Meetodeid tekstide leksikaalsete ja grammatiliste erinevuste tuvastamiseks meditsiiniliste tarbetekstide näitel

Raul Sirel

Abstract


Artiklis käsitletakse seni uurimata eestikeelset ressurssi: ravimipakendites sisalduvaid infolehti ja arstidele suunatud ravimeid tutvustavaid kokkuvõtteid. Nimetatud ainestiku analüüsimiseks kasutatakse mõnda läbipaistvat statistilist meetodit, mis võimaldavad kerge vaevaga tuvastada tekstide tüübist ja žanrist tulenevaid leksikaalseid ja grammatilisi erinevusi. Taolise analüüsi eesmärgiks on ühest küljest katsetada nimetatud meetodite efektiivsust tekste eristavate karakteristikute leidmisel, kuid ka koguda andmestikust lähtuvaid taustateadmisi keeletehnoloogiliste rakenduste efektiivsemaks loomiseks.

DOI: http://dx.doi.org/10.5128/ERYa9.17


Keywords


korpuslingvistika, tekstilingvistika, tekstikorpused, žanrianalüüs, keeletehnoloogia, eesti keel

Full Text:

PDF

References


Atias, Nir; Sharan, Roded 2011. An algorithmic framework for predicting side-effects of drugs. – Journal of Computational Biology, 18, 207–218.

Askehave, Inger; Swales, John M. 2001. Genre identification and communicative purpose: A problem and a possible solution. – Applied Linguistics, 22 (2), 195–212.

Biber, Douglas; Conrad, Susan; Reppen, Randi 1998. Corpus Linguistics: Investigating Language Structure and Use. Cambridge: Cambridge University Press.

Chilton, Paul; Schäffner, Christina 2002. Politics as Text and Talk: Analytic Approaches to Political Discourse. Amsterdam: John Benjamins Publishing Co.

EKK = Erelt, Mati; Erelt, Tiiu; Ross, Kristiina 2007. Eesti keele käsiraamat. 3., täiendatud trükk. Tallinn: Eesti Keele Sihtasutus.

Fairclough, Norman 2003. Analysing Discourse: Textual Analysis for Social Research. London, New York: Routledge.

Hennoste, Tiit 2002. Suulise kõne uurimine ja sõnaliigi probleemid. – Renate Pajusalu, Ilona Tragel, Tiit Hennoste, Haldur Õim (Toim.). Teoreetiline keeleteadus Eestis. Tartu Ülikooli üldkeeleteaduse õppetooli toimetised 4. Tartu: Tartu Ülikooli Kirjastus, 56–73.

Hennoste, Tiit; Muischnek, Kadri 2000. Eesti kirjakeele korpuse tekstide valiku ja märgendamise põhimõtted ning kahe allkeele võrdluse katse. – Tiit Hennoste (Toim.). Arvutuslingvistikalt inimesele. Tartu Ülikooli üldkeeleteaduse õppetooli toimetised 1. Tartu: Tartu Ülikooli Kirjastus, 183–317.

Kaalep, Heiki-Jaan 1997. An Estonian morphological analyser and the impact of a corpus on its development. – Computers and the Humanities, 31 (2), 115–133. http://www.cl.ut.ee/yllitised/chum1997.pdf (28.12.2012). http://dx.doi.org/10.1023/A:1000668108369

Kaalep, Heiki-Jaan; Vaino, Tarmo 1998. Vale meetodiga õiged tulemused? Eesti keele morfoloogiline ühestamine statistika abil. http://www.cl.ut.ee/yllitised/kk_yhest_1998.pdf (28.12.2012).

Kasik, Reet 2007. Sissejuhatus tekstiõpetusse. Tartu: Tartu Ülikooli Kirjastus.

Kilgarriff, Adam 2001. Comparing Corpora. – International Journal of Corpus Linguistics, 6 (1), 1–37.

Kuhn, Michael; Campillos, Monica; Letunic, Ivica; Jensen, Lars J.; Bork, Peer 2010. A side effect resource to capture phenotypic effects of drugs. – Molecular Systems Biology 6, artikkel nr 343. http://dx.doi.org/10.1038/msb.2009.98

Liikane, Lauri; Kesa, Marilin 2006. Arvutisõnastik. Elektrooniline versioon. www.keeleveeb.ee (28.12.2012).

Martin, James R. 1985. Process and Text: Two aspects of human semiosis. – J. D. Benson, W. S. Greaves (Eds.). Systemic Perspectives on Discourse, Vol 1: Selected Theoretical Papers from the 9th Int. Systemic Workshop. Norwood, N.J.: Ablex, 248–274.

Nabeta, Keita; Kimura, Masaomi; Ohkura, Michiko; Tsuchiya, Fumito 2012. Analysis on descriptions of precautionary statements in package inserts of medicines. – V. G. Duffy (Ed.). Advances in Human Factors and Ergonomics in Healthcare. USA: CRC Press, 257–266.

Pajupuu, Hille; Kerge, Krista 2010. Characteristics and assessment of educated L1 and L2 dialogue. – Rosario Caballero Rodrigues, Jesus Pinar Sanz (Eds.). Modos y formas de la communicacion humana / Ways and Modes of Human Communication. Cuenca: Universidad Castilla-La Mancha, 339–348.

Rayson, Paul; Garside, Roger 2000. Comparing corpora using frequency profiling. – WCC '00 Proceedings of the workshop on Comparing corpora, 9, 1–6. http://dx.doi.org/10.3115/1117729.1117730

Reinsalu, Riina 2011. Leping tekstiliigina: žanristruktuur. – Eesti Rakenduslingvistika Ühingu aastaraamat, 215–229.

Vardi, Iris 2000. Developing critical writers at the undergraduate level: some insights from critical thinking pedagogy and linguistics. – Cornerstones of higher education. Selected papers from the 1999 HERDSA Annual International Conference, Melbourne, Australia, 12-15 July 1999.




DOI: http://dx.doi.org/10.5128/ERYa9.17

Refbacks

  • There are currently no refbacks.


Copyright (c) 2013 Raul Sirel

Creative Commons License
This work is licensed under a Creative Commons Attribution-NonCommercial 4.0 International License.

ISSN 1736-2563 (print)
ISSN 2228-0677 (online)
DOI 10.5128/ERYa.1736-2563