Ühendverbid eesti keele pindsüntaktilises analüüsis

Kadri Muischnek, Kaili Müürisep, Tiina Puolakainen

Abstract


Artikkel käsitleb ühendverbide tuvastamist eesti keele automaatse pindsüntaktilise analüüsi käigus. Ühendverbide äratundmine on vajalik lause täpsemaks süntaktiliseks analüüsiks, sest lause osaliste süntaktilised funktsioonid, semantilised rollid ja nende keelendamine sõltub sellest, milline on lause keskmeks olev predikaatverb, sh sellest, kas predikaatverb on lihtverb või ühendverb.

Ühendverbide tuvastamineks rakendatakse kahte strateegiat: leksikonipõhist ja reeglipõhist. Viimane tähendab seda, et osa korrapäraseid produktiivselt kombineeruvaid ühendverbe pannakse kokku reeglite abil. Artiklis kirjeldatakse kahte eksperimenti: esialgse ja täiustatud ühendverbide tuvastamise käiku. Täiustatud süsteemi tulemus on päris hea, saavutades saagise 97,4% ja täpsuse 96,6%.

DOI: http://dx.doi.org/10.5128/ERYa10.14


Keywords


arvutilingvistika; püsiühendite tuvastamine; eesti keel

Full Text:

PDF

References


Baldwin, Timothy; Villavicencio, Aline 2002. Extracting the unextractable: a case study on verb particles. – Proceedings of the Conference on Computaional Natural Language Learning (CoNLL 2002), Taipei, Taiwan, 31 August – 1 September 2002. Association for Computational Linguistics, 1–7.

EKG I = Erelt, Mati; Reet Kasik; Helle Metslang; Henno Rajandi; Kristiina Ross; Henn Saari; Kaja Tael; Silvi Vare 1995. Eesti keele grammatika I. Morfoloogia. Sõnamoodustus. [The Grammar of the Estonian Language I: Morphology. Word-formation.] Eesti Teaduste Akadeemia Eesti Keele Instituut. Tallinn.

EKG II = Erelt, Mati; Reet Kasik; Helle Metslang; Henno Rajandi; Kristiina Ross; Henn Saari; Kaja Tael; Silvi Vare 1993. Eesti keele grammatika II. Süntaks. Lisa: kiri. [The Grammar of the Estonian Language II: Syntax.] Eesti Teaduste Akadeemia Keele ja Kirjanduse Instituut. Tallinn.

EKSS = Langemets, Margit; Tiits, Mai; Valdre, Tiia; Veskis, Leidi; Viks, Ülle; Voll, Piret (Toim.) 2009. Eesti keele seletav sõnaraamat 1–6. [The Explanatory Dictionary of Estonian.] Tallinn: Eesti Keele Sihtasutus.

Erelt, Mati (Toim.) 2003. Estonian Language. Linguistica Uralica Supplementary Series Vol 1. Tallinn: Estonian Academy Publishers.

Erelt, Mati 2013. Eesti keele lauseõpetus. Sissejuhatus. Öeldis. [Estonian Syntax. Introduction.] Tartu ülikooli eesti keele osakonna preprindid 4. Tartu Ülikool.

Forst, Martin; Holloway King, Tracy; Laczkó, Tibor 2010. Particle verbs in computational LFGs: Issues from English, German, and Hungarian. – Proceedings of LFG 10. CSLI Publications, 228−248.

Kaalep, Heiki-Jaan 2009. Mitmesõnalised verbid. [Multiword verbs.] – Ettekande slaidid internetiaadressil http://www.keeletehnoloogia.ee/konverentsid/ekkt-teine-konverents/slaidid-2009/mitmesonaliste-verbide-aratundmine-tekstides (30.9.2013).

Kaalep, Heiki-Jaan; Muischnek, Kadri 2002. Using the text corpus to create a comprehensive list of phrasal verbs. – Proceedings of Language Resources and Evaluations: Third International Conference on Language Resources and Evaluation, Las Palmas, May 29–31, LREC 2002. European Language Resources Association, 101−105.

Kaalep, Heiki-Jaan; Muischnek, Kadri 2008. Multi-word verbs of Estonian: a database and a corpus. – Proceedings of the LREC Workshop “Towards a Shared Task for Multiword Expressions”, Marrakech, Morocco, June 1, 2008. European Language Resources Association, 23−26.

Karlsson, Fred; Voutilainen, Atro; Heikkilä, Juha; Anttila, Arto (Eds.) 1995. Constraint Grammar: A Language-Independent System for Parsing Running Text. Natural Language Processing 4. Berlin, New York: Mouton de Gruyter.

Muischnek, Kadri; Kaalep, Heiki-Jaan 2009. Eesti keele püsiühendid arvutilingvistikas: miks ja kuidas. [Estonian multiword expressions in computational linguistics.] – Eesti Rakenduslingvistika Ühingu aastaraamat, 5, 157−172. http://dx.doi.org/10.5128/ERYa5.10

Müürisep, Kaili 2000. Eesti keele arvutigrammatika: süntaks. [Computer Grammar of Estonian: Syntax.] Dissertationes Mathematicae Universitatis Tartuensis 22. Tartu: Tartu Ülikooli Kirjastus.

Pajusalu, Renate 2009. Sõna ja tähendus. [Word and Meaning.] Tallinn: Eesti Keele Sihtasutus.

Puolakainen, Tiina 2001. Eesti keele arvutigrammatika: morfoloogiline ühestamine. [Computer Grammar of Estonian: Morphological Disambiguation.] Dissertationes Mathematicae Universitatis Tartuensis 27. Tartu: Tartu Ülikooli Kirjastus.

Ramisch, Carlos; Villavicencio, Aline; Moura, Leonardo; Idiart, Marco 2008. Verb-particle constructions, noise and idiomaticity. – Proceedings of the Twelfth Conference on Computational Natural Language Learning (CoNLL 2008), Manchester, UK, August 2008. Association for Computational Linguistics, 49–56.

Roosmaa, Tiit; Koit, Mare; Muischnek, Kadri; Müürisep, Kaili; Puolakainen, Tiina; Uibo, Heli 2003. Eesti keele arvutigrammatika: mis on tehtud ja kuidas edasi? [A formal grammar of Estonian: Experience and prospects.] – Keel ja Kirjandus, 46 (3), 192−209.

Rätsep, Huno 1978. Eesti keele lihtlausete tüübid. [Types of Simple Sentences in Estonian.] Eesti NSV TA Emakeele Seltsi toimetised 12. Tallinn: Valgus.

Saagpakk, Paul F. 1992. Eesti-inglise sõnaraamat. [Estonian-English Dictionary.] 2. trükk. Tallinn: Koolibri.

Sag, Ivan A.; Baldwin, Timothy; Bond, Francis; Copestake, Ann; Flickinger, Dan 2002. Multiword Expressions: A Pain in the Neck for NLP. – Alexander Gelbukh (Ed.). Computational Linguistics and Intelligent Text Processing. Third International Conference, CICLing 2002, Mexico City, Mexico, February 17-23, 2002. Proceedings. Lecture Notes in Computer Science 2276. Springer Verlag, 1–15.

Uiboaed, Kristel 2010. Statistilised meetodid murdekorpuse ühendverbide tuvastamisel. [Statistical methods for phrasal verb detection in Estonian dialects.] – Eesti Rakenduslingvistika Ühingu aastaraamat, 6, 307−326. http://dx.doi.org/10.5128/ERYa6.19

Villavicencio, Aline 2003. Verb-particle constructions and lexical resources. – Proceedings of the Meeting of the Asociation for Computational Linguistics: 2003 workshop on Multiword Expressions, Sapporo, Japan, July 2003. Asociation for Computational Linguistics, 57−64.

Villavicencio, Aline; Copestake, Ann 2002. Verb-particle constructions in a computational grammar of English. – Jong-Bok Kim, Stephen Wechsler (Eds.). Proceedings of the 9th International Conference on Head-Driven Phrase Structure Grammar, Kyung Hee University, Seoul 5-7 August, 2002. CSLI Publications, 357−371.
DOI: http://dx.doi.org/10.5128/ERYa10.14

Refbacks

  • There are currently no refbacks.


Copyright (c) 2014 Kadri Muischnek, Kaili Müürisep, Tiina Puolakainen

Creative Commons License
This work is licensed under a Creative Commons Attribution-NonCommercial 4.0 International License.

ISSN 1736-2563 (print)
ISSN 2228-0677 (online)
DOI 10.5128/ERYa.1736-2563