Sõnaliik leksikograafi töölaual: sõnaliikide roll tänapäeva leksikograafias

Geda Paulsen, Ene Vainik, Maria Tuulik

Abstract


Sõnaliik on traditsiooniliselt keele kirjelduse osa, mis hõlmab sõna morfoloogilist ja süntaktilist käitumist, aga ka tähendust ning pragmaatilist funktsiooni. Vaatamata sellele, et sõnaliigid on tinglike piiridega ning keeleteaduslikult kaugel ühtsest või selgest nähtusest, on see kategooriana leksikograafias vajalik kui kompaktne viis andmaks ülevaadet sõna käitumisest kasutuses. Ka e-leksikograafias vältimatud automaatsed protseduurid nagu morfoloogiline ja süntaktiline märgendamine ning tähenduste ühestamine eeldavad kas konkreetselt või vaikimisi leksikaalsete üksuste eristamist. Käesolevas artiklis anname sissevaate sõnaliikide rolli leksikograafi töös. Vahendame tulemusi aastal 2019 tehtud uuringust, mille eesmärk oli välja selgitada eesti keelt kirjeldavate leksikograafide probleeme ning vajadusi seoses sõnaliikidega, aga ka ootusi keeletehnoloogilistele lahendustele sõnaliigi määramise hõlbustamiseks.

*** 

On word classes in contemporary lexicography: The lexicographers’ view

This study examines the role of word classes in the contemporary lexicographic work. The analysis is based on a metalexicographic semi-structured interview carried out among 23 Estonian lexicographers. We focus on three main research questions: i) How necessary are word classes in lexicopraphers’ work? ii) What kinds of problems they do experience related to the word classes? iii) How do lexicographers solve these problems and how could digital tools facilitate the word class judgement processes?

The results indicate that in lexicography, word classes provide an (implicit or explicit) frame for organisation of data, even if word-class tagging does not directly belong among the tasks of the lexicographer. The word class determination process in unclear cases is a complicated one. In addition to the usage of a word and the expected needs of the user, the lexicographer must consider the structural requirements of the particular dictionary (s)he is working with. Along with the development of digital resources, the demands of the data model behind the electronic database have to be considered; not to mention the theoretical linguistic insights. Linguistically, the most problematic issues appear in the grammaticalisation and lexicalisation processes related to inflectional suffixes (mainly adverbs and adpositions) or conversional transposition (adjectives). The typical word-class altering devices in Estonian such as suffixal derivation (see, e.g. Vare 2006: 199) do not emerge as particularly problematic.

The interviewed lexicographers would welcome a digital application that would facilitate and quickened the word class determination process. The application would have an improved morphological tagger compared to the present tools and it would be more efficient in extracting statistical information from corpora. Lexicographers wish to acquire information about the prevailing word-class function together with the data this assessment is based on. Yet, the lexicographer makes the final decision.


Keywords


word classes, lexicography, semi-structured interview, Estonian

Full Text:

PDF

References


Alexander, Marc 2015. Words and dictionaries. – John R. Taylor (Ed.), The Oxford Handbook of the Word. Kindle Edition. Oxford: Oxford University Press, 37–53. https://doi.org/10.1093/oxfordhb/9780199641604.013.021

Anward, Jan 2000. A dynamic model of part-of-speech differentiation. – Petra M. Vogel, Bernard Comrie (Eds.), Approaches to the Typology of Word Classes. Berlin: Mouton de Gruyter, 3–45.

Croft, William 2001. Radical Construction Grammar: Syntactic Theory in Typological Perspective. Oxford: Oxford University Press.

Culicover, Peter W. 1999. Syntactic Nuts. Oxford: Oxford University Press.

EKG I = Erelt, Mati; Kasik, Reet; Metslang, Helle; Rajandi, Henno; Ross, Kristiina; Saari, Henn; Tael, Kaja; Vare, Silvi 1995. Eesti keele grammatika I. Morfoloogia. Sõnamoodustus [‘The Grammar of the Estonian Language I: Morphology. Word-formation’].Tallinn: ETA Eesti Keele Instituut.

EKG II = Erelt, Mati; Kasik, Reet; Metslang, Helle; Rajandi, Henno; Ross, Kristiina; Saari, Henn; Tael, Kaja; Vare, Silvi 1993. Eesti keele grammatika II. Süntaks. Lisa: kiri [‘The Grammar of the Estonian Language II: Syntax’]. Tallinn: ETA Keele ja kirjanduse instituut.

Eesti keele naabersõnad 2019 [‘The Estonian Collocations Dictionary, ECD’]. Jelena Kallas, Kristina Koppel, Geda Paulsen, Maria Tuulik (Toim.). Eesti Keele Instituut. Sõnaveeb 2019. https://sonaveeb.ee (14.2.2019).

EKS = Eesti keele sõnaraamat 2019 [‘The Dictionary of Estonian, DicEst’]. Margit Langemets, Mai Tiits, Udo Uibo, Tiia Valdre, Piret Voll (Toim.). Eesti Keele Instituut. Sõnaveeb 2019. https://sonaveeb.ee (14.2.2019).

EKSS 2009 = Eesti keele seletav sõnaraamat I–VI [‘The Explanatory Dictionary of Estonian’]. “Eesti kirjakeele seletussõnaraamatu” 2., täiendatud ja parandatud trükk. Margit Langemets, Mai Tiits, Tiia Valdre, Leidi Veskis, Ülle Viks, Piret Voll (Toim.). Eesti Keele Instituut. Tallinn: Eesti Keele Sihtasutus, 2009.

Erelt, Mati 2017. Sissejuhatus süntaksisse [‘Introduction to syntax’]. – Mati Erelt, Helle Metslang (Toim.), Eesti keele süntaks. Eesti keele varamu III. Tartu: Tartu Ülikooli Kirjastus, 537–564.

Grünthal, Riho 2003. Finnic Adpositions and Cases in Change. Suomalais-Ugrilaisen Seuran toimituksia 244. Helsinki: Finno-Ugrian Society.

Habicht, Külli 2001. Lexicalization and grammaticalization – opposite phenomena? About some lexicalized verb forms in Old Written Estonian. – Estonian Typological Studies V. Tartu Ülikooli eesti keele õppetooli toimetised 18. Tartu: Tartu Ülikool, 26–76.

Habicht, Külli; Penjam, Pille; Prillop, Külli 2011. Sõnaliik kui rakenduslik probleem: sõnaliikide märgendamine vana kirjakeele korpuses [‘Parts of speech as a functional and linguistic problem: Annotation of parts of speech in the corpus of Old Written Estonian’]. – Eesti Rakenduslingvistika Ühingu aastaraamat, 7, 19–41. https://doi.org/10.5128/ERYa7.02

Jürine, Anni; Habicht, Külli 2013. Kaassõnade tsükliline areng [’The cycle of postpositions’]. – Keel ja Kirjandus, 12, 736–749.

Kallas, Jelena; Koeva, Svetla; Langemets, Margit; Tiberius, Carole; Kosem, Iztok 2019. Lexicographic practices in Europe: Results of the ELEX Survey on user needs. – I. Kosem, T. Zingano Kuhn, M. Correia, J. P. Ferreria, M. Jansen, I. Pereira, J. Kallas, M. Jakubíček, S. Krek, C. Tiberius (Eds.), Electronic Lexicography in the 21st century. Proceedings of the eLex 2019 conference. 1−3 October 2019, Sintra, Portugal. Brno: Lexical Computing CZ, s.r.o., 519−536.

Kasik, Reet 2012. Nulltuletus ja konversioon eesti keeles [’Zero-derivation and conversion in Estonian’]. – Keel ja Kirjandus 11, 793–806.

Koppel, Kristina; Tavast, Arvi; Langemets, Margit; Kallas, Jelena 2019. Aggregating dictionaries into the language portal Sõnaveeb: Issues with and without a solution. – I. Kosem, T. Zingano Kuhn, M. Correia, J. P. Ferreria, M. Jansen, I. Pereira, J. Kallas, M. Jakubíček, S. Krek, C. Tiberius (Eds.), Electronic Lexicography in the 21st century. Proceedings of the eLex 2019 conference. 1−3 October 2019, Sintra, Portugal. Brno: Lexical Computing CZ, s.r.o., 434−452.

Kenesei, Istvan 2018. On the definition of word classes. Preprint. https://doi.org/10.13140/rg.2.2.34114.27842

Kilgarriff, Adam; Rychlý, Pavel; Smrž, Pavel and Tugwell, David 2004. The Sketch Engine. – Geoffrey Williams, Sandra Vessier (EDS.), Proceedings of the 11th EURALEX International Congress. Lorient, France: Université de Bretagne Sud, 105–116.

Langemets, Margit 2010. Nimisõna süstemaatiline polüseemia eesti keeles ja selle esitus keelevaras [’Systematic Polysemy of Nouns and its Lexicographic Treatment in Estonian Language Resources’]. Tallinn: Eesti Keele Sihtasutus.

Langemets, Margit; Uibo, Udo; Tiits, Mai; Valdre, Tiia; Voll, Piret 2018. Eesti keel uues kuues. Eesti keele sõnaraamat 2018 [’Estonian lexis revisited: The Dictionary of Estonian 2018’]. – Keel ja Kirjandus, 12, 942−958.

Metslang, Helle 2017. Kvantorifraas [’Quantifier phrases’]. – Mati Erelt, Helle Metslang (Toim.), Eesti keele süntaks. Eesti keele varamu III. Tartu: Tartu Ülikooli Kirjastus, 463–478.

Oja, Vilja 1995. Võrdlusel baseeruvaist värviliitsõnadest [’Comparison-based compound color words in Estonian’]. – Keel ja Kirjandus, 12, 809–817.

Paulsen, Geda; Vainik, Ene; Tuulik, Maria; Lohk, Ahti 2019. The lexicographer’s voice: Word classes in the digital era. – I. Kosem, T. Zingano Kuhn, M. Correia, J. P. Ferreria, M. Jansen, I. Pereira, J. Kallas, M. Jakubíček, S. Krek, C. Tiberius (Eds.), Electronic Lexicography in the 21st century. Proceedings of the eLex 2019 conference. 1−3 October 2019, Sintra, Portugal. Brno: Lexical Computing CZ, s.r.o., 319–337.

Paulsen, Geda 2018. Manner and adverb: Fuzzy categorial boundaries in collocations. – Eesti Rakenduslingvistika Ühingu aastaraamat, 14, 117–135. https://doi.org/10.5128/ERYa14.07

Paulsen, Geda 2019. Sõnaliigipiiridest kollokatsioonide vaatenurgast: erikäändelised noomenadverbid [’Word class boundaries and collocations: The Estonian nominal adverbs in special cases’]. – Eesti Rakenduslingvistika Ühingu aastaraamat, 15, 121–137. https://doi.org/10.5128/ERYa15.07

Prillop, Külli 2004. Kuidas märksõnastada vanu eestikeelseid tekste? [’How to lemmatize old Estonian texts’] – Keel ja Kirjandus, 2, 90−99.

Rätsep, Huno 1978. Eesti keele lihtlausete tüübid [’ Types of Simple Sentences in Estonian’]. Valgus: Tallinn.

Sahkai, Heete 2008. Konstruktsioonipõhine keelemudel ja sõnaraamatumudel [’Some lexicographic implications of a construction-based model of language’]. – Eesti Rakenduslingvistika Ühingu aastaraamat, 4, 177−186. https://doi.org/10.5128/ERYa4.11

Sepper, Maria-Maren 2007. Indirectal in Literary Estonian. – Trames, 11 (3), 299–323.

Smith, Mark C. 2015. Word categories. – John R. Taylor (Ed.), The Oxford Handbook of the Word. Kindle Edition. Oxford: Oxford University Press. https://doi.org/10.1093/oxfordhb/9780199641604.013.019

Sõnaveeb 2019 [’Dictionary portal WordWeb’]. Eesti Keele Instituudi sõnastikuportaal. Indrek Hein, Jelena Kallas, Kristina Koppel, Margit Langemets, Kaur Männiko, Tõnis Nurk, Ülle Viks (arendajad ja toimetajad); Martin Laubre, Raigo Ukkivi, Arvi Tavast, Sander Lastovets, Sander Rautam (arendajad). https://sonaveeb.ee (20.9.2019).

Tavast, Arvi; Langemets, Margit; Kallas, Jelena; Koppel, Kristina 2018. Unified data modelling for presenting lexical data: The case of EKILEX. – J. Čibej, V. Gorjanc, I. Kosem, S. Krek (Eds.), Proceedings of the 18th EURALEX international congress. Ljubljana University Press, Faculty of Arts, 749−761.

Tiits, Mai 1982. Seisundiadverbidest [‘About adverbs of state’]. – Keel ja Kirjandus, 1, 17−21.

Vare, Silvi 2004. Eesti keele verbimoodustus: desubstantiivne konversioon [’Verb formation in Estonian: denominal conversion’]. – Emakeele Seltsi aastaraamat, 50, 39–65.

Vare, Silvi 2006. Adjektiivide substantivatsioonist ühe tähendusrühma näitel [’On the substantivation of adjectives in Estonian’]. – Ellen Niit. Keele ehe. Tartu Ülikooli eesti keele õppetooli toimetised, 30. Tartu: Tartu Ülikool, 205−222.

Viks, Ülle 1992. Väike vormisõnastik [’Concise Morphological Dictionary of Estonian’]. I–II. Tallinn: Eesti Teaduste Akadeemia.

ÕS = Eesti õigekeelsussõnaraamat 2018 [’Dictionary of Standard Estonian’]. Maire Raadik, Tiiu Erelt, Tiina Leemets, Sirje Mäearu (Toim.). Tallinn: Eesti Keele Sihtasutus.

Võrguviited

Eesti keele süntaksianalüsaator. http://kodu.ut.ee/~kaili/parser/ (20.9.2019).

EKI reeglipõhise morfoloogia demo. http://artur.eki.ee/morf/ (20.9.2019).

ESTMORF. http://eki.ee/keeletehnoloogia/projektid/estmorf/estmorf.html#2 (20.9.2019).

Sketch Engine. https://www.sketchengine.eu/ (20.9.2019).




DOI: http://dx.doi.org/10.5128/ERYa16.11

Refbacks

  • There are currently no refbacks.


Copyright (c) 2020 Geda Paulsen, Ene Vainik, Maria Tuulik

Creative Commons License
This work is licensed under a Creative Commons Attribution-NonCommercial 4.0 International License.

ISSN 1736-2563 (print)
ISSN 2228-0677 (online)
DOI 10.5128/ERYa.1736-2563