Eesti keele püsiühendid arvutilingvistikas: miks ja kuidas

Kadri Muischnek, Heiki-Jaan Kaalep

Abstract


Artikkel räägib püsiühendite automaattöötlusest arvutilingvistikas. Püsiühendi all mõeldakse siin kahe või enama sõna(vormi) ühendit, mida mingi tähenduse väljendamiseks on tavaks koos kasutada; selle definitsiooni alla mahuvad nii idiomaatilised kui ka kollokatiivsed ühendid. Arvutilingvistikas on püsiühendid probleemiks, sest nad komplitseerivad teksti alt-üles analüüsimudelit, mille järgi lause struktuuri ja tähenduse ehituskiviks on üksiksõna. Artikkel annab ülevaate püsiühendite automaattöötluse kolmest etapist – püsiühendite tuvastamisest, nende leksikoni koostamisest ja püsiühendite märgendamisest tekstis. Nende ülesannete lahendamiseks on arvutilingvistikas välja töötatud tüüpilised meetodid, kuid need meetodid on eesti keele kui vaba sõnajärjega morfoloogiliselt keeruka keele analüüsil rakendatavad ainult teatud reservatsioonide ja modifikatsioonidega. Artiklis analüüsitaksegi eesti keele “erivajadusi” selles vallas.

DOI: http://dx.doi.org/10.5128/ERYa5.10


Keywords


arvutilingvistika; püsiühendid; püsiühendite tuvastamine; püsiühendite leksikon; püsiühendite märgendamine; eesti keel

Full Text:

PDF


DOI: http://dx.doi.org/10.5128/ERYa5.10

Refbacks

  • There are currently no refbacks.


Copyright (c) 2012 Kadri Muischnek, Heiki-Jaan Kaalep

Creative Commons License
This work is licensed under a Creative Commons Attribution-NonCommercial 4.0 International License.

ISSN 1736-2563 (print)
ISSN 2228-0677 (online)
DOI 10.5128/ERYa.1736-2563