Korpuslingvistiline lähenemine eesti internetikeele automaatsele morfoloogilisele analüüsile

Kadri Muischnek, Heiki-Jaan Kaalep, Raul Sirel

Abstract


Artiklis analüüsitakse eesti uue meedia keelekasutuse e internetikeele leksikaalseid ja ortograafilisi eripärasusi ning nendest tulenevaid automaatsel morfoloogilisel analüüsil kerkivaid raskusi. Esitatakse meetodid nende probleemide lahendamiseks: sagedased kõrvalekalded normeeritud kirjakeelest lahendatakse kasutajasõnastiku abil ning harvem esinevad, kuid regulaarsed kõrvalekalded automaatseid teisendusreegleid rakendades. Korpusespetsiifilise leksika analüüsiks pakutakse välja kasutajasõnastiku automaatse täiendamise meetod. Artikli autorid on seisukohal, et internetisuhtluses kasutatava keelevariandi erinevused normeeritud kirjakeelest on valdavalt kirjutajate teadliku keelemängu tulemus, mitte kehva kirjaoskuse väljendus.

http://dx.doi.org/10.5128/ERYa7.07


Keywords


arvutilingvistika; korpuslingvistika; morfoloogia; morfosüntaks; ortograafia; sõnaliigid; eesti keel

Full Text:

PDF


DOI: http://dx.doi.org/10.5128/ERYa7.07

Refbacks

  • There are currently no refbacks.


Copyright (c) 2012 Kadri Muischnek, Heiki-Jaan Kaalep, Raul Sirel

Creative Commons License
This work is licensed under a Creative Commons Attribution-NonCommercial 4.0 International License.

ISSN 1736-2563 (print)
ISSN 2228-0677 (online)
DOI 10.5128/ERYa.1736-2563