Korpuslingvistiline lähenemine eesti internetikeele automaatsele morfoloogilisele analüüsile
Abstract
Artiklis analüüsitakse eesti uue meedia keelekasutuse e internetikeele leksikaalseid ja ortograafilisi eripärasusi ning nendest tulenevaid automaatsel morfoloogilisel analüüsil kerkivaid raskusi. Esitatakse meetodid nende probleemide lahendamiseks: sagedased kõrvalekalded normeeritud kirjakeelest lahendatakse kasutajasõnastiku abil ning harvem esinevad, kuid regulaarsed kõrvalekalded automaatseid teisendusreegleid rakendades. Korpusespetsiifilise leksika analüüsiks pakutakse välja kasutajasõnastiku automaatse täiendamise meetod. Artikli autorid on seisukohal, et internetisuhtluses kasutatava keelevariandi erinevused normeeritud kirjakeelest on valdavalt kirjutajate teadliku keelemängu tulemus, mitte kehva kirjaoskuse väljendus.
http://dx.doi.org/10.5128/ERYa7.07
Keywords
arvutilingvistika; korpuslingvistika; morfoloogia; morfosüntaks; ortograafia; sõnaliigid; eesti keel
Full Text:
PDFDOI: http://dx.doi.org/10.5128/ERYa7.07
Refbacks
- There are currently no refbacks.
Copyright (c) 2012 Kadri Muischnek, Heiki-Jaan Kaalep, Raul Sirel
This work is licensed under a Creative Commons Attribution-NonCommercial 4.0 International License.
ISSN 1736-2563 (print)
ISSN 2228-0677 (online)
DOI 10.5128/ERYa.1736-2563