Kesksete lausekomponentide järjestus õppijakeeles: arvutianalüüsi katse

Helena Metslang, Erika Matsak

Abstract


Artikkel käsitleb eesti keele lihtlause sõnajärje arvutianalüüsi katset, mille eesmärgiks on õppijakeele sõnajärje vealeidja loomine. Katse käigus koostati eesti keele sagedaste sõnajärjetüüpide mallid, mis kirjeldasid lihtlause ja mõne lihtsama liitlausetüübi verbi, tuumargumentide ning nende järge mõjutavate moodustajate või sõnade järge (põhiliselt subjekt, objekt, predikaat, adverbiaal lause algul või seotud laiendina, üldlaiend). Mallid leiti Tartu Ülikooli kirjakeele korpuse põhjal. Saadud mallide katvust hinnati kirjakeele ja õppijakeele korpuste peal spetsiaalselt loodud programmi abil. Artiklis kirjeldatav programm, mis on kasutatav koos mallide koguga, analüüsib õppijakeelt, märkides küsitavaks laused, mis ühelegi mallile ei vasta. Artikkel tutvustab mallide kogu loomise protsessi ja tekstilausete sõnajärge hindavat programmi. Antakse ka ülevaade programmi efektiivsusest õppijakeele tekstide analüüsil ning vealeidja edasise arendamise vajadustest. Õppijakeele analüüsil kasutati Tallinna Ülikooli eesti vahekeele korpust, mis koondab ligi 740 000 sõne mahus eesti keele õppijate loovkirjutisi ja harjutusi.

DOI: http://dx.doi.org/10.5128/ERYa6.11


Keywords


sõnajärg; korpuslingvistika; teise keele omandamine; eesti keel

Full Text:

PDF


DOI: http://dx.doi.org/10.5128/ERYa6.11

Refbacks

  • There are currently no refbacks.


Copyright (c) 2012 Helena Metslang, Erika Matsak

Creative Commons License
This work is licensed under a Creative Commons Attribution-NonCommercial 4.0 International License.

ISSN 1736-2563 (print)
ISSN 2228-0677 (online)
DOI 10.5128/ERYa.1736-2563