Leksika-grammatika piirimail: publitsistlike arvamuslugude keelekasutusmustrid

Pille Eslon

Abstract


https://doi.org/10.5128/LV32.01

Uurimus paigutub kasutuspõhise korpuslingvistilise keelekäsitluse raamesse. Nagu varasemates töödes, mis tehtud eesti ilukirjandus- ja õppijakeele korpustel, rajaneb ka siinne arvamuslugude (Postimees ja Õhtuleht) keeleanalüüs kolmest komponendist koosnevatele sõnaliigijärjenditele ehk keelekasutusmustritele, mis leitud morfosüntaktiliselt märgendatud tekstidest andmekaeve põhimõttel töötava programmiga Klastrileidja. Korduvalt esinevasse sõnaliigijärjendisse on sisse kodeeritud selle komponentide kooskasutuse fonoloogilised, süntaktilised ja kontseptuaalsed reeglid, mis avalduvad semantika-grammatika piirimail ning toovad esile keelekasutuse seaduspärasusi. Seetõttu on aktiivselt kasutatavad mustrid sobiv allikmaterjal eesti keele õppes, eri lähtekeelega õppijate keelekasutuse võrdlemisel jm, k.a õppija kirjutatud tekstide automaatse töötlemise vajadusel (sõnastuse parandamine koos viitega reegli(te)le ja sihtkeelepärasemale sõnastusele).

***

At the border of lexis and grammar: Language use patterns of journalistic opinion articles

The study draws on the usage-based corpus linguistic approaches. It presents the linguistic analysis of opinion articles (published in the Estonian daily newspapers Postimees and Õhtuleht), relying on part-of-speech trigrams. These language use patterns have been extracted from morpho-syntactically tagged texts using the data mining software Cluster Catcher (Klastrileidja) developed at the Tallinn University. Earlier, similar analysis has been done based on the corpora of Estonian fiction and learner language.

The recurring part-of-speech sequences have the encoded phonological, syntactic, and conceptual rules of their components’ co-occurrence that manifest at the border of semantics and grammar, bringing out the regularities of language use. Therefore, the actively used language patterns can be considered a suitable source material for teaching and learning Estonian, comparing the language production of learners speaking different native languages and also for automated processing of learner writings (e.g., proposing corrections in wording with references to rules and examples of the target language use).

 


Keywords


lingvistiline klasteranalüüs; keelekasutusmustrid; leksikaalgrammatiline varieeruvus; keelekasutuse seaduspärasused; eesti keel; linguistic cluster analysis; language use patterns; lexical-grammatical variation; regularities of language use; Estonian

Full Text:

PDF


DOI: http://dx.doi.org/10.5128/553

Refbacks

  • There are currently no refbacks.


Copyright (c) 2022 Pille Eslon

Creative Commons License
This work is licensed under a Creative Commons Attribution-NonCommercial 4.0 International License.

ISSN 1736-9290 (print)
ISSN 2228-3854 (online)
DOI  https://doi.org/10.5128/LV.1736-9290