Kõnetehnoloogia vajab žanrilist lähenemist

Krista Kerge, Hille Pajupuu, Kairi Tamuri, Heidi Meier

Abstract


Oleme varasemas uurimuses näidanud, et ettelugemisel seostuvad pausid ja hingamine kui etteloetud teksti loomulikkuse tunnused tugevasti funktsionaalstiiliga (ajakirjandustekst, ilukirjandustekst). Tekstiuurimuse andmestik aitab muuta loomulikuks sünteeskõne, kuid ka tuvastada tekstiliiki ehk žanrit, eristada funktsionaalstiile ja autorite sõnastuslaadi ning muuta otstarbekamaks sõnastiku ja grammatika kasutuse teksti automaatses analüüsis. Artiklis osutatakse hingamise ja pausidega seostuvale ja teistele eesti teksti formaliseeritavate parameetrite uurimustele, mida keeletehnoloogia arenduses seni arvestatud ei ole. Varasema kontrollimiseks võrreldakse ilukirjandusteksti kahe žanri ettelugemise pause ja hingamist ajakirjandusuudise seniste andmetega. Tulemused kinnitavad, et pauside ja sissehingamise kestus ning nende seotus lause süntaktilise liigendusega erineb mitte ainult funktsionaalstiilide, vaid ka žanrite kaupa. Süntaktilist liigendust kannavad seejuures peamiselt kirjavahemärgid. Ilukirjanduse puhul mängib pauside tekkes kaasa teksti lugejapoolne interpretatsioon. Tekst–kõne-sünteesis, mis on mõeldud tekstide ettelugemiseks, tuleks pauside ja hingamise genereerimisel lähtuda pikema ajakirjandusliku uudise kui muudeltki parameetritelt neutraalse tekstiliigi andmetest.

DOI: http://dx.doi.org/10.5128/ERYa4.04

Keywords


pausid; hingamine; funktsionaalstiil; žanr; uudised; ilukirjanduskeel; kõnesüntees; eesti keel

Full Text:

PDF


DOI: http://dx.doi.org/10.5128/ERYa4.04

Refbacks

  • There are currently no refbacks.


Copyright (c) 2012 Krista Kerge, Hille Pajupuu, Kairi Tamuri, Heidi Meier

Creative Commons License
This work is licensed under a Creative Commons Attribution-NonCommercial 4.0 International License.

ISSN 1736-2563 (print)
ISSN 2228-0677 (online)
DOI 10.5128/ERYa.1736-2563