Kõnetehnoloogia vajab žanrilist lähenemist
Abstract
Oleme varasemas uurimuses näidanud, et ettelugemisel seostuvad pausid ja hingamine kui etteloetud teksti loomulikkuse tunnused tugevasti funktsionaalstiiliga (ajakirjandustekst, ilukirjandustekst). Tekstiuurimuse andmestik aitab muuta loomulikuks sünteeskõne, kuid ka tuvastada tekstiliiki ehk žanrit, eristada funktsionaalstiile ja autorite sõnastuslaadi ning muuta otstarbekamaks sõnastiku ja grammatika kasutuse teksti automaatses analüüsis. Artiklis osutatakse hingamise ja pausidega seostuvale ja teistele eesti teksti formaliseeritavate parameetrite uurimustele, mida keeletehnoloogia arenduses seni arvestatud ei ole. Varasema kontrollimiseks võrreldakse ilukirjandusteksti kahe žanri ettelugemise pause ja hingamist ajakirjandusuudise seniste andmetega. Tulemused kinnitavad, et pauside ja sissehingamise kestus ning nende seotus lause süntaktilise liigendusega erineb mitte ainult funktsionaalstiilide, vaid ka žanrite kaupa. Süntaktilist liigendust kannavad seejuures peamiselt kirjavahemärgid. Ilukirjanduse puhul mängib pauside tekkes kaasa teksti lugejapoolne interpretatsioon. Tekst–kõne-sünteesis, mis on mõeldud tekstide ettelugemiseks, tuleks pauside ja hingamise genereerimisel lähtuda pikema ajakirjandusliku uudise kui muudeltki parameetritelt neutraalse tekstiliigi andmetest.
DOI: http://dx.doi.org/10.5128/ERYa4.04Keywords
Full Text:
PDFDOI: http://dx.doi.org/10.5128/ERYa4.04
Refbacks
- There are currently no refbacks.
Copyright (c) 2012 Krista Kerge, Hille Pajupuu, Kairi Tamuri, Heidi Meier
This work is licensed under a Creative Commons Attribution-NonCommercial 4.0 International License.
ISSN 1736-2563 (print)
ISSN 2228-0677 (online)
DOI 10.5128/ERYa.1736-2563