Other translations of this page: None.

2007.a töökava:

  • kõne mikroprosoodilised variatsioonid ja vokaali omakestuse roll kõnetajus
  • spontaanse kõne stukrtuur, pauside klassifikatsioon ja seosed prosoodiliste ning süntaktiliste üksustega
  • aktsendi suuruse ja akustiliste tunnuste hälvete vahelised seosed
  • automaatse segmenteerimise meetodid
  • kõnekvaliteedi automaatne hindamine

2007.a tulemused

Kõne mikroprosoodilised variatsioonid ja vokaali omakestuse roll kõnetajus

Mitmete keelte kohta tehtud uuringute tulemusena on leitud, et kõnes esinevad universaalsed mikroprosoodilised nähtused:

  • madalate vokaalide omakestus on pikem kui kõrgetel vokaalidel
  • madalate vokaalide põhitoon on madalam kui kõrgetel vokaalidel
  • madalate vokaalide intensiivsus on suurem kui kõrgetel vokaalidel

Koostöös S.Werneriga (Joensuu ülikool) on uuritud eesti ja soome keele mikroprosoodilisi nähtusi, eelkõige vokaalide omakestusi ja selle rolli häälikukvaliteedi tajus. Saamaks statistiliselt usaldusväärsemaid mõõteandmeid, teostati täiendavaid omakestuse akustilisi mõõtmisi laboratoorses kõnes (CVC-üksustes). Mõõteandmed täiendavad meie 2006.a avaldatud esmaseid tulemusi omakestuste kohta eesti ja soome keeles.

Omakestuste rolli uurimiseks kõnetajus on lähtutud vene keele kohta avaldatud uurimistulemustest, milles leiti, et kui vokaalikvaliteet on ebamäärane, siis lühema vokaalikestuse korral tajutakse kõrgemat vokaali. Selle hüpoteesi kontrollimiseks eesti- ja soomekeelsete kuulajatega koostati sünteesstiimulite korpus (kasutades Klatt’i formantsünteesi mudelit), mille abil:

  • määrati tajukatses vokaalide /i/ ja /e/ kategooriapiir
  • edasisteks tajutestideks valiti kaks kategooriapiirile lähimat sünteesstiimulit
  • sünteesiti uus korpus, kus stiimulite kestust muudeti 60st kuni 140 ms-ni 20 ms kaupa

Tajutest viidi läbi ABX-meetodil, kus A ja B stiimulid esindasid /i/ ja /e/ sihtväärtusi, X aga muutuva kestusega ebamäärast stiimulit; kuulajateks olid eesti ja soome emakeelega isikud (kummagi keele puhul 10 katseisikut). Tajutesti tulemused näitasid, et vokaalikvaliteedi taju sõltub vokaali kestusest – pikemad vokaalid tajutakse /e/-na, lühemad /i/-na. Seega leidis kinnitust hüpotees, et vokaali omakestus mängib rolli vokaalikategooria tajumisel ka kvantiteedi keelte puhul.

Tulemused on esitatud publikatsioonis:
Werner, Stefan; Meister, Einar (2008). Microdurational influences on perceived vowel quality. In: The Third Baltic Conference on Human Language Technologies 2007 : Kaunas, October 4-5: Vilnius: Lietuviu kalbos institutas, 2008. [ilmumas]

Spontaanse kõne stukrtuur, pauside klassifikatsioon ja seosed prosoodiliste ja süntaktiliste üksustega

Spontaanse kõne temporaalse sturktuuri uurimisel analüüsiti loengukõne prosoodiliste üksuste ja nendevaheliste pauside tunnuseid. Segmenteeritud kõnematerjalis klassifitseeriti järgnevad temporaalsed üksused ja neile vastavad pausid ning leiti nende keskmised kestused:

  • Teema – ühe slaidi esitamiseks kulunud aeg – 70s
  • Teemapaus – slaidivahetusega kaasnev paus – 3s
    • Hingamisrühm – kahe järjestikuse sissehingamise vaheline kõneintervall – 5s
    • Hingamispaus – 1s
      • Prosoodiline rühm – vaikse või täidetud pausiga eraldatud hingamisrühmasisene kõneintervall – 1.2s
      • Prosoodiliste rühmade vaheline paus – 0.4s

Tulemused on esitatud publikatsioonis:
Meister, Einar; Lippus, Pärtel (2008). On temporal organization of spontaneous Estonian: preliminary analysis results of lecture speech. In: The Third Baltic Conference on Human Language Technologies 2007 : Kaunas,October 4-5: Vilnius: Lietuviu kalbos institutas, 2008. [ilmumas]

Et mõõtmistulemused saadi ainult ühe keelejuhi materjali analüüsil, siis ei saa nende alusel teha veel põhjapanevaid üldistusi, vajalik on mitmete keelejuhtide loengukõne analüüs. Temporaalse struktuuri analüüsiks on vajalik segmenteeritud kõnematerjali olemasolu, mida „toodab“ P.Terase projekt „Eesti keele spontaanse kõne foneetiline korpus“. 2007.a lõpuks oli neil segmenteeritud veel kahe keelejuhi loengukõne, mis võimaldab 2008.a teha täiendavat analüüsi ja saada statistiliselt usaldusväärsemaid tulemusi. Ka prosoodiliste üksuste süntaktiliste seoste uurimine on edasi lükatud segmenteeritud materjali vähesuse tõttu.

Aktsendi suuruse ja akustiliste tunnuste hälvete vahelised seosed

Vene aktsendiga eestikeelse kõne analüüsil teostati tajukatseid aktsendi suuruse hindamiseks ja uuriti tajutud aktsendi suuruse ning akustiliste tunnuste hälvete vahelisi seoseid. Uurimismaterjaliks oli 20 keelejuhi eesti keele eksamisalvestused, millest valiti tajukatseks 20 sekundiline lõik iga keelejuhi kõnest. Aktsendi suuruse hindamisel kasutati 6-pallist intervallskaalat, kus:

  • 1 - aktsendita kõne
  • 6 - maksimaalne aktsent

Katseisikuteks olid 20 eesti emakeelega isikut. Tajuhinnangute põhjal reastati keelejuhid tajutud aktsendi suuruse järgi ja võrreldi tavakuulajate hinnaguid foneetikust ekspertide veaanalüüsi tulemustega. Leiti, et tajutud aktsendi suuruse ja veaanalüüsi tulemuste vahel on tugev positiivne korrelatsioon (r=0.942; p< 0.001).
Hääldusvigade analüüs näitas, sagedasemateks vigadeks on temporaalse struktuuri, helilisuse/helituse, häälikukvaliteedi, palatalisatsiooni ja sõnarõhu vead. Vigade esinemissageduse põhjal grupeeriti aktsendiga keelejuhid 5 aktsendigruppi.

Tulemused on esitatud publikatsioonides:
Meister, Lya (2007). Perceptual assessment of the degree of Russian accent. In: Proceedings of the 16th Nordic Conference of Computational Linguistics NODALIDA-2007: (Toim.) Nivre,J. et al.. Tartu: University of Tartu, 2007, 345 - 348.

Meister, Lya; Meister, Einar (2007). Perceptual assessment of Russian-accented Estonian. In: ICPhS XVI : Proceedings of the 16th International Congress of Phonetic Sciences, 6-10 August 2007, Saarbrücken Germany: Saarbrücken: Universität des Saarlandes, 2007, 1717 - 1720.

Automaatse segmenteerimise meetodid

Selle alateema raames võrreldi erinevate automaatse segmenteerimise meetodite tulemusi publitseeritud andmete põhjal ja anti soovitusi vastava prototüübi väljatöötamiseks projekti „Eestikeelse kõnetuvastuse meetodite uurimine ja arendamine" raames. Automaatse segmenteerija prototüüp on kirjeldatud projekti 2007.a tulemustes, programmi kasutamiseks kliki siia.

Kõnetaju mudelite kasutamine kõnekvaliteedi hindamise algoritmides

Automaatne kõnekvaliteedi hindamine on väga oluline erinevate kõnekodeerimisalgoritmide ja kommunikatsioonikanalite võrdlemisel ja arendamisel. ITU (International Telecommunication Union) on standarditeks tunnistanud mitmed algoritmid, mis on rakendatavad eri tüüpi sidekanalite ja kodeerimisviiside puhul. Ülesande püstitus pärineb koostööst Skype’iga neile sobiva algortmi arendamiseks. Töö käigus võrreldi kahe algoritmi – PESQ (Perceptual Evaluation of Speech Quality) ja 3SQM (Single Sided Speech Quality Measure) tulemusi erinevate signaalimoonutuste ja kodeerimisviiside puhul. Uuriti, kuidas on erinevaid psühhoakustilisi tajumehanisme algoritmiliselt modelleeritud ja pakuti välja võimalusi nende edasiarenduseks.

Töö tulemused on esitatud publikatsioonis:
Muskat, Margus; Meister, Einar (2008). Quality estimation of time-scale modified signals. In: The Third Baltic Conference on Human Language Technologies 2007 : Kaunas, October 4-5: Vilnius: Lietuviu kalbos institutas, 2008. [ilmumas]

 
projects/variatiivsus/tulemused2007.et.txt · Last modified: 2008/02/22 13:25 by einar