Other translations of this page: None.

2008. a tulemused

ER uudistekorpuse automaatne märgendamine

Eesti Raadio (ER) uudistekorpuse käsitsi märgendamise kiirendamiseks loodi uudiste automaatne transkriptsioonisüsteem. Süsteem kasutab varem välja töötatud eesti keele tuvastusmootorit. Süsteemi akustilised mudelid on treenitud BABEL ning SpeechDat kõneandmebaaside põhjal, mudeleid on adapteeritud väikese hulga juba transkribeeritud uudistesalvestuse põhjal. Süsteemi keelemudel on saadud erinevate ajakirjandus-, ilukirjandus- ning ER uudistetekstide interpolatsiooni tulemusena, interpolatsioonikaalud optimiseeriti olemasolevate ER uudistetekstide põhjal. Konkreetse päeva uudistesaadete transkribeerimiseks luuakse sellele päevale kohandatud keelemudel, milleks kasutatakse ER-st saadud diktorite poolt kasutatud uudistetekste. Keelemudeli sõnavara saamiseks arvutatakse antud päeva uudistetekstidest ning keelemudeli treeningtekstidest morfeemide esinemissagedused, need interpoleeritakse ning sõnavarasse valitakse 40000 sagedasemat morfeemi. Morfeemide häälduse leidmiseks kasutatakse varem välja töötatud reeglipõhist meetodit. Saadud sõnavara põhjal luuakse uus päevaspetsiifiline 3-gramm mudel, mille saamiseks kasutatakse samuti üldise treeningmaterjali ning antud päevale vastavate uudistetekstide interpolatsiooni. Selline keelemudel peaks hõlbustama antud päeva uudistetekstides olevate sõnakombinatsioonide tuvastamist, kuid suutma rahuldavalt toimida ka tekstide puudumise korral. Süsteem on praeguseks täielikult tööle rakendatud.

Kõnelõikude automaatne grupeerimine kõneleja järgi

2008. aastal oli uurimistöö kõnelõikude automaatseks grupeerimiseks kõneleja järgi suunatud uute ja sobivate meetodite leidmisele ning esmasele implementeerimisele. Uurimistöö sisaldas nii üldist kontseptuaalse raamistiku uurimist, kui ka detailsemat meetodite implementeerimist Matlab-i keskkonnas ning erinevate eksperimentide läbiviimist meetodite töökindluse kontrolliks. Töö tulemusena leiti arendussuunad, millele edasises uurimises enam keskenduda, et eri meetodeid kombineerides saavutada võrreldavad tulemused ülesande lahendamiseks ning teisalt tagada lahenduse uudsus kindlustamaks võimalust tulemuste publitseerimiseks.

Olulise lähtekohana võib välja tuua uurimuse kõneinfo talletamisest ajukoores ning kuidas erinevad elementaarseid helistiimuleid töötlevad ajuosade ergastumine viib kontseptuaalse terviku loomiseni, mille tulemusena identifitseeritakse kõnelev persoon (E. Formisano et al., Science, 322, 970). Seega üheks võimalikuks arendussunnaks võiks olla ka kontseptipõhised mudelid, mida kasutatakse andmete analüüsimisel. Välja võiks tuua kontseptuaalse klasterdamise meetodi, mis kasutab aglomeratiivsel klasterdamisel põhinevat õppimist – COBWEB (D. Fisher, Machine Learning, 2, 139). Testiti meetodi juba väljatöötatud rakendust, kuid edasisel rakendamisel on kavas see ka implementeerida võimaldamaks arendust.

Traditsioonilisele üht õppimisalgoritmi kasutavale kujutuvastuse lahendusele pakkus alternatiivi lahendus, kus oli kombineeritud kolm õppimisalgoritmi – valveta (unsupervised) ja valvega (supervised) ning kinnitusega (reinforcement) õppimine (K. Doya, Neural Net., 12, 961). Tulenevalt eelnevast tutvuti kolme meetodi klassiga. Jätkati aglomeratiivsete meetodite klassi kuuluva ja valveta õppimisalgoritmi kasutava iseorganiseeruvate kaartide meetodi kasutamist erinevate ülesannete lahendamisel, et avada andmete varjatud struktuur ja klassifitseerida näited. Iseorganiseeruvate kaartide meetod on kasutusel ka kõnelejate grupeerimisel (I. Lapidot et al., IEEE Trans. on Neural Net., 13(4), 877) ning toimus töö saadud tulemuste kordamise eesmärgil.

Teise komponendina oli vaatluse all tagasisidega ja valvega õppimist kasutav neurovõrk, mis kasutab mitmeväärtuselist aktiveerimisfunktsiooni ja seeläbi suudab jäljendada neuronite erinevaid ergastustasemeid (I. Aizenberg et al., IEEE Trans. on Neural Net., 19(5), 883). Mitmeväärtuseline neurovõrk implementeeriti Matlab-i keskkonnas ning teostati eksperimente tuvastusülesannetega. Ka antud neurovõrku saaks rakendada konkreetsete kõnelejate tuvastamiseks, kui teiste meetoditega on eelnevalt välja selgitatud olulised kõnelejaid eristavaid tunnused.

Oluliste tunnuste väljaselgitamiseks oli kavas rakendada evolutsioonilist lähenemist ning see implementeeriti ülesande raames, kus uuriti agendi juhtimiseks vajalike tagasisideahelate tekkimist loomaks tingimusi proto-semantika tekkeks. Tagasisideahelad võimaldavad eristada erinevate stiimulite olulisust lahendamisel oleva ülesande seisukohast. Väljatöötatud metoodikat on kavas proovida rakendada kõneleja tuvastamisel oluliste tunnuste väljaselgitamiseks ning samuti on see vahendiks kinnitusega õppimise kasutamiseks kolme õppimisalgoritmi kombineeritult kasutava mudeli rakendmaisel.

Edasise uurimistöö on suunatud meetodite koostoime hindamisele ning eksperimentide läbiviimisele.

Osalemine eesti häälkäskluste standardi väljatöötamises

Euroopa Komisjoni eestvedamisel arendatakse info- ja kommunikatsioonitehnoloogia valdkonnas häälkäskluste standardit. Valdavalt suunatud häälkäskluste esitamiseks mobiilides, kuid tulevikus võiks neid kasutada ka näiteks targa kodu juhtimisel. Läbitud on standardi eestikeelse osa arenduse esimeses faas ning läbi on viidud intervjuud, et selgitada välja enimkasutatavad väljendid mingi käskluse esitamiseks ning teostamisel teine faas – intervjuude tulemuste hindamine ja enamkasutatud käskluste selekteerimine. Kõnetehnoloogia labori töö oleks seotud standardi väljatöötamise kolmanda faasiga, mille raames saaks analüüsida kõnetuvastuse seisukohast erinevate sõnade foneetilist eristatavust. Kuid hetkel puudub laboril sisendinformatsioon antud faasis osalemiseks.

 
projects/tuvastus/tulemused2008.et.txt · Last modified: 2009/02/17 18:50 by tanel