Mitmesuguste nimede (isiku-, koha-, kaubamärgi- jms) hääldus on eriti võõrnimede puhul äärmiselt varieeruv. Võõrnimesid hääldatakse nii emakeele, nimele vastava võõrkeele kui ka mõne teise võõrkeele reeglite järgi. See tekitab probleeme automaatses kõnetuvastuses, sest sellist varieeruvust hääldussõnastiku loomisel üldjuhul ei arvestata. Selle töö eesmärgiks on nimede häälduse modelleerimise täiustamine, kasutades kogumisel olevat nimehäälduste korpust ja mitmesuguseid masinõppe meetodeid.
Töö sisuks on pikkadele kõnesalvestustele (loengud, raadiosaated, kõned) automaatsete tekstipõhiste kokkuvõtete genereerimine, kasutades kõnetuvastust ja mitmesuguseid keeletöötlusalgoritme.
Kõnetuvastussüsteemi väljundiks on sõnade jada. Selle töö raames võrreldakse ja implementeeritakse statistilisi algoritme, mis võimaldavad leida pikema kõnesalvestuse (näiteks raadio uudiste- või vestlussaate, või loengusalvetuse) tuvastustulemusest kõige tõenäolisemad jututeema muutused. Sisendina võib kasutada nii puhtalt lingvistilist informatsiooni (näit. sõnade esinemissagedused), kui ka akustilist infot (näit. sõnadevaheliste pauside pikkused).
Töö sisuks on uurida algoritme, mis võimaldavad kirjavahemärkide lisamist kõnetuvastussüsteemi väljundisse, milleks on (osaliselt valesti tuvastatud) sõnade jada. Töö raames peaks võrdlema ja implementeerima algoritme, mis võimaldavad statistilise mudeli treenimist kirjavahemärkide kõige tõenäolisemate asukohtade leidmiseks mitmesugustest treeningandmetest (kirjakeele tekstid, kõneandmebaasid).
Spontaanse kõne hääldus erineb tugevalt dikteeritud kõne hääldusest: selles esineb palju kiirest kõnetempost tingitud kontraktsioone, ebaselget artikulatsiooni ja erinevaid hääldusvariante. Selle töö raames vaadeldakse meetodeid selliste variatsioonide modelleerimiseks kõnetuvastuses, ning sellise mudeli treenimiseks hääliku tasandil transkribeeritud foneetiliste korpuste põhjal.
(Teema võetud)
Tänapäeva võimsad graafikaprotsessorid (GPU) on paljude arvutuste tegemisel traditsioonilistest protsessoritest (CPU) kuni kümneid kordi kiiremad. Selle töö sisuks on mingi konkreetse arvutusmahuka kõnetuvastussüsteemi mooduli (mida kasutatakse kas süsteemi treenimisel või tuvastuses) implementeerimine graafikaprotsessorite abil, kasutades näiteks NVidia CUDA arhitektuuri.
Paljud keeletehnoloogia ülesanded kasutavad algoritme, mida rakendatakse väga suurtele teksti- või kõnekorpustele. Kui algoritm implementeerida ühel protsessoril kasutamiseks, võtab andmete töötlemine tihti liiga kaua aega. Selle töö sisuks on mingi labori uurimistöös vajaliku algoritmi paralleliseerimine, mis võimaldaks seda jooksutada paralleelselt mitmel protsessoril ja/või arvutiklastris. Märksõnad: MapReduce, Apache Hadoop
Küsimused: einar@ioc.ee või tanel.alumae@phon.ioc.ee