Other translations of this page: English

Magistri- ja doktoritöö teemad

Nimede häälduse modelleerimine kõnetuvastuses

Mitmesuguste nimede (isiku-, koha-, kaubamärgi- jms) hääldus on eriti võõrnimede puhul äärmiselt varieeruv. Võõrnimesid hääldatakse nii emakeele, nimele vastava võõrkeele kui ka mõne teise võõrkeele reeglite järgi. See tekitab probleeme automaatses kõnetuvastuses, sest sellist varieeruvust hääldussõnastiku loomisel üldjuhul ei arvestata. Selle töö eesmärgiks on nimede häälduse modelleerimise täiustamine, kasutades kogumisel olevat nimehäälduste korpust ja mitmesuguseid masinõppe meetodeid.

Automaatsete kokkuvõtete koostamine kõnesalvestustele

Töö sisuks on pikkadele kõnesalvestustele (loengud, raadiosaated, kõned) automaatsete tekstipõhiste kokkuvõtete genereerimine, kasutades kõnetuvastust ja mitmesuguseid keeletöötlusalgoritme.

Kõnetuvastuse väljundi segmenteerimine jututeemade järgi

Kõnetuvastussüsteemi väljundiks on sõnade jada. Selle töö raames võrreldakse ja implementeeritakse statistilisi algoritme, mis võimaldavad leida pikema kõnesalvestuse (näiteks raadio uudiste- või vestlussaate, või loengusalvetuse) tuvastustulemusest kõige tõenäolisemad jututeema muutused. Sisendina võib kasutada nii puhtalt lingvistilist informatsiooni (näit. sõnade esinemissagedused), kui ka akustilist infot (näit. sõnadevaheliste pauside pikkused).

Kirjavahemärkide lisamine kõnetuvastussüsteemi väljundisse

Töö sisuks on uurida algoritme, mis võimaldavad kirjavahemärkide lisamist kõnetuvastussüsteemi väljundisse, milleks on (osaliselt valesti tuvastatud) sõnade jada. Töö raames peaks võrdlema ja implementeerima algoritme, mis võimaldavad statistilise mudeli treenimist kirjavahemärkide kõige tõenäolisemate asukohtade leidmiseks mitmesugustest treeningandmetest (kirjakeele tekstid, kõneandmebaasid).

Spontaanse kõne hääldusvariatsioonide modelleerimine kõnetuvastuses

Spontaanse kõne hääldus erineb tugevalt dikteeritud kõne hääldusest: selles esineb palju kiirest kõnetempost tingitud kontraktsioone, ebaselget artikulatsiooni ja erinevaid hääldusvariante. Selle töö raames vaadeldakse meetodeid selliste variatsioonide modelleerimiseks kõnetuvastuses, ning sellise mudeli treenimiseks hääliku tasandil transkribeeritud foneetiliste korpuste põhjal.

Graafikaprotsessorite kasutamine [mingis kõnetuvastusüsteemi moodulis]

(Teema võetud)

Tänapäeva võimsad graafikaprotsessorid (GPU) on paljude arvutuste tegemisel traditsioonilistest protsessoritest (CPU) kuni kümneid kordi kiiremad. Selle töö sisuks on mingi konkreetse arvutusmahuka kõnetuvastussüsteemi mooduli (mida kasutatakse kas süsteemi treenimisel või tuvastuses) implementeerimine graafikaprotsessorite abil, kasutades näiteks NVidia CUDA arhitektuuri.

Mingi keeletehnoloogia ülesande paralleliseerimine

Paljud keeletehnoloogia ülesanded kasutavad algoritme, mida rakendatakse väga suurtele teksti- või kõnekorpustele. Kui algoritm implementeerida ühel protsessoril kasutamiseks, võtab andmete töötlemine tihti liiga kaua aega. Selle töö sisuks on mingi labori uurimistöös vajaliku algoritmi paralleliseerimine, mis võimaldaks seda jooksutada paralleelselt mitmel protsessoril ja/või arvutiklastris. Märksõnad: MapReduce, Apache Hadoop

Küsimused: einar@ioc.ee või tanel.alumae@phon.ioc.ee

 
studying/topics.et.txt · Last modified: 2012/09/18 14:40 by tanel