Other translations of this page: None.

2013. a töökava

Projekti raames on juba välja töötatud mitmesuguseid avalikke rakendusi. Siiski takistab praegune kõnetuvastuskvaliteet rakenduste laiemat kasutust. Üheks selle aasta põhisuunaks on keskendumine tuvastuskvaliteedi parandamisele. Selleks on kavas tuvastussüsteemis implementeerida mujal maailmas ennast tõestanud keerulisemaid meetodeid, mis peaks tuvastuskvaliteeti märgatavalt parandama.

Akustiliste mudelite treenimisel on kavas kasutusele võtta närvivõrkude abil arvutatud tunnusvektorid, mis on viimastel aastatel laialdast tähelepanu leidnud. Mitmed uuringud on näidanud, et närvivõrkude abil treenitud akustiliste tunnuste kasutamisel õnnestub tuvastusvigade arvu vähendada 10-30%.

Samuti eksperimenteerime akustiliste mudelite diskriminatiivse treenimise meetoditega ja/või keerulisemate adapteerimisalgoritmidega.

Ka keelemudeli juures kavatseme rakendada täiustatud meetodeid (näit. närvivõrkude põhine keelemudel, maksimaalse entroopia põhine keelemudel või nende kombinatsioon).

Nimetatud meetodid peaksid suure kindlusega vähendama tuvastusvigade arvu just viletsama kvaliteediga kõne puhul. Nende integreerimine praegu kasutusel olevatesse kõnetuvastusmootoritesse pole siiski väga lihtne ja seetõttu kulub projekti töö põhimaht sellele.

Kuna EKT projektis “Kõne- ja multi-modaalsed korpused” on 2013. a kavas koguda ja transkribeerida ka televisiooni vestlussaateid, siis plaanime kõnetuvastust testida ja kvalitatiivselt hinnata just seda tüüpi andmete põhjal, lisaks senikasutatud kolme tüüpi andmetele.

Kuna TTÜ Haridustehnoloogiakeskusel on suur huvi kasutada kõnetuvastust loengusalvestuste subtitreerimiseks, kavatseme uurida ka seda suunda. Testime loengute transkribeerimise praegust kvaliteeti, hindame mitmesuguse lisamaterjali (olemasolevad käsitsi loodud subtiitrid, konspektid, õpikutekstid) kasutusvõimalusi süsteemi adapteerimiseks loengukõnele.

2013. a on siiski ka kavas arendada edasi rakendusi. Uurime edasi reaalajalise tagasisidega dikteerimise implementeerimise võimalusi Android platvormil. Teise suunana soovime implementeerida reaalajalise dikteerimise toe veebibrauserisse. Eesmärk on luua kõikidel operatsioonisüsteemidel töötav brauserilaiendus, mis kasutab reaalajalise kõnetuvastuse serverit, et võimaldada kasutada veebibrauseris kõnetuvastust tekstiväljade täitmiseks.

 
projektid/tuvastus2/tookava2013.et.txt · Last modified: 2013/06/26 16:28 by tanel