Other translations of this page: None.

2014. a töökava

2014. a on projekti viimane aasta ning seetõttu on kavas eelkõige tähelepanu pöörata projekti esialgses töökavas püstitatud eesmärkide täitmisele.

Offline kõnetuvastussüsteemi puhul on 2011. a püstitatud eesmärgid saavutatavale täpsusele juba täidetud. Sellegipoolest kavatseme ka sel aastal tegutseda selle kõnetuvastussüsteemi täiustamise kallal. Eelkõige on kavas kasutusele võtta selliseid meetodeid, mis viimastel aastatel muude keelte puhul häid tulemusi on andnud: paremini optimiseeritud närvivõrgupõhised akustilised mudelid (kasutades treenimise kiirendamiseks graafikaprotsessoreid), keelemudeli parem optimiseerimine jms. Uueks eemärgiks on saavutada raadio- ja telesaadete automaatse transkribeerimise puhul stabiilselt alla 20% sõnavigade osakaal.

Implementeeritakse tuvastatud teksti automaatne varustamine kirjavahemärkidega. Selleks rakendatakse masinõppepõhist lähenemist, kus kasutatakse nii leksikaalset kui ka akustilist infot optimaalsete kirjavahemärkide jada leidmiseks. Kirjavahemärgistaja integreeritakse olemasoleva offline kõnetuvastussüsteemiga.

Täiesti uue suunana on kavas implementeerida offline kõnetuvastussüsteemi moodul, mis seostab iga kõnesegmendiga kõneleja nime. Praegune süsteem juba teostab kõneleja-põhist kõne segmenteerimist, kuid ilma kõneleja nimedeta – kõnesegmendid lihtsalt klasterdatakse kõneleja järgi. Uueks eemärgiks on seega leida ka igale klastrile vastav inimese nimi. Vajadust sellise süsteemi järele on ilmutanud meediamonitooringufirmad, kes on offline kõnetuvastussüsteemi põhilised kasutajad. Kõneleja identifitseerimiseks rakendatakse masinõppesüsteemi, mis kasutatab kahte allikat: kõnekorpuse põhjal koostatud sagedamini esinevate kõnelejate akustilisi mudeleid ning leksikaalset infot kõnesalvestusest (näit. kui raadiosaates esineb lausung “stuudiokülaline on täna Andrus Veerpalu”, siis sellest saab järeldada, et üks kõnelejatest võib suure tõenäosusega olla Andrus Veerpalu). On siiski selge, et selline süsteem saab toimida ainult teatud tüüpi kõnesalvestuste puhul: kui kõnes puudub igasugune lingvistiline info kõneleja nime koha, ning kõneleja hääl on süsteemile tundmatu, siis kõneleja nime identifitseerida ei saa.

Täiendatakse veebipõhise kõnetuvastuse kasutajaliidest. Eesmärgiks on saavutada olukord, kus kõnetuvastust saaks lihtsalt kasutada suvalise internetisaidi iga tekstivälja täitmiseks, ilma vajaduseta, et vastav veebisait oleks kõnetuvastuse oma lehekülgedega integreerinud. See võimaldaks näiteks dikteerida e-kirju gmail.com keskkonnas, dikteerida kommentaare postimees.ee lehekülgedel jne. Sellise kasutajakogemuse implementeerimiseks paistab olevat kaks võimalust: nn. boorkmarklet või veebibrauseri laiendus. Eksperimentide käigus valitakse kõige kasutajasõbralikum lahendus. Samuti on kavas teha veebipõhine kõnetuvastus reaalselt kasutavamaks, lisades kirjavahemärkide dikteerimise toe.

 
projektid/tuvastus2/tookava2014.et.txt · Last modified: 2014/02/28 12:37 by tanel