Other translations of this page: None.

2009. a töökava

Eesti raadiote jutusaadete automaatse transkriptioonisüsteemi prototüübi loomine

Viimastel aastatel on paljud Eesti raadio- (Vikerraadio, R2, Raadio Kuku) ja telekanalid (ETV) alustanud eetris kõlanud jutusaadete arhiveerimist ning nende avalikkusele hilisemaks kuulamiseks Internetis kättesaadavaks tegemist. Tihti on info uute saadete ilmumise kohta publitseeritud RSS-voona, mis hõlbustab kasutajal nende olemasolu märkamist nn 'podcasting'-trakvara abil. Kõneandmete iseloom teeb aga nende automaatse käsitsi märgendamise, indekseerimise, organiseerimise ja nendest olulise info leidmise väga aeganõudvaks. Nii iseloomustab arhiveeritud raadiosaateid tavaliselt ainult maksimaalselt paarilauseline kokkuvõtte. Ainsaks võimaluseks saadete sisust täpsema ülevaate saamiseks on nende läbikuulamine.

Antud töö lõppeesmärgiks on eesti raadio- ja telekanalite jutusaadete arhiivi pidev automaatne transkribeerimine, selle indekseerimine, organiseerimine ja annoteerimine eesmärgiga teha see lõppkasutajale paremini kättesaadavaks. 2009. a on kavas luua olemasolevatel treeningandmetel põhinev transkriptsioonisüsteem, mis rakendab mitmesuguseid tüüpiliselt sellistes süsteemides kasutatavad nn multi-pass meetodid, kus kasutatakse kõnelejapõhist kõnesegmentide grupeerimist ('speaker diarization'), akustiliste mudelite adapteerimist jms. Aasta lõppedes on eesmärgiks süsteemi poolt saadud keskmise tuvastuskvaliteedi hindamine ning tuvastuskvaliteedi parandamiseks vajalike tööde ja ressursside identifitseerimine.

Uuringud kõnelejapõhise kõnesegmentide grupeerimise alal

Antud töö keskendub kõnelejapõhisele kõnesegmentide grupeerimisele ('speaker diarization'). See ülesanne on oluline kõnematerjali automaatse transkribeerimise ühe osana, võimaldades nn valveta ('unsupervised') akustiliste mudelite adapteerimist konkreetsele kõnelejale, mis parandab transkriptsioonikvaliteeti.

Kavas on võtta kasutusele kõnelõike kõneleja järgi automaatset grupeerimist võimaldav tarkvara ning teostada eksperimente kombineerides erinevaid meetodite klasse. Uudse lahendusena on plaanis rakendada tagasiside ja valvega õppimist kasutavat neuronvõrku, mis pruugib mitmeväärtuselist aktiveerimisfunktsiooni, kõnelõikude klassifitseerimisel kõneleja järgi. Tulemusi hinnatakse kasutades standardset kvaliteedi hindamise süsteemi.

 
projects/tuvastus/kava2009.et.txt · Last modified: 2009/02/26 16:23 by einar