Other translations of this page: None.

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

projects:tuvastus:kava2009.et [2009/02/26 15:01]
tanel
projects:tuvastus:kava2009.et [2009/02/26 16:23] (current)
einar
Line 6: Line 6:
  
 Antud töö lõppeesmärgiks on eesti raadio- ja telekanalite jutusaadete arhiivi pidev automaatne transkribeerimine, selle indekseerimine, organiseerimine ja annoteerimine eesmärgiga teha see lõppkasutajale paremini kättesaadavaks. 2009. a on kavas luua olemasolevatel treeningandmetel põhinev transkriptsioonisüsteem, mis rakendab mitmesuguseid tüüpiliselt sellistes süsteemides kasutatavad nn multi-pass meetodid, kus kasutatakse kõnelejapõhist kõnesegmentide grupeerimist ('speaker diarization'), akustiliste mudelite adapteerimist jms. Aasta lõppedes on eesmärgiks süsteemi poolt saadud keskmise tuvastuskvaliteedi hindamine ning tuvastuskvaliteedi parandamiseks vajalike tööde ja ressursside identifitseerimine. Antud töö lõppeesmärgiks on eesti raadio- ja telekanalite jutusaadete arhiivi pidev automaatne transkribeerimine, selle indekseerimine, organiseerimine ja annoteerimine eesmärgiga teha see lõppkasutajale paremini kättesaadavaks. 2009. a on kavas luua olemasolevatel treeningandmetel põhinev transkriptsioonisüsteem, mis rakendab mitmesuguseid tüüpiliselt sellistes süsteemides kasutatavad nn multi-pass meetodid, kus kasutatakse kõnelejapõhist kõnesegmentide grupeerimist ('speaker diarization'), akustiliste mudelite adapteerimist jms. Aasta lõppedes on eesmärgiks süsteemi poolt saadud keskmise tuvastuskvaliteedi hindamine ning tuvastuskvaliteedi parandamiseks vajalike tööde ja ressursside identifitseerimine.
 +
  
  
Line 12: Line 13:
 Antud töö keskendub kõnelejapõhisele kõnesegmentide grupeerimisele ('speaker diarization'). See ülesanne on oluline kõnematerjali automaatse transkribeerimise ühe osana, võimaldades nn valveta ('unsupervised') akustiliste mudelite adapteerimist konkreetsele kõnelejale, mis parandab transkriptsioonikvaliteeti. Antud töö keskendub kõnelejapõhisele kõnesegmentide grupeerimisele ('speaker diarization'). See ülesanne on oluline kõnematerjali automaatse transkribeerimise ühe osana, võimaldades nn valveta ('unsupervised') akustiliste mudelite adapteerimist konkreetsele kõnelejale, mis parandab transkriptsioonikvaliteeti.
  
-Kavas on võtta kasutusele kõnelõike kõneleja järgi automaatset grupeerimist võimaldav tarkvara ning teostada eksperimente kombineerides erinevaid meetodite klasse. Uudse lahendusena on plaanis rakendada tagasiside ja valvega õppimist kasutavat neurovõrku, mis pruugib mitmeväärtuselist  aktiveerimisfunktsiooni, kõnelõikude klassifitseerimisel kõneleja järgi. Tulemusi hinnatakse kasutades standardset kvaliteedi hindamise süsteemi.+Kavas on võtta kasutusele kõnelõike kõneleja järgi automaatset grupeerimist võimaldav tarkvara ning teostada eksperimente kombineerides erinevaid meetodite klasse. Uudse lahendusena on plaanis rakendada tagasiside ja valvega õppimist kasutavat neuronvõrku, mis pruugib mitmeväärtuselist  aktiveerimisfunktsiooni, kõnelõikude klassifitseerimisel kõneleja järgi. Tulemusi hinnatakse kasutades standardset kvaliteedi hindamise süsteemi.
  
  
  
 
projects/tuvastus/kava2009.et.txt · Last modified: 2009/02/26 16:23 by einar