Other translations of this page: None.

2010. a põhitulemused

2010. aastal keskenduti prototüüpide väljatöötamisele. Tegeleti suure sõnavaraga kõnetuvastuse, ning täisautomaatse pikkade kõnesalvestuste transkribeerimissüsteemi loomisega. Praeguseks on arendatud välja süsteem, mis automaatselt segmenteerib pika helisalvestuse lühemateks lõikudeks, klassifitseerib saadud lõigud kõneks ja mitte-kõneks (näit. muusika), grupeerib kõnelõigud kõnelejate järgi, ning transkribeerib kõnelõigud, kasutades kolmesammulist tuvastust, kus pärast igat sammu arvutatakse igale kõnelejale uued adapteeritud akustilised mudelid. Adapteerimise abil õnnestub tuvastusvigade arvu umbes 15% võrra vähendada. Sellise tuvastusstrateegia abil saavutatavat tuvastuskvaliteeti on hinnatud kolme liiki testandmete põhjal: raadiouudiste salvestuste puhul on valesti tuvastatud sõnu 14.9%, raadiote vestlussaadete puhul 28.6% ning keeletehnoloogia konverentsi ettekannete salvestuste puhul 37.1%.

Realiseeriti kaks eelpoolkirjeldatud tuvastustehnoloogiat kasutavat prototüüpi:

  • Kõnesalvestuste transkriptsioonide sirvimist, salvestuste kuulamist, ning nendest otsingut võimaldav veebirakendus, millega saab tutvuda aadressil http://bark.phon.ioc.ee/tsab. Veebirakenduse lähtekood on saadaval AGPL litsensi alusel.
  • Veebirakendus, mille kaudu saavad lõppkasutajad rakendada kõnetuvastustehnoloogiat oma helifailide automaatseks transkribeerimiseks. Veebipõhise kasutajaliidese kaudu saab kõnet sisaldavaid helifaile saata labori serverisse transkribeerimisele. Transkriptsioon saadetakse kasutaja e-mailile.

Projekti raames arendatud meetodeid kasutades implementeeriti ka kõnetuvastussüsteemi prototüüp radioloogidele (koostöös AS-iga Cybernetica), mis esmastes eksperimentides on andnud väga häid tulemusi (vähem kui 10% sõnavigu adapteerimata ning reaalajalise tuvastuse puhul).

Teadustöö raames tegeleti statistilise kõnetuvastuse keelemudeli adapteerimisega, mis on eelpool kirjeldatud rakendustes väga aktuaalne. Tulemused publitseeriti rahvusvaheliste konverentside kogumikes.

 
projects/tuvastus/tulemused2010.et.txt · Last modified: 2011/09/14 12:51 by tanel