Other translations of this page: None.

2009. a tulemused

Vestlussaadete transkriptsioonisüsteem

Aasta põhitulemuseks oli Eesti raadiote vestlussaadete transkriptsioonisüsteemi prototüübi loomine. Süsteem võimaldab täisautomaatset vestlussaate salvestuse transkribeerimist. Transkribeerimine koosneb järgmistest faasidest:

  • helisalvestuse konverteerimine 16 kHz 16-bitisele kujule, edasiseks töötluseks vajalike tunnusvektorite arvutamine;
  • salvestuse jagamine kõneks, muusikaks,saate alguse- ja vahekõllideks;
  • kõnelõikude grupeerimine vastavalt kõnelejale (ingl. k. speaker diarization);
  • kõnetuvastuse esimene faas kõnelejast sõltumatute akustiliste mudelitega;
  • kõnelejale adapteeritud akustiliste mudelite loomine vastavalt esimeses faasis saadud tuvastushüpoteesidele;
  • kõnetuvastuse teine faas kasutades kõnelejale adapteeritud mudeleid;
  • liitsõnade rekonstrueerimine tuvastatud morfeemijadast.

Süsteemi tuvastuskvaliteeti hinnati nelja vestlussaate salvestuse põhjal (“Olukorrast riigis”, “Keskpäevatund”, “Välismääraja” ning “Kukkuv õun”). Tuvastase sõnavigade osakaal on 36.7% ning tähevigade osakaal 16.1%.

Süsteem on teatud muudatustega kasutatav ka loengu- ja konverentsisalvestuste transkribeerimiseks.

Süsteemi tuvastuskvaliteedi parandamiseks on eelkõige vajalik suurem spontaanse iseloomuga transkribeeritud kõneandmete hulk. See võimaldab sobivamate akustiliste mudelite loomist ning keelemudeli paremat adapteerimist vestlussaadete kõne stiilile.

Valdkonnaspetsiifiline rakendusuuring

AS Cybernetica tellimusel uuriti kõnetuvastuse rakendusvõimalust radioloogia valdkonnas, milles raames realiseeriti valdkonnaspetsiifiline kõnetuvastussüsteem. Süsteemi tuvastuskorrektsuseks saavutati üle 90%.

 
projects/tuvastus/tulemused2009.et.txt · Last modified: 2010/06/03 11:19 by tanel