Other translations of this page: None.

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

projektid:tuvastus2:tulemused2011.et [2012/02/15 16:34]
tanel
projektid:tuvastus2:tulemused2011.et [2012/02/26 15:12] (current)
tanel
Line 35: Line 35:
   * Serveri lähtekood (BSD litsents): https://github.com/alumae/ruby-pocketsphinx-server   * Serveri lähtekood (BSD litsents): https://github.com/alumae/ruby-pocketsphinx-server
   * Java teek serveriga suhtlemiseks (LGPL litsents): http://code.google.com/p/net-speech-api   * Java teek serveriga suhtlemiseks (LGPL litsents): http://code.google.com/p/net-speech-api
 +
  
 ==== Juhendamata andmete kasutamine ==== ==== Juhendamata andmete kasutamine ====
Line 43: Line 44:
  
 Juhendmata andmete kasutamine andis siiski häid tulemusi mobiilirakenduste juures. Esialgu kasutasime reaalajalise tuvastuse serveris, mida kasutavad rakendused “Kõnele” ja “Arvutaja”, raadiote vestlussaadetele optimeeritud mudeleid. Nädal pärast rakenduste avalikustamist võtsime serveri logidest kõik tuvastuseks saadetud helifailid, ning transkribeerisime need täpse ja mitmesammulise tuvastusmootori abil. Saadud (vigaste) transkriptsioonide põhjal lõime uued, mobiilirakendustele adapteeritud akustilised mudelid ning optimiseerisime ka statistilise keelemudeli. See andis märgatava tuvastuskvaliteedi paranemise -- tuvastuvigade osakaal (word error rate) langes 44%-lt 29%-le. Juhendmata andmete kasutamine andis siiski häid tulemusi mobiilirakenduste juures. Esialgu kasutasime reaalajalise tuvastuse serveris, mida kasutavad rakendused “Kõnele” ja “Arvutaja”, raadiote vestlussaadetele optimeeritud mudeleid. Nädal pärast rakenduste avalikustamist võtsime serveri logidest kõik tuvastuseks saadetud helifailid, ning transkribeerisime need täpse ja mitmesammulise tuvastusmootori abil. Saadud (vigaste) transkriptsioonide põhjal lõime uued, mobiilirakendustele adapteeritud akustilised mudelid ning optimiseerisime ka statistilise keelemudeli. See andis märgatava tuvastuskvaliteedi paranemise -- tuvastuvigade osakaal (word error rate) langes 44%-lt 29%-le.
-Pikkade kõnesalvestuste tuvastamise kvaliteet+ 
 + 
 +==== Pikkade kõnesalvestuste tuvastamise kvaliteet ==== 
 + 
 Tänu aasta jooksul tehtud täiustustele ning uute treeningandmete lisandumisele paranes ka pikkade kõnesalvestuste transkribeerimise kvaliteet. Allolevas tabelis on toodud sõnavigade osakaal mitme erinevat tüüpi testvalimi puhul (kasutades kolmesammulist adapteerimisega tuvastust). Võrdluseks on toodud ka 2010. a lõpu seis: Tänu aasta jooksul tehtud täiustustele ning uute treeningandmete lisandumisele paranes ka pikkade kõnesalvestuste transkribeerimise kvaliteet. Allolevas tabelis on toodud sõnavigade osakaal mitme erinevat tüüpi testvalimi puhul (kasutades kolmesammulist adapteerimisega tuvastust). Võrdluseks on toodud ka 2010. a lõpu seis:
  
-  * Raadiote vestlussaated: xx (2010: 28,6) +  * Raadiote vestlussaated: 26,1 (2010: 28,6) 
-  * Konverentsiettekanded: 34,(2010: 37,1) +  * Konverentsiettekanded: 33,(2010: 37,1) 
-  * Telefoniintervjuud raadios: xx (2010: -)+  * Telefoniintervjuud raadios: 29,1 (2010: -)
 
projektid/tuvastus2/tulemused2011.et.1329316493.txt.gz · Last modified: 2012/02/15 16:34 by tanel