Other translations of this page: None.

2012. a põhitulemused

Tänu mitmesugustele arendustöödele (confusion decoding, keelemudeli parandamine) ja treeningamaterjali lisandumisele paranes pikkade kõnesalvestuste tuvastamise kvaliteet, Tuvastusvigade osakaal valdkonniti on toodud järgmises nimekirjas (sulgudes seis 2011. a lõpus):

  • Vestlussaated 25,6% (27.1%)
  • Konverentsikõned 33,0% (33,9%)
  • Telefoniintervjuud 26,6% (29,1%)

Täielikult reimplementeeriti keelemudeli treenimise raamistik. Kui varem kasutati keelemudeli treenimisel tekstide normaliseerimiseks morfoloogilist analüsaatorit, siis nüüd kasutatakse morfoloogilist analüsaatorit ainult liitsõnade tükeldamiseks. Selle muudatuse üheks eesmärgiks oli pärisnimede korrektsem käsitlemine keelemudelis. Varem hoolitses sõnade suure/väikese algustähega kirjutamise eest morfo-analüsaator, nüüd leitakse see sõnade esinemisstatistika ja konteksti statistilise analüüsi põhjal. Kui varem olid paljud pärisnimed tuvastusväljundis väikese tähega (“Jürgen ligi, Einar meister, Katrin rehemaa, Euroopa liit, kesklinna vene gümnaasium, Balti filmi ja meediakool”), siis nüüd on enamus nimesid korrektse algustähega (“Jürgen Ligi, Einar Meister, Katrin Rehemaa, Euroopa Liit, Kesklinna Vene Gümnaasium, Balti Filmi ja Meediakool”).

Kõik nimetatud täiendused on integreeritud avalikku pikkade kõnetuvastuste tuvastamise serverisse. Seda serverit on 2012. a lõpuga seisuga kasutatud kokku üle 11000 salvestuse tuvastamiseks, kogumahuga üle 550 tunni.

Tegeleti mobiilirakenduste edasiarendamisega. Täiendati rakenduste Kõnele ja Arvutaja kasutajaliidest ja funktsionaalsust. Arvutaja kasutajaliides järgib nüüd Android 4.0 kasutajaliidese disaini juhiseid. Arvutajale lisati võimalus kasutada Google'i kõnetuvastusserverit ja sellega seoses ka teiste keelte tugi.

Rakendusel Kõnele oli 2012. a lõpu seisuga üle 3500 kasutaja ja rakendusel Arvutaja üle 1000. Seoses kõnetuvastusrakenduste loomisega said projekti täitjad Tanel Alumäe ja Kaarel Kaljurand aasta Keeleteo auhinna.

Reaalajalise tuvastuse serverit (mida rakendused Kõnele ja Arvutaja kasutavad) on kokku kasutatud üle 100000 korra, tuvastatud kokku üle 130 tunni kõnet.

2012. a töökavas oli plaan teha rakendus “Kõnele” sarnaseks Android 4.0-s oleva Google’i poolt implementeeritud kõnetuvastusega: rakendus peaks kõnelemise ajal kuvama ekraanil juba räägitud kõnest leitud osalise tuvastushüpoteesi, samuti peaks olema võimalik pikemate kõnelõikude (näiteks tervete e-mailide) dikteerimine. Seda ei õnnestunud 2012. a teha seoses Android 4.0 API muudatustega. Nimelt ei paku Android 4.0 dikteerimiseks avalikku APIt, vaid kasutab alati sisseehitatud Google'i kõnetuvastust. Puudub võimalus kasutada dikteerimiseks kolmanda osapoole implementatsiooni. Ainsaks väljapääsuks paistab olevat terve klaviatuurirakenduse implementeerimine, mis on äärmiselt mahukas töö.

Kuigi osad 2012. a töökavas olnud mobiilirakendustega seotud ülesanded jäid tegemata, tehti selles valdkonnas muid töid, mida esialgses kavas ei olnud. Loodi uus rakendus Inimesed, mis võimaldab kõne abil otsida telefoni kontaktide nimekirjast kirjeid. See rakendus eristub teistest seniloodud rakendustest selle poolest, et kõnetuvastust teostatakse telefoni enda riistvara abil, mitte serveris. Sellise rakenduse loomine sisaldus projekti algeesmärkides. Selle rakenduse loomise teine põhieesmärk oli demonstreerida piiratud kuid dünaamiliselt muutuva sõnavaraga lihtsa eestikeelse kõnetuvastusrakenduse loomist. Rakendus on tasuta ja vaba lähtekoodiga.

Eksperimentaalsema suunana testiti mobiili-liidese poolt saadetud metaandmete (näiteks rakenduse kohta, kus kõnetuvastust kasutati) rakendamist keelemudeli adapteerimiseks. Selle idee ajendiks oli tähelepanek, et erinevates rakendustes (näiteks kaardirakendus vs. meeldetuletusrakendus) on väga erinev sõnavara ja lausestruktuur. Osutus, et luues 20-le populaarseimale rakendusele juhendamata adapteerimise abil kohandatud keelemudelid, on võimalik sõnavigade osakaalu vähendada u. 10%. Seda meetodit siiski veel tema küllalt suure ressursinõudlikkuse tõttu avalikus serveris ei rakendata.

Otseselt projekti teemadel avaldati 2012. a neli publikatsiooni rahvusvahelistel konverentsidel.

Pikkade kõnesalvestuste tuvastussüsteemi võttis kasutusele meediamonitooringuga tegelev ettevõte Freqmedia. Kõnetuvastuse rakendamise vastu on huvi üles näidanud ka Riigikogu Kantselei (Riigikogu komisjonide istungite transkribeerimine) ja TTÜ Haridustehnoloogiakeskus (loengute subtitreerimine).

Projektil on eelmiste aastate jäägid kogusummas 2006,64 eurot. See summa on planeeritud arvuti ostuks. Seoses Küberneetika instituudi kohustusega osta arvuteid ainult läbi riigihangete ei õnnestunud seda ostu eelmisel aastal läbi viia, küll aga on plaanis ost teostada esimesel võimalusel sel aastal.

 
projektid/tuvastus2/tulemused2012.et.txt · Last modified: 2013/06/26 16:27 by tanel