Other translations of this page: None.

This is an old revision of the document!


Jutusaadete ja loengute transkribeerimise juhend

See juhend põhineb väga suures osas prantsusekeelsele juhendil, väikeste erinevustega kõhkluste jms märgendamise osas. Pranstuskeelne juhend on päris hästi loetav inglise keeles Google Translate abil.

Struktureerimine

Salvestus jaotatakse sektsioonideks, “kõneüksusteks” (speaker turn) ja lõpuks väiksemateks, lausesarnasteks osadeks.

Sektsioone on kolme tüüpi: report, filler ja non-trans. Meie põhimõte on selline, et report on sektsioon kõnega, filler on sektsioon muusikaga, vahekõllide ja muu sellisega ja non-trans on lihtsalt selline sektsioon, mida pole transkribeeritud. Näiteks kui salvestus on transkribeeritud osaliselt, siis märgendamata sektsioonid on non-trans tüüpi.

Report-tüüpi sektsioonidel tuleks määrata ka teema (topic). Seega, kui vestlussaates teema muutub, siis tuleb teha uus sektsioon. Teemavahetustesse võib suhtuda üsna vabalt. Näiteks saates “Olukorrast riigis” käsitletakse tavaliselt mingeid kindlaid teemasid. Mõnes teises saates võibki aga olla ainult üks teema. Teema nimed võib ka oma äranägemise järgi panna (näiteks “Töölepinguseadus”, “Europarlamendi valimised”, “Gruusia”). Saate alguses või lõpus olevale üldisele jutule pole vaja teemat panna.

Kõneüksused (speaker turns) vastavad ühe konkreetse kõneleja kõnele. Seega, uus kõneüksus tuleb tekitada siis, kui kõneleja muutub (või uue report-sekstiooni alguses), vajutades Ctrl-T. Avanenud dialoogis tuleks ka täita ära kõnela atribuutide osa (sugu, kvaliteet, spontaanne/mitte-spontanne jne).

Lõpuks tuleks kõneüksused jagada lausesarnasesteks osadeks. Siin on juhised üsna vabad. Ühe osa pikkus võiks olla umbes 5-20 sekundit. Uue osa võiks tekitada siis, kui kõnes on pikem paus, näiteks hingamispaus. Hingamispausi puhul tuleks vaadata kindlasti seda, et kui märgendatakse ka hingamispausis olev kuuldav hingamine ([r]), siis osadevaheline piir peaks ajas olema mitte hingamispausi keskel, vaid lõpus, ning märgendus [r] peab siis jääma lõppenud osa lõppu, mitte uue osa algusesse.

Kõne transkribeerimine

Kõne transkribeerimisel on suureks abiks TAB, Alt-TAB, Shift-TAB ja muud sellised klahvikombinatsioonid, mida siin pikalt ei tutvustata, inglisekeelses juhendis on see olemas.

Trankribeerimisel kasutada ortograafilist transkriptsiooni, s.t. kirjutada sõnad nii nagu tavaliselt kirjapildis. Numbrid kirjutatakse lahti, ning lisatakse sponaanse kõne elemente (kõhklused, hingamised, pooleldi välja hääldatud sõnad) tähistavad märgendused.

Sponaatnses kõnes teatavasti lause mõiste puudub, või on väga hägune. Siiski võiks oma äranägemise järgi komasid ja punkte sõnade vahele panna, nii et laused oleks grammatiliselt võimalikult korrektsed.

Erinevalt prantsuskeelsest juhendist kirjutame meie lause alguse sõna suure tähega, nagu ikka. Kirjavahemärkide ette tühikut panna pole vaja.

Nimesid tähistavad lühendid e. akronüümid kirjutada “nii nagu ikka”, hoolimata sellest, kas neid hääldatakse tähthaaval või mitte: “NATO, Eesti NSV, KGB, OSCE”. Kui lühendit hääldatakse “sõnana”, mitte tähthaaval, ning ta pole NATO, NASA, BICO, ETA, EMKE, ERSO, siis peaks lisama lühendi häälduse: pärast sõna kirjutamist võtta menüüst “Insert event” (Ctrl-D), valida dialoogiaknas: “Pronunce”, “Apply to previous word”, ning kirjutada tekstikasti hääldus ortograafilises transkriptsioonis. Siis peaks tekkima umbes selline transkriptsioon, näiteks:

  • FIFA +[pron=fifa]
  • CD-ROM +[pron=tseederomm]
 
projects/tuvastus/trans-juhend.et.1245147405.txt.gz · Last modified: 2009/06/16 13:16 by tanel