Other translations of this page: None.

Jutusaadete ja loengute transkribeerimise juhend

See juhend põhineb väga suures osas prantsusekeelsel juhendil, väikeste erinevustega kõhklushäälitsuste jms märgendamise osas. Prantsuskeelne juhend on päris hästi loetav inglise keeles Google Translate abil.

Struktureerimine

Salvestus jaotatakse sektsioonideks, “kõneüksusteks” (speaker turn) ja lõpuks väiksemateks, lausesarnasteks osadeks.

Sektsioone on kolme tüüpi: report, filler ja non-trans. Meie põhimõte on selline, et report on sektsioon kõnega, filler on sektsioon muusikaga, vahekõllide ja muu sellisega ja non-trans on lihtsalt selline sektsioon, mida pole transkribeeritud. Näiteks kui salvestus on transkribeeritud osaliselt, siis märgendamata sektsioonid on non-trans tüüpi.

Report-tüüpi sektsioonidel tuleks määrata ka teema (topic). Seega, kui vestlussaates teema muutub, siis tuleb teha uus sektsioon. Teemavahetustesse võib suhtuda üsna vabalt. Näiteks saates “Olukorrast riigis” käsitletakse tavaliselt mingeid kindlaid teemasid. Mõnes teises saates võibki aga olla ainult üks teema. Teema nimed võib ka oma äranägemise järgi panna (näiteks “Töölepinguseadus”, “Europarlamendi valimised”, “Gruusia”). Saate alguses või lõpus olevale üldisele jutule pole vaja teemat panna.

Kõneüksused (speaker turns) vastavad ühe konkreetse kõneleja kõnele. Seega, uus kõneüksus tuleb tekitada siis, kui kõneleja muutub (või uue report-sekstiooni alguses), vajutades Ctrl-T. Avanenud dialoogis tuleks ka täita ära kõnela atribuutide osa (sugu, kvaliteet, spontaanne/mitte-spontanne jne).

Lõpuks tuleks kõneüksused jagada lausesarnasesteks osadeks (seda saab lihtsalt teha vajutades õiges kohas Enter). Siin on juhised üsna vabad. Ühe osa pikkus võiks olla umbes 5-20 sekundit. Uue osa võiks tekitada siis, kui kõnes on pikem paus, näiteks hingamispaus. Hingamispausi puhul tuleks vaadata kindlasti seda, et kui märgendatakse ka hingamispausis olev kuuldav hingamine ([r]), siis osadevaheline piir peaks ajas olema mitte hingamispausi keskel, vaid lõpus, ning märgendus [r] peab siis jääma lõppenud osa lõppu, mitte uue osa algusesse.

Kõne transkribeerimine

Kõne transkribeerimisel on suureks abiks TAB, Alt-TAB, Shift-TAB ja muud sellised klahvikombinatsioonid, mida siin pikalt ei tutvustata, inglisekeelses juhendis on see olemas.

Trankribeerimisel kasutada ortograafilist transkriptsiooni, s.t. kirjutada sõnad nii nagu tavaliselt kirjapildis. Numbrid kirjutatakse lahti, ning lisatakse sponaanse kõne elemente (kõhklused, hingamised, pooleldi välja hääldatud sõnad) tähistavad märgendused.

Spontaanses kõnes teatavasti lause mõiste puudub, või on väga hägune. Siiski võiks oma äranägemise järgi komasid ja punkte sõnade vahele panna, nii et laused oleks grammatiliselt võimalikult korrektsed.

Erinevalt prantsuskeelsest juhendist kirjutame meie lause alguse sõna suure tähega, nagu ikka. Kirjavahemärkide ette tühikut panna pole vaja.

Nimesid tähistavad lühendid e. akronüümid kirjutada “nii nagu ikka”, hoolimata sellest, kas neid hääldatakse tähthaaval või mitte: “NATO, Eesti NSV, KGB, OSCE, H1N5”. Kui lühendit hääldatakse “sõnana”, mitte tähthaaval, ning ta pole NATO, NASA, ETA (need on teada erandid), siis peaks lisama lühendi häälduse: pärast sõna kirjutamist võtta menüüst “Insert event” (Ctrl-D), valida dialoogiaknas: “Pronounce”, “Apply to previous word”, ning kirjutada tekstikasti hääldus ortograafilises transkriptsioonis. Siis peaks tekkima umbes selline transkriptsioon:

FIFA +[pron=fifa] ''  
CD-ROM +[pron=tseederomm]''

Internetiaadressid ja e-maili aadressid transkribeerida sarnaselt, kuid lisada (URL:) prefiks hääldusele, tekkima peaks midagi sellist:

www.delfi.ee +[pron=(URL:) VVV delfi EE]
www.google.com +[pron=(URL:) WWW punkt guugl punkt komm]
kaisukaru@hotmail.com +[pron=(URL:) kaisukaru ät hotmeil punkt komm]

VVV kirjutada siis kui hääldatakse “veeveevee”, mitte “kaksisvee kaksisvee ..”, nagu oleks tegelikult õige. Õigesti tuleks märgendada, kas öeldi “punkt” seal osade vahel, või mitte.

Konkreetselt valesti hääldatud sõnu võib märgistada Insert event abil nii:

Rakvere +[pron=rakreve]

Kui sõna on hääldatud lihtsalt lohakalt, siis võib jätta ainult ortograafilise kujule.

Võõrkeelse sõna tähistamiseks võtta jälle “Insert event..”, valida “Type=language”, tekstkasti näiteks “English” ja “Apply to previous word”, nii et tekib midagi sellist:

cybernetics +[lang=English]

Pikema võõrkeelse sõnadejada tähistatamiseks valida see enne Insert event.. klikkamist, ning võtta “Apply to selection”, tekib midagi sellist:

Muusikastiili nimi on [lang=English] easy listening [-lang=English]

Võõrnimede puhul tuleks lisada nende eestipärane hääldus Insert event abil:

[pron=mahmuud abaasi-]Mahmoud Abbasi[-pron=mahmuud abaasi]

Osaliselt välja öeldud sõna transkribeerimiseks kasutada sellist konventsiooni: näiteks kui kõneleja ilmselt üritab öelda “küberneetika”, aga hääldab välja ainult “küberneet”, siis väljaütlemata osa panna sulgudesse, ilma tühikuta:

küberneet(ika)

Kui ei ole selge, mida ta üritas öelda, siis on lihtsalt tühjad sulud:

küberneet()

Sama võib teha ära kadunud sõna algusega:

(kü)berneetika 

või

()berneetika

Kui ei saa üldse aru, mis öeldi, siis võib panna lihtsalt tühjad sulud: (). Sõna keskel häälduses kaduvat osa märgendada ortograafiliselt, näiteks:

kakskümmend

mitte

kaksk(ümme)end

Kõhklused (“ee”, “öö”), hingamised, köhatused ja suumatsutused tuleks tähistada vastavalt [b], [r], [bg] ja [bb]. Neid saab sisestada Insert event→Isolated noise abil, või shortcutiga (näiteks [b] saab vajutades Alt-b, neid saab ise konfigureerida). Kõiki selliseid mürasid pole vaja märgendada, piisab paremini kuuldaolevatest.

Muusika, reklaamid ja vahekõllid

Pikem muusika tähistada nii: [musique]

Saate alguse või vahekõll: [jingle]

Neid samuti mitte otse välja kirjutada, vaid lisada Insert event→Isolated noise abil.

Muusika ja vahekõllid peaks olema ka eraldi filler-tüüpi sekstioonis, mitte report-tüüpi sektsiooni sees.

Tihti on saatealguskõllis ka mingi kõne. Seda ei pea transkribeerima.

Kui jutu taustal kostab vaikne muusika (tihti saate sissejuhatavas osas), siis transkribeerida kõne nagu tavaliselt, kuid märkida ta Insert event → Overlapping noise abil, nii et tekib midagi sellist:

[musique-]Tänases saates[-musique]

Samaaegne kõne

Sellised lõigud, kus kaks või rohem inimest samaaegselt räägivad, tuleb teha eraldi sektsioonideks, sektsiooni omadustes määrata “Overlapping speech”. Kõnet ennast pole vaja transkribeerida, sektsiooni võib tühjaks jätta.

Kui ühe inimese kõne on tunduvalt valjum kui taustalkõneleja oma (näiteks kui taustal kostub nõustuvaid “mühatusi”), siis pole vaja uut sekstsiooni tekitada. Samuti, kui samaaegsus on väga lühike (alla poole sekundi, tihti siis, kui üks kõneleja alustab lauset kui teine pole veel päris lõpetanud), siis transkribeerida ainult valjemalt kõnelaja osa.

 
projects/tuvastus/trans-juhend.et.txt · Last modified: 2009/07/01 18:48 by tanel