Other translations of this page: None.

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

projects:tuvastus:trans-juhend.et [2009/06/16 14:27]
tanel
projects:tuvastus:trans-juhend.et [2009/07/01 18:48] (current)
tanel
Line 2: Line 2:
  
  
-See juhend põhineb väga suures osas [[http://trans.sourceforge.net/en/transguidFR.php|prantsusekeelsele juhendil]], väikeste erinevustega kõhkluste jms märgendamise osas. Prantsuskeelne juhend on päris hästi loetav inglise keeles Google Translate [[http://translate.google.com/translate?js=n&prev=_t&hl=en&ie=UTF-8&u=http%3A%2F%2Ftrans.sourceforge.net%2Fen%2FtransguidFR.php&sl=fr&tl=en&history_state0=|abil]].+See juhend põhineb väga suures osas [[http://trans.sourceforge.net/en/transguidFR.php|prantsusekeelsel juhendil]], väikeste erinevustega kõhklushäälitsuste jms märgendamise osas. Prantsuskeelne juhend on päris hästi loetav inglise keeles Google Translate [[http://translate.google.com/translate?js=n&prev=_t&hl=en&ie=UTF-8&u=http%3A%2F%2Ftrans.sourceforge.net%2Fen%2FtransguidFR.php&sl=fr&tl=en&history_state0=|abil]]. 
  
  
Line 16: Line 17:
 Kõneüksused (speaker turns) vastavad ühe konkreetse kõneleja kõnele. Seega, uus kõneüksus tuleb tekitada siis, kui kõneleja muutub (või uue report-sekstiooni alguses), vajutades Ctrl-T. Avanenud dialoogis tuleks ka täita ära kõnela atribuutide osa (sugu, kvaliteet, spontaanne/mitte-spontanne jne).  Kõneüksused (speaker turns) vastavad ühe konkreetse kõneleja kõnele. Seega, uus kõneüksus tuleb tekitada siis, kui kõneleja muutub (või uue report-sekstiooni alguses), vajutades Ctrl-T. Avanenud dialoogis tuleks ka täita ära kõnela atribuutide osa (sugu, kvaliteet, spontaanne/mitte-spontanne jne). 
  
-Lõpuks tuleks kõneüksused jagada lausesarnasesteks osadeks. Siin on juhised üsna vabad. Ühe osa pikkus võiks olla umbes 5-20 sekundit. Uue osa võiks tekitada siis, kui kõnes on pikem paus, näiteks hingamispaus. Hingamispausi puhul tuleks vaadata kindlasti seda, et kui märgendatakse ka hingamispausis olev kuuldav hingamine ([r]), siis osadevaheline piir peaks ajas olema mitte hingamispausi keskel, vaid lõpus, ning märgendus [r] peab siis jääma lõppenud osa lõppu, mitte uue osa algusesse.+Lõpuks tuleks kõneüksused jagada lausesarnasesteks osadeks (seda saab lihtsalt teha vajutades õiges kohas Enter). Siin on juhised üsna vabad. Ühe osa pikkus võiks olla umbes 5-20 sekundit. Uue osa võiks tekitada siis, kui kõnes on pikem paus, näiteks hingamispaus. Hingamispausi puhul tuleks vaadata kindlasti seda, et kui märgendatakse ka hingamispausis olev kuuldav hingamine ([r]), siis osadevaheline piir peaks ajas olema mitte hingamispausi keskel, vaid lõpus, ning märgendus [r] peab siis jääma lõppenud osa lõppu, mitte uue osa algusesse. 
 + 
 + 
  
  
Line 33: Line 37:
 Erinevalt prantsuskeelsest juhendist kirjutame meie lause alguse sõna suure tähega, nagu ikka. Kirjavahemärkide ette tühikut panna pole vaja. Erinevalt prantsuskeelsest juhendist kirjutame meie lause alguse sõna suure tähega, nagu ikka. Kirjavahemärkide ette tühikut panna pole vaja.
  
-Nimesid tähistavad lühendid e. akronüümid kirjutada "nii nagu ikka", hoolimata sellest, kas neid hääldatakse tähthaaval või mitte: "NATO, Eesti NSV, KGB, OSCE, H1N5". Kui lühendit hääldatakse "sõnana", mitte tähthaaval, ning ta pole NATO, NASA, BICO, ETA, EMKE, ERSO, siis peaks lisama lühendi häälduse: pärast sõna kirjutamist võtta menüüst "Insert event" (Ctrl-D), valida dialoogiaknas: "Pronounce", "Apply to previous word", ning kirjutada tekstikasti hääldus ortograafilises transkriptsioonis. Siis peaks tekkima umbes selline transkriptsioon, näiteks+Nimesid tähistavad lühendid e. akronüümid kirjutada "nii nagu ikka", hoolimata sellest, kas neid hääldatakse tähthaaval või mitte: "NATO, Eesti NSV, KGB, OSCE, H1N5". Kui lühendit hääldatakse "sõnana", mitte tähthaaval, ning ta pole NATO, NASA, ETA (need on teada erandid), siis peaks lisama lühendi häälduse: pärast sõna kirjutamist võtta menüüst "Insert event" (Ctrl-D), valida dialoogiaknas: "Pronounce", "Apply to previous word", ning kirjutada tekstikasti hääldus ortograafilises transkriptsioonis. Siis peaks tekkima umbes selline transkriptsioon: 
-  * '' FIFA +[pron=fifa] ''   +  FIFA +[pron=fifa] ''   
-  * '' CD-ROM +[pron=tseederomm]''+  CD-ROM +[pron=tseederomm]''
  
 Internetiaadressid ja e-maili aadressid transkribeerida sarnaselt, kuid lisada (URL:) prefiks hääldusele, tekkima peaks midagi sellist: Internetiaadressid ja e-maili aadressid transkribeerida sarnaselt, kuid lisada (URL:) prefiks hääldusele, tekkima peaks midagi sellist:
-  * ''www.delfi.ee +[pron=(URL:) VVV delfi EE]'' +  www.delfi.ee +[pron=(URL:) VVV delfi EE] 
-  * ''www.google.com +[pron=(URL:) WWW punkt guugl punkt komm]'' +  www.google.com +[pron=(URL:) WWW punkt guugl punkt komm] 
-  * ''kaisukaru@hotmail.com +[pron=(URL:) kaisukaru ät hotmeil punkt komm]''+  kaisukaru@hotmail.com +[pron=(URL:) kaisukaru ät hotmeil punkt komm]
 VVV kirjutada siis kui hääldatakse "veeveevee", mitte "kaksisvee kaksisvee ..", nagu oleks tegelikult õige. Õigesti tuleks märgendada, kas öeldi "punkt" seal osade vahel, või mitte. VVV kirjutada siis kui hääldatakse "veeveevee", mitte "kaksisvee kaksisvee ..", nagu oleks tegelikult õige. Õigesti tuleks märgendada, kas öeldi "punkt" seal osade vahel, või mitte.
  
  
-Konkreetselt valesti hääldatud sõnu võib märgistada nii Isert event abil nii:   +Konkreetselt valesti hääldatud sõnu võib märgistada //Insert event// abil nii:   
-  * ''Rakvere +[pron=rakreve]''+  Rakvere +[pron=rakreve]
 Kui sõna on hääldatud lihtsalt lohakalt, siis võib jätta ainult ortograafilise kujule. Kui sõna on hääldatud lihtsalt lohakalt, siis võib jätta ainult ortograafilise kujule.
  
 Võõrkeelse sõna tähistamiseks võtta jälle "Insert event..", valida "Type=language", tekstkasti näiteks "English" ja "Apply to previous word", nii et tekib midagi sellist: Võõrkeelse sõna tähistamiseks võtta jälle "Insert event..", valida "Type=language", tekstkasti näiteks "English" ja "Apply to previous word", nii et tekib midagi sellist:
-  * ''cybernetics +[lang=English]''+  cybernetics +[lang=English]
  
 Pikema võõrkeelse sõnadejada tähistatamiseks valida see enne Insert event.. klikkamist, ning võtta "Apply to selection", tekib midagi sellist: Pikema võõrkeelse sõnadejada tähistatamiseks valida see enne Insert event.. klikkamist, ning võtta "Apply to selection", tekib midagi sellist:
-  * ''Muusikastiili nimi on [lang=English] easy listening [-lang=English]''+  Muusikastiili nimi on [lang=English] easy listening [-lang=English]
  
 Võõrnimede puhul tuleks lisada nende eestipärane hääldus Insert event abil: Võõrnimede puhul tuleks lisada nende eestipärane hääldus Insert event abil:
-  [pron=mahmuud abaasi-]Mahmoud Abbasi[-pron=mahmuud abaasi]+  [pron=mahmuud abaasi-]Mahmoud Abbasi[-pron=mahmuud abaasi]
  
 Osaliselt välja öeldud sõna transkribeerimiseks kasutada sellist  Osaliselt välja öeldud sõna transkribeerimiseks kasutada sellist 
Line 61: Line 65:
 aga hääldab välja ainult "küberneet", siis väljaütlemata osa panna  aga hääldab välja ainult "küberneet", siis väljaütlemata osa panna 
 sulgudesse, ilma tühikuta:  sulgudesse, ilma tühikuta: 
-  * ''küberneet(ika)''+  küberneet(ika)
  
 Kui ei ole selge, mida ta üritas öelda, siis on lihtsalt tühjad sulud:  Kui ei ole selge, mida ta üritas öelda, siis on lihtsalt tühjad sulud: 
  
-  * ''küberneet() ''+  küberneet()
  
 Sama võib teha ära kadunud sõna algusega:  Sama võib teha ära kadunud sõna algusega: 
-  * ''(kü)berneetika'', või ''()berneetika'' +  (kü)berneetika  
 +või  
 +  ()berneetika
  
 Kui ei saa üldse aru, mis öeldi, siis võib panna lihtsalt tühjad sulud: (). Sõna keskel häälduses kaduvat osa märgendada ortograafiliselt, näiteks:  Kui ei saa üldse aru, mis öeldi, siis võib panna lihtsalt tühjad sulud: (). Sõna keskel häälduses kaduvat osa märgendada ortograafiliselt, näiteks: 
-  * ''kakskümmend'', mitte ''kaksk(ümme)end''+  kakskümmend 
 +mitte  
 +  kaksk(ümme)end
  
 Kõhklused ("ee", "öö"), hingamised, köhatused ja suumatsutused tuleks tähistada vastavalt [b], [r], [bg] ja [bb]. Neid saab sisestada Insert event->Isolated noise abil, või shortcutiga (näiteks [b] saab vajutades Alt-b, neid saab ise konfigureerida). Kõiki selliseid mürasid pole vaja märgendada, piisab paremini kuuldaolevatest. Kõhklused ("ee", "öö"), hingamised, köhatused ja suumatsutused tuleks tähistada vastavalt [b], [r], [bg] ja [bb]. Neid saab sisestada Insert event->Isolated noise abil, või shortcutiga (näiteks [b] saab vajutades Alt-b, neid saab ise konfigureerida). Kõiki selliseid mürasid pole vaja märgendada, piisab paremini kuuldaolevatest.
Line 77: Line 85:
  
  
-===== Muusika ja vahekõllid =====+ 
 + 
 + 
 + 
 +===== Muusika, reklaamid ja vahekõllid =====
  
 Pikem muusika tähistada nii: [musique]  Pikem muusika tähistada nii: [musique] 
Line 86: Line 98:
  
 Muusika ja vahekõllid peaks olema ka eraldi filler-tüüpi sekstioonis, mitte report-tüüpi sektsiooni sees. Muusika ja vahekõllid peaks olema ka eraldi filler-tüüpi sekstioonis, mitte report-tüüpi sektsiooni sees.
 +
 +Tihti on saatealguskõllis ka mingi kõne. Seda ei pea transkribeerima.
 +
 +Kui jutu taustal kostab vaikne muusika (tihti saate sissejuhatavas osas), siis transkribeerida kõne nagu tavaliselt, kuid märkida ta //Insert event -> Overlapping noise abil//, nii et tekib midagi sellist:
 +
 +  [musique-]Tänases saates[-musique]
 +
 +
 +===== Samaaegne kõne =====
 +
 +Sellised lõigud, kus kaks või rohem inimest samaaegselt räägivad, tuleb teha eraldi sektsioonideks, sektsiooni omadustes määrata "Overlapping speech". Kõnet ennast pole vaja transkribeerida, sektsiooni võib tühjaks jätta. 
 +
 +Kui ühe inimese kõne on tunduvalt valjum kui taustalkõneleja oma (näiteks kui taustal kostub nõustuvaid "mühatusi"), siis pole vaja uut sekstsiooni tekitada. Samuti, kui samaaegsus on väga lühike (alla poole sekundi, tihti siis, kui üks kõneleja alustab lauset kui teine pole veel päris lõpetanud), siis transkribeerida ainult valjemalt kõnelaja osa.
 
projects/tuvastus/trans-juhend.et.1245151679.txt.gz · Last modified: 2009/06/16 14:27 by tanel