6. Nimikointi

Nimikoinnilla (engl. labeling) tarkoitetaan sitä, että (digitaalisesti) tallennettuun puhenäytteeseen liitetään systemaattisesti annotaatioita (annotation) eli jonkinlaisia (symbolisia) kuvauksia näytteen sisällöstä. Nimikointi tehdään yleensä jollakin tähän tarkoitukseen kehitetyllä tietokoneohjelmalla, joista Praat on yksi vaihtoehto. Ääninäytteen on oltava digitaalisessa muodossa ts. äänitiedostona esim. tietokoneen kovalevyllä tai jonkintyyppisillä levykkeillä. Ääninäytettä kuunnellaan ja siitä piirrettyjä kuvia katsellaan analyysiohjelmalla. Kuuntelun ja katselun perusteella kirjoitetaan ääninäytteen pariksi nimikointitiedosto, joka sisältää ääninäytteen kuvaukset.

Nimikoinnin tarkoituksena on muodostaa "maamerkkejä", joiden perusteella alkuperäisestä puhesignaalista voidaan löytää halutut osat ja kohdistaa niihin vaikkapa akustisia analyyseja tai muita toimenpiteitä. Nimikointi on välttämätöntä, jos halutaan hallita ja hyödyntää suurta määrää puheaineistoa.

Nimikoinnissa annotaatiot on sidottava ääninäytteen aikaulottuvuuteen. Tätä varten ääninäyte yleensä segmentoidaan: siitä rajataan halutulla tarkkuudella segmenttejä (äänipätkiä, joilla on määrätty alku- ja loppupiste sekä ajallinen kesto; engl. segment). Segmenteille voidaan sitten antaa nimiä eli nimikoida ne. Myös ääninäytteen tietyille yksittäisille ajanhetkille (aikapisteille) voidaan antaa nimiä (näin syntyy ns. ankkureita, engl. point). Pelkkä ääninäytteen litterointi esimerkiksi tekstitiedostoon ei siis ole nimikoimista, koska siinä litteraation eri osia ei kytketä ääninäytteen vastaaviin ajallisiin kohtiin.

Annotaatiotyylejä on erilaisia ja tutkija voi kehittää oman annotaatiotavan sen mukaan, minkälaisista puheen ilmiöistä on kiinnostunut. Annotaatio voi olla esimerkiksi ortografinen ts. oikeinkirjoitusta noudattava litteraatio (engl. yl. transliteration, transcript), morfologisten yksiköiden kuvaus, prosodisten piirteiden kuvaus tai vaikkapa foneettinen transkriptio (engl. transcription) puheesta. Ensin mainitussa tapauksessa segmenttirajat voivat olla vaikkapa yksittäisten sanojen tai lauseiden välillä, kun taas foneettista tutkimusta varten rajataan usein yksittäisiä äänteitä.

Jos erilaisia puheen yksiköitä halutaan käyttää hyödyksi yhdessä, voidaan luoda useita annotaatio- tai nimikointikerroksia tai -tasoja: yhdelle merkitään äänteiden rajat, toiselle sanojen rajat, kolmannelle lauserajat jne.

Automaattisia segmentointi- ja nimikointimenetelmiä yritetään jatkuvasti kehittää eri puolilla maailmaa. Toistaiseksi tarkimman nimikoinnin saa kuitenkin aikaan ihminen, sillä puheen nimikointi vaatii monenlaisten kielellisten tulkintojen tekemistä. Samasta syystä voidaan valitettavasti todeta myös, että sekä puheen litterointi, transkriptio että nimikointi ovat aina jossakin määrin subjektiivisia tuotoksia: niiden tarkkuus ja johdonmukaisuus riippuvat nimikoijan intresseistä, tiedoista, taidoista ja teoreettisesta näkemyksestä.

Aliluvut

: 6.1 Miksi puhetta nimikoidaan : Praat-opas : 5.2 Äänen muokkaaminen (leikkaa-liimaa-toiminnot) Sisältö Hakemisto

Mietta Lennes 2004-09-13