Eniten käytetty foneettinen transkriptiojärjestelmä on kansainvälinen foneettinen aakkosto (International Phonetic Alphabet eli IPA). IPA-merkkikartat selityksineen löytyvät Kansainvälisen foneettisen yhdistyksen (International Phonetic Association) verkkosivuilta (3).
Koska kaikissa laitteistoissa ei ole asennettuna foneettista kirjasinta ja koska foneettisia symboleita pitäisi voida yksiselitteisesti käsitellä ja siirtää tietokoneesta toiseen, tarvitaan IPA-merkeistä ASCII-versio. ASCII-muotoisten transkriptioiden lukeminen on tottumattomalle hieman epämukavampaa kuin IPA-kirjasinten. Eräs IPA-aakkoston ASCII-versio on Worldbet (16). Muitakin foneettisten merkkien ASCII-versioita on, esim. SAMPA (ja sen laajennus X-SAMPA; 1) jne.
Worldbetissä ns. perussymbolia merkitään yleensä yhdellä ASCII-merkillä, toisinaan kahdella. Äänteen lisäartikulaatiot tai artikulaatiopiirteiden muutokset merkitään tarkkeilla eli diakriiteillä kuten IPAssakin. Jokainen tarke erotetaan perussymbolista (ja muista mahdollisista tarkkeista) merkitsemällä sen eteen alaviiva '_'. Kun alaviivan muistaa merkitä jokaisen tarkkeen eteen, tarkkeet on helpompi erottaa toisistaan myös annotaatioiden myöhemmässä automaattisessa käsittelyssä.
Esimerkiksi vokaalilaadun tarkka erottelu on hyvin vaikeaa ja subjektiivista. Kannattaa myös muistaa, että kaksi annotoijaa ei juuri koskaan päädy täysin samaan foneettiseen transkriptioon, ja päätös symbolin valinnasta pitäisikin tehdä kohtalaisen nopeasti ja turhia miettimättä. Johdonmukainen transkriptiotaito kehittyy vain harjoittelemalla.
Kuulonvaraisesti suunnilleen samaa äännelaatua voidaan usein kuvata kahdella tai useammalla tavalla yhdistelemällä eri perussymboleja ja tarkkeita. Näin on erityisesti vokaalien kohdalla. Kun pyritään mahdollisimman foneettiseen annotaatioon, ei periaatteessa ole merkitystä sillä, mikä perussymboli valitaan ja paljonko tarkkeita joudutaan käyttämään, kunhan lopputuloksen kaikkien merkkien yhdistelmä suunnilleen vastaa äänteen havaittua artikulatorista laatua. Sen sijaan foneemisessa annotaatiossa joudutaan tekemään tulkinta siitä, mikä on ollut kyseistä äännettä vastaava foneeminen muoto: tällöin on perusmerkiksi valittava se symboli, joka lähinnä vastaa alkuperäistä foneemia. On huomattava, että foneeminen annotaatio on siis riippuvainen annotoijan lingvistisestä näkemyksestä. Toisaalta useimmat automaattiset segmentointityökalut perustuvat foneemiseen annotaatioon, jossa esimerkiksi ortografisesta litteraatiosta muutamalla säännöllä johdettu foneemijono ''pakotetaan'' sopimaan äänisignaaliin. Automaattinen segmentteri ei siis yleensä sopeudu puheen foneettisiin erikoisuuksiin, jotka on siksi käsin tarkistettava.