Teoreettinen kielen perusyksikkö, joka voi muuttaa sanan merkityksen. Foneemi on eri asia kuin äänne. Foneemiyksikköä käytetään yleensä vain automaattisin menetelmin tuotetussa puheen annotaatiossa, jolloin karkea ''foneemijono'' määritetään käsin tehdyn ortografisen litteraation pohjalta ja tämän jälkeen ''pakotetaan'' segmentointiohjelmistolla näiden foneemien rajat äänisignaaliin.
Koska foneemi on oikeastaan lingvistinen abstraktio eikä foneemeja esiinny puheessa sellaisenaan, ei foneemien nimikointi varsinaisesta puhesignaalista ole relevanttia. Foneemisegmenttejä tuotetaan yleensä vain automaattisilla menetelmillä, minkä jälkeen annotaatio on tarkistettava käsin ja muunnettava realistisemmaksi äännekerroksen annotaatioksi.
Sen sijaan jo annotoidun sanakerroksen (ks. 4) yksiköille voidaan periaatteessa määrittää näiden sisältämät teoreettiset foneemit. Tällöin foneemikuvaus on kuitenkin sananmuotojen ominaisuus, eikä näin kuvatuilla foneemiyksiköillä ole ajallista alku- ja loppupistettä.
Automaattisesti luotava foneemipohjainen ''esisegmentointi'' voidaan yleensä tehdä vain jonkinlaisen ortografisen litteraatin perusteella. Varsinaista rakenteellista annotaatiota automaattinen segmentointi ei kuitenkaan edellytä.
Mikäli annotoidaan fonologisessa mielessä teoreettisia foneemiyksiköitä, tämä voidaan tehdä vasta kun sananmuodot on annotoitu.
Foneemiyksikön nimike on sitä ensisijaisesti vastaavan äänteen ts. allofonin Worldbet- tai IPA-muotoinen kuvaus (ks liite A).