Zpět na seznam manuálů

Fonetická transkripce češtiny

V2T (voice-to-text) systémy pracují se seznamem slov (slovníkem), kde je u každého slova uvedena jeho výslovnost. Např. slovo pět má výslovnost [pjet]. U některých slov je vhodné uvést více výslovností, např. LCD [elcédé, elsídí], DVD [dévédé, dívídí].

Slova jsou ve slovníku zapsána pomocí písmen, číslic a nebo symbolů. Výslovnosti pomocí fonémů. Každý foném je přitom reprezentován vždy jen jedním symbolem. Např. slovo D1, které se zkládá z písmene D a číslice 1, má výslovnost [déjedna], která se zapisuje pomocí příslušných sedmi fonémů. Symboly pro fonémy jsou přitom zvoleny tak, aby byly pokud možno totožné s odpovídajícími (podobnými) písmeny daného jazyka.

Cílem fonetické transkripce je převést textový zápis slova na odpovídající výslovnost zapsanou pomocí fonémů. Protože ale slovo ve slovníku může obsahovat i číslice a další speciální symboly, je fonetický přepis definován nad množinou tzv. grafémů, která je omezená co do rozsahu a obsahuje většinou pouze písmena dané abecedy.

Převést textový zápis slova do grafémového zápisu je přitom jednoduché. Znamená to zapsat slovo pomocí znaků dané abecedy tak, jak je čteno. U běžných slov je pak grafémový zápis totožný s tím, jak se slovo běžně píše (a čte). Pozornost je naopak nutné věnovat zejména cizím slovům, zkratkám a slovům obsahujícím číslovky či symboly.

Fonetická transkripce slova či fráze tedy probíhá ve dvou krocích:

  1. krok: Slovo se přepíše do grafémů (znaků abecedy) způsobem, jakým je čteno.

  2. krok: Použijí se pravidla fonetické transkripce (popsaná stručně na konci manuálu) nebo příslušný automatický nástroj či program (tzv. G2P převodník).

Příklady grafémové a fonetické transkripce běžných (domácích) slov, cizích slov, akronymů, zkratek, čísel atd.

Typ slova Příklad Přepis do grafémů Přepis do fonémů
Běžné slovo Petr petr petr
kolo kolo kolo
chtít chtít Xťít
Cizí slovo John džon Čon
Voight vojt vojt
Citroën sitroen sitroen
Akronym UNESCO unesko unesko
Click4Sky klik for skáj klikforskáj
Zkratka ČSSD čé es es dé čéesezdé
ŘSD ř s d řEsEdE
ÖMV é em fau éemfau
Víceslovný výraz The Beatles d bítls dEbítls
Aix en Provence eks án prováns eksánprováns
chargé d'affaires šaržé d afér šaržédafér
Výrazy s čísly 23. dvacátý třetí dvacátítŘeťí
7x sedumkrát sedumkrát
B52 bé padesát dva bépadesáddva

Seznam a vysvětlení fonémů a jejich symbolů je uveden níže. Dále pak následují pravidla fonetického přepisu z grafémů do fonémů (G2P).

Množina fonémů (fonetická abeceda)

Foném Grafém(y) Příklad - text Příklad - fonetický přepis Vysvětlení
a a akt a k t
á á pár p á r
b b bota b o t a
c c co c o
C dz Dzurinda C u r i n d a
leckdo l e C g d o znělá varianta fonému c
č č čas č a s
Č džungle Č u N g l e
George Č o r č
d d dům d ú m
ď ď dívka ď í f k a
e e erb e r p
é é éter é t e r
f f film f i l m
g g gól g ó l
h h hůl h ú l
X ch chalupa X a l u p a
i i bil b i l grafémy i a y se v češtině vyslovují shodně
y byl b i l grafémy i a y se v češtině vyslovují shodně
í í bít b í t grafémy í a ý se v češtině vyslovují shodně
ý být b í t grafémy í a ý se v češtině vyslovují shodně
j j jen j e n
k k kos k o s
l l los l o s
m m muž m u š
M m tramvaj t r a M v a j retozubné m, varianta fonému m před f a v
n n nám n á m
N n banka b a N k a zadní (velární) n, varianta fonému n před k a g
ň ň někdo ň e g d o
ňadro ň a d r o
o o olej o l e j
ó ó óda ó d a
p p pak p a k
r r rok r o k
ř ř řeka ř e k a znělá varianta
Ř ř keř k e Ř neznělá varianta, vyskytuje se na konci slov a v okolí neznělých párových souhlásek
příklad p Ř í k l a t neznělá varianta, vyskytuje se na konci slov a v okolí neznělých párových souhlásek
s s sýr s í r
š š šel š e l
t t tak t a k
ť ť dítě ď í ť e
u u ujel u j e l
ú ú ústí ú s ť í
ů kůl k ú l
v v vata v a t a
z z zrak z r a k
ž ž žal ž a l
E ŘSD ř E s E d E neutrální vokál, tzv. "šva", vyskytuje se zejména ve zkratkách a slovech anglického původu
the d E neutrální vokál, tzv. "šva", vyskytuje se zejména ve zkratkách a slovech anglického původu

Kromě výše popsaných fonémů pracuje systém ještě s dalšími zvukovými modely, které reprezentují různé ruchy a ticho. Některé z nich je přitom možné použít v rámci tvorby výslovnosti slov - viz tento seznam.

Množina uvažovaných (podporovaných) grafémů, které mohou být zkonvertovány do fonémů:

Písmena české abecedy (velká i malá):

a, á, b, c, č, d, ď, e, é, ě, f, g, h, ch, i, í, j, k, l, m, n, ň, o, ó, p, q, r, ř, s, š, t, ť, u, ú, ů, v, w, x, y, ý, z, ž

Ostatní symboly (z jiných jazyků nebo např. číslice) musí být před fonetickým přepisem nejprve převedeny na některý výše uvedený grafém (např. německé ö ve slově Köln se zapíše jako výslovnostně nejbližší grafém é).

Pravidla fonetického přepisu (z grafémů na fonémy = G2P pravidla)

Základní pravidla

Základní pravidlo je to, že daný grafém se přepíše na odpovídající foném, např. doma -> d o m a. K tomu je nutné pro některé grafémy přidat následující zvláštní pravidla a spodobu znělosti.

Zvláštní pravidla

Grafém(y) Foném Příklad Vysvětlení
d ď dítě -> ď í ť e změkčení (palatalizace) způsobené následujícím vokálem i
dz C Dzurinda -> C u r i n d a
Č ungle -> Č u N g l e
ě e děti -> ď e ť i
je pěkný -> p je k n í
ňe měl -> m ňe l
m M tramvaj -> t r a M v a j retozubné M způsobené následujícím v nebo f
n N banka -> b a N k a zadní (velární) N způsobené následujícím k nebo g
ň nikdo -> ň i g d o změkčení (palatalizace) způsobené následujícím vokálem i
q kv Quido -> kv i d o
t ť ďítě -> ď í ť e změkčení (palatalizace) způsobené následujícím vokálem i
ů ú půl -> p ú l
w v wolfram -> v o l f r a m
x ks text -> t e ks t
gz exil -> e gz i l
y i byl -> b i l
ý í kýl -> k í l

Spodoba znělosti

V češtině se výrazně uplatňuje spodoba znělosti, znělé souhlásky se mohou vyslovovat za určitých okolností nezněle a naopak. Pravopis na tuto změnu výslovnosti přitom nebere zřetel. Spodoba se děje za těchto okolností:

  1. znělé souhlásky se na konci slov vyslovují nezněle, např. led -> l e t.

  2. vlivem souhláskového okolí - nejčastěji poslední souhláska ve skupině ovlivní výslovnost celé skupiny. Např. znělý foném z ve slově r o z t o k se vyslovuje nezněle jako s (r o s t o k) kvůli tomu, že za ním následuje neznělý foném t.

Znělé a neznělé fonémy (souhlásky) přitom tvoří páry, v jejichž rámci se spodoba znělosti druhého typu uplatňuje:

Znělostní páry
Neznělá souhláska p t c č k f s ť Ř š X
Znělá souhláska b d C Č g v z ď ř ž h

Vybrané příklady spodoby znělosti vlivem následující párové souhlásky:

Spodoba Příklad Důvod spodoby
Změna znělé na neznělou
b -> p h l o u b k a -> h l o u p k a po b následuje neznělé k
d -> t h l a d k ý -> h l a t k í po d následuje neznělé k
ď -> ť l o ď k a -> l o ť k a po ď následuje neznělé k
g -> k g a n g s t e r -> g a N k s t e r po g následuje neznělé s
h -> X l e h k ý -> l e X k í po h následuje neznělé k
ž -> š Ž i ž k a -> ž i š k a po ž následuje neznělé k
v -> f d í v k a -> ď í f k a po v následuje neznělé k
z -> s h e z k ý -> h e s k í po z následuje neznělé k
Změna neznělé na znělou
č -> Č l é č b a -> l é Č b a po č následuje znělé b
f -> v š é f d i r i g e n t -> š é v d i r i g e n t po f následuje znělé d
s -> z I n n s b r u c k -> i n z b r u k po s následuje znělé b
š -> ž H u š b a u e r -> h u ž b a u e r po š následuje znělé b
Změna skupin souhlásek
ck -> Cg l e c k d o -> l e C g d o po c and k následuje znělé d
vz -> fs v z t á h l -> f s t á h l po v and z následuje neznělé t

Výjimkou z tohoto pravidla je foném v, který asimilaci podléhá (jak je vidět z příkladu "dívka" výše), ale nezpůsobuje ji: svatba -> s v a t b a či kotva -> k o t v a.