Fonetická transkripce češtiny
V2T (voice-to-text) systémy pracují se seznamem slov (slovníkem), kde je u každého slova uvedena jeho výslovnost. Např. slovo pět má výslovnost [pjet]. U některých slov je vhodné uvést více výslovností, např. LCD [elcédé, elsídí], DVD [dévédé, dívídí].
Slova jsou ve slovníku zapsána pomocí písmen, číslic a nebo symbolů. Výslovnosti pomocí fonémů. Každý foném je přitom reprezentován vždy jen jedním symbolem. Např. slovo D1, které se zkládá z písmene D a číslice 1, má výslovnost [déjedna], která se zapisuje pomocí příslušných sedmi fonémů. Symboly pro fonémy jsou přitom zvoleny tak, aby byly pokud možno totožné s odpovídajícími (podobnými) písmeny daného jazyka.
Cílem fonetické transkripce je převést textový zápis slova na odpovídající výslovnost zapsanou pomocí fonémů. Protože ale slovo ve slovníku může obsahovat i číslice a další speciální symboly, je fonetický přepis definován nad množinou tzv. grafémů, která je omezená co do rozsahu a obsahuje většinou pouze písmena dané abecedy.
Převést textový zápis slova do grafémového zápisu je přitom jednoduché. Znamená to zapsat slovo pomocí znaků dané abecedy tak, jak je čteno. U běžných slov je pak grafémový zápis totožný s tím, jak se slovo běžně píše (a čte). Pozornost je naopak nutné věnovat zejména cizím slovům, zkratkám a slovům obsahujícím číslovky či symboly.
Fonetická transkripce slova či fráze tedy probíhá ve dvou krocích:
krok: Slovo se přepíše do grafémů (znaků abecedy) způsobem, jakým je čteno.
krok: Použijí se pravidla fonetické transkripce (popsaná stručně na konci manuálu) nebo příslušný automatický nástroj či program (tzv. G2P převodník).
Příklady grafémové a fonetické transkripce běžných (domácích) slov, cizích slov, akronymů, zkratek, čísel atd.
Typ slova | Příklad | Přepis do grafémů | Přepis do fonémů |
---|---|---|---|
Běžné slovo | Petr | petr | petr |
kolo | kolo | kolo | |
chtít | chtít | Xťít | |
Cizí slovo | John | džon | Čon |
Voight | vojt | vojt | |
Citroën | sitroen | sitroen | |
Akronym | UNESCO | unesko | unesko |
Click4Sky | klik for skáj | klikforskáj | |
Zkratka | ČSSD | čé es es dé | čéesezdé |
ŘSD | ř s d | řEsEdE | |
ÖMV | é em fau | éemfau | |
Víceslovný výraz | The Beatles | d bítls | dEbítls |
Aix en Provence | eks án prováns | eksánprováns | |
chargé d'affaires | šaržé d afér | šaržédafér | |
Výrazy s čísly | 23. | dvacátý třetí | dvacátítŘeťí |
7x | sedumkrát | sedumkrát | |
B52 | bé padesát dva | bépadesáddva |
Seznam a vysvětlení fonémů a jejich symbolů je uveden níže. Dále pak následují pravidla fonetického přepisu z grafémů do fonémů (G2P).
Množina fonémů (fonetická abeceda)
Foném | Grafém(y) | Příklad - text | Příklad - fonetický přepis | Vysvětlení |
---|---|---|---|---|
a | a | akt | a k t | |
á | á | pár | p á r | |
b | b | bota | b o t a | |
c | c | co | c o | |
C | dz | Dzurinda | C u r i n d a | |
leckdo | l e C g d o | znělá varianta fonému c | ||
č | č | čas | č a s | |
Č | dž | džungle | Č u N g l e | |
George | Č o r č | |||
d | d | dům | d ú m | |
ď | ď | dívka | ď í f k a | |
e | e | erb | e r p | |
é | é | éter | é t e r | |
f | f | film | f i l m | |
g | g | gól | g ó l | |
h | h | hůl | h ú l | |
X | ch | chalupa | X a l u p a | |
i | i | bil | b i l | grafémy i a y se v češtině vyslovují shodně |
y | byl | b i l | grafémy i a y se v češtině vyslovují shodně | |
í | í | bít | b í t | grafémy í a ý se v češtině vyslovují shodně |
ý | být | b í t | grafémy í a ý se v češtině vyslovují shodně | |
j | j | jen | j e n | |
k | k | kos | k o s | |
l | l | los | l o s | |
m | m | muž | m u š | |
M | m | tramvaj | t r a M v a j | retozubné m, varianta fonému m před f a v |
n | n | nám | n á m | |
N | n | banka | b a N k a | zadní (velární) n, varianta fonému n před k a g |
ň | ň | někdo | ň e g d o | |
ňadro | ň a d r o | |||
o | o | olej | o l e j | |
ó | ó | óda | ó d a | |
p | p | pak | p a k | |
r | r | rok | r o k | |
ř | ř | řeka | ř e k a | znělá varianta |
Ř | ř | keř | k e Ř | neznělá varianta, vyskytuje se na konci slov a v okolí neznělých párových souhlásek |
příklad | p Ř í k l a t | neznělá varianta, vyskytuje se na konci slov a v okolí neznělých párových souhlásek | ||
s | s | sýr | s í r | |
š | š | šel | š e l | |
t | t | tak | t a k | |
ť | ť | dítě | ď í ť e | |
u | u | ujel | u j e l | |
ú | ú | ústí | ú s ť í | |
ů | kůl | k ú l | ||
v | v | vata | v a t a | |
z | z | zrak | z r a k | |
ž | ž | žal | ž a l | |
E | ŘSD | ř E s E d E | neutrální vokál, tzv. "šva", vyskytuje se zejména ve zkratkách a slovech anglického původu | |
the | d E | neutrální vokál, tzv. "šva", vyskytuje se zejména ve zkratkách a slovech anglického původu |
Kromě výše popsaných fonémů pracuje systém ještě s dalšími zvukovými modely, které reprezentují různé ruchy a ticho. Některé z nich je přitom možné použít v rámci tvorby výslovnosti slov - viz tento seznam.
Množina uvažovaných (podporovaných) grafémů, které mohou být zkonvertovány do fonémů:
Písmena české abecedy (velká i malá):
a, á, b, c, č, d, ď, e, é, ě, f, g, h, ch, i, í, j, k, l, m, n, ň, o, ó, p, q, r, ř, s, š, t, ť, u, ú, ů, v, w, x, y, ý, z, ž
Ostatní symboly (z jiných jazyků nebo např. číslice) musí být před fonetickým přepisem nejprve převedeny na některý výše uvedený grafém (např. německé ö ve slově Köln se zapíše jako výslovnostně nejbližší grafém é).
Pravidla fonetického přepisu (z grafémů na fonémy = G2P pravidla)
Základní pravidla
Základní pravidlo je to, že daný grafém se přepíše na odpovídající foném, např. doma -> d o m a. K tomu je nutné pro některé grafémy přidat následující zvláštní pravidla a spodobu znělosti.
Zvláštní pravidla
Grafém(y) | Foném | Příklad | Vysvětlení |
---|---|---|---|
d | ď | dítě -> ď í ť e | změkčení (palatalizace) způsobené následujícím vokálem i |
dz | C | Dzurinda -> C u r i n d a | |
dž | Č | džungle -> Č u N g l e | |
ě | e | děti -> ď e ť i | |
je | pěkný -> p je k n í | ||
ňe | měl -> m ňe l | ||
m | M | tramvaj -> t r a M v a j | retozubné M způsobené následujícím v nebo f |
n | N | banka -> b a N k a | zadní (velární) N způsobené následujícím k nebo g |
ň | nikdo -> ň i g d o | změkčení (palatalizace) způsobené následujícím vokálem i | |
q | kv | Quido -> kv i d o | |
t | ť | ďítě -> ď í ť e | změkčení (palatalizace) způsobené následujícím vokálem i |
ů | ú | půl -> p ú l | |
w | v | wolfram -> v o l f r a m | |
x | ks | text -> t e ks t | |
gz | exil -> e gz i l | ||
y | i | byl -> b i l | |
ý | í | kýl -> k í l |
Spodoba znělosti
V češtině se výrazně uplatňuje spodoba znělosti, znělé souhlásky se mohou vyslovovat za určitých okolností nezněle a naopak. Pravopis na tuto změnu výslovnosti přitom nebere zřetel. Spodoba se děje za těchto okolností:
znělé souhlásky se na konci slov vyslovují nezněle, např. led -> l e t.
vlivem souhláskového okolí - nejčastěji poslední souhláska ve skupině ovlivní výslovnost celé skupiny. Např. znělý foném z ve slově r o z t o k se vyslovuje nezněle jako s (r o s t o k) kvůli tomu, že za ním následuje neznělý foném t.
Znělé a neznělé fonémy (souhlásky) přitom tvoří páry, v jejichž rámci se spodoba znělosti druhého typu uplatňuje:
Znělostní páry | |||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|
Neznělá souhláska | p | t | c | č | k | f | s | ť | Ř | š | X |
Znělá souhláska | b | d | C | Č | g | v | z | ď | ř | ž | h |
Vybrané příklady spodoby znělosti vlivem následující párové souhlásky:
Spodoba | Příklad | Důvod spodoby |
---|---|---|
Změna znělé na neznělou | ||
b -> p | h l o u b k a -> h l o u p k a | po b následuje neznělé k |
d -> t | h l a d k ý -> h l a t k í | po d následuje neznělé k |
ď -> ť | l o ď k a -> l o ť k a | po ď následuje neznělé k |
g -> k | g a n g s t e r -> g a N k s t e r | po g následuje neznělé s |
h -> X | l e h k ý -> l e X k í | po h následuje neznělé k |
ž -> š | Ž i ž k a -> ž i š k a | po ž následuje neznělé k |
v -> f | d í v k a -> ď í f k a | po v následuje neznělé k |
z -> s | h e z k ý -> h e s k í | po z následuje neznělé k |
Změna neznělé na znělou | ||
č -> Č | l é č b a -> l é Č b a | po č následuje znělé b |
f -> v | š é f d i r i g e n t -> š é v d i r i g e n t | po f následuje znělé d |
s -> z | I n n s b r u c k -> i n z b r u k | po s následuje znělé b |
š -> ž | H u š b a u e r -> h u ž b a u e r | po š následuje znělé b |
Změna skupin souhlásek | ||
ck -> Cg | l e c k d o -> l e C g d o | po c and k následuje znělé d |
vz -> fs | v z t á h l -> f s t á h l | po v and z následuje neznělé t |
Výjimkou z tohoto pravidla je foném v, který asimilaci podléhá (jak je vidět z příkladu "dívka" výše), ale nezpůsobuje ji: svatba -> s v a t b a či kotva -> k o t v a.