Fonetická transkripce slovenštiny
V2T (voice-to-text) systémy pracují se seznamem slov (slovníkem), kde je u každého slova uvedena jeho výslovnost. Např. slovo nemoc má výslovnost [ňemoc]. U některých slov je vhodné uvést více výslovností, např. LCD [elcédé, elsídí], DVD [dévédé, dívídí].
Slova jsou ve slovníku zapsána pomocí písmen, číslic a nebo symbolů. Výslovnosti pomocí fonémů. Každý foném je přitom reprezentován vždy jen jedním symbolem. Např. slovo K2, které se zkládá z písmene K a číslice 2, má výslovnost [kádva], která se zapisuje pomocí příslušných pěti fonémů. Symboly pro fonémy jsou přitom zvoleny tak, aby byly pokud možno totožné s odpovídajícími (podobnými) písmeny daného jazyka.
Cílem fonetické transkripce je převést textový zápis slova na odpovídající výslovnost zapsanou pomocí fonémů. Protože ale slovo ve slovníku může obsahovat i číslice a další speciální symboly, je fonetický přepis definován nad množinou tzv. grafémů, která je omezená co do rozsahu a obsahuje většinou pouze písmena dané abecedy.
Převést textový zápis slova do grafémového zápisu je přitom jednoduché. Znamená to zapsat slovo pomocí znaků dané abecedy tak, jak je čteno. U běžných slov je pak grafémový zápis totožný s tím, jak se slovo běžně píše (a čte). Pozornost je naopak nutné věnovat zejména cizím slovům, zkratkám a slovům obsahujícím číslovky či symboly.
Fonetická transkripce slova či fráze tedy probíhá ve dvou krocích:
krok: Slovo se přepíše do grafémů (znaků abecedy) způsobem, jakým je čteno
krok: Použijí se pravidla fonetické transkripce (popsaná stručně na konci manuálu) nebo příslušný automatický nástroj či program (tzv. G2P převodník).
Seznam fonémů a jejich symbolů je eveden níže. Na rozdíl od běžného seznamu pro slovenštinu obsahuje české hlásky ř (reprezentované fonémy ř a Ř - kvůli možnosti pracovat s českými slovy) a některé podobné fonémy jsou reprezentovány jen jedním z nich (systém je datailněji rozlišuje pomocí architekury vnitřních akustických modelů):
Hlásky l, ĺ, a ľ jsou reprezentovány jedním fonémem l.
Hlásky r a ŕ jsou reprezentovány jedním fonémem r.
Hlásky e a ä jsou reprezentovány jedním fonémem e.
Příklady grafémové a fonetické transkripce běžných (domácích) slov, cizích slov, akronymů, zkratek, čísel atd.
Typ slova | Příklad | Přepis do grafémů | Přepis do fonémů |
---|---|---|---|
Běžné slovo | roztoč | rostoč | roztoč |
liečba | liečba | ljeČba | |
samoľúbosť | samoľúbosť | samolúbosť | |
Cizí slovo | John | džon | Čon |
segway | segvej | segvej | |
George | džordž | Čorč | |
Citroën | sitroen | sitroen | |
Akronym | UNESCO | unesko | unesko |
Click4Sky | klikforskaj | klikforskaj | |
XPress | ekspress | ekspres | |
Zkratka | USB | ú es bé | úezbé |
HTML | h t m l | hEtEmElE | |
ÖMV | é em fau | éemfau | |
FBI | ef bí aj | evbíaj | |
Víceslovný výraz | The Beatles | d bítls | dEbítls |
The Washington Post | d vošinktn poust | dEvošiNktnpoust | |
Aix en Provence | eks án prováns | eksánprováns | |
d’Artagnan | d artaňan | dartaňan | |
chargé d'affaires | šaržé d afér | šaržédafér | |
Steve Jobs | stíf džobs | stívČops | |
Číslo | 20. | dvadsiaty | dvacjati |
7x | sedem krát | seďemkrát | |
5P | päť pé | peťpé |
Seznam a vysvětlení fonémů a jejich symbolů je uveden níže. Dále pak následují pravidla fonetického přepisu z grafémů do fonémů (G2P).
Množina fonémů (fonetická abeceda)
Foném | Grafém(y) | Příklad - text | Příklad - fonetický přepis | Vysvětlení |
---|---|---|---|---|
a | a | amatér | a m a t é r | |
á | á | amalgám | a m a l g á m | |
b | b | bájka | b á j k a | |
c | c | cibule | c i b u l e | |
C | dz | Dzurinda | C u r i n d a | |
hockde | h o C g ď e | znělá varianta fonému c | ||
č | č | čas | č a s | |
Č | dž | maharadža | m a h a r a Č a | |
George | Č o r č | |||
d | d | dávka | d á u k a | |
ď | dievka | ď j e u k a | ||
e | e | elektrické | e l e k t r i c k é | |
ä | svätá | s v e t á | ||
é | é | emblém | e m b l é m | |
f | f | forma | f o r m a | |
g | g | gorila | g o r i l a | |
h | h | historik | h i s t o r i k | |
X | ch | chalupa | X a l u p a | |
i | i | bil | b i l | grafémy i a y se ve slovenštině vyslovují shodně |
y | byli | b i l i | grafémy i a y se ve slovenštině vyslovují shodně | |
í | í | síce | s í c e | grafémy í a ý se ve slovenštině vyslovují shodně |
ý | bledý | b l e d í | grafémy í a ý se ve slovenštině vyslovují shodně | |
j | j | jelenica | j e l e ň i c a | |
k | k | kečup | k e č u p | |
l | l | lipový | l i p o v í | |
ĺ | kĺb | k l p | grafém ĺ je reprezentován fonémem l | |
ľ | kľúč | k l ú č | grafém ľ je reprezentován fonémem l | |
m | m | meč | m e č | |
M | m | osemvalcový | o s e M v a l c o v í | retozubné m, varianta fonému m před f a v |
n | n | nakúpil | n a k ú p i l | |
N | n | banka | b a N k a | zadní (velární) n, varianta fonému n před k a g |
ň | ň | umelkyňa | u m e l k i ň a | |
o | o | obchod | o p X o t | |
ó | ó | narkóza | n a r k ó z a | |
p | p | plno | p l n o | |
r | r | rasa | r a s a | |
ŕ | škvŕka | š k v r k a | grafém ŕ je reprezentován fonémem r | |
ř | ř | Říčany | ř í č a n i | český foném ř, znělá varianta |
Ř | ř | Kopřivnice | k o p Ř i v ň i c e | český foném ř, neznělá varianta - vyskytuje se na konci slov a v okolí neznělých párových souhlásek |
s | s | stolička | s t o l i č k a | |
š | š | šek | š e k | |
t | t | tajil | t a j i l | |
ť | necítil | ň e c í ť i l | ||
u | u | usiluje | u s i l u j e | |
ú | ú | absolútna | a p s o l ú t n a | |
v | v | vápenná | v á p e n á | |
z | z | západka | z á p a t k a | |
ž | ž | žuvačka | ž u v a č k a | |
E | FTV | f E t E v E | neutrální vokál, tzv. "šva", vyskytuje se zejména ve zkratkách a slovech anglického původu | |
the | d E | neutrální vokál, tzv. "šva", vyskytuje se zejména ve zkratkách a slovech anglického původu |
Kromě výše popsaných fonémů pracuje systém ještě s dalšími zvukovými modely, které reprezentují různé ruchy a ticho. Některé z nich je přitom možné použít v rámci tvorby výslovnosti slov - viz tento seznam.
Množina uvažovaných (podporovaných) grafémů, které mohou být zkonvertovány do fonémů:
Písmena slovenské abecedy (velká i malá):
a, á, ä, b, c, č, d, ď, dz, dž, e, é, f, g, h, ch, i, í, j, k, l, ĺ, ľ, m, n, ň, o, ó, ô, p, q, r, ŕ, s, š, t, ť, u, ú, v, w, x, y, ý, z, ž
České znaky:
ř (fonémy ř a Ř)
Ostatní symboly (z jiných jazyků nebo např. číslice) musí být před fonetickým přepisem nejprve převedeny na některý výše uvedený grafém (např. německé ü ve slově Köln se zapíše jako výslovnostně nejbližší grafém é).
Pravidla fonetického přepisu (z grafémů na fonémy = G2P pravidla)
Základní pravidla
Základní pravidlo je to, že daný grafém se přepíše na odpovídající foném, např. doma -> d o m a. K tomu je nutné pro některé grafémy přidat následující zvláštní pravidla a spodobu znělosti.
Zvláštní pravidla
Grafém(y) | Foném | Příklad | Vysvětlení |
---|---|---|---|
ä | e | deväť -> ď e v e ť | |
d | ďj | vodič -> v o ď i č | změkčení (palatalizace) způsobené následujícím vokálem i |
dz | C | Dzurinda -> C u r i n d a | |
dž | Č | džús -> Č ú s | |
ĺ | l | kĺzačka -> k l z a č k a | od ľ a l je ĺ detailněji rozlišováno vnitřním modelem V2T systému |
ľ | l | ľahký -> l a X k í | od ĺ a l je ľ detailněji rozlišováno vnitřním modelem V2T systému |
m | M | osemvalcový -> o s e M v a l c o v í | retozubné M způsobené následujícím v nebo f |
n | N | banka -> b a N k a | zadní (velární) N způsobené následujícím k nebo g |
ňj | niekto -> ň j e k t o | změkčení (palatalizace) způsobené následujícím vokálem i | |
ô | u o | pôsobí -> p u o s o b í | |
q | kv | Quido -> kv i d o | |
ŕ | r | dovŕšené -> d o v r š e n é | od r je ŕ detailněji rozlišováno vnitřním modelem V2T systému |
t | ťj | tiež -> ť j e š | změkčení (palatalizace) způsobené následujícím vokálem i |
w | v | wolfram -> v o l f r a m | |
x | ks | text -> t e ks t | |
gz | exil -> e gz i l | ||
y | i | ryba -> r i b a | i a y se ve slovenštině vyslovuje stejně |
ý | í | Sýrie -> s í r i j e | í a ý se ve slovenštině vyslovuje stejně |
Spodoba znělosti
Ve slovenštině se výrazně uplatňuje spodoba znělosti, znělé souhlásky se mohou vyslovovat za určitých okolností nezněle a naopak. Pravopis na tuto změnu výslovnosti přitom nebere zřetel. Spodoba se děje za těchto okolností:
znělé souhlásky se na konci slov vyslovují nezněle, např. led -> l e t
vlivem souhláskového okolí - nejčastěji poslední souhláska ve skupině ovlivní výslovnost celé skupiny. Např. znělý foném z ve slově r o z t o k se vyslovuje nezněle jako s (r o s t o k) kvůli tomu, že za ním následuje neznělý foném t.
Znělé a neznělé fonémy (souhlásky) přitom tvoří páry, v jejichž rámci se spodoba znělosti uplatňuje:
Znělostní páry | |||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|
Neznělý foném | p | t | c | č | k | f | s | ť | Ř | š | X |
Znělý foném | b | d | C | Č | g | v | z | ď | ř | ž | h |
Vybrané příklady spodoby znělosti vlivem následující párové souhlásky:
Spodoba | Příklad | Důvod vlivem následující párové souhlásky | |
---|---|---|---|
Změna znělé na neznělou | |||
b | p | b á b k a -> b á p k a | po b následuje neznělé k |
d | t | b e s i e d k a -> b e s j e t k a | po d následuje neznělé k |
ď | ť | r e ď k e v -> r e ť k e u | po ď následuje neznělé k |
g | k | g a n g s t e r -> g a N k s t e r | po g následuje neznělé s |
h | X | ľ a h k ý -> l a X k í | po h následuje neznělé k |
Změna neznělé na znělou | |||
č | Č | l i e č b a -> l j e Č b a | po č následuje znělé b |
v | v | š é f d i r i g e n t -> š é v d i r i g e n t | po f následuje znělé d |
X | h | S u ch d o l -> s u h d o l | po ch následuje znělé d |
k | g | k d e -> g ď e | po k následuje znělé d |
p | b | u p d a t e -> a b d e j t | po p následuje znělé d |
s | z | I n n s b r u c k -> i n z b r u k | po s následuje znělé b |
t | d | f u t b al -> f u d b a l | po t následuje znělé b |
Změna skupin souhlásek | |||
ck | Cg | h o c k d e -> h o C g ď e | po c a k následuje znělé d |
Ve slovenštině se dále v určitých situacích uplatňuje (na rozdíl od češtiny) spodoba znělosti před nepárovými sonorními souhláskami (m, n, ň, l, r a jejich varianty). Jedná se o změnu neznělé souhlásky na znělou před výskytem sonorní souhlásky ve složených slovech (např. štvrťrok -> š t v r ď r o k; šéfredaktor -> š é u r e d a k t o r). V sekvencích souhlásek a na morfematických švech ve slovech, která nejsou složeninami, se tato spodoba zásadně neuplatňuje (klepnúť -> k l e p n ú ť; vlákno -> v l á k n o). Výjimkou je tvar pomocného slovesa byť - sme -> z m e.