Fonetická transkripce polštiny
V2T (voice-to-text) systémy pracují se seznamem slov (slovníkem), kde je u každého slova uvedena jeho výslovnost. Např. slovo rzecz má výslovnost [žeč]. U některých slov je vhodné uvést více výslovností, např. LCD [elcede, elsidi], DVD [devede, dividi].
Slova jsou ve slovníku zapsána pomocí písmen, číslic a nebo symbolů. Výslovnosti pomocí fonémů. Každý foném je přitom reprezentován vždy jen jedním symbolem. Např. slovo K2, které se zkládá z písmene K a číslice 2, má výslovnost [kadva], která se zapisuje pomocí příslušných pěti fonémů. Symboly pro fonémy jsou přitom zvoleny tak, aby byly pokud možno totožné s odpovídajícími (podobnými) písmeny daného jazyka.
Cílem fonetické transkripce je převést textový zápis slova na odpovídající výslovnost zapsanou pomocí fonémů. Protože ale slovo ve slovníku může obsahovat i číslice a další speciální symboly, je fonetický přepis definován nad množinou tzv. grafémů, která je omezená co do rozsahu a obsahuje většinou pouze písmena dané abecedy.
Převést textový zápis slova do grafémového zápisu je přitom jednoduché. Znamená to zapsat slovo pomocí znaků dané abecedy tak, jak je čteno. U běžných slov je pak grafémový zápis totožný s tím, jak se slovo běžně píše (a čte). Pozornost je naopak nutné věnovat zejména cizím slovům, zkratkám a slovům obsahujícím číslovky či symboly.
Fonetická transkripce slova či fráze tedy probíhá ve dvou krocích:
krok: Slovo se přepíše do grafémů (znaků abecedy) způsobem, jakým je čteno.
krok: Použijí se pravidla fonetické transkripce (popsaná stručně na konci manuálu) nebo příslušný automatický nástroj či program (tzv. G2P převodník).
Na rozdíl od oficiálních pravidel polské fonetické transkripce je výslovnost některých grafémů (skupin grafémů) v rámci V2T systému reprezentována jen jedním fonemém (systém pak odlišnosti ve výslovnosti těchto grafémů rozlišuje datailněji pomocí architekury vnitřních akustických modelů):
Výslovnost grafémů ć, cz, ci je reprezentována jedním fonémem č.
Výslovnost grafémů dż, dzi, dź je reprezentována jedním fonémem Č.
Výslovnost grafémů ś, sz, si je reprezentována jedním fonémem š.
Výslovnost grafémů ż, ź, zi, rz je reprezentována jedním fonémem ž.
Příklady grafemické a fonetické transkripce běžných (domácích) slov, cizích slov, akronymů, zkratek, čísel atd.
Typ slova | Příklad | Přepis do grafémů | Přepis do fonémů |
---|---|---|---|
Běžné slovo | licznik | licznik | ličňik |
upokorzenie | upokorzenie | upokožeňe | |
chrapanie | chrapanie | Xrapaňe | |
limonka | limonka | limoNka | |
kluczyć | kluczyć | klučyč | |
Cizí slovo | dźons | dźons | Čons |
voix | vła | vła | |
Citroën | sitroen | sitroen | |
Schönberg | szenberk | šenberk | |
Akronym | UNESCO | unesko | unesko |
b2b | bi tu bi | bitubi | |
Zkratka | ABS | a be es | abees |
HTML | cha te em el | Xateemel | |
SOS | es o es | esoes | |
Víceslovný výraz | The Beatles | d bitls | dEbitls |
Aix en Provence | eks an provans | eksanprovans | |
chargé d'affaires | szarźe d afer | šaržedafer | |
Výrazy s čísly | 2. | drugi | drugi |
7x | siedem razy | šedemrazy | |
A8 | a osiem | aošem |
Seznam a vysvětlení fonémů a jejich symbolů je uveden níže. Dále pak následují pravidla fonetického přepisu z grafémů do fonémů (G2P).
Množina fonémů (fonetická abeceda)
Foném | Grafém(y) | Příklad - text | Příklad - fonetický přepis | Vysvětlení |
---|---|---|---|---|
a | a | akordeon | a k o r d e o n | |
ą | ą | akrobatą | a k r o b a t ą | |
b | b | balon | b a l o n | |
c | c | całe | c a ł e | |
C | dz | bardzo | b a r C o | |
č | ć | nakłuć | n a k ł u č | |
cz | Niemczy | ň e m č y | ||
ci | kabarecie | k a b a r e č e | ||
Č | dż | dżungla | Č u N g l a | |
dzi | arcydzieł | a r c y Č e ł | ||
dź | dźwięk | Č v j ę k | ||
g | George | Č o r č | ||
d | d | dach | d a c h | |
e | e | edukacja | e d u k a c j a | |
ę | ę | fantazję | f a n t a z j ę | |
f | f | fabryczka | f a b r y č k a | |
g | g | gabinet | g a b i n e t | |
h | h | horyzont | h o r y z o n t | |
X | ch | modnych | m o d n y X | |
h | huczna | X u č n a | ||
i | i | idąc | i d ą c | |
j | j | jabłko | j a b ł k o | |
k | k | kabaret | k a b a r e t | |
l | l | labirynt | l a b i r y n t | |
ł | ł | łacina | ł a c i n a | |
m | m | macierze | m a c i e r z e | |
n | n | nabić' | n a b i ć' | |
N | n | dżungla | Č u N g l a | velární (zadní) N, varianta fonému n před k a g |
ň | ni | Niemczy | ň e m č y | |
o | o | obalić | o b a l i ć | |
p | p | pacjent | p a c j e n t | |
r | r | rabat | r a b a t | |
s | s | sabotaż | s a b o t a ż | |
š | ś | nieśli | ň e š l i | |
sz | Warszawa | v a r š a v a | ||
si | nosi | n o š i | ||
t | t | tabel | t a b e l | |
u | u | notyfikuje | n o t y f i k u j e | |
ó | nosów | n o s u f | ||
v | w | Warszawa | v a r š a v a | |
v | Nova | n o v a | ||
y | y | bledszy | b l e d s z y | |
z | z | złu | z ł u | |
ž | ż | drży | d r ž y | |
ź | łaźni | ł a ž ň i | ||
zi | zawęził | z a v ę ž i ł | ||
rz | drzewo | d ž e v o | ||
E | the | d E | neutrální vokál, tzv. "šva", vyskytuje se zejména ve zkratkách a slovech anglického původu |
Kromě výše popsaných fonémů pracuje systém ještě s dalšími zvukovými modely, které reprezentují různé ruchy a ticho. Některé z nich je přitom možné použít v rámci tvorby výslovnosti slov - viz tento seznam.
Množina uvažovaných (podporovaných) grafémů, které mohou být zkonvertovány do fonémů:
Písmena polské abecedy (velká i malá):
a, ą, b, c, ć, d, e, ę, f, g, h, i, j, k, l, ł, m, n, ń, o, ó, p, r, s, ś, t, ť, u, w, x, y, z, ź, ż
Písmena běžně používaná v cizích slovech: q, x, v
Ostatní symboly (z jiných jazyků nebo např. číslice) musí být před fonetickým přepisem nejprve převedeny na některý výše uvedený grafém (např. německé ü ve jménu Müller se zapíše jako "výslovnostně" nejbližší grafém y)
Pravidla fonetického přepisu (z grafémů na fonémy = G2P pravidla)
Základní pravidla
Základní pravidlo je to, že daný grafém se přepíše na odpovídající foném, např. doły -> d o ł y. K tomu je nutné přidat pro některé grafémy následující zvláštní pravidla a spodobu znělosti
Zvláštní pravidla
Grafém(y) | Foném | Příklad | Vysvětlení |
---|---|---|---|
ci | č | kabarecie -> k a b a r e č e | |
cz | č | Niemczy -> ň e m č y | |
ć | č | nakłuć -> n a k ł u č | |
dz | C | bardzo -> b a r C o | |
dzi | Č | arcydzieł -> a r c y Č e ł | |
dż | Č | dżungla -> Č u N g l a | |
dź | Č | dźwięk -> Č v j ę k | |
g | Č | George -> Č o r č | cizí slovo |
ch | X | modnych -> m o d n y X | |
h | X | huczna -> X u č n a | |
n | N | dżungla -> Č u N g l a | zadní (velární) N, předchází k či g |
ni | ň | Niemczy -> ň e m č y | změkčení (palatalizace) v sekvenci ni |
ś | š | nieśli -> ň e š l i | |
sz | š | Warszawa -> v a r š a v a | |
si | š | nosi -> n o š i | změkčení (palatalizace) v sekvenci si |
ó | u | nosów -> n o s u f | |
w | v | Warszawa -> v a r š a v a | |
ż | ž | drży -> d r ž y | |
ź | ž | łaźni -> ł a ž ň i | |
zi | ž | zawęził -> z a v ę ž i ł | změkčení (palatalizace) v sekvenci zi |
rz | ž | drzewo -> d ž e v o |
Spodoba znělosti
V polštině se uplatňuje spodoba znělosti, znělé souhlásky se mohou vyslovovat za určitých okolností nezněle a naopak. Pravopis na tuto změnu výslovnosti přitom nebere zřetel. Spodoba se děje za těchto okolností:
znělé souhlásky se na konci slov vyslovují nezněle, např. David -> d a v i t
vlivem souhláskového okolí - nejčastěji poslední souhláska ve skupině ovlivní výslovnost celé skupiny (tzv. regresivní spodoba). Např. znělý foném b ve slově n a g r o b k i se vyslovuje nezněle jako p (n a g r o p k i) kvůli tomu, že za ním následuje neznělý foném k. V polštině se uplatňuje i progresivní spodoba znělosti, a to v případě hláskové sekvence neznělý konsonant + w, v jakékoliv pozici ve slově. Slovo podeszwa tedy bude vysloveno jako p o d e š f a.
Znělé a neznělé fonémy (souhlásky) přitom tvoří páry, v jejichž rámci se spodoba znělosti uplatňuje:
Znělostní páry | |||||||||
---|---|---|---|---|---|---|---|---|---|
Neznělý foném | p | t | c | č | k | f | s | š | X |
Znělý foném | b | d | C | Č | g | v | z | ž | h |
Vybrané příklady spodoby znělosti vlivem následující párové souhlásky:
(Regresivní) spodoba | Příklad | Důvod vlivem následující párové souhlásky |
---|---|---|
b -> p | n a g r o b k i -> n a g r o p k i | po b následuje neznělé k |
C -> c | i s l a n dz k a -> i s l a n c k a | po C následuje neznělé k |
č -> Č | c h o ć b y -> X o Č b y | po č následuje znělé b |
d -> t | k ł a d k a -> k ł a t k a | po d následuje neznělé k |
g -> k | g a n g s t e r -> g a N k s t e r | po g následuje neznělé s |
v -> f | s i e w k a -> š e f k a | po v následuje neznělé k |
s -> z | S t r a s b u r g -> s t r a z b u r k | po s následuje znělé b |
ž -> š | ch rz t e m -> X š t e m | po ž následuje neznělé t |
(Progresivní) spodoba | Příklad | Důvod vlivem následující párové souhlásky |
---|---|---|
w -> f | t w a r o ż e k -> t f a r o ž e k | před w předchází neznělé t |
ć w i a r t e k -> č f j a r t e k | před w předchází neznělé ć | |
b a l o n i a r s t w o -> b a l o ň a r s t f o | před w předchází neznělé st |