Přeskočit na obsah

Wikipedie:Časté chyby při strojovém překladu

Z Wikipedie, otevřené encyklopedie

Strojový překlad Wikipedie je dlouhodobě oblíbený nástroj, který pomáhá jednotlivým editorům s překlady článků z jiných jazyků. Česká Wikipedie je jednou z 30 největších jazykových verzí internetové encyklopedie. To ji přirozeně řadí do situace, kdy z hlediska zahraničních nebo celosvětových témat čeští editoři budou a musí čerpat z ostatních jazykových verzí. Pomocí strojového překladu mohou překládat rychleji a z jazyků, kterými v běžném případě nevládnou. Takové překlady však bývají problematické. Tato stránka si klade za účel některé z častých chyb strojových překladů ukázat.

Problematické části ve výstupech strojových překladů

[editovat | editovat zdroj]
  1. Časté opakování stejných slov v jedné větě.
  2. Příliš dlouhá a složitá souvětí.
  3. Otrocké překlady některých ustálených slovních spojení.
  4. Chybné překlady slovních spojení, kde je vyžadována znalost určitého kulturního kontextu.
  5. Chybná terminologie např. v případě taxonym, regionů
  6. Chybné přepisy místních názvů

Jednotlivé nástroje pro strojový překlad se samozřejmě stále vyvíjejí, nicméně se jedná o nemyslící stroj, který hledá nejlepší odpovídající hodnotu. Nástroj, který je excelentní pro snadné a rychlé porozumění, však nemůže být v roli rozhodující o obsahu na Wikipedii, která přísluší vždy uživateli.

Níže jsou vybrané ukázky strojového překladu (k lednu 2025) a častých chyb. Názvy článků se týkají použitých témat, nejedná se o výňatky z článků na české Wikipedii. Tučně jsou označeny stylistické nepřesnosti.

Angličtina

[editovat | editovat zdroj]
Donald Trump
angličtina (zdrojový text) čeština (překlad deepl) chyby
Trump graduated with a bachelor's degree in economics from the University of Pennsylvania in 1968. He became president of the Trump family real estate business in 1971 and focused on luxury accommodations. After a series of business bankruptcies in the 1990s, he launched several side ventures. From 2004 to 2015, he produced and hosted the reality television series The Apprentice. Trump v roce 1968 získal bakalářský titul v oboru ekonomie na Pensylvánské univerzitě. V roce 1971 se stal prezidentem rodinného realitního podniku Trumpů a zaměřil se na luxusní ubytování. Po sérii podnikatelských bankrotů v 90. letech 20. století zahájil několik vedlejších podniků. V letech 2004-2015 produkoval a uváděl televizní reality show The Apprentice. Sousloví prezident podniku se v češtině nepoužívá, stejně jako zahájení několika vedlejších podniků či luxusní ubytování. V tomto případě je nezbytné je ručně nahradit za vhodné pojmy – jednatel společnosti, ubytování pro náročné nebo založil několik nových firem. Vhodný pojem nelze v tomto případě snadno vybrat, je nezbytné mu porozumět z kontextu.
Kensington
angličtina (zdrojový text) čeština (překlad deepl) chyby
The manor of Kensington, in the county of Middlesex, was one of several hundred granted by King William the Conqueror (1066–1089) to Geoffrey de Montbray (or Mowbray), Bishop of Coutances in Normandy, one of his inner circle of advisors and one of the wealthiest men in post-Conquest England. He granted the tenancy of Kensington to his follower Aubrey de Vere I, who was holding the manor from him as overlord in 1086, according to the Domesday Book. Panství Kensington v hrabství Middlesex bylo jedním z několika stovek, které král Vilém Dobyvatel (1066-1089) udělil Geoffreymu de Montbray (nebo Mowbray), biskupovi z Coutances v Normandii, jednomu z jeho nejbližších rádců a jednomu z nejbohatších mužů v Anglii po dobytí. Ten udělil nájemní právo na Kensington svému stoupenci Aubreymu de Vere I., který od něj podle Domesday Book držel panství v roce 1086 jako overlord. Namísto Panství Kensington je stylisticky vhodnější užít Kensingtonské panství, srov. Kensingtonský palác namísto Palác Kensington. V českém kontextu nebývá majetek do péče udělován, nýbrž svěřován. Jedná se o ustálenou terminologii v majetkoprávní oblasti, kterou strojové překladače nejspíš neznají, resp. vychází z odlišného pojetí stejného aktu jinými právními systémy. Dobytí je v anglickém kontextu vnímáno jako historická události a má svůj význam (srov. Odsun pro vysídlení Němců apod.). Takový obrat nelze v českém textu použít, neboť strojový překlad není schopen porozumět kontextu textu. Je otázka, zdali se jedná o odpovídající historický termín, lze ale předpokládat, že termín overlord se v češtině nepoužívá a pro dějiny Anglie je k dispozici český termín zažitější, který ovšem překladač zde nepoužil.
Cantonment
angličtina (zdrojový text) čeština (překlad deepl) chyby
Several cities in the Indian subcontinent, including Ahmedabad, Ambala, Bellary, Belgaum, Bangalore, Danapur, Jabalpur, Kanpur, Bathinda, Delhi, Nilgiris, Chennai, Mumbai, Pune, Meerut, Ramgarh, Secunderabad, and Trichy, contained large cantonments of the former British Indian Army, with Meerut and Ramgarh being two of the most important cantonments in Northern India, second only to the headquarters at Rawalpindi (now in Pakistan). V několika městech na indickém subkontinentu, včetně Ahmedábádu, Ambaly, Bellary, Belgaumu, Bangalore, Danapuru, Džabalpuru, Kánpuru, Bathindy, Dillí, Nilgiri, Čennaí, Bombaje, Púny, Mírútu, Rámgarhu, Sekunderábádu a Tričí, se nacházely velké kantony bývalé britské indické armády, přičemž Mírút a Rámgarh byly dva nejdůležitější kantony v severní Indii, hned po velitelství v Rávalpindí (nyní v Pákistánu). Místní názvy mohou mít české ekvivalenty. V případě anglicky psaných místních názvů se tyto užívají bez fonetického přepisu, v případě jiných zemí toto nemusí být zřejmé. Namísto Bangalore se používá název Bengalúr apod. Strojový překlad je schopen toto reflektovat jen z části. Sousloví velké kantony v českém kontextu odkazuje na velké správní jednotky (např. ve Švýcarsku), nikoliv na vojenské objekty, jako tomu bylo v Indii. Je nezbytné termín v textu vysvětlit a případně užít anglický pojem. Je otázkou, zdali v českém historickém kontextu je užíván pojem Britská indická armáda nebo není užitý jiný. Nejste-li si jisti, použijte nadřazený, tj. Britská armáda. Pojem velitelství je při strojovém překladu vlivem vyšší míry posesivity v angličtině pro češtinu nadužíván a je nezbytné zvolit termín jiný.
Sága o Nibelunzích
němčina (zdrojový text) čeština (překlad deepl) chyby
Die Sage schlägt sich in mittelalterlichen Quellen außer im Nibelungenlied in der Sage von Dietrich von Bern (Thidrekssaga, altnordisch mit niederdeutschen Quellen, ca. 1250) und zahlreichen Liedern der Edda nieder. Unter diesen sind mehrere Sigurdlieder und das ältere Atlilied (altisländisch, aufgezeichnet im 13. Jahrhundert nach teilweise viel älteren Quellen oder Vorstufen). Prosa-Nacherzählungen der Eddalieder finden sich in der Edda des Snorri Sturluson (altisländisch, ca. 1220) und in der Völsunga-Saga (altisländisch, ca. 1250). Vom Ende des 13. Jahrhunderts stammt der Nornagests þáttr. Kromě Písně o Nibelunzích se sága odráží ve středověkých pramenech v sáze Dietricha z Bernu (Thidrekssaga, staroslověnština s dolnoněmeckými prameny, asi 1250) a četných písních z Eddy. Patří k nim několik Sigurdových písní a starší Atlilied (staroislandsky, zapsaná ve 13. století částečně na základěmnohem starších pramenů či předchůdců). Prozaické převyprávění písní z Eddy lze nalézt v Eddě Snorriho Sturlusona (staroislandsky, cca 1220) a v sáze Völsunga (staroislandsky, cca 1250). Nornagests þáttr pochází z konce 13. století. Strojový překlad není schopen použití synonym a často používá stejná slova za sebou, jako zde např. sága. Staroslověnština není v tomto případě vůbec na místě; strojový překlad kontextuálně vytušil starý jazyk s vazbou předchůdce na současný, kterému v češtině skutečně staroslověnština odpovídá, nicméně zde se jedná o starou severštinu. Užití slova předchůdců je v tomto případě nešťastné, neboť by v češtině měl být zvolen pojem jiný, méně odkazující na otrocký překlad.

Francouzština

[editovat | editovat zdroj]
Joseph Chambon
francouzština (zdrojový text) čeština (překlad Google) čeština (překlad DeepL) chyby
Baron de Limoron par lettres patentes du 13 mars 1812. Règlement d'armoiries :
Ecartelé : au premier, d'or à l'arbre arraché, de sinople, accompagné en chef de deux tiges à trois épis chacune du même posées en chevron ; au deuxième, des barons tirés de l'armée ; au troisième, de gueules au boeuf arrêté, contourné, d'argent ; au quatrième, d'or à la fourmi posée en fasce, de sable. Livrées : les couleurs de l'écu, le verd en bordure seulement.
Baron de Limoron patentem dopisů z 13. března 1812. Erbovní řád:
Čtvrtletní: první, zlatá s roztrhaným stromem, sinople, doprovázená v čele dvěma stonky se třemi ušima, každý z nich umístěný v šípu; na druhém baroni pocházející z armády; třetí, gules, zastavený vůl, tvarovaný, argent; čtvrtý, zlatý s mravencem ve fesu, sobolí. Livreji: barvy štítu, zelená pouze na okraji.
Baron de Limoron na základě patentu ze dne 13. března 1812. Pravidla pro zbraně :
Čtvrcený: v prvním, Or strom vymýcený, vert, mezi v čele dva stonky po třech klasech položené v chevronu; ve druhém, baroni vytaženi z vojska; ve třetím, Gules vůl zastavený, contourny, argent; ve čtvrtém, Or mravenec položený v fess, sable. Játra: barvy štítu, zelená pouze na okraji.
Jedná se o heraldický popis šlechtického znaku. Protože je text jen hutným heslovitým výčtem jednotlivých prvků, překladač nedokáže izolované výrazy zasadit do kontextu, nerozpoznává gramatické vazby, nepoznává ustálené výrazy označující heraldické barvy (or = zlatá, vert = zelená, gules = červená, argent = stříbrná, sable = černá) apod.

Maďarština

[editovat | editovat zdroj]
Nové Zámky
maďarština (zdrojový text) čeština (překlad deepl) chyby
A várat a törökök szeptember 26-án vették birtokba. Ezután megalakították az Újvári ejáletet. Érsekújvár eleste komoly következményekkel járt. Nyitra, Léva, Galgóc, Komját, Nógrád, Drégely és Buják környéke a török portyák áldozata lett. Hrad byl 26. září dobyt Turky. Poté vznikl Újvárský ejálet. Pád Érsekújváru měl vážné následky. Nyitra, Léva, Galgoč, Komiţa, Nógrád, Drégely a okolí Bujaku padly za oběť tureckým nájezdům. V případě historických toponym strojový překlad nedokáže pro jiné užití v jiném kulturním prostředí najít odpovídající český ekvivalent. Namísto Érsekújvár musí být v češtině vždy použity Nové Zámky, obdobně namísto Nyitra správné Nitra, některá toponyma ale mohou být v užití volnější, jako zde Nógrád namísto Novohrad apod.
Zámuří
maďarština (zdrojový text) čeština (překlad deepl) chyby
Az 1664-es szentgotthárdi csata az egész mai Muravidékre is kihatott: török és keresztény főseregek felvonulási területe volt a vidék és falvai jelentős pusztítást voltak kénytelenek elszenvedni főleg a tatár lovasság támadásától. A török invázió következtében némely települések örökre elpusztultak és nyom nélkül eltűntek. Részben ezek lakosai vándoroltak Somogyba. Bitva u Szentgotthárdu v roce 1664 se dotkla i celého dnešního moravského regionu: oblast byla nástupištěm tureckých a křesťanských vojsk a její vesnice utrpěly značné škody, zejména od tatarské jízdy. V důsledku tureckého vpádu byly některé osady navždy zničeny a zmizely beze stopy. Část jejich obyvatel se přestěhovala do Somogy. Namísto Moravského regionu je odpovídajícím českým termínem Zámuří. V případě pojmu nástupiště je nezbytné najít adekvátní pojem z vojenské terminologie, např. nástupní prostor apod. Použití místních názvů, která nejsou v českém textu obvyklá bez vysvětlení může být matoucí, správně by mělo být do župy Somogy.
Vysoké Tatry
maďarština (zdrojový text) čeština (překlad deepl) chyby
Amikor a terület a Felvidék részeként Magyarországhoz tartozott, a Tátra alján a fenyvest elsősorban a jegenyefenyő állományai alkották. A trianoni döntést követően az új gazdák haszonszerzés céljából a mélyebben gyökerező, szívós, ám lassú növekedésű – így csekélyebb gazdasági haszonnal kecsegtető – jegenyefenyőt kivágták, helyére sekélyebben gyökerező, de gyors növekedésű lucfenyőt telepítettek. A telepített fenyves nagy részét a 2004. november 19-i szélvihar szinte teljesen megsemmisítette. V době, kdy tato oblast patřila k Uhersku jako součást Vysočiny, tvořily borové lesy na úpatí Tater především porosty borovice lesní. Po Trianonské smlouvě noví hospodáři vykáceli borovici lesní s hlubšími kořeny, odolnou, ale pomalu rostoucí borovici lesní, která přinášela menší hospodářský užitek, a nahradili ji smrkem s mělčími kořeny, ale rychle rostoucím. Většina borových porostů byla téměř zcela zničena větrnou smrští z 19. listopadu 2004. Pojem Felvidék je specifický historický maďarský termín, který nelze přeložit jako Vysočina ale jako Horní zem (tzn. horní ve smyslu že je výše než byl zbytek Uherska; odtud překladač chybně dohledává slovo Vysočina), případně území dnešního Slovenska, v takovém případě je však nezbytné změnit kontext celé věty. Nahradili ji nelze uvést bez toho, aniž by bylo zmíněno kdo tak učinil, např. lesní správa, příslušné úřady apod. V češtině nelze použít událost z 19. listopadu 2004, ale událost dne 19. listopadu 2004 nebo jen událost 19. listopadu 2004.

Arabština

[editovat | editovat zdroj]
Jusúf Aún
arabština (zdrojový text) čeština (překlad deepl) chyby
بدأ عون حياته العسكرية متطوعا عام 1983، ومنذ عام 1984 شارك في عدة دورات عسكرية من بينها دورة الضباط عام 1986، ودورة الغطس عام 1987، ودورة الضابط العسكري عام 1996، وذلك إلى جانب دورة قائد كتيبة عام 2002، ودورة في عمل الأركان عام 2012. Aoun zahájil svou vojenskou kariéru jako dobrovolník v roce 1983 a od roku 1984 se zúčastnil několika vojenských kurzů, včetně důstojnického kurzu v roce 1986, potápěčského kurzu v roce 1987, kurzu pro vojenské důstojníky v roce 1996, kurzu pro velitele praporu v roce 2002 a kurzu pro štábní práci v roce 2012. Joseph Aoun je anglikanizované jméno, správná podoba by měla být pravděpodobně Jusúf Aún – v češtině musí být arabské pojmy vždy ve fonetickém přepisu. Pojem dobrovolník může být v arabském jazyce užit pro vojenskou hodnost nebo paravojenskou jednotku, v češtině nicméně takto užíván není a měl by být najít odpovídající pojem. Stejně tak štábní práce není v češtině užívaný obrat, ale otrocký překlad, pro který překladač nenalezl vhodný český ekvivalent.

Související stránky

[editovat | editovat zdroj]