Chybí lidé a aktuální dokumentace, shodli se překladatelé na LinuxDays

22. 10. 2025
Doba čtení: 5 minut

Sdílet

To, že na nás náš svobodný software mluví česky není samozřejmost, ale výsledek dlouhodobé práce řady překladatelů. Je to činnost, která vyžaduje dobrou znalost angličtiny, češtiny, i linuxového softwaru.

Čeští překladatelé se sdružují kolem webu L10N.cz (a tamní e-mailové konference a Matrix kanálu). Tohle můžeme zkusit změnit, zlepšit stav českých překladů a zjednodušit začátek novým překladatelům. Na nedávno proběhlých — a velmi povedených — LinuxDays se v neděli uskutečnilo setkání překladatelů, kde jsme si vyměňovali zkušenosti a diskutovali co a jak nám (ne)funguje, kde jsou potíže a co by se dalo zlepšit.

Obecně o překladech

Překladatelé typicky pracují se soubory PO, které lze stáhnout například z gitového repozitáře překladů. Soubory PO (Portable Object) obsahují překlady textových řetězců v softwaru a slouží k jeho lokalizaci do různých jazyků.

Vznikají ze souborů POT (šablon), které vývojáři vyexportují ze zdrojového kódu a obsahují všechny přeložitelné texty v původním jazyce (obvykle angličtině). Pro každý jazyk překladů tak ze souborů POT vznikne separátní sada souborů PO. Pokud překlad probíhá pomocí webové aplikace, překladatel s nimi vůbec nepřijde do styku.

Překladatelská současnost

Obecně panovala shoda, že řada projektů má nežádoucí technické bariéry, které mají velký potenciál odradit zájemce o překlady. Jako typický příklad mohou sloužit linuxové manuálové stránky, kde si překladatel musí naklonovat příslušný repozitář a potom v adresáři po/cs najít, a pomocí speciálního software jako je Lokalize pro KDE, přeložit příslušný soubor PO. Přitom musí překladatel správně použít skripty v adresáři po a samozřejmě používat Git a nic nerozbít nikde jinde. Takto je to navíc jen zjednodušené, kompletní postup je delší.

Nástroje pro překlady

Je zřejmé, že proces, kdy uživatel musí relativně složitě získávat účet na GitLabu Debianu a naučit se práci s Gitem a se speciálními skripty, není zcela ideální start pro někoho, kdo má pravděpodobně jiné kompetence, než běžný linuxák.

Obdobná situace je například u KDE, jak nám předvedl Jan Papež, kde jsou překlady v SVN repozitáři, případně si uživatel může najít soubory PO jednotlivých komponent v GitLabu. Podobně to vypadá u řady dalších projektů – navíc čím větší projekt, tím hůře se s tím dá něco udělat.

Samozřejmě, soubor si lze „nějak ručně“ stáhnout, přeložit a poslat mailem koordinátorovi, ale ani to není ideální. Překladatel typicky nemá k dispozici věci jako historii překladů, kontext, návrhy podobných překladů a podobně. Někdy to může být ještě složitější a koordinátor pak odesílá překlady pod svým účtem, čímž reálný překladatel poněkud přichází o kredity.

Vstupní bariéru pro zájemce o překlady minimalizují webové nástroje jako je Weblate, které kombinují funkce verzovacího systému (může běžet na Gitem nebo jiným repozitářem), specializovaného překladatelského softwaru a všech možných obslužných skriptů.

Nástroje pro překlady

První verzi napsal v roce 2012 Michal Čihař v SUSE a nyní hostuje přes 1400 projektů. Projekty jako openSUSE nebo LibreOffice si hostují vlastní instance Weblate. Benjamin Alan Jamie z týmu Weblate představil, co všechno umí a řadu dalších věcí.

Obdobný nástroj je Mozilla Pontoon, ve kterém najdete drtivou většinu překladů projektů Mozilly a který představil Pavel Cvrček. Do takovýchto webových služeb se stačí prostě se přihlásit a začít překládat. Překladatel nemusí tušit nic o existenci souborů PO, nemusí řešit Git ani nic dalšího. Jen se přihlásí a začne pracovat. Minimalizuje to vstupní bariéry, takže to má největší potenciál přilákat nové přispěvatele a hlavně je hned zase neodradit.

Nástup ejáj

Nelze nezmínit umělou inteligenci, velké jazykové modely a vůbec strojové překlady. Všechny tyto nástroje mají potenciál výrazně zvýšit efektivitu práce, ale nesou s sebou i celou řadu potíží. Od licenčních a etických dilemat přes potíže s udržením konzistence terminologie a nejrůznějšími posuny významů, až po nedeterministické chování a nepředvídatelnost výsledku.

Nicméně překladatelů je obecně nedostatek, materiálů k přeložení je víc než dost, takže pokud nedokážeme přilákat zástupy nových překladatelů, buď musíme nasadit strojové překlady, anebo bude míra přeloženosti svobodného softwaru klesat. Jiná možnost není. Samozřejmě nemizí role lidského faktoru, který musí zajistit, aby překlady byly konzistentní a nebyly v nich chyby.

Některé projekty už tyto techniky aktivně využívají. Například LibreOffice používá API DeepL při překladech svých příruček. V Mozille někteří překladatelé obdobně používají umělou inteligenci při překladech dokumentace. Rozsáhlejší texty jsou typickým místem, kde AI velmi šetří práci. U dokumentace obvykle dochází mezi verzemi k větším či menším změnám. Překladatelské nástroje sice ukazují rozdíly mezi starou a novou verzí, ale takovéto opravy delších bloků textu jsou poměrně nepohodlné, zatímco korekce pomocí LLM je rychlá a dostatečně spolehlivá.

Nástroje pro překlady

Zajímavý příklad této problematiky představil Martin Hajduch, který v soukromé společnosti využívá API ChatGPT k překladům průmyslového software. Potřebné přesnosti dosahují tak, že nejdříve nechají s nějakým primitivním promptem přeložit již přeložený text a v dalším kroku po GPT chtějí, aby prompt sám upravit tak, aby se jeho překlad blížil již přeložené variantě.

Po zhruba třech až pěti takových iterativních krocích mají prompt dostatečně ujasněný pro daný projekt a mohou nechat přeložit zbytek. Pythonový skript to celé řeší celkem efektivně, celý proces výrazně zvyšuje efektivitu práce, šetří čas překladatelům. Iterativní úpravy promptu vedou k vysoké spolehlivosti překladu, který samozřejmě stále vyžaduje ruční kontrolu.

Výměna zkušeností a domácí úkoly

Poslední takové setkání proběhlo na LinuxDays v roce 2017, takže podstatnou část vymezeného času jsme strávili vzájemným představováním, které nástroje různé týmy používají, jaké s tím mají zkušenosti, co funguje dobře a co méně.

Zároveň jsme seznali, že dokumentace a instrukce pro překladatele jsou mnohdy zastaralé, nedostatečné, anebo pro nově příchozí málo motivační. Na tomto musíme zapracovat, což znamená aktualizaci L10N.cz a příslušných stránek jednotlivých projektů. To je podmínka nutná k tomu, aby se situace v překladech zlepšila. Pomůžete nám?

Jak se zapojit

Pokud máte nějaký open-source projekt, na kterém vám záleží a kterému byste rádi pomohli zlepšením jeho přeloženosti do češtiny, na jeho domovské stránce většinou najdete sekci „jak se zapojit“ a tam kapitolu o překladech s instrukcemi. Řada nejen linuxových projektů je popsána na L10N.cz, kde můžete najít kontakty a návody. Ideálně se také přidejte k naší e-mailové konferenci a/nebo matrixovému kanálu, ať zůstanete v obraze.

Řada projektů má své překlady ve webových službách (např. Fedora, LibreOffice, Mozilla nebo openSUSE), kde se stačí zaregistrovat a můžete začít pracovat. Obdobně je velké množství projektů hostovaných přímo ve Weblate. Tak se do toho s chutí pusťte.

(Autorem obrázků je Vojtěch Zeisek.)

Autor článku

Biolog, bioinformatik pracující s genetickými daty. Jejich zpracování typicky probíhá na linuxových serverech MetaCentra. Dlouholetý linuxák a uživatel openSUSE. Občasný přispěvatel do řady open-source projektů a překladatel.