A já si desítky let lámu hlavu, proč učitelé angličtiny na SŠ/VŠ plýtvají energií na 1001 variaci na stará ohraná témata (a teď se i trápí generováním textů) místo toho, aby nasměrovali energií svých studentů a společně se vrhli na překlady nějakého pěkného OSS.
No já nevím, tohle zkusil v devadesátých letech jeden podnikavý učitel dokonce komerčně. V takovém překladu vyšla kniha tuším od Sterlinga (nebo Gibsona? každopádně cyberpunk) a výsledek byl naprosto otřesný.
Jak se tam píše, tak dá. ;-) Ale není to tak jednoduché. Musí se to pak kontrolovat, protože jinak AI např. neudrží konzistentní terminologii...
... a držet konzistentní terminologii je u technických překladů základ. (Doplnění pro případného neznalého čtenáře.)
To neni zdaleka jen u technickych prekladu ... schvalne ... co mi dodas, kdyz po tobe chci vyrobit a prinest "minomet" (mortar) ...
Ty ses dneska vylih ze? Videls nekdy nejakej translatorovej preklad? Tohle je exaktne totez. A je to pohroma naprosto vzdy. Je to vlastne radove horsi, nez preklad ibovolniho literarniho dila. Proc? Protoze tu knizku typicky nekdo uz prelozil, takze to ta uzasna AI ukradne.
Asi takhle: Překládal jsem před cca rokem a půl (novou, nikdy nepublikovanou) povídku kamarádky do angličtiny. Nejdřív ručně, pak jsem vždycky kus vložil do DeepL a porovnal. Byl to beleteristický text, kamarádka psát docela umí a hodně využívá možnosti co jí čeština dává. Občas jsem měl lepší formulaci já, občas jsem se po shlédnutí DeepL překladu uhodil do hlavy "no jasně, pro tohle je přece v angličtině tahle fráze / idiom". Párkrát DeepL popletl jednající osoby nebo udělal podobnou botu. Nicméně kvůli limitaci jsem mu to dávkoval, kdyby překládal celý text najednou, možná by měl lepší kontext.
Před asi půl rokem jsem korigoval jeden několik párstránkových textů přeložených (myslím) ChatGPT z němčiny do angličtiny. Na pár místech jsem přidal / ubral / změnil slovo, aby to znělo lépe a jednou jsem ho nachytal že opět prohodil osoby. Ale jinak naprosto v pohodě.
Takže bych řekl, že s překlady technické dokumentace může AI hodně pomoct. Sice to stále chce lidskou kontrolu (to ona i práce člověka...), ale i tak ušetří hromadu času.
22. 10. 2025, 09:26 editováno autorem komentáře
Opakovani matka moudrosti ze?
https://www.youtube.com/watch?v=6fy42pCc1Z4
"Nizky uroven energie"
"Jedalen"
"pokrok v tlaku"
Jo, presne takhle vypadaj vsechny AIckovy preklady.
Zrovna u tohohle je problém, že se překládají jednotlivé výrazy bez kontextu, a bez něj AI, stejně jako lidský překladatel neví, který z možných překladů vybrat.
U technické dokumentace jde o souvislejší text, kde ten kontext je, nebo jde celkem jednoduše dodat.
"U technické dokumentace jde o souvislejší text"
Jasne ... takze manpage si vzivote nevidel. Zadnou.
Kdysi dávno u nějakého programu k dotykovému panelu byla v menu položka: "Okolo programu", takový hezký slovníkový překlad :-)
Takhle já někdy v počítačovém pravěku přemýšel co znamená nastavte "stavební dráty" než jsem dostal německý originál a tam si přečetl, že se jedná o baudrate.
V manuale k Sharp MZ821 byla taky dobrá hláška - Barvy se OČervenají. V originale to bylo the colors will be ORed. A rozhodně to nepřekládal stroj, bylo to v roce 1987.
Překlady technických termínů jsou někdy pozoruhodné. Třeba ve Windows, kde bych předpokládal dobře placené týmy překladatelů se vyskytl pojem: "index uživatelských zkušeností".
Co si pod tím má BFU představit?
Já si pod tím představím číslo, označující kolik zkušeností má uživatel s nějakým programem a jsem úplně vedle :-)
A také "analyzátor lidského rozhraní" či "vyčíslovač sériového portu" (snad si to pamatuju správně). Ale nic asi nepřeková překlad filmu Skála ... generál Atorney by mohl vyprávět.
Kdysi v minulém tisíciletí se na Invexu se řešilo, jak v pravěkých MS Windows překládat tlačítko "OK".
Horkými kandidáty bylo "Staniž se / Staň se" a "Budiž".
Já myslím že dokonce někde bylo tlačítko "Budiž" ... Ha! Našel jsem, GTK2 a Gnome :-)
https://launchpad.net/ubuntu/+source/gtk+2.0/+bug/3864
https://bugzilla.gnome.org/show_bug.cgi?id=320714
Někomu to může připadat legrační, ale to „Beru na vědomí“ nebo „Budiž“ je výstižnější. Ono to „OK“ sice může být taky takové indiferentní, lhostejné, ale chápu ho víc jako souhlas. Kdežto s hláškou, která vyskočila v dialogovém okně, uživatel často nemusí souhlasit a nemusí se mu líbit – jen ji bere na vědomí.
Vedle tlačítka „OK“ by se slušelo mít i alternativní možnost „Not OK“. (ale na to už máme dvojice Yes / No, nebo Accept / Cancel, Continue / Back atd.)
To je prosté - dělalo by to samé co OK, ale uživatel by se mohl cítit lépe...
I když, to už by mohl být lepší posuvník se škálou od „souhlasím plně a bezpodmínečně“ až po „jen přes mou mrtvolu“.
22. 10. 2025, 14:49 editováno autorem komentáře
To by vypadalo dobře... Ještě by se na základě toho posuvníku mohl měnit text "OK" od
"Hurá" přes strohé "OK" až po "Jdu skočit z mostu" :-D
Proto jsem v dřevních časech, když jsem se ještě živil pácháním programů, používal "Zmiz". Ujalo se to, uživatelé byli překvapeni, ale nikdy si význam nespletli.
Od Windows 3.11 do minimálně Windows 7 bylo u nastavení rozsahu DHCP přeloženo:
Od:
Komu:
Jeden by myslel, že to je e-mail...
Zaujala mě poznámka o překladu manuálových stránek. Podle mě je to zbytečnost, protože manpages čtou jen admini, programátoři a znalejší uživatelé (BFU nepracují s terminálem) a ti jistě umějí anglicky (aspoň tak, aby rozuměli technickým textům).
Osobně se překladům spíš vyhýbám a to již od dávné doby, kdy nějaký dobráček zavedl pro 'directory' překlad 'složka' místo tehdy již zavedeného 'adresář'. Jelikož se to objevilo v MS-Win, tak to mělo zcela devastující dopad a dnes je složkami zahnojeno všude a všechno.
Ještě perlička pro osoby znalé MIME. Zpráva o více částech může obsahovat na začátku 'multipart' tzv. preamble, který však musí být v US-ASCII (tj. 7bitový), protože není kam deklarovat znakovou sadu. Když to však nějaký hloupý překladatel přeloží s použitím znaků národní abecedy (samozřejmě ve 'svém' charsetu) např. jako 'Tato zpráva je typu MIME o více částech' (a je úplně jedno, jestli v PC-852, Windows-1250 nebo UTF-8), tak 8. bity korektní MTA usekne, tj. na jakýsi zbastlenec. A to ještě není to nejhorší (MIME-MUA preamble stejně neukazuje). Je-li to totiž v rámci části S/MIME (podepsané), tak useknutím 8. bitů podpis ztratí platnost a jsou z toho problémy. Těmito neduhy oplývaly a možná ještě oplývají např. Lotus Domino, MS-Exchange/Outlook a podobné výtvory, kde překlady asi dělali a možná ještě dějají nějací ignoranti RFC. Pevně věřím, že to není případ komunity kolem L10N.cz. :-)
Výraz "složka" nemá s překladem nic společného. "directory" je koncept ze souborového systému a Microsoft nad tím vytvořil GUI koncept a pojmenoval ho "folder" (folder může představovat directory v souborovém systému, ale taky nemusí, může třeba sdružovat soubory s určitým tagem v databázi nad souborovým systémem). Výraz "folder" je naprosto správně překládaný jako "složka", zatímco "directory" dál jako "adresář" a to i v terminologii Microsoftu.
22. 10. 2025, 11:22 editováno autorem komentáře
Microsoft jako obvykle nic nevymyslel. S metaforou složky („folder“) přišel v 80. letech Xerox Star (nebo možná ještě někdo před ním – celkově ta metafora desktopu pochází ze střediska Xerox PARC ze 70. let). Oproti tomu adresář („directory“) je unixový pojem vycházející z toho, jak jsou tam data uložena (speciální soubor obsahující adresy souborů).
Nicméně souhlasím, že z pohledu uživatele dává větší smysl pojem „složka“ zatímco „adresář“ je pro uživatele spíš matoucí.
Ano, první s tím přišel Xerox, od něj to převzal MacOS a s Windows 95 na metaforu kancelářského stolu jako počítačového rozhraní přešel i Microsoft a začal taktéž používat složky. A protože v předchozích svých systémech to, v čem organizoval soubory, nazýval adresáři, vznikl mylný dojem, že si svévolně něco přejmenoval. Některé projekty pak kvůli tomu sveřepě pojmenovávají jako adresáře to, co ve skutečnosti adresáře nejsou, jenom aby na pojmenování složky nenaskakovaly. Přitom to jsou sice sobě blízké, ale pořád dva různé koncepty.
22. 10. 2025, 15:01 editováno autorem komentáře
Jeden nejmenovaný pedagog na nejmenované škole v devadesátých letech používal termín "direktoriář". Když si na to vzpomenu, dodnes mi to kroutí mozkem.
Jsi dobrý demagog (a nebo neználek). Za změnu označení "adresář" na "složka" nemůže žádný překladatel, ale někdo u M$, kdo si usmyslel, že "directory" je špatně a že nově to bude "folder". Změna překladu je pak už jen logická reakce. A že pak i Linux sjednotí terminologii taky nepřekvapí.
Dlouho jsem pojmenování Složky, nemohl vystát, ale co učím děti na prvním stupni a papírové složky používám jako pomůcku při vysvětlování uspořádání souborového systému, tak jsem ten pojem vzal na milost a dnes už mi přijde lepší než "adresář".
"Dlouho jsem pojmenování Složky, nemohl vystát"
Já také, protože jsem byl zvyklý na "adresář", ale když na to mám koukat nezaujatě, tak složka jako entita pro shlukování položek je výstižnější.
Akorát zůstal příkaz "cd" :-)
Já mám tedy se složkou problém ten, že není věcně hiearchická. Takže to pak dopadá tak, že daný uživatel má deset tisíc souborů v dvouúrovňové struktuře. Což tedy asi není dané zrovna pojmenováním té struktury, to je jasné, ale rozhodně je to tím taky přiživeno.
To si úplně nemyslím. Když uživatel narve do fyzické složky příliš mnoho papírů, tak mu dojde, že už se to tam nevejde a že by mohl mít třeba pro každý rok jinou složku.
Spíš to souvisí s tím, že někteří lidé jsou prostě bordeláři nebo je jim to jedno a radši budou příště soubor pracně hledat, než aby teď strávili čas s jeho správným pojmenováním a zařazením do správné složky. Tzn. mají jiné časové preference.
Když uživatel narve do fyzické složky příliš mnoho papírů, tak mu dojde, že už se to tam nevejde? No, a to je právě to. Papírů ano... Jenomže dat ne. Ano, mají jiné časové preference. Efektivně vedoucí k tomu, že tím časem ve výsledku plýtvají a shodou okolností je to velice typické pro lidi, co nejsou schopní uvažovat alespoň trochu dopředu.
A ani to by nevadilo, ale titíž si pak na to děsně stěžují a chtějí s tím pomoci. A jsou hrozně nespokojení když jim člověk řekne, že jediná udržitelná pomoc je když si tam prostě ten bordel nebudou dělat :-D
Spíš to souvisí s tím, že někteří lidé jsou prostě bordeláři
To mi připomnělo, jak jsem se v SVJ snažil dodržovat princip jeden email jedno téma s důkladně definovaným předmětem a když jsem poslal 5 emailů pro 5 věcí, tak následoval chaos v podobě odpovědí na libovolný z těch emailů a kromě těch 5 témat tam bylo třeba 10 dalších. A jako třešničku na dortu považuji to, že se mě po letech ptali, jestli jim nemůžu poslat jejich email, protože jej nemohou najít. A byla to revize výtahů u projektu pro schodiště. :-D Jako já se v tom vyznám, protože mám vlastní spisový systém, ale ta drzost je skutečně překvapující.
Někdy stačí mít v klíčových věcech pořádek na to aby si člověk na tom postavil kariéru:-) A nemusí mít kdovíjak výjimečně technické znalosti.
Tahanice se stavebním úřadem a prace v korporatu mne naučili archivacni strategii. Obvykle "tohle jsi sám rozhodl 5 let zpatky a tady to posílám tvuj email" funguje.
Ano, vytáhnout email z roku 2006 někdy v roce 2020 jsem jako strategii používal také. S (h)různými účinky :-D Aneb já vám to říkal už před 14 lety!
Složka, podsložka...
Velká složka, do té se vejde menší složka a do té ještě menší... Nebo třeba šanon / pořadač?
Directory je vlastně takový rozcestník se směrovkami na adresy souborů a dalších rozcestníků. Ovšem rozcestník 1 může ukazovat na rozcestník 2 a rozcestník 2 může ukazovat na rozcestník 3 a 1, rozcestník 3 pak na 1 a 2, čili kruh (v tomto případě trojúhelník).
Říká se že *abiš má na každého složku. Což kdyby měl na každého adresář? :-)
Tím jsi mi připomněl ComfoDesk. Tam byla hierarchie s pevně daným názvem (a ikonou) pro jednotlivé úrovně – skříň, zásuvka, složka, podsložka. Ale úplně se to neosvědčilo.
I ty fyzické složky papírů můžeš vkládat do sebe – v počítači je to abstraktnější, takže tam nejsou fyzická omezení.
Ten adresář/directory dává technicky větší smysl a to přirovnání k rozcestníku taky. Ale když uživatel pracuje se dokumenty, tabulkami a dalšími kancelářskými metaforami, tak do toho nějaký turistický rozcestník moc nezapadá.
Ten kruh na souborovém systému lze udělat taky, jen ne přes standardní API (operační systém se tomu z pochopitelných důvodů snaží zabránit).
>…kdy nějaký dobráček zavedl pro 'directory' překlad 'složka' místo tehdy již zavedeného 'adresář'.…
Trochu vysvětlení (historické okénko):
IMHO to přišlo z macOS, ale to je jen můj názor.
Na Win, to známe, jsou soubory a adresáře (files and directories). Problém nastal, když Microsoft vymyslel Active Directory a najednou adresář na disku není to samé co adresář v AD a dost se to plete nejenom v originále, ale pak i v lokalizacích.
Naproti tomu historicky (od nepaměti, ale já pamatuji až System 7 tj. ~1990) macOS má soubory a složky (files and folders). To je správně i z hlediska anglického jazyka a tudíž i překlad do CZ je správně. A zavedení podpory Active Directory do macOS nedělal problémy ani v originále ani v lokalizacích.
A když tohle viděli lokalizátoři na Linuxu tak to z macOS zkopírovali (stejně jako někteří programátoři kopírují macOS GUI).
Proč se v AJ macOS používají files/folders a ve Win files/directories to přesně nevím, ale asi to bude zvyklostmi a jazykovými nuancemi lidi ze západního pobřeží USA na severu (Redmonton) a jihu (Cupertio).
Já bych to přeložil přes AI. Když to není přeloženo, tak se zase frfle stylem "Já neumím anglicky, proč je všechno anglicky?!"
Poznámka: Proč proč? Protože ten, co psal ten software, se narodil v části světa, kde se mluví anglicky a neví, že existuje Česko, a on se nebude kvůli tobě učit tvůj jazyk. Buď rád, že ten software existuje, taky nemusel, a ty jsi místo pičování u e-mailu z pohodlí zaprděného teplíčka mohl jít na poštu a čekat pár dní, než to někomu dojde.
Já to vidím takto:
A) Stále víc lidí umí anglicky, a nakonec i z pohledu hledání chyb je angličtina nejlepší, a nakonec na ni přepne většina lidí, protože až uvidí český error a bude to mít řešit, tak pochopí, že je lepší mít systém v angličtině.
B) Překlady děláme pro lidi, co anglicky neumí, nebo mají nějaký nacionalismus v krvi, kde nepřepnou na angličtinu z principu, protože já prostě nevím, této mentalitě nerozumím. Něco něco bohooo, já se narodil v Česku/Slovensku a ree ree reee a slovo steak musím mít naše slovo a nacpeme ženám ová!
Etika okolo AI? U překladu? No, tak tady to trošku přeháníme, abych to tak řekl. Co je neetické na tom, že přeložím tlačítko "reboot" na "restart", případně "Undo" na "Zpět"?
Stále víc lidí umí anglicky
Mě teda překvapuje, že tohle je potřeba psát na technickém webu, kde bych angličtinu bral jako zcela automatický předpoklad. Připomnělo mi to (nejspíš) profesora Kulhánka, který nejdřív dal do přijímacího řízení: "umět číst anglicky" a po roce to změnil na "umět číst" :-D
Já se narodil v minulém režimu (a tisícíletí), na základce jsem uměl perfektně německy a na vejšce automaticky anglicky a od té doby nic jiného v IT nepoužívám, jako fyzik i něco z latiny a řečtiny.
České překlady nebudu komentovat, ty jsou vesměs dobré, ale jestli mi to někdo dá zase češtinu na server, který mám spravovat, tak budu mít do konce života ubytování na hradě Mírov...
"ale jestli mi to někdo dá zase češtinu na server, který mám spravovat, tak budu mít do konce života ubytování na hradě Mírov..."
Tak to budem dva ...
Na kulhankovy prednasky strašně rád vzpomínám:-) I když byly pro nas mene matematicky postizene sado maso :-) Ale fyzika mne bavila a tak jsem mel motivaci s tim zápasit.
Bohužel já na VŠ zažil už studenty kteří měli problémy se slidy v angličtině ( prednaska byla v češtině) a stěžovali si na katedře. A vyvojove prostředí chtěli v češtině. Já jazykové moc nadaný nejsem - jen aj/nj a mizerne základy japonštiny. A doma tedy hovoříme s dětmi trojjazycne. Pořád mne opravuji:-)
Možná je to tím ze u hranic s německem a v dobe 8bitu tech domácích zdroju moc nebylo.
Jakmile se otevřel trh a začaly překlady lide si zvykli. Nevim jaká je vaše zkušenost ale v 90 letech byla úroveň vyuky jazyků na prumkach strašná. Člověk přišel na VŠ absolutně nepripravený pokud nemel vlastni iniciativu.
23. 10. 2025, 08:43 editováno autorem komentáře
Tohle mi přijde zvláštní, ale možná je to generační problém. Já jsem chodil někdy v 6-7 letech na programování v jazyce logo a nikdo se neobtěžoval s překladem příkazu "repeat" apod. Prostě nás to učili tak jak to bylo.
Nevim jaká je vaše zkušenost ale v 90 letech byla úroveň vyuky jazyků na prumkach strašná.
Já nejsem expert na jazyky, ale moje zkušenost ze střední a potom i vysoké byla taková, že učitelé prostě věděli koho a kde učí (tedy elektroprůmka a univerzitní fyzika), takže nás nikdo netrápil četbou Shakespeara, ale prostě jsme překládali papíry o laserech, vysílačích apod, nikdo nepřekládal zavedená pojmenování v libovolném jazyce a tak dále.
Takže pro mě osobně angličtina byla přirozenou součástí IT někdy od těch šesti let a měl jsem prostě štěstí na učitele, kteří nás netrápili různými perfekty v němčině nebo něčím podobným v angličtině. A i technici na celém světě tohle při komunikaci berou jako standard. Asi nejlepší kniha, kterou jsem kdy o postgresu četl napsal někdo z Rakouska a použil tam asi 1000 anglických slov. Není to beletrie, je to o učení se optimalizace dotazů.
Zcela automatický předpoklad to opravdu není. Když jsme se vrátili ze zahraničí, nastoupil jsem do nejmenovaného korporátu v Brně přesvědčen, že moje angličtina je mizerná a mluvil jsem tam z padesáti lidí nejlépe. Jenomže na druhou stranu ti lidé se to nemají naučit aktivně kde. Pokud zrovna nemají talent na jazyky. To vás naučí jenom to zahraničí.
Že se v různých koutech světa mluví různými jazyky je normální. Byly tu sice nějaké pokusy o sjednocení nebo nahrazení přirozených jazyků umělými, ale to jsou utopie.
Přívětivý software mluví na uživatele jeho přirozeným jazykem a přizpůsobuje se mu i v dalších ohledech (měna, formát data, čísel, typografie atd.).
Co se týče strojových překladů, tak ty hodně pokročily - např. DeepL generuje často texty, které jsou skoro použitelné jako hotový překlad (když to srovnám s Google Translate před lety). Ale někdy je úplně mimo a překroutí význam textu. Je to užitečné na porozumění cizích textů – když člověk aspoň trochu zná původní jazyk, ale sám by to louskal pracně a se slovníkem, tak když si dá vedle sebe původní text a strojový překlad, dá se tomu dobře rozumět. Ale předhodit někomu jen ten strojový překlad, aniž by se mohl podívat, co tam bylo původně, to nadělá víc škody než užitku. Např. některé internetové obchody se snaží strojově překládat názvy a popisy zboží a zprávy posílané mezi uživateli a to je vyloženě zlo. Pro překlady softwaru to může být užitečné, ale musí to někdo pečlivě zkontrolovat (takže to až tak moc práce neušetří).
"ale musí to někdo pečlivě zkontrolovat (takže to až tak moc práce neušetří)."
Naopak, delat korekturu je vyrazne narocnejsi, nez to rovnou prekladat. Specielne, kdyz ten preklad je blabol.
Proto ma korektor k dispozici original. Jinak je to vesteni z kristalove koule.
Nelze pracovat pouze s konecnym prekladem.
Přívětivý software mluví na uživatele jeho přirozeným jazykem a přizpůsobuje se mu i v dalších ohledech (měna, formát data, čísel, typografie atd.).
Tak jsem asi divný, ale já si musím nastavit v podstatě celé locales.
Formát čísel bez oddělovačů, datum v ISO, čas 24h, angličtina a pokud možno všude jednotky, zejména u měn CZK, EUR, USD. Nejlepší je, že na české klávesnici se leckde ani nedá napsat IP adresa na numpadu, protože to tam vkládá čárku, zatímco v IP je tečka.
Ty klávesy mají jiný kód - normální čárka/tečka a ta numerická nejsou totéž:
čárka: keycode 59 (keysym 0x2c, comma) tečka: keycode 60 (keysym 0x2e, period) numerická: keycode 91 (keysym 0xffae, KP_Decimal)
Je na konkrétním programu, aby tu klávesu správně interpretoval. Mám v KDE nastavenou českou lokalizaci a např. LibreOffice při stisku KP_Decimal píše čárku, zatímco Konsole, Netbeans nebo nástroj na konfiguraci sítě píší tečku.
Co se týče formátu data, tak nejhorší je ta americká zvrácenost. Do českého textu patří 22. října 2025, 22. 10. 2025, případně 22. X. 2025. Strojově čitelný formát je samozřejmě 2025-10-22. Což někdy používám i ve svých poznámkách na začátku řádku nebo tam, kde podle toho chci jednoduše řadit. To je takový napůl strojový formát. Do lidsky čitelného souvislého textu bych to ale nedával.
P.S. Jen pro pořádek musím ještě říct, že rozlišuji UI a strojově čitelná data - UI má být lokalizované a přívětivé, zatímco data (proudící mezi programy nebo počítači) mají být v první řadě jednotná a kompatibilní.
U AI základem úspěchu je poskytnout dostatek kontextu. Izolovaný zlomek textu se překládá blbě. Ale pokud dokážete modelu dát infromaci o tom, v jaké aplikaci, na jakém místě se daný text vyskytuje a co je okolo (to může být klidně (automaticky generovaný) screenshot), bude to hned vypadat úplně jinak.