Hlavní navigace

Názor ke zprávičce Textové soubory na různých operačních systémech od Lael Ophir - Windows samozřejmě umí Unicode v Notepadu i WordPadu....

  • Aktualita je stará, nové názory již nelze přidávat.
  • 23. 7. 2008 15:39

    Lael Ophir (neregistrovaný)
    Windows samozřejmě umí Unicode v Notepadu i WordPadu. Problém je v tom, že většina textových souborů historicky není v Unicode. Proto se soubor otevírá v code page systému. V Unicode se otevře pouze pokud je na začátku souboru Byte Order Mark (BOM), který Unicode Consorcium doporučuje k identifikaci takového souboru (případně pokud Notepad vyhodnotí, že to Unicode musí být, což ale u UTF-8 nelze zjistit). Problém je v tom, že unixy původně žádnou podporu Unicode nemají, a UTF-8 je prakticky ne-podporou - berličkou, která má snížit na minimum počet nutných úprav systému. A protože soubory na unixech mají mnohdy pevně dané začátky souborů (například na první řádce je uveden interpret skriptu), a neupravené nástroje (třeba kdysi bash) neskousnou BOM, tak unixy zásadně neříkají, že je soubor v Unicode.

    Řešením je například použít menu File/Open v Notepadu. Ale aby to bylo uživatelsky příjemné, nechcete unixy nějak naučit používat BOM?