Myslím, že nikdo z běžných uživatelů (kterým je ostatně tak často vytýkáno, že používají jen výchozí formáty .doc .xls .ppt v MS Office), nebude v novém souftwaru používat více jak deset let staré formáty souborů, tudíž se jich toto naprosto nijak nedotkne. Kdo přešel na MS Office dříve, ten si již zřejmě nějaké své staré dokumenty dávno pře-uložil do novějšího formátu a těžko se dnes najde někdo (v domácím prostředí), kdo si bude chtít v Office 2003/7 otevírat nějaký x-let starý dosud dokument v původním formátu. Navíc i tak má možnost si podporu těchto formátů znovu aktivovat.
Pokud jde o firemní prostředí, kde by ještě podpora těchto typů souborů mohla být někde vyžadována, tak je záležitostí správce, aby potřebných pár hodnot v registru nastavil a případně je pomocí skupinové politiky aplikoval u všech klientů, takže běžných uživatelů se to opět nijak nedotkne.
Myslím, že se kolem tohoto zbytečně nafukuje bublina, ač nejde o nic zvlášť důležitého. Nebýt to MS Office, nikoho by asi ani nenapadlo se nějak pozastavovat nad tím, že nějaký program přestává v nové verzi podporovat staré a málo používané formáty, navíc zatím ani ne zcela, ale jen je jejich podpora ve výchozím nastavení vypnutá.
Že přidaná hodnota upgradu je často záporná není u MS nic nového. Například Outlooky 97 disponovaly poměrně zajímavou funkcí synchronizace adresáře přes mail. Fungovalo to tak, že se na každé stanici Outlooku řeklo, kterým uživatelům (mailům) se má adresář synchronizovat. Při změně pak Outlook odeslal maily, které Outlooky příjemců potichu zpracovaly a synchronizaci provedly. Pro SOHO bez Exchange serveru super záležitost. Jenže kde se vzal, tu se vzal, objevil se Office XP, kde tato fce již chyběla. Známý se obrátil na MS, zda se svou legální licencí na Office XP (které potřeboval kvůli kompatiblitě se zákazníky) může používat Outlook v downgradované verzi 97. Odpověď od Microsoftu byla super - buď za licenci Office XP používat komplet Office 97 (to by pak nákup licence byl zbytečný) a nebo ať si trhnou nohou.
Čili přidaná hodnota pro známého byla taktéž záporná.
Faktem ale je, že toto není zdaleka jen problém MS, ale kdejakého výrobce softwaru. Zkrátka formáty se mění, vyvíjejí se jejich novější verze, které už ani nemusí být s těmi staršími kompatibilní. Ano - v tomto ohledu je dobré mít po ruce nějaké otevřené řešení, které umožní implementovat třeba i x-let starý formát do nové aplikace - otázkou je, zda jej tam někdo za oněch x-let implemetntuje. Nechci "věštit" budoucnost, ale myslíte si, že za dejme tomu 20 let běžně otevřete formát Open Document dejme tomu v Open Office 12? V době,kdy už může být na světě novjěíš specifikace formátu Open Document třeba verze 3.5? Formát to sice bude otevřený, ale přesto jej nemusí aplikace podporovat, protože už se budou zkrátka zaměřovat na novější formáty s rozšířenými možnostmi. Zkrátka digitální data ani v otevřeném formátu nikdy nemůžete prohlísit za zcela bezpečná, protože i když je uložíte zabezpečeně, stejně je nemusíte "dešifrovat" do nějaké použitelné podoby. Papír, kámen a hliněné destičky přeci jen ještě dlouho nic nepřekoná... :)
Toto je právě výhoda otevřených formátů a úplné dokumentace. V budoucnu budou nejen nové formáty, ale i nové procesory, operační systémy a programovací jazyky. Ale bude-li k mání úplná dokumentace původního formátu a zájem (třeba i minimální), bude vždy možno napsat patřičný konverzní program. (Otázkou samozřejmě je, zda bude do čeho strčit staré médium).
Někdy už zapomínáme na to, že ačkoliv je program majetkem autora, data jsou majetkem uživatele. Když jem psal databázové aplikace, nikdy jsem neopomněl zařadit export dat do několika běžně užívaných formátů, protože jsem věděl, že potřeba dat je delší, než životnost dané aplikace. Mnohé firmy, které se jinak chlubí svojí profesionalitou, na to dnes z vysoka kašlou a zapouzdřují data do svých objektů jako do trezoru.(To je nakonec případ i "formátu" doc). Skutečný formát musí být definován nezávisle a nikoliv odvozován z konkrétní aplikace. (Stejně jako programovací jazyk má být definován nezávisle na kompilátoru). Problémům s konverzí se v budoucnu sice úplně nevyhneme - ale výrazně se zmenší.
Kdybyste o věci něco věděl, tak byste alespoň tušil, jak podobné věci fungují. A zatím co vytištěný časopis tu opravdu bude ještě za 100 let, jeho zdrojové soubory v Quarku v té době těžko někdo otevře. Proto se soubory pro archivují pro dlouhodobé uložení ve dvou formách: 1) vyrastrované v neupravitelném formátu, který otevřete i za 100 let (to je třeba TIFF CCITT Group IV), a 2) v původním upravitelném formátu.
Mé znalosti nejsou menší, než vaše arogance. Ať tak či onak, se špatně dokumentovaným formátem bude vždycky problém a čím více formátů, tím hůře. Vámi popsaná cesta je z nouze ctnost, nikoliv řešení. Pokud v elektronických archivech nedokážeme informace vyhledávat a zpracovat (a to jde u obrázků těžko), je lepší zůstat u papíru.
Omlouvám se za svou aroganci. V zápalu diskuze jsem se omylem utrhl na vás, přitom si to zasloužil jiný :(
Popsaná cesta je jediná možná. Za 20 ani 100 let zřejmě nebudete potřebovat původní soubor v upravitelné formě. Navíc z právního hlediska je důležité mít přesně ten dokument, který jste měl v roce 200x. Ne dokument rozházený, s jinými fonty apod. Rastrové formáty typu TIFF tohle zajišťují. Samozřejmě indexovat lze i TIFF. Dělá se to s použitím OCR. Stejně tak je možné indexovat původní soubor, a dát na výběr ten, nebo TIFF.
Informace často nepotřebujete vyhledávat fulltextem. Když vás zajímá vystavená faktura číslo 12345678/200x, máte jeí číslo v metadatech (resp. v externí DB). A samozřejmě i archiv bez fulltextu má oproti papírovému řadu výhod. Vyjma toho vyhledávání v metadatech je to rychlejší dostupnost dokumentu (nemusí nikdo hodiny hledat v krabicích), bezpečnější uložení (od papíru se blbě dělá záloha), elektronický dokument může mít na stole více lidí najednou, atd.
Mr. Gentleman, bohužel Vám musím odporovat. Naše firma, měla stabilně nastaveno u produktů Office 97, Office 2000 a Office XP (novější nemáme koupené a nepoužíváme je) ukládání ve starší verzi souborů (typicky zejména příklad Word 95). Důvod je ten, že v mnoha podnicích a státních úřadech mají ještě v provozu Windows 98SE a tam novější verze než Office 95 nebývá a novější verze dokumentů neumějí otevřít. Proto se vše ukládalo ve starší verzi, aby ta mohla být zasílána bez problémů. Rovněž uživatelé jiného software třeba Open Office tyto starší dokumenty otevírají bez problémů. Tedy například v naší firmě máme cca 90% textových dokumnetů ve formátu Office 95 a stejné to je s tabulkami a prezentacemi.
Tak si ve firmě nastavíte Group Policy, jak je popsáno na MS KB. A můžete se u toho zamyslet, jestli opravdu chcete dnes ukládat do téměř 13 let starého formátu Wordu 95. Možná jste pár let zaspali.
Ano, souhlasím, že třeba vaše firma může mít s tímto problém. MS v USA poměrech si asi moc nedovede představit české firmy s x-let starým softwarem :). Ovšem:
1) Vás se tento problém netýká - blokování otevírání a ukládání těchto souborů je nově zavedeno pouze u Office 2003 s instalovaným SP3 (a možná Office 2007). Pokud novější verzi Office než XP nemáte a komunikujete s firmami, které také nové Office nemají, problém nemáte.
2) Pokud od vás přijde nějaký dokument do firmy, která nové Office má, lze předpokládat, že admin v dané firmě povolil popsaným způsobem otevírání a ukládání starších verzí. V opačném případě by vám zřejmě přišel požadavek na odeslání souboru v novějším formátu, což s instalovanými Office 2000/XP opět nepředstavuje vážný problém (byť, ano - je to jsitě otravné a přináší to jisté náklady navíc, kdyby už jen v tom, poučit uživatele, aby vybrali jiný formát souboru, než výchozí.
3) Nevyužíváte-li makra a podobné specifické záležitosti, nastavte ako výchozí formát souboru RTF, který by měli zvládnout jak staré, tak nové aplikace, včetně Open Office, atd.
Ale ano, chápu vás, že to může představovat problém - těm se ale asi nikdy nelze zcela vyhnout a nelze počítat - minimálně u uzavřených formátů, že tu budou neustále a že je půjde otevřít navždy i v nejnovějších verzích aplikací. Přeci jen 10 a více let je v IT strašně dlouhá doba.
Data uložená ve formátu OpenOffice je možné přečíst i bez OO. Je to sice nouzovka, ale _je to možné_, formát open document je ve své podstatě několik zaZIPovaných XML souborů (tudíž plain text). Takže i když nebudu mít open office, tak mohu přejmenovat *.odt na *.zip, rozbalit a ta data z toho souboru dostat. Toto v dokumentech typu DOC možné není, protože to jsou binární formáty, které nejsou zdokumentované... Takže mohu říct, že data uložená v prví verzi open office dokážu přečíst stejně tak, jako data nejnovější. Jsou to prostě pořád plain text soubory...
Ja myslim ze zdokoumentovane jsou, ale v nejakem internim dokumentu Microsoftu. Nestaci, aby byl format dokumentovany. Musi tak jeste byt ucineno verejne a zdarma.
Jen jestli. Někdy jedinou dokumentací bývá kód programu, který data dokáže zpracovat. Nepředpokládám, že by v MS neměli žádnou dokumentaci, ale při stylu jejich programování věřím, že spousta věcí je opravdu zakleta v kódu, a do popisu se ani nedostala.
Mohou být dostupné dávkové konvertory a často se u aplikací vyskytuje to, že starší formát otevřou, ale při uložení nabídnou uložit soubor v novějším formátu, takže je možné, že pokud jste se soubory pracoval i v novějších verzích aplikací, můžete je mít i v novějším formátu - tak jsem to myslel s tím pře-ukládáním. Samozřejmě pokud dokumenty ležely někde na disku více než deset let bez povšimnutí a teď je budete chtít otevřít v aplikaci, která už zmíněný formát nepodporuje, nebo nepodporuje ve výchozím nastavení, pak máte problém. Ovšem dokumenty, s nimiž jste deset let nepracoval asi nebudou mít zase tak velkou cenu a pokud nějak cenné skutečně jsou a nejsou určeny k další editaci - což asi nejsou, pokud jste s nimi oněch deset let nepracoval - pak takové patří do archivu - vytisknout na papír, uložit do PDF, nebo nějakého otevřeného formátu, pokud je to možné. Uložení souborů deset a více let na disku v proprietárním, veřejně nedokumentovaném formátu není archivace, ale riziko ztráty dat hardwarovou/softwarovou cestou - co kdyby už výrobce softwaru neexistoval a starý program by na nových systémech nešlo spustit - v tom případě jsou data v ... :/.