Omlouvám se za svou aroganci. V zápalu diskuze jsem se omylem utrhl na vás, přitom si to zasloužil jiný :(
Popsaná cesta je jediná možná. Za 20 ani 100 let zřejmě nebudete potřebovat původní soubor v upravitelné formě. Navíc z právního hlediska je důležité mít přesně ten dokument, který jste měl v roce 200x. Ne dokument rozházený, s jinými fonty apod. Rastrové formáty typu TIFF tohle zajišťují. Samozřejmě indexovat lze i TIFF. Dělá se to s použitím OCR. Stejně tak je možné indexovat původní soubor, a dát na výběr ten, nebo TIFF.
Informace často nepotřebujete vyhledávat fulltextem. Když vás zajímá vystavená faktura číslo 12345678/200x, máte jeí číslo v metadatech (resp. v externí DB). A samozřejmě i archiv bez fulltextu má oproti papírovému řadu výhod. Vyjma toho vyhledávání v metadatech je to rychlejší dostupnost dokumentu (nemusí nikdo hodiny hledat v krabicích), bezpečnější uložení (od papíru se blbě dělá záloha), elektronický dokument může mít na stole více lidí najednou, atd.

