Google Desktop pro Linux skončil dávno, asi ve stejnou chvíli jako Picasa pro Linux. Jen ten verze pro Windows ještě přežívala.
Mimochodem základem DocFetcher je knihovna Lucene. To je chvalitebné rozhodnutí. Lucene má tu nejlepší pověst. Moc mě mrzí, že Nepomuk-Strigi, na rozdíl od originálního Strigiho, toho kdysi funkčního, zahodil Lucene a vydal křížovou cestou přes Redland, Sesame2 po Virtuoso. Ach jo..
Zajímala by mě kvalita textových analyzátorů. Kvalita těchto zásadních modulů je recenzenty často opomíjena. Ono že program podporuje nějaký formát, se musíte ptát jak dobře ho podporuje. V sobotu jsem se hořce zklamal v LO a její údajné podpoře SVG.
Jestli DocFetcher používá Apache POI, Java projekt na čtení MS Office formátů, tak bych se neradoval předčasně, mám jeho schopnostmi hlavně co se týče DOCu špatné zkušenosti. U složitých dokumentů klidně kus vynechá, ale je to už dávno co jsem s tím hrál. Naopak čtení i zápis XLS byl obvykle bez problémů.
Momentálně používám Recoll, jako jediný vyhledává spolehlivě. Asi hlavně proto, že jako jediný není závislý na Inotify a podobných FS change listenerech, o jejich kvalitě nemám valné mínění (experimentálně ověřeno). Desktop prohledávače tak občas neregistrují změny indexovaných dokumentů, to se týká i GDS. Recoll nemá vůbec démona, prohledává ad-hoc. Zajímalo by mě jak je na tom
Tak vám budu kazit radost. DocFetcher interně Apache POI používá.
http://sourceforge.net/projects/docfetcher/forums/forum/702424/topic/4484545
http://en.wikipedia.org/wiki/Apache_POI
HWPF (Horrible Word Processor Format) – aims to read and write Microsoft Word 97 (DOC) format files. This component is in initial stages of development.
.. to nezní povzbudivě.