Google Desktop pro Linux skončil dávno, asi ve stejnou chvíli jako Picasa pro Linux. Jen ten verze pro Windows ještě přežívala.
Mimochodem základem DocFetcher je knihovna Lucene. To je chvalitebné rozhodnutí. Lucene má tu nejlepší pověst. Moc mě mrzí, že Nepomuk-Strigi, na rozdíl od originálního Strigiho, toho kdysi funkčního, zahodil Lucene a vydal křížovou cestou přes Redland, Sesame2 po Virtuoso. Ach jo..
Zajímala by mě kvalita textových analyzátorů. Kvalita těchto zásadních modulů je recenzenty často opomíjena. Ono že program podporuje nějaký formát, se musíte ptát jak dobře ho podporuje. V sobotu jsem se hořce zklamal v LO a její údajné podpoře SVG.
Jestli DocFetcher používá Apache POI, Java projekt na čtení MS Office formátů, tak bych se neradoval předčasně, mám jeho schopnostmi hlavně co se týče DOCu špatné zkušenosti. U složitých dokumentů klidně kus vynechá, ale je to už dávno co jsem s tím hrál. Naopak čtení i zápis XLS byl obvykle bez problémů.
Momentálně používám Recoll, jako jediný vyhledává spolehlivě. Asi hlavně proto, že jako jediný není závislý na Inotify a podobných FS change listenerech, o jejich kvalitě nemám valné mínění (experimentálně ověřeno). Desktop prohledávače tak občas neregistrují změny indexovaných dokumentů, to se týká i GDS. Recoll nemá vůbec démona, prohledává ad-hoc. Zajímalo by mě jak je na tom
Tak vám budu kazit radost. DocFetcher interně Apache POI používá.
http://sourceforge.net/projects/docfetcher/forums/forum/702424/topic/4484545
http://en.wikipedia.org/wiki/Apache_POI
HWPF (Horrible Word Processor Format) – aims to read and write Microsoft Word 97 (DOC) format files. This component is in initial stages of development.
.. to nezní povzbudivě.
Tak to smrdí tím, že sám autor neví jakou licenci by použil... Při psaní sklizně je to běžná praxe, ve zdrojových kódech má napsanou jinou licenci než na domovských stránkách a podobně. Je to smutné, ale autoři/programátoři si mnohdy s licencí moc starosti nedělají.
Co se týče zákazu komerčního užití, takový dodatek myslím není možný, ale expert přes licence zdaleka nejsem.
Autor programu si tam může dát libovolný dovětek. Otázka je, zda je pak licence bezesporná a platná.
V tomto případě se ovšem domnívám, že autor měl v úmyslu vědomě mást. Napadlo by kohokoliv soudného zabalit meziprodukt kompilace v assembleru o označit ho za zdrojový kód? Stálo netriviální úsilí takový "zdroják" vytvořit. Nepřítomnost zdrojového kódu pro Windows tomu jen nasvědčuje.
Takový "zdrojový kód" je v přímém rozporu s LGPL, neboť nejen že to nesplňuje definici úplného zdroje, ale dokonce to ani nesplňuje definici zdrojového kódu: "preferovaná forma díla určená na jeho úpravy".
Myslim, ze je realny dovod nieco take spravit. Niektore statne institucie napriklad maju predpis, ze ak sa vybera medzi open-source a proprietarnym, pricom je vysledok tak narovnako, tak ma vyhrat open-source. Niekde je open-source zvyhodnovany aj ked dostacuje na vec, na ktoru ho je treba (nech si existuje 1000x silnejsi proprietarny & plateny soft, tak ten ma sutaz prehrat).