Dobry den, mam trochu offtopic dotaz, ale neni kam se jinam obratit... Nevite prosim o robusnim fulltextu, ktery by zvladal rychle praci s asi 0.5 mil textovych souboru, booleovske op., near, vyhledavani v ruznych polich atd.. popr. vektorove prohledavani (vazeni termu)? Musi mit perfektne zvladnute vyhledavani v ceskem textu, lematizaci (truncation), popr. gramaticky slovnik na doplnovani ostatnich tvaru slov.
Nemam 100% predstavu, kolik takovz soft stoji, ale proto se ptam. Preferuji hlavne levne nabidky, ale za jakykoliv tip na komercni nabidku budu vdecny. (Pokud snad nekde existuje nejaky srovnavaci clanek, tak rovnez...) Dikz moc.
Napadaji mne Autonomy nebo Verity. Prvne jemnovany pouziva obsahoveho vyhledavani pomoci AI, ktere je nezavisle na pouzitem jazyce a dava vysoce presne vysledky.
Verity pak pouziva semantickych stromu a ma podporu cestiny od firmy Tovek.
V obou pripadech jde ale o ceny v radu statisicu.
Fulltext pod PostgreSQL jsem zkoumal loni, tehdy jsem našel dvě věci, obě si dělaly do separátní tabulky seznam slov vázaný na původní záznamy. Čili spíš šidítko než fulltext. Možná už vymyslel někdo něco lepšího, ale pokud ne, tak bohužel v tomto směru není PostgreSQL to pravé ořechové, to už radši MySQL - ale to ho zase umí jen u MyISAM databází, které pro změnu nezvládají třeba transakce. To pak má občas člověk chuť řvát a mlátit hlavičkou o zeď...:-(
Fulltextové (plnotextové) databáze:
ConText CZ
producent: Sefira, spol. s r. o., Česká republika
Lokalizace a rozšíření funkčnosti modulu Oracle Context Cartridge (interMedia Text) o práci s českými a slovenskými texty.
Excalibur
producent: Excalibur Technologies
zastoupení v ČR: INCAD, spol. s r. o.
SuperText
producent: 5D software, spol. s r. o.
TexPro
producent: Fulcrum - Exprit, spol. s r. o.
zastoupení v ČR: Exprit, spol. s r. o.
Verity K2, TOPIC
producent: Verity, Inc.
WAIS