Vlákno názorů k článku Princip jednoduchého fulltextu s příklady v SQL a PHP (2) od Martin Koníček - Opravdu pěkný článek, jsem docela rád že se...

Článek je starý, nové názory již nelze přidávat.

12. 2. 2005 12:09

Martin Koníček (neregistrovaný)

Opravdu pěkný článek, jsem docela rád že se někdo chytil na můj komentář, že kritizovat umí každý, ale tvořit málokdo a našel se i člověk, jež krom kritiky navrhl i jak to vylepšit.

Problém ovšem je, že udělat opravdu rozumné vyhledávání je otázkou opravdu na knihu. Tyto dva články rozebírají takřka jen teorii, ale implementace by byla opravdovým oříškem.

Podle mě by bylo fajn, kdyby se tu někde objevila funkční knižnice tokenizátoru, která by si rozumně poradila i s češtinou. Mě by na to stačil alespoň seznam českých koncovek, kdyby ho někdo měl byl bych mu opravdu vděčný, už mám i seznam synonym a podobných věcí.

To na co ale narážím nejvíce je omezený počet zdrojů na vytvoření vyhledávání. Ono totiž není dost dobře možné naprogramovat dobré vyhledávání za rozumný čas. Podle mě je škoda, že se na to nemyslí už v databázích, protože tam kdyby existoval rozumný fulltext by to bylo nejrychlejší a nejlepší. Jistou možností nad kterou v poslední době uvažuji je napsání nějakého tokenizátoru přímo do databáze a zbytek řešit přes triggery a SQL kód. Nevýhodou je, že MySQL je dost slabá na takové použití a pochybuji, že někdo bude menší projekty programovat pro něco jiného.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
13. 2. 2005 13:49

anonymní

No, myslím, že jsem nedávno v Karolinu viděl (v jazykovědných knihách) knihu, která dopodrobna rozebírala, jak parser češtiny napsat :) Jakási anglicky psaná monografie...
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
14. 2. 2005 8:33

Dalibor Šrámek (neregistrovaný)

Fulltext s převáděním českých slov na základní tvar podle slovníku a podporou synonym poskytuje například modul tsearch2 do PostgreSQL - viz tady na Rootu http://www.root.cz/clanky/fulltextovani-v-postgresql-modul-tsearch2/
S tou implementací bych to tak složitě neviděl. Když jsem kód ukázkový kód pro článek testoval, vytvořil jsem indexátor dopsáním méně než 10 řádků v PHP. Konstrukce dotazů pro nejjednodušší případy všechna slova v dotazu OR nebo všechna AND nejspíš nezabere o moc větší počet.

Komerční sdělení

Praktické tipy z UX: Od redesignu k optimalizaci výkonu

Vlákno názorů k článku Princip jednoduchého fulltextu s příklady v SQL a PHP (2) od Martin Koníček - Opravdu pěkný článek, jsem docela rád že se...

Komerční sdělení

Praktické tipy z UX: Od redesignu k optimalizaci výkonu

Dále u nás najdete

Chystá se EDU Rádio, které rodičům ušetří za doučování

Spropitné v restauracích se nebude muset danit ani evidovat v EET

MeshCore je bezdrátová síť nejen pro mimořádné události

Ke kuplířství nedocházelo, říká obžalovaný z kauzy Sex.cz

USA chystají web na obcházení blokací obsahu

Daňové přiznání 2026: Termíny, novinky a změny

Malware, ransomware a další online hrozby: Jak se liší?

Registrace zaměstnance od 1. dubna 2026 pro účely JMHZ

U dědečkova stavu našla smysl a teď oživuje unikátní tkaní

Ještě mi nevrátili peníze za Markétu a už je tu EET zas

V Evropě roste zájem o alternativu k Microsoftu, říká Petra Novotná

Sailfish OS na Sony Xperia 10 III: seznámení a instalace

Irsko se po pauze znovu otevírá pro výstavbu datových center

Lidé si mohou nechat zdarma vyšetřit znaménka, zrak i cukr

AI prolomila celou firemní infrastrukturu za 21 hodin

Domén s koncovkou .CZ přibývá, většina je podepsaných

Připravit, pozor, teď! Spouštíme Channeltrends Awards 2025

Deset kroků pro maximální zabezpečení Google účtu

V USA povolili terapii Optune i pro léčbu rakoviny slinivky

Stát dá svobodu důchodcům, které držel ve III. pilíři