Hlavní navigace

Vlákno názorů k článku Princip jednoduchého fulltextu s příklady v SQL a PHP (2) od Jakub Hegenbart - Jejda...kdyby to tak fungovalo i nad takovymi 50-100...

  • Článek je starý, nové názory již nelze přidávat.
  • 8. 2. 2005 2:05

    Jakub Hegenbart
    Jejda...kdyby to tak fungovalo i nad takovymi 50-100 GB dat, to bych to mohl pouzit taky :)

    Ad levostranne doplneni: Muzu pouzit SQL wildcards: "LIKE '%lina'". Problem je s indexy, ze...pokud bych potreboval urychlit hledani indexem s zolikem na zacatku, musel bych si ukladat i rotovane slovo. Nicmene pokud rezie zpracovani tabulky slov je dostatecne mala oproti zpracovani tabulky vyskytu, nebude to tak kriticke. (Jeste ze muzeme pracovat ve vazebni tabulce slova<->clanky jen s IDcky :) Jinymi slovy: pri prohledavani narocnem kvuli velkym textum a mnoha clankum spise nez kvuli velkemu poctu dotazu vadi mene nez v opacnem pripade.

    Potencialni stop slova? Tipoval bych ta, ktera se vyskytuji v temer kazdem clanku...alias mala selektivita. Proste spocitam procentuelne, kolikrat se slovo "nebo" vyskytuje v clancich a kdyz zjistim, ze v 95%, klidne si ho muzu dovolit vynechat, protoze u funkce relevance zalozene na kvalitativnim hodnoceni (primarni razeni podle poctu ruznych obsazenych slov dotazu) mi moc nepomuze... U jine relevance by mohl byt samozrejme potrebny jiny postup.

    Je mozne, ze mi to uz ale poradne nemysli...mel bych jit spat. Vetsi cast domaciho ukolu ted rozhodne dusevne nezvladnu...

    Zdravim...
    (Kaaczu taky :)
  • 12. 2. 2005 3:50

    Jakub Hegenbart
    Fakt? Ve Smalltalku a na mem desktopu doma? Nad OODBMS? (protoze v tom bude zbytek SW...)

    Kdepak, tohle si radsi udelam sam...ostatne je to i pekne cviceni z lingvistiky, ktera je mym druhym zivotem...

    Rikejme tomu hobby :)