Vlákno názorů k článku Úvaha ohledně zneužívání LIKE v databázích od t42 - takove clanky prave na root patri, i kdyz...

Článek je starý, nové názory již nelze přidávat.

22. 4. 2009 2:21

t42 (neregistrovaný)

takove clanky prave na root patri, i kdyz by mozna mohl byt malinko kratsi. Celkove ale skvela prace, za kterou patri velky dik!

jinak LIKE je v urcitych pripadech OK, napriklad pokud ma formu napriklad 'hledaneslovo%'. Ovsem forma '%hledaneslovo%' je opravdu silenost nejvetsi
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
22. 4. 2009 5:50

xurpha (neregistrovaný)

A to je ta databáze tak blbá, že nedokáže „LIKE '%asdf%'“ optimalizovat na „= 'asdf'“? (Když už stejně provádí tuny dalších optimalizací?)
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
22. 4. 2009 6:43

Mastodont (neregistrovaný)

A jak byste si takovou optimalizaci představoval? :-))) Dejme tomu, že bych měl tabulku knih se sloupcem Obsah, kde by byla hodnota třeba
"Výskyt střevlíků v Krkonoších."
Jak by databáze měla optimalizovat "select * from tab where obsah LIKE %střevl%" na "select * from tab where obsah = 'střevl' ??
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
22. 4. 2009 9:06

podlesh

V podstatě jediná možnost je fulltext, a to žádná databáze (pokud vím) sama neudělá.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
22. 4. 2009 9:50

tomas z. (neregistrovaný)

Otázka je co znamená sama, třeba v téhle (placené rozšíření) to stačí nastavit.

http://sql602.sourceforge.net/helpdir-cs/xml/html/fulltext.html
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
22. 4. 2009 10:27

Pavel Stěhule

Ono to ani nejde - like %neco% může najít něco jiného než fulltextový operátor. Like porovnává znak po znaku, kdežto fulltext po tokenech (dalo bz se to přirovnat, ke slovům). K tomu se ještě tokeny převádí na lexémy - fulltext dohledá žlutý, žluté, žlutá - to může být (podle nastavení) jeden token.

Existuje metoda, jak připravit index, který by dokázal akcelerovat vyhledání podřetězců v řetězci. Má jen jednu dost velkou vadu. Výsledný index je řádově větší než indexovaná data.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
22. 4. 2009 11:04

podlesh

Samozřejmě, fulltext by fungoval jinak, to je právě důvod proč nemůže být LIKE nahrazen fulltextem v rámci optimalizace přímo databází.

Ovšem z hlediska aplikace je 90% oprávněných použití operátoru LIKE nahraditelných fulltextem.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
22. 4. 2009 11:20

Pavel Stěhule

ju, souhlas
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
24. 4. 2009 18:59

Tomáš Vondra

Tak existují samozřejmě databáze které fulltext přímo obsahují, ale dává to pochopitelně obecně jiné výsledky než LIKE operátor. Otázkou je čeho chcete dosáhnout - většina problematických použití LIKE se kterými jsem se setkal byla triviálním pokusem o fulltext.

A k tomu už existují vhodnější projekty - ať už tsearch2, nebo například Lucene (osobně dávám přednost Lucene, ačkoliv jsem velký příznivec PostgreSQL).
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
23. 4. 2009 20:57

Lael Ophir (neregistrovaný)

Autor příspěvku se možná snažil říci, že pokud hledáte '%střevl%', tak výsledek musí obsahovat i výsledek hledání 'střevl%' a '%střevl'. DB může tyhle věci vracet na prvním místě, protože se k nim díky indexu dostane výrazně rychleji, než k '%střevl%'. Kdo si počká, dočká se nakonec i výsledků hledání '%střevl%'.

V praxi to samozřejmě nemá moc význam, datový model musí být slušně navržený.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
24. 4. 2009 19:02

Tomáš Vondra

Což je ovšem úplně k ničemu pokud ty výsledky chcete třídit podle daného sloupce (například podle ID). V tom případě musí databáze stejně načíst všechny výsledky, setřídit a až potom může vracet uživateli.

Nehledě na to že problematická použití LIKE operátoru se většinou týkají větších textů (například popisy výrobků v e-shopu), zhusta HTML formátovaných, takže pravděpodobnost že najdete dané slovo hned na začátku textu je mizivá (už proto že tam nejspíš bude nějaká HTML značka).
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
21. 5. 2009 18:28

Lael Ophir (neregistrovaný)

Jak jsem říkal, v praxi mnou popsaný efekt nemá velký význam.

Používat LIKE jako náhradu fulltextu je samozřejmě hrubě špatně.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
24. 4. 2009 18:55

Tomáš Vondra

Ano, ta databáze je tak "blbá" že vám tuto nesmyslnou optimalizaci neprovede. Ono totiž ty dvě podmínky nejsou ekvivalentní.

Některé LIKE dotazy optimalizovat lze (například postfixové dotazy, tj. dotazy "retezec%" lze optimalizovat pomocí indexů), ale většina je bohužel "neoptimalizovatelná" :-(
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
22. 4. 2009 7:49

anonymní

Ovsem forma '%hledaneslovo%' je opravdu silenost nejvetsi
Co to je za plk?
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
22. 4. 2009 12:58

Sten (neregistrovaný)
Ovsem forma '%hledaneslovo%' je opravdu silenost nejvetsi

Co třeba když hledáte Karlovo náměstí (náměstí Karlovo, nám. Karlovo, Karlovo nám. ap.)?

WHERE `ulice` LIKE '%Karlovo%'

Komerční sdělení

Praktické tipy z UX: Od redesignu k optimalizaci výkonu

Vlákno názorů k článku Úvaha ohledně zneužívání LIKE v databázích od t42 - takove clanky prave na root patri, i kdyz...

Komerční sdělení

Praktické tipy z UX: Od redesignu k optimalizaci výkonu

Dále u nás najdete

JMHZ a změny v daních z příjmů v roce 2026 a 2027

Malware, ransomware a další online hrozby: Jak se liší?

Ke kuplířství nedocházelo, říká obžalovaný z kauzy Sex.cz

Petr Šmíd: Když startupy rostou, české fondy je opouštějí

Irsko se po pauze znovu otevírá pro výstavbu datových center

Chystá se EDU Rádio, které rodičům ušetří za doučování

30 % nákladů díky AI dolů, ale nuda v práci jde nahoru

Co chceme od AI asistentů? Návrhy odpovědí a třídění pošty

Plánované změny v penzích: Zjistili jsme další podrobnosti

V Evropě roste zájem o alternativu k Microsoftu, říká Petra Novotná

Strojové učení slibuje rychlejší a levnější vývoj baterií

Nervózní Microsoft začal v ČR žehlit Trumpův chaos

Proč mají vysavače mikrofony? Omylem ovládl tisíce vysavačů DJI

Kdo se bude moct vyhnout EET a co bude muset splnit?

Agentické nakupování mění pravidla e-commerce

U dědečkova stavu našla smysl a teď oživuje unikátní tkaní

Domén s koncovkou .CZ přibývá, většina je podepsaných

Sailfish OS na Sony Xperia 10 III: seznámení a instalace

Google uvádí Gemini 3.1 Pro a přidává působivé benchmarky

Z evropského koláče chytrých telefonů ukusují Apple a Honor