Vlákno názorů k článku Knihovna FAISS a embedding: základ jazykových modelů (3. část – role indexů) od atarist - Takze jestli to chapu dobre, tak vsechny ty...

Článek je starý, nové názory již nelze přidávat.

19. 8. 2025 11:23

atarist

Takze jestli to chapu dobre, tak vsechny ty indexy maji linearni slozitost a stahnout to nejde? (jasne, to je teorie, v praxi dava vyznam mit sice stejnou slozitost, ale prakticky o rad mensi casy,...)
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
19. 8. 2025 11:46

Milan Straka

Stříbrný podporovatel

Ne, ta složitost nemusí být lineární.

Třeba u toho IVF je to triviálně odmocnina -- člověk si vytvoří Θ(√n) regionů, takže v první fázi v čase Θ(√n) najde nejbližší region a ten pak prohledá v čase Θ(n/√n)=Θ(√n). (Většinou těch regionů chcete prohledávat víc, řekněme k, tak jich vytvoříte Θ(√kn) a opět vyjde složitost hledání jako Θ(√kn).)

Podle https://en.wikipedia.org/wiki/Hierarchical_navigable_small_world je složitost HNSW dokonce logaritmická (je to v základu prohledávání stromu logaritmické hloubky).
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
19. 8. 2025 12:20

linuxák

Ty indexy jsou aproximativní, takže je to vždy nějaký trade-off mezi rychlostí hledání a přesností hledání. Stáhnout složitost pod lineární samozřejmě jde, v extrémním případě můžu mít index, který bude vybírat výsledky náhodně se složitostí O(1). Ano, bude to prakticky k ničemu a přesnost hledání bude hodně špatná, ale bude to index se složitostí O(1).

Dobrý benchmark indexů je zde: https://github.com/erikbern/ann-benchmarks

Komerční sdělení

Praktické tipy z UX: Od redesignu k optimalizaci výkonu

Vlákno názorů k článku Knihovna FAISS a embedding: základ jazykových modelů (3. část – role indexů) od atarist - Takze jestli to chapu dobre, tak vsechny ty...

Komerční sdělení

Praktické tipy z UX: Od redesignu k optimalizaci výkonu

Dále u nás najdete

Pálení žáhy zhoršuje nevhodná večeře. Vadí přejídání i kafe

Windows budou důkladněji chráněny před AI agenty

Malware, ransomware a další online hrozby: Jak se liší?

Ke kuplířství nedocházelo, říká obžalovaný z kauzy Sex.cz

Apple opravil bezpečnostní chybu, která byla v iOS od verze 1.0

30 % nákladů díky AI dolů, ale nuda v práci jde nahoru

OSVČ senioři letos v přehledech uplatní slevu na pojistném

Daňové přiznání 2026: Termíny, novinky a změny

Nový model OpenAI kóduje 15krát rychleji než jeho předchůdce

Kdy a jak podat přiznání, aby vám přeplatek vrátili co nejdřív?

USA chystají web na obcházení blokací obsahu

Příspěvek na produkty spoření na stáří a daň z příjmů

Lidl Outlet opustil Olomouc a zamířil na sever Moravy

Google uvádí Gemini 3.1 Pro a přidává působivé benchmarky

AI jako soudce – zákon na prvním místě

Navazující a souběžná zaměstnání pro účely JMHZ

Hackeři útočí přes e-mail, prahnou po přihlašovacích údajích

EET není český výmysl. Zjistěte, kde za účtenku můžete vyhrát auto

Nejen daňové přiznání, OSVČ musí podat elektronicky přehledy

Agentické nakupování mění pravidla e-commerce