Názory k článku FAISS: knihovna pro rychlé a efektivní vyhledávání podobných vektorů (2. část)

Zasílat nově přidané názory e-mailem

Článek je starý, nové názory již nelze přidávat.

17. 7. 2025 15:21

atarist

Tyjo to je docela skoda, ze float16 a bfloat16 nejsou rozumne podporovany v jazycich. Tusim to pridavaji do Rustu, ale jinak nikde nic (ani v Go podpora neni), takze nejaka rychla "vektorizace" operaci moc nehrozi :(
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
20. 7. 2025 14:24

dustin

Zajímavé. Vrtá mi v hlavě následující - údajně se vektory embeddings mohou zezadu zkracovat, přičemž dochází jen k mírné ztrátě přesnosti významu původního textu (např. model vrátí pole 1500 floatů, ale do DB se uloží jen prvních 700). Z toho mi vyplývá, že relevance významu klesá s indexem vektoru. A tudíž, že by výpočet vzdálenosti vektorů měl brát v úvahu index příslušné dimenze. Mohu poprosit o komentář? Díky.
20. 7. 2025, 14:24 editováno autorem komentáře
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
20. 7. 2025 22:55

linuxák

Index vektoru s relevancí nesouvisí, modely nejsou takhle učené. Embedding o 1500 floatech si je možné představit jako množinu 1500 features, kdy některé jsou význámné více a jiné méně, ale distribuce "významnosti feature" je náhodná, není vázána na index.

Operace oříznutí vektoru z 1500 floatů na 700 floatů je redukce dimenzionality, která se dá udělat i chytřeji, než vyhozením 800 features, ale zjevně to nějak funguje, i když se vybere 800 náhodných features, které se dají pryč. Vybrat 800 posledních je technicky nejjednodušší, ale pokud by se náhodný výběr udělal nějak jinak, mělo by to dopadnout velmi podobně.

Co z toho plyne? Asi by se dalo říct, že významných features zůstane ve zbylých 700 pořád dost na to, aby hledání nějak fungovalo, i když s nižší přesností.
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
21. 7. 2025 11:05

dustin

Díky. Domníval jsem se, že první číslo vektoru udává feature s největší relevancí, a jeho hodnota nějaké mapování na konkrétní téma feature (třeba pes), s tím, že 32bitové číslo umožňuje enkódovat jedno z obrovského množství různých témat. Takže pozice je téma a hodnota jeho relevance? Díky
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
21. 7. 2025 11:43

Pavel Tišnovský

Zlatý podporovatel

Ano, jak to píšeš v poslední větě. A proto se klidně může použít float16/bfloat16 a některé modely jdou dokonce dál a využívají pouze bajt/prvek. To pro relevanci může dostačovat.

PS: asi jsi myslel tuto formu vektorizace https://www.root.cz/clanky/vyuziti-knihovny-scikit-learn-pro-zpracovani-a-analyzu-prirozeneho-jazyka-nlp/#k13 ta se taky používá, například při kategorizacích atd.
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
21. 7. 2025 11:54

dustin

Díky. Myslel jsem normální vektorová embeddings, co se používá třeba pro RAG.
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
21. 7. 2025 9:04

MaraOu

Nejsem tento odborník, ale z mých chabých znalostí bych řekl, že redukce dimenzionality se ve FAISS neprovádí automaticky, ale musí se explicitně nechat vyžádat. -> faiss.PCAMatrix

Používá se k tomu PCA analýza, která hledá přímkové korelace mezi dimenzemi.

Mějme mrak bodů přibližně ve tvaru přímky... pro jeho popsání bychom potřebovali souřadnice XY. Pokud ale osy trnsformujeme tak, aby X procházela regresní přímkou, rozptyl bodů v Y bude zanedbatelný. Lze pak dimenzi Y zahodit a ponechat pouze informaci o X + znalost transformace. Přijdeme tak o minimum informace.

Tady myslím, velmi výstižný obrázek o velikosti ryb pokud mají zhruba podobný tvar.

https://www.researchgate.net/profile/Benjamin-Friedrich-5/publication/263968032/figure/fig1/AS:296571984990208@1447719679034/llustration-of-principal-component-analysis-A-As-a-minimal-example-we-consider-a_W640.jpg
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
21. 7. 2025 9:35

MaraOu

Ještě tedy dokážu si představit, že u vektorů se stovkami dimenzí je možné dimenze seřadit dle variability hodnot od nejvyšší po nejnižší a zahodit dimenze s nízkou variabilitou i bez PCA.
- Zobrazit celé vlákno

Zasílat nově přidané názory e-mailem

Názory k článku FAISS: knihovna pro rychlé a efektivní vyhledávání podobných vektorů (2. část)

Dále u nás najdete

Digitální squatting je na vzestupu, podvodníci cílí na velké značky

Počet OSVČ opět vzrostl, podniká nejvíce lidí v historii

Začínající podnikatel: Přijímáme zaměstnance

Jak porodnice pomáhají, když dítě zemře?

OSVČ musí podat daňové přiznání elektronicky, nemusí přes datovku

Problémy s lymfou trápí spíš ženy, projevuje se otoky

Počet nových pracovních míst prudce klesá

Agentické nakupování mění pravidla e-commerce

Ke kuplířství nedocházelo, říká obžalovaný z kauzy Sex.cz

Nejen daňové přiznání, OSVČ musí podat elektronicky přehledy

Miliony webů nesplňují zákon o přístupnosti. Jaký hrozí trest?

Evidenční list již zaměstnavatel vyhotovovat nebude

Domén s koncovkou .CZ přibývá, většina je podepsaných

Špionáž v Googlu a phishing na Signalu

Máte plné zuby AI? Firefox má řešení

USA chystají web na obcházení blokací obsahu

Desítky rozšíření pro Chrome kradou uživatelská data

Začínající podnikatel: Základní termíny a marketing

České firmy pod náletem kyberútoků. Počet vzrostl o pětinu

Daňové přiznání 2026: Termíny, novinky a změny