Názory k článku pgvector: vektorová databáze postavená na Postgresu

Zasílat nově přidané názory e-mailem

Článek je starý, nové názory již nelze přidávat.

6. 3. 2025 12:19

atarist

zajimave. Jak je na tom pgvector v porovnani s Milvusem? Ten se (zda se) pouziva hodne casto. Taky FAISS, ale to je asi jen v LLM oblasti?
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
6. 3. 2025 15:16

cc

Pgvector je pomalý a vyplatí se jen když potřebuješ kombinovat vector query s nějakou SQL query. Není problém udělat něco co je 100x rychlejší i na CPU (správné indexování, atd...).
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
6. 3. 2025 17:22

Pavel Tišnovský

Zlatý podporovatel

nějakou ruční optimalizací možná to 100x půjde, ale třeba Milvus tedy 100x rychlejší než pgvector není. Jo pokud něco běží na GPU, tak asi ano, ale málokdo má GPU s dostatkem paměti.
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
6. 3. 2025 21:41

cc
Je potřeba dobrý index a nepočítat věci pořád znovu.

Jak počítá pgvector třeba cosine similarity?

Takto:

/* Auto-vectorized */ for (int i = 0; i < dim; i++) { similarity += ax[i] * bx[i]; norma += ax[i] * ax[i]; normb += bx[i] * bx[i]; }

A přitom 2/3 výpočtů se dá předpočítat. A toto funkce je bottleneck!

Takže problém pgvectoru je, že se nikdo nepokusil o optimalizace, a nebo je to v rámci pg prostě jedno, protože tam jsou jiné režie. Takže jak říkám, není to pro ty co chcou třeba 5k qps na jádro, ale pro ty, co jim stačí třeba 20.
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
7. 3. 2025 8:30

Pavel Tišnovský

Zlatý podporovatel

to je pravda, bez indexů to bude špatné. akorát se potom namísto přesných výsledků budou provádět "odhady" (viz příště). Ono to v praxi většinou až tak nevadí, pokud je to běžná úloha na similarity search, ale někdy je to problém.
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
7. 3. 2025 18:28

cc

To má i pgvector (tu aproximaci), ale i tak to nemá výkon, protože i při aproximaci je potřeba volat tu distance funkci třeba 10000x na query (když chci recall třeba kolem 98-99%).

V tomto případě se prostě vyplatí ručně optimalizovat a přemýšlet - fakt nechápu, proč by si ta databáze nemohla předpočítat ty sumy pro každý vektor, je to snad to nejjednodušší co se dá udělat a v tomto případě to je 66% compute gain (FMA není zadarmo a tento loop FMA jednoznačně saturuje).

Ale samozřejmě se vyplatí i další optimalizace - když mám index, tak to znamená "skoky" v DB, takže tady je lepší bulking a implementovat to přímo v té funkci. Dělal jsem na něčem takovám a je to fakt neuvěřitelné jak se to celé dá zoptimalizovat tak, že compute už není problém, ale memory bandwidth je - pak už není co dělat :)
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
7. 3. 2025 18:40

Pavel Tišnovský

Zlatý podporovatel

jj souhlas, zase jsme zpátky u SIMD :-) Tyjo netuším, proč to nedělají. Přitom pgvector se nasazuje pro LLM (RAG) s fakt dlouhýma vektorama, tam by to pomohlo.
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
7. 3. 2025 20:17

ventYl

O tomto rozsireni bol celkom zaujimavy talk na tohtorocnom FOSDEMe:

https://fosdem.org/2025/schedule/event/fosdem-2025-5531-from-queries-to-pints-building-a-beer-recommendation-system-with-pgvector/

sila tohto rozsirenia vynikne, ak su vektory fakt dlhe a ako kazdy zaujimavy problem v pocitacovych vedach, vacsinou dlhe vektory skoncia pri umelej inteligencii.
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
8. 3. 2025 8:54

Pavel Tišnovský

Zlatý podporovatel

diky podivam se. Z popisku to vypada, ze dela presne to, na co je pgvector urcenej, tak jsem zvedavej.
- Zobrazit celé vlákno

Zasílat nově přidané názory e-mailem

Názory k článku pgvector: vektorová databáze postavená na Postgresu

Dále u nás najdete

Malware, ransomware a další online hrozby: Jak se liší?

Navazující a souběžná zaměstnání pro účely JMHZ

V USA povolili terapii Optune i pro léčbu rakoviny slinivky

Zmatky u superdávky: přerušeno, zpracovává se a kdy dokládat

Lidé si mohou nechat zdarma vyšetřit znaménka, zrak i cukr

Ve firmách se pořád věří jediné „pravdě“ z dat. A to je problém

Počet nových pracovních míst prudce klesá

Na arytmii přišel díky hodinkám. Lékaři radí zkoušet tep pravidelně

Registrace zahraničního zaměstnance pro účely JMHZ

Nedostatek vitaminu D se projeví nejen únavou

Ve špičkových restauracích se dá díky festivalu najíst za půlku

Rostoucí cena operačních pamětí zásadně zdražuje počítače

Sociální sítě: od seznamování k debatám o bezpečnosti

Nervózní Microsoft začal v ČR žehlit Trumpův chaos

AMD přichází se značkou Ryzen AI do segmentu stolních počítačů

Budoucnost Office, digitálního pracoviště a e‑shopů

Konflikt na Blízkém východě: informace pro turisty

Jaké screeningy vám lékař doporučí po padesátce

Pojišťovny zneužívají lenosti svých klientů. Ti za to platí

Po rodičovské na pracák. V prvních měsících dostanete 19 269 Kč