Názory k článku Rozšíření PostgreSQL jménem pgvector, embedding a sémantické vyhledávání (1. část)

Zasílat nově přidané názory e-mailem

Článek je starý, nové názory již nelze přidávat.

12. 8. 2025 8:10

oss

MariaDb podporuje vektory nativne (bez nutnosti instalovat extensions) uz od zaciatku roka.
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
12. 8. 2025 8:42

dustin

Poměrně dlouho to bylo v release kandidátovi, v ostré verzi 11.8 až od letošního června. Ale funguje to zdá se poměrně dobře.
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
12. 8. 2025 9:26

Pavel Tišnovský

Zlatý podporovatel

Dík za info. Budu to muset prozkoumat, jestli tam nejsou nějaká omezení a jaké to používá strategie indexování. Ona se tato oblast hodně vyvíjí a zrovna pgvector nemusí být ideálním řešením.
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
12. 8. 2025 10:35

dustin

Hodí se to pro stávající mariadb/mysql aplikace, kde chtějí přidat RAG nad dokumenty/objekty, které mají i další výběrová kritéria - stávající komplexní selecty se jen rozšíří o vektorové kritérium. V našem případě to bylo pomocí WITH/CTE docela jednoduché, vektorové kritérium se celkem snadno zaintegrovalo do stávajícího vyhledávání. Držet vektory mimo hlavní DB by bylo daleko složitější a méně efektivní.
12. 8. 2025, 10:35 editováno autorem komentáře
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
12. 8. 2025 11:52

oss

Skusal som to na vlastnom vyhladavani obrazkov, v databaze som mal cez 50 000 vektorov a na problemy som nenarazil.
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
12. 8. 2025 12:18

Pavel Tišnovský

Zlatý podporovatel

jj u nás to jsou spíš miliony, takže se tam ukazují vlastnosti indexů (v podstatě se už u těchto velikostí musí přejít k odhadům a ne přesným výsledkům, více o tom příště)
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
12. 8. 2025 20:18

vilgefortz

Nemate zkustenost, proc ruzne backendy vraci ruzne dobre vysledky? Napr. jsme zkusili, ze pgvector vlastne je asi nejlepsi, o chlup horsi byla chromadb a hodne spatne vychazi v default nastaveni opensearch. U pgvectoru je neprijemne omezeni na delku vektoru 2048 (pro fp32 vektory), a treba qwen3-embed-4b model vraci kolem 2500 dlouhe vektory. U chromadb jsem narazil na dost hloupou implementaci pomoci sqlite, ktera behem par mesicu nabobtnala na 25GB a kazdy insert do db ji celou cetl, takze vse trvalo velmi dlouho.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
12. 8. 2025 20:43

cc

Toto se vyplatí jen když člověk nemá těch vektorů moc a potřebuje opravdu SQL jako filter. Zkoušel jsem to na jeden projekt a prostě to nešlo - když má člověk třeba 100m vektorů tak je potřeba mnohem lepší index a tuning. A když to filtrování není složité tak post-filter taky funguje celkem dobře.

Je to velký trade-off a ty funkce v pgvectoru mi a ni nepřišli nějak optimalizované. Třeba cosine distance a L2 distance může člověk udělat velmi podobně ryché, jen je k tomu potřeba normalizační koeficient těch vektorů (pro oba vektory co se porovnávají se dá předpočítat, a pro ty v DB dokonce uložit jako metadata).
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
12. 8. 2025 21:12

Pavel Tišnovský

Zlatý podporovatel

přesně tak, pro tak velké datové sady (100M, ale už klidně u 1M) už je exaktní vyhledávání strašně pomalé a je nutný použít IVFFlat nebo HNSW (nic dalšího pgvector zatím nepodporuje). Nebo jít do FAISS na GPU, když na to má firma peníze (což většinou nemá :-).
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
13. 8. 2025 10:49

cc

Nebo Vamana - to je podle mě top pro opravdu velký dataset. Jen je potřeba následovat tu implementaci od MS a ne to dělat podle toho jejich research paperu, který tam má snad i úmyslné chyby.
- Zobrazit celé vlákno

Zasílat nově přidané názory e-mailem

Názory k článku Rozšíření PostgreSQL jménem pgvector, embedding a sémantické vyhledávání (1. část)

Dále u nás najdete

Majetkové přiznání dalo ministrům současné vlády zabrat

Před otevřením baru přišel lockdown, teď prodává znalosti

Spotřeba elektřiny v Evropě prudce poroste, může za to AI

Paramount získal Warnery a Netflix na tom vydělal

Energetické infrastruktuře bez chytrého řízení hrozí kolaps

Spropitné v restauracích se nebude muset danit ani evidovat v EET

Po rodičovské na pracák. V prvních měsících dostanete 19 269 Kč

Americká televize Newsmax se chystá do Česka

EET 2.0 bude děravá jako ústa staré ženy

Tisíce firem se sice vyhnou auditu, účetní závěrku za rok 2025 ale ještě ověřit musí

Při podezření na rakovinu jděte za praktikem, nehledejte na internetu

Medicína na míru s AI pomalu vstupuje do zdravotnictví

Takto praktik zkontroluje játra, když budete chodit na prevenci

Kdo by to byl před pár lety řekl: IT přestává být profesí budoucnosti

Český SAP posilují Štěpánka Ryšavá a Štěpán Kroupa

Nejlepší telefony všech dob dostanou pořádného nástupce

Česko je evropský premiant v digitalizaci online plateb

Velkým firmám nejsou lhostejní jejich klienti na Blízkém východě

Zdeněk se cítil zdravý, pak ve spánku dostal mrtvici

Experti nedoporučují rušit rozhlasové a TV poplatky