Knihovna FAISS a embedding: základ jazykových modelů (3. část – role indexů)

19. 8. 2025

Doba čtení: 30 minut

Líbí se vám článek?
Podpořte redakci

Důležitou součástí knihovny FAISS je široká nabídka indexů. Kromě interně naivních „lineárních“ indexů existují indexy založené na rozdělení prostoru Voroného dekompozicí či index HNSW: Hierarchical Navigable Small World.

Obsah

1. Knihovna FAISS a embedding: základ jazykových modelů (3. část – role indexů)

2. Časová složitost vyhledávání při použití výchozího indexu FlatL2

3. Benchmark: zjištění časové složitosti vyhledávání při použití výchozího indexu FlatL2

4. Výsledky prvního benchmarku

5. Vliv rychlosti vyhledávání na počtu prvků (dimenzi) vektorů

6. Výsledky druhého benchmarku

7. Dimenze vektorů vs. jejich počet

8. Benchmarky měřící rychlosti vyhledání nejpodobnějších vektorů v sadě s proměnným počtem vektorů i proměnným počtem dimenzí

9. Výsledky třetího a čtvrtého benchmarku: lineární a logaritmická stupnice

10. Indexy založené na použití sofistikovanějších datových struktur

11. Rozdělení celého prostoru Voroného dekompozicí

12. Konstrukce indexu IVFFlat

13. Benchmark: časy vyhledávání nejpodobnějších vektorů s využitím indexu FlatL2

14. Výsledky pátého benchmarku

15. Benchmark: modifikace počtu buněk při konstrukci indexu FlatL2

16. Výsledky šestého benchmarku

17. Index HNSW (Hierarchical Navigable Small World)

18. Výsledky sedmého benchmarku

19. Repositář s demonstračními příklady

20. Odkazy na Internetu

1. Knihovna FAISS a embedding: základ jazykových modelů (3. část – role indexů)

V předchozích článcích o knihovně FAISS jsme používali dva typy indexů. První z těchto indexů je založen na výpočtu Eukleidovské vzdálenosti vektorů – jeho cílem je nalézt k vektorů, které se nejvíce podobají vstupnímu vzorku. Druhý index je založen na výpočtu skalárního součinu, protože u normalizovaných vektorů platí, že jejich skalární součin odpovídá míře jejich podobnosti. Tyto dva typy indexů ve své základní podobě mají jména IndexFlatL2 a IndexFlatIP. Jejich výhodou je jednoduchá implementace i absolutní přesnost výsledků – skutečně se vždy vrátí k nejpodobnějších vektorů. Nevýhodou je obecně lineární časová složitost, což začne být problematické v případě, že se pracuje s modely, které obsahují jednotky, desítky či dokonce stovky milionů vektorů.

Právě lineární časová složitost (resp. v těchto případech i její „strmost“) vedla k tomu, že do knihovny FAISS byly přidány i další typy indexů. Některé z nich nemusí být zcela přesné, tj. indexy sice vrací požadovaných k vektorů, ovšem nemusí se jednat o nejpodobnější vektory. Pro potřeby jazykových modelů je však určitá nepřesnost akceptovatelná a někdy i vítaná.

Mezi indexy podporované knihovnou FAISS patří například:

	Factory
IndexFlatL2	„Flat“
IndexFlatIP	„Flat“
IndexHNSWFlat	„HNSW,Flat“
IndexIVFFlat	„IVFx,Flat“
IndexLSH	×
IndexScalarQuantizer	„SQ8“
IndexPQ	„PQx“, "PQ"M"x"nbits
IndexIVFScalarQuantizer	„IVFx,SQ4“ „IVFx,SQ8“
IndexIVFPQ	"IVFx,PQ"y"x"nbits
IndexIVFPQR	„IVFx,PQy+z“

2. Časová složitost vyhledávání při použití výchozího indexu FlatL2

Nejprve si ověříme časovou složitost (konkrétně závislost času vyhledání na počtu uložených vektorů) indexu IndexFlatL2. Prvky vektorů budou datového typu float32, což sice znamená relativně velké nároky na operační paměť, ovšem samotné výpočty (na CPU!) jsou poměrně rychlé, protože lze využít instrukční sady SSEx či AVX.

Poznámka: všechny tři první benchmarky, s nimiž se v dnešním článku seznámíme, skutečně používají ten nejjednodušší možný index nazvaný IndexFlatL2. Podobných výsledků (stejná časová složitost atd.) dosáhneme při použití indexu IndexFlatIP. I když se u těchto indexů používají odlišné výpočty pro zjištění podobnosti vektorů, způsob samotného výběru vektorů je stále stejný – lineárně se prochází celou datovou sadou. Až ve druhé části článku se seznámíme s indexy založenými na sofistikovanějších datových strukturách, které umožňují rychlejší, ovšem (obecně) ne tak přesné vyhledávání.

Jednoduchý benchmark, který slouží pro změření časové složitosti vyhledávání, jsme si již ukázali v předchozích článcích o knihovně FAISS. Ovšem aby byly výsledky měření přesnější, musíme celý benchmark nepatrně upravit. V benchmarku se provádí následující operace:

Vytvoření matice obsahující zvolený počet vektorů s předem známou dimenzí (počtem prvků).
Konstrukce indexu (L2) z této matice.
Opakované vyhledání k nejpodobnějších vektorů k náhodně zvolenému vektoru. Čím větší bude počet opakování tohoto kroku, tím přesnější budou výsledky benchmarku.
Vykreslení závislosti času vyhledávání (předchozí bod) na celkovém počtu vektorů n.

Poznámka: pro spouštění všech benchmarků bude použit nástroj uv nebo pdm. Soubor pyproject.toml obsahující definici projektu, vypadá následovně (důležitý je zde hlavně seznam knihoven, na nichž projekt závisí):

[project]
name = "faiss-1"
version = "0.1.0"
description = "Default template for PDM package"
authors = [
    {name = "Pavel Tisnovsky", email = "ptisnovs@redhat.com"},
]
dependencies = [
 "faiss-cpu>=1.11.0",
 "matplotlib>=3.10.3",
 "numpy>=2.3.1",
]
requires-python = "==3.12.*"
readme = "README.md"
license = {text = "MIT"}
 
 
[tool.pdm]
distribution = false

3. Benchmark: zjištění časové složitosti vyhledávání při použití výchozího indexu FlatL2

V první verzi benchmarku je dimenze vektorů (počet prvků) specifikován konstantou DIMENSIONS (která se pochopitelně nemění). Počet opakování vyhledání náhodného vektoru je uložen v konstantě REP_COUNT. Čím větší je hodnota této konstanty, tím pomalejší bude benchmark, ovšem tím více se omezí náhodné vlivy.

Úplný zdrojový kód dnešního prvního benchmarku vypadá následovně:

# Knihovna FAISS
#
# - benchmark rychlosti nalezení nejpodobnějších vektorů
# - výpis výsledků v tabulkové formě
# - vizualizace výsledků formou grafu
 
from time import time
import faiss
import numpy as np
 
import matplotlib.pyplot as plt
 
 
def similarity_search(n, k):
    """Nalezeni k nejblizsich vektoru v mnozine n vektoru."""
    # pocet slozek vektoru
    DIMENSIONS=128
 
    t1 = time()
 
    # nahodne vektory
    data = np.random.rand(n, 128).astype('float32')
 
    t2 = time()
 
    # konstrukce indexu pro vyhledavani na zaklade vzdalenosti
    index = faiss.IndexFlatL2(DIMENSIONS)
    index.add(data)
 
    t3 = time()
    REP_COUNT = 20
 
    # opakovane mereni rychlosti nalezeni nejpodobnejsich vektoru
    for _ in range(REP_COUNT):
        # vektor, ke kteremu budeme pocitat vzdalenost
        query_vector = np.random.rand(1, DIMENSIONS).astype("float32")
 
        # pocet nejblizsich bodu
        distances, indices = index.search(query_vector, k)
 
        # test, kolik vektoru se nalezlo
        assert len(distances) == k
        assert len(indices) == k
 
    t4 = time()
 
    return n, t2-t1, t3-t2, (t4-t3)/REP_COUNT
 
 
ns = []
ts_search = []
 
for n in np.linspace(0, 1000000, 11):
    print(n)
    n, t_rand, t_index, t_search = similarity_search(int(n), 1)
    ns.append(n)
    ts_search.append(t_search)
 
 
plt.xlabel("# vectors")
plt.ylabel("Time/sec")
plt.plot(ns, ts_search, "m-", label="similarity search")
 
# přidání legendy
plt.legend(loc="upper left")
 
# povolení zobrazení mřížky
plt.grid(True)
 
plt.savefig("faiss_benchmark_1.png")
 
# zobrazení grafu
plt.show()

4. Výsledky prvního benchmarku

Výsledky benchmarku popsaného v předchozí kapitole vypadají následovně:

Obrázek 1: Výsledky benchmarku při použití standardního indexu FlatL2 pro proměnný počet vektorů

Autor: tisnik, podle licence: Rights Managed

Poznámka: ze změřeného a zobrazeného průběhu je poměrně dobře patrná lineární časová složitost vyhledávacího algoritmu, minimálně pro zvolený rozsah 0 až jeden milion vektorů v datové sadě. Větší datová sada již vyžaduje velký objem operační paměti a (minimálně na mém stroji) by se již negativně projevilo swapování.

5. Vliv rychlosti vyhledávání na počtu prvků (dimenzi) vektorů

V prvním benchmarku, jehož výsledky jsme si právě ukázali, jsme měnili pouze počet vektorů uložených do indexu a měřili jsme čas vyhledání nejpodobnějších vektorů. Ovšem jaký vliv má na rychlost vyhledávání počet prvků vektorů, tj. jejich dimenze? Pro zjištění podobnosti vektorů se používá klasická metrika L², tj. výpočet Eukleidovské vzdálenosti v n-dimenzionálním prostoru. Tento výpočet je založen na zobecněné Pythagorově větě (sčítají se druhé mocniny rozdílů odpovídajících si prvků, teoreticky se ještě výsledek odmocní, ale to již nehraje podstatnou roli). A pochopitelně s rostoucím počtem dimenzí roste i počet operací.

Benchmark upravíme tak, že počet vektorů bude konstantní, ale bude se měnit jejich dimenze v rozsahu 0 až 4000 (některé embedding modely se hodnotě 4000 skutečně přibližují):

# Knihovna FAISS
#
# - benchmark rychlosti nalezení nejpodobnějších vektorů
# - je použit index FlatL2
# - postupně se zvyšuje počet dimenzí vektorů
# - délka vektorů zůstává konstantní
# - vizualizace výsledků formou grafu
 
from time import time
import faiss
import numpy as np
 
import matplotlib.pyplot as plt
 
 
def similarity_search(dimensions, n, k):
    """Nalezeni k nejblizsich vektoru v mnozine n vektoru."""
    t1 = time()
 
    # nahodne vektory
    data = np.random.rand(n, dimensions).astype('float32')
 
    t2 = time()
 
    # konstrukce indexu pro vyhledavani na zaklade vzdalenosti
    index = faiss.IndexFlatL2(dimensions)
    index.add(data)
 
    t3 = time()
    REP_COUNT = 20
 
    for _ in range(REP_COUNT):
        # vektor, ke kteremu budeme pocitat vzdalenost
        query_vector = np.random.rand(1, dimensions).astype("float32")
 
        # pocet nejblizsich bodu
        distances, indices = index.search(query_vector, k)
 
        # test, kolik vektoru se nalezlo
        assert len(distances) == k
        assert len(indices) == k
 
    t4 = time()
 
    return n, t2-t1, t3-t2, (t4-t3)/REP_COUNT
 
 
ns = []
ts_search = []
 
for dimensions in np.linspace(0, 4000, 11):
    n = 100000
    print(dimensions, n)
    n, t_rand, t_index, t_search = similarity_search(int(dimensions), n, 1)
    ns.append(dimensions)
    ts_search.append(t_search)
 
 
plt.xlabel("# dimensions")
plt.ylabel("Time/sec")
plt.plot(ns, ts_search, "m-", label="similarity search")
 
# přidání legendy
plt.legend(loc="upper left")
 
# povolení zobrazení mřížky
plt.grid(True)
 
plt.savefig("faiss_benchmark_2.png")
 
# zobrazení grafu
plt.show()

6. Výsledky druhého benchmarku

I ze změřených výsledků druhého benchmarku vyplývá (v souladu s teorií), že vyhledání nejpodobnějších vektorů má lineární časovou složitost, tentokrát ovšem s ohledem na počtu prvků vektorů. To by nemělo být příliš překvapivé zjištění, ovšem naznačuje, že se (pravděpodobně) interně neprovádí žádné sofistikované optimalizace:

Obrázek 2: Výsledky benchmarku při použití standardního indexu FlatL2 pro proměnný počet dimenzí

Autor: tisnik, podle licence: Rights Managed

7. Dimenze vektorů vs. jejich počet

Při tréninku embedded modelů je nutné volit vhodný počet dimenzí, který do jisté míry souvisí i s celkovým počtem vektorů (tj. počtem textů/vět, které jsou daným modelem reprezentovány). Dimenze vektorů se většinou pohybuje v rozsahu 256 až 4096 (což už jsou specializované případy); typická hodnota dimenze je 384, 512 nebo 768. A celkový počet vektorů se pohybuje od několika set tisíc (modely pro konkrétní malou oblast) až do stovek milionů (obecné embedded modely).

Paměťové nároky se (pro přímé indexy) počítají jednoduše:
dimenze × počet vektorů × velikost prvku (bit, byte, float16, float32)

To tedy vlastně znamená, že pokud zachováme konstantní hodnotu dimenze × počet vektorů, můžeme zjistit, která z těchto hodnot má větší vliv na rychlost vyhledávání – zda je to dimenze (vyšší dimenze = složitější početní operace, například více výpočtů čtverce rozdílů prvků vektorů a více součtů) nebo počet vektorů (vyšší počet = vyšší počet výpočtů). To si ověříme v benchmarku, který je uveden v navazující kapitole.

8. Benchmarky měřící rychlosti vyhledání nejpodobnějších vektorů v sadě s proměnným počtem vektorů i proměnným počtem dimenzí

Dva benchmarky, které jsou popsány v této kapitole, měří rychlost vyhledání nejpodobnějších vektorů v datové sadě s proměnným počtem vektorů n, která navíc mají proměnný počet dimenzí dimensions. Počet dimenzí roste s mocninou dvojky a počet vektorů je odvozen ze vztahu 65536*64 // dimensions. To tedy znamená, že celkový počet prvků zůstává konstantní: n×dimensions=65536*64=4194304 (to je dostatečně malý počet, aby se nepřesáhla dostupná kapacita operační paměti).

Oba parametry vstupující do benchmarků se vypočítají takto:

for d in range(0, 14):
    dimensions = 2**d
    n = 65536*64 // dimensions

A proč jsou vytvořeny benchmarky dva? Samotné měření zůstává naprosto stejné, ovšem první benchmark vykreslí grafy s využitím lineární stupnice/měřítka a druhý benchmark použije logaritmické měřítko (důvod uvidíme v další kapitole). Jinak se tyto dva benchmarky nijak neliší:

# Knihovna FAISS
#
# - benchmark rychlosti nalezení nejpodobnějších vektorů
# - je použit index FlatL2
# - výpis výsledků v tabulkové formě
# - postupně se zvyšuje počet dimenzí vektorů
# - délka vektorů se zmenšuje s rostoucím počtem dimenzí vektorů
# - vizualizace výsledků formou grafu
 
from time import time
import faiss
import numpy as np
 
import matplotlib.pyplot as plt
 
 
def similarity_search(dimensions, n, k):
    """Nalezeni k nejblizsich vektoru v mnozine n vektoru."""
    t1 = time()
 
    # nahodne vektory
    data = np.random.rand(n, dimensions).astype('float32')
 
    t2 = time()
 
    # konstrukce indexu pro vyhledavani na zaklade vzdalenosti
    index = faiss.IndexFlatL2(dimensions)
    index.add(data)
 
    t3 = time()
    REP_COUNT = 20
 
    for _ in range(REP_COUNT):
        # vektor, ke kteremu budeme pocitat vzdalenost
        query_vector = np.random.rand(1, dimensions).astype("float32")
 
        # pocet nejblizsich bodu
        distances, indices = index.search(query_vector, k)
 
        # test, kolik vektoru se nalezlo
        assert len(distances) == k
        assert len(indices) == k
 
    t4 = time()
 
    return n, t2-t1, t3-t2, (t4-t3)/REP_COUNT
 
 
ns = []
ts_search = []
 
for d in range(0, 14):
    dimensions = 2**d
    n = 65536*64 // dimensions
    print(dimensions, n)
    n, t_rand, t_index, t_search = similarity_search(dimensions, n, 1)
    ns.append(dimensions)
    ts_search.append(t_search)
 
 
plt.xlabel("# dimensions")
plt.ylabel("Time/sec")
plt.plot(ns, ts_search, "m-", label="similarity search")
 
# přidání legendy
plt.legend(loc="upper left")
 
# povolení zobrazení mřížky
plt.grid(True)
 
plt.savefig("faiss_benchmark_3.png")
 
# zobrazení grafu
plt.show()

# Knihovna FAISS
#
# - benchmark rychlosti nalezení nejpodobnějších vektorů
# - je použit index FlatL2
# - výpis výsledků v tabulkové formě
# - postupně se zvyšuje počet dimenzí vektorů
# - délka vektorů se zmenšuje s rostoucím počtem dimenzí vektorů
# - vizualizace výsledků formou grafu (logaritmické měřítko)
 
from time import time
import faiss
import numpy as np
 
import matplotlib.pyplot as plt
 
 
def similarity_search(dimensions, n, k):
    """Nalezeni k nejblizsich vektoru v mnozine n vektoru."""
    t1 = time()
 
    # nahodne vektory
    data = np.random.rand(n, dimensions).astype('float32')
 
    t2 = time()
 
    # konstrukce indexu pro vyhledavani na zaklade vzdalenosti
    index = faiss.IndexFlatL2(dimensions)
    index.add(data)
 
    t3 = time()
    REP_COUNT = 20
 
    for _ in range(REP_COUNT):
        # vektor, ke kteremu budeme pocitat vzdalenost
        query_vector = np.random.rand(1, dimensions).astype("float32")
 
        # pocet nejblizsich bodu
        distances, indices = index.search(query_vector, k)
 
        # test, kolik vektoru se nalezlo
        assert len(distances) == k
        assert len(indices) == k
 
    t4 = time()
 
    return n, t2-t1, t3-t2, (t4-t3)/REP_COUNT
 
 
ns = []
ts_search = []
 
for d in range(0, 14):
    dimensions = 2**d
    n = 65536*64 // dimensions
    print(dimensions, n)
    n, t_rand, t_index, t_search = similarity_search(dimensions, n, 1)
    ns.append(dimensions)
    ts_search.append(t_search)
 
 
plt.xlabel("# dimensions")
plt.ylabel("Time/sec")
plt.semilogy(ns, ts_search, "m-", label="similarity search")
 
# přidání legendy
plt.legend(loc="upper left")
 
# povolení zobrazení mřížky
plt.grid(True)
 
plt.savefig("faiss_benchmark_4.png")
 
# zobrazení grafu
plt.show()

9. Výsledky třetího a čtvrtého benchmarku: lineární a logaritmická stupnice

Z výsledků třetího benchmarku by se mohlo zdát, že pokud budeme ignorovat situaci s nejmenší dimenzí vektorů (a tím pádem s jejich největším počtem), bude čas pro nalezení k nejpodobnějších vektorů konstantní – neboli že pokud je celkový počet prvků konstantní, bude stejný i čas hledání:

Obrázek 3: Výsledky benchmarku – proměnný počet vektorů i počet dimenzí (lineární stupnice)

Autor: tisnik, podle licence: Rights Managed

Ve skutečnosti je však situace odlišná od předchozího popisu, protože s rostoucím počtem dimenzí (a proporcionálně se snižujícím počtem vektorů) čas vyhledání nejpodobnějších vektorů roste. To odhalíme použitím logaritmického měřítka na vertikální ose, což bylo realizováno ve čtvrtém benchmarku. Jeho výsledky vypadají následovně:

Obrázek 4: Výsledky benchmarku – proměnný počet vektorů i počet dimenzí (logaritmická stupnice)

Autor: tisnik, podle licence: Rights Managed

Poznámka: v případě, že vám na grafu nevyhovují dlouhé časy pro malý počet dimenzí (= mnoho vektorů), je vhodné začít až od 128 dimenzí.

10. Indexy založené na použití sofistikovanějších datových struktur

Z předchozích benchmarků je patrné, že čas vyhledání nejpodobnějších vektorů lineárně roste s jejich rostoucím počtem. Ovšem v jazykových modelech se setkáme s datovými sadami, které obsahují desítky či dokonce stovky milionů vektorů, takže (pochopitelně) existuje snaha o snížení času vyhledávání – ideálně změnou časové složitosti (z lineární složitosti k například logaritmické složitosti nebo složitosti s odmocninou), nebo alespoň sice se zachováním lineární složitosti, ovšem s jejím menším sklonem (což je ona někdy podceňovaná konstanta k ve vztahu k O(n)). I v těchto oblastech nám knihovna FAISS nabízí různá řešení. V rámci dalších kapitol se seznámíme se dvěma různými technikami, které jsou založeny na použití sofistikovanějších datových struktur, než jsou pouhé sekvence (tabulky) vektorů.

11. Rozdělení celého prostoru Voroného dekompozicí

Jeden z dostupných a relativně často používaných algoritmů určených pro urychlení vyhledávání podobných vektorů spočívá v tom, že se n-dimenzionální prostor, ve kterém vektory vstupní datové sady leží, rozdělí do zadaného počtu oblastí. Pro rozdělení se přitom typicky používá Voroného dekompozice, i když by teoreticky bylo možné použít i další metody (možná zobecněný oktalový strom?). Algoritmus vyhledávání je v tom nejjednodušším případě upraven následujícím způsobem:

Vstupem je vektor (dotaz) k němuž v datové sadě hledáme nejbližší vektory
Pro tento vstupní vektor je zjištěna oblast (Voroného dekompozice), ve které bude prováděno vyhledávání
Následně jsou nejbližší vektory vyhledávány pouze v této oblasti

Problém spočívá v tom, že právě popsaný algoritmus nemusí vyhledat skutečně nejbližší vektory. To nastane v případě, že se vstupní vektor nachází blízko hranice oblasti a nejbližší vektor(y) by se tedy nacházel za touto hranicí. Proto může být algoritmus vyhledávání upraven do nepatrně odlišné podoby:

Vstupem je vektor (dotaz) k němuž v datové sadě hledáme nejbližší vektory
Pro tento vstupní vektor je zjištěna oblast (Voroného dekompozice), ve které bude prováděno vyhledávání
Dále jsou zjištěno m sousedních oblastí k nalezené oblasti (m je konfigurovatelné)
Následně jsou nejbližší vektory vyhledávány v nalezené oblasti (bod 2) i oblastech sousedních (bod 3)

Čím větší je hodnota m, tím pomalejší, ale přesnější je vyhledání nejbližších vektorů.

12. Konstrukce indexu IVFFlat

Rozdělení n-dimenzionálního prostoru podle Voroného dekompozice je pochopitelně nutné nějakým způsobem realizovat. Podporu pro toto rozdělení programátorům sice nabízí samotná knihovna FAISS, ovšem samotná konstrukce indexu se nepatrně zkomplikuje. Připomeňme si, že původně jsme si nechali zkonstruovat index následujícím postupem:

# konstrukce indexu pro vyhledavani na zaklade vzdalenosti
index = faiss.IndexFlatL2(dimensions)

Ihned poté bylo možné do indexu všechny vektory vložit:

index.add(data)

Při aplikaci Voroného dekompozice se nejprve samostatným příkazem index představující realizaci této dekompozice vytvoří a teprve poté se zkonstruuje index typu IVFFlat. Parametrem nlist je možné určit způsob rozdělení celého n-dimenzionálního prostoru do nepřekrývajících se oblastí:

# konstrukce indexu pro vyhledavani na zaklade vzdalenosti
quantizer = faiss.IndexFlatL2(DIMENSIONS)
index = faiss.IndexIVFFlat(quantizer, DIMENSIONS, nlist)

Rozdílný je nyní způsob přidávání vektorů do indexu, protože index je nutné nejprve „natrénovat“ a teprve poté je do něj možné vektory přidat. Je to ostatně pochopitelné, protože samotná Voroného dekompozice závisí na koncových souřadnicích vektorů. Při tréninku tedy „pouze“ dojde k dekompozici a při vkládání vektorů k rozdělení vektorů do jednotlivých oblastí:

index.train(data)
index.add(data)

Poznámka: je tedy umožněno, aby byla dekompozice provedena s využitím odlišné (typicky menší) datové sady, což sice nepovede k nejpřesnějším výsledkům, ovšem celý postup se může poměrně významně urychlit.

13. Benchmark: časy vyhledávání nejpodobnějších vektorů s využitím indexu FlatL2

V dalším demonstračním příkladu, který si dnes ukážeme, budeme měřit čas vyhledání nejpodobnějších vektorů s využitím indexu nazvaného FlatL2, při jehož konstrukci byly vektory rozděleny do předem nastaveného počtu oblastí. Celý benchmark se tedy (z pohledu programátora) liší pouze tím, jakým způsobem se index zkonstruován. Samotné vyhledávání nejpodobnější vektorů je stále stejné (minimálně z pohledu toho, jaké funkce se volají). Měření budeme opět provádět pro datovou sadu s počtem vektorů, který se mění od nuly (resp. od hodnoty odpovídající počtu oblastí, což je „skoro nula“) do jednoho milionu:

# Knihovna FAISS
#
# - benchmark rychlosti nalezení nejpodobnějších vektorů
# - je použit index FlatL2
# - výpis výsledků v tabulkové formě
# - vizualizace výsledků formou grafu
 
from time import time
import faiss
import numpy as np
 
import matplotlib.pyplot as plt
 
 
def similarity_search(n, k, nlist=5):
    """Nalezeni k nejblizsich vektoru v mnozine n vektoru."""
    # pocet slozek vektoru
    DIMENSIONS=128
 
    t1 = time()
 
    # nahodne vektory
    data = np.random.rand(n, 128).astype('float32')
 
    t2 = time()
 
    # konstrukce indexu pro vyhledavani na zaklade vzdalenosti
    quantizer = faiss.IndexFlatL2(DIMENSIONS)
    index = faiss.IndexIVFFlat(quantizer, DIMENSIONS, nlist)
 
    index.train(data)
    index.add(data)
 
    t3 = time()
    REP_COUNT = 100
 
    for _ in range(REP_COUNT):
        # vektor, ke kteremu budeme pocitat vzdalenost
        query_vector = np.random.rand(1, DIMENSIONS).astype("float32")
 
        # pocet nejblizsich bodu
        distances, indices = index.search(query_vector, k)
 
        # test, kolik vektoru se nalezlo
        assert len(distances) == k
        assert len(indices) == k
 
    t4 = time()
 
    return n, t2-t1, t3-t2, (t4-t3)/REP_COUNT
 
 
ns = []
ts_search = []
 
for n in np.linspace(0, 1000000, 11):
    # nlist nemuze byt nulovy a soucasne musi byt mensi nez
    # pocet vektoru
    if n == 0:
        n = 5
    print(n)
    n, t_rand, t_index, t_search = similarity_search(int(n), 1)
    ns.append(n)
    ts_search.append(t_search)
 
 
plt.xlabel("# vectors")
plt.ylabel("Time/sec")
plt.plot(ns, ts_search, "m-", label="similarity search")
 
# přidání legendy
plt.legend(loc="upper left")
 
# povolení zobrazení mřížky
plt.grid(True)
 
plt.savefig("faiss_benchmark_5.png")
 
# zobrazení grafu
plt.show()

14. Výsledky pátého benchmarku

Z výsledků pátého benchmarku je patrné, že se rychlost vyhledávání skutečně zvýšila. Konkrétně pro datovou sadu s jedním milionem vektorů se čas vyhledání snížil z 0,03 sekundy na 0,009 sekundy. Navíc si musíme uvědomit, že počet oblastí, do kterých byly vektory rozděleny, byl na nastaven na velmi malou hodnotu, konkrétně pouze na pět oblastí, takže bychom měli očekávat maximálně pětinásobné urychlení. A dále je z průběhu grafu patrné, že vyhledání má stále lineární časovou složitost (ovšem s mnohem menším sklonem):

Obrázek 5: Výsledky benchmarku při rozdělení prostoru Voroného dekompozicí na pět oblastí

Autor: tisnik, podle licence: Rights Managed

15. Benchmark: modifikace počtu buněk při konstrukci indexu FlatL2

V předchozím benchmarku byl počet oblastí (buněk) nastaven na velmi nízkou hodnotu, konkrétně na hodnotu 5. Ovšem nic nám pochopitelně nebrání ve zvýšení této hodnoty, například na padesát oblastí; musíme ale počítat s tím, že se sníží přesnost vyhledání. Zvyšuje se totiž pravděpodobnost, že se vzorový vektor bude nacházet blízko okraje nějaké oblasti a nikoli poblíž jejího středu. Nicméně bude zajímavé zjistit, jak bude vyhledání rychlé v případě, že počet oblastí zvýšíme z hodnoty 5 (což je v praxi velmi malá hodnota) na 50:

# Knihovna FAISS
#
# - benchmark rychlosti nalezení nejpodobnějších vektorů
# - je použit index IVFlat
# - výpis výsledků v tabulkové formě
# - vizualizace výsledků formou grafu
 
from time import time
import faiss
import numpy as np
 
import matplotlib.pyplot as plt
 
 
def similarity_search(n, k, nlist=50):
    """Nalezeni k nejblizsich vektoru v mnozine n vektoru."""
    # pocet slozek vektoru
    DIMENSIONS=128
 
    t1 = time()
 
    # nahodne vektory
    data = np.random.rand(n, 128).astype('float32')
 
    t2 = time()
 
    # konstrukce indexu pro vyhledavani na zaklade vzdalenosti
    quantizer = faiss.IndexFlatL2(DIMENSIONS)
    index = faiss.IndexIVFFlat(quantizer, DIMENSIONS, nlist)
 
    index.train(data)
    index.add(data)
 
    t3 = time()
    REP_COUNT = 100
 
    for _ in range(REP_COUNT):
        # vektor, ke kteremu budeme pocitat vzdalenost
        query_vector = np.random.rand(1, DIMENSIONS).astype("float32")
 
        # pocet nejblizsich bodu
        distances, indices = index.search(query_vector, k)
 
        # test, kolik vektoru se nalezlo
        assert len(distances) == k
        assert len(indices) == k
 
    t4 = time()
 
    return n, t2-t1, t3-t2, (t4-t3)/REP_COUNT
 
 
ns = []
ts_search = []
 
for n in np.linspace(0, 1000000, 11):
    # nlist nemuze byt nulovy a soucasne musi byt mensi nez
    # pocet vektoru
    if n == 0:
        n = 50
    print(n)
    n, t_rand, t_index, t_search = similarity_search(int(n), 1)
    ns.append(n)
    ts_search.append(t_search)
 
 
plt.xlabel("# vectors")
plt.ylabel("Time/sec")
plt.plot(ns, ts_search, "m-", label="similarity search")
 
# přidání legendy
plt.legend(loc="upper left")
 
# povolení zobrazení mřížky
plt.grid(True)
 
plt.savefig("faiss_benchmark_6.png")
 
# zobrazení grafu
plt.show()

Poznámka: hodnota 50 je do benchmarku „zadrátována“ na dvou místech. Později benchmark upravíme do podoby, ve které se bude jednat o jeden z proměnných parametrů benchmarku.

16. Výsledky šestého benchmarku

Opět se podívejme na výsledky benchmarku, jehož zdrojový kód byl uveden v předchozí kapitole:

Obrázek 6: Výsledky benchmarku při rozdělení prostoru Voroného dekompozicí na padesát oblastí

Autor: tisnik, podle licence: Rights Managed

Zajímavé bude porovnání hodnot získaných ze všech tří základních benchmarků, tedy benchmarku se základním indexem L2 (bez dalších optimalizací), benchmarku s rozdělením prostoru do pěti oblastí podle Voroného dekompozice a benchmarku s rozdělením prostoru na základě téže dekompozice, ovšem nyní do padesáti oblastí:

#	Benchmark	Čas vyhledání pro milion vektorů	Teoretické urychlení	Skutečné urychlení
1	L2	0,03	1,00×	1,00×
2	Voroného dekompozice, 5 oblastí	0,009	5.0×	3.3×
3	Voroného dekompozice, 50 oblastí	0,00175	50.0×	17.1×

Poznámka: počet oblastí je pochopitelně možné dále zvyšovat. Závislost urychlení vyhledání nejpodobnějších vektorů na základě počtu oblastí a počtu sousedních oblastí si uvedeme příště v závěrečném článku o knihovně FAISS.

17. Index HNSW (Hierarchical Navigable Small World)

Jedním z potenciálně velmi užitečných indexů, které jsou nabízeny (nejenom) knihovnou FAISS, je index označovaný zkratkou HNSW neboli Hierarchical Navigable Small World. Jak již název tohoto indexu naznačuje, je metoda HNSW založena na rozdělení celého prostoru do hierarchicky organizovaných menších částí (ty jsou nazývány „malé světy“). Samotné rozdělování prostoru je časově velmi náročné, ovšem na druhou stranu se urychlí vyhledávání podobných vektorů, a to o jeden až dva řády. Samozřejmě se i s tímto indexem pojí určité nevýhody, ovšem prozatím nám bude postačovat vytvoření benchmarku, z něhož je patrné, jakým způsobem se tento index používá:

# Knihovna FAISS
#
# - benchmark rychlosti nalezení nejpodobnějších vektorů
# - je použit index HNSWFlat
# - výpis výsledků v tabulkové formě
# - vizualizace výsledků formou grafu
 
from time import time
import faiss
import numpy as np
 
import matplotlib.pyplot as plt
 
 
def similarity_search(n, k):
    """Nalezeni k nejblizsich vektoru v mnozine n vektoru."""
    M = 32
    ef_search = 16
    ef_construction = 32
    # pocet slozek vektoru
    DIMENSIONS=128
 
    t1 = time()
 
    # nahodne vektory
    data = np.random.rand(n, 128).astype('float32')
 
    t2 = time()
 
    # konstrukce indexu pro vyhledavani na zaklade vzdalenosti
    index = faiss.IndexHNSWFlat(DIMENSIONS, M)
    index.hnsw.efConstruction = ef_construction
    index.hnsw.efSearch = ef_search
 
    index.add(data)
 
    t3 = time()
    REP_COUNT = 100
 
    for _ in range(REP_COUNT):
        # vektor, ke kteremu budeme pocitat vzdalenost
        query_vector = np.random.rand(1, DIMENSIONS).astype("float32")
 
        # pocet nejblizsich bodu
        distances, indices = index.search(query_vector, k)
 
        # test, kolik vektoru se nalezlo
        assert len(distances) == k
        assert len(indices) == k
 
    t4 = time()
 
    return n, t2-t1, t3-t2, (t4-t3)/REP_COUNT
 
 
ns = []
ts_search = []
 
for n in np.linspace(0, 1000000, 11):
    print(n)
    n, t_rand, t_index, t_search = similarity_search(int(n), 1)
    ns.append(n)
    ts_search.append(t_search)
 
 
plt.xlabel("# vectors")
plt.ylabel("Time/sec")
plt.plot(ns, ts_search, "m-", label="similarity search")
 
# přidání legendy
plt.legend(loc="upper left")
 
# povolení zobrazení mřížky
plt.grid(True)
 
plt.savefig("faiss_benchmark_7.png")
 
# zobrazení grafu
plt.show()

18. Výsledky sedmého benchmarku

Výsledky sedmého a dnes již posledního benchmarku jsou zobrazeny na obrázku pod tímto odstavcem. Zajímavé je, že v tomto případě došlo k velmi radikálnímu urychlení vyhledávání podobných vektorů. Konkrétně se (pro jeden milion vektorů) čas vyhledání snížil z přibližně 0,03 sekundy na pouhých 0,0007 sekundy, takže rychlost vyhledávání je zhruba 43× vyšší. Co však nevidíme je čas nutný pro konstrukci indexu – ten je naopak velmi dlouhý. O problematice konstrukce indexu (což nás prozatím příliš netrápilo, ovšem u podobných komplikovanějších indexů je to již reálný problém) se zmíníme v závěrečném článku o knihovně FAISS.

Obrázek 7: Výsledky benchmarku založeného na využití indexu HNSW

Autor: tisnik, podle licence: Rights Managed

19. Repositář s demonstračními příklady

Demonstrační příklady použité v článcích Knihovna FAISS a embedding: základ jazykových modelů a Knihovna FAISS a embedding: základ jazykových modelů (2. část) lze nalézt na následujících odkazech:

#	Příklad	Stručný popis	Adresa
1	transformer1.py	inicializace modelu paraphrase-MiniLM-L6-v2 přes knihovnu sentence-transformers s výpisem základních informací o něm	https://github.com/tisnik/most-popular-python-libs/blob/master/faiss-transfomers/transformer1.py
2	transformer2.py	inicializace modelu all-mpnet-base-v2 přes knihovnu sentence-transformers s výpisem základních informací o něm	https://github.com/tisnik/most-popular-python-libs/blob/master/faiss-transfomers/transformer2.py
3	transformer3.py	inicializace modelu Seznam/small-e-czech přes knihovnu sentence-transformers s výpisem základních informací o něm	https://github.com/tisnik/most-popular-python-libs/blob/master/faiss-transfomers/transformer3.py
4	transformer4.py	vektorizace textů (vět) přes knihovnu sentence-transformers s využitím zvoleného modelu	https://github.com/tisnik/most-popular-python-libs/blob/master/faiss-transfomers/transformer4.py
5	transformer5.py	informace o vypočtené matici s vektorizovaným textem (embedding)	https://github.com/tisnik/most-popular-python-libs/blob/master/faiss-transfomers/transformer5.py
6	transformer6.py	výpočet a zobrazení vypočtené tabulky podobností	https://github.com/tisnik/most-popular-python-libs/blob/master/faiss-transfomers/transformer6.py
7	transformer7.py	nalezení významově nejpodobnějších vět s využitím vektorizované databáze textů	https://github.com/tisnik/most-popular-python-libs/blob/master/faiss-transfomers/transformer7.py
8	transformer8.py	nalezení významově nejpodobnějších vět s využitím vektorizované databáze textů	https://github.com/tisnik/most-popular-python-libs/blob/master/faiss-transfomers/transformer8.py
9	transformer9.py	nalezení vět nejbližších k zadanému termínu	https://github.com/tisnik/most-popular-python-libs/blob/master/faiss-transfomers/transformer9.py
10	transformerA.py	podpora pro hledání na základě sémantické podobnosti	https://github.com/tisnik/most-popular-python-libs/blob/master/faiss-transfomers/transformerA.py

11	dataset1.py	získání datové sady s milionem anglických vět	https://github.com/tisnik/most-popular-python-libs/blob/master/faiss-transfomers/dataset1.py
12	dataset2.py	získání tréninkových dat s milionem anglických vět	https://github.com/tisnik/most-popular-python-libs/blob/master/faiss-transfomers/dataset2.py
13	dataset3.py	konstrukce Pythonovského seznamu s větami	https://github.com/tisnik/most-popular-python-libs/blob/master/faiss-transfomers/dataset3.py
14	dataset4.py	konstrukce Pythonovského seznamu s větami, omezení počtu vět	https://github.com/tisnik/most-popular-python-libs/blob/master/faiss-transfomers/dataset4.py

15	transformerB.py	vytvoření indexu z datové sady s milionem anglických vět	https://github.com/tisnik/most-popular-python-libs/blob/master/faiss-transfomers/transformerB.py
16	transformerC.py	refaktoring předchozího demonstračního příkladu	https://github.com/tisnik/most-popular-python-libs/blob/master/faiss-transfomers/transformerC.py
17	transformerD.py	zjištění rychlosti nalezení nejpodobnějších vět	https://github.com/tisnik/most-popular-python-libs/blob/master/faiss-transfomers/transformerD.py
18	transformerE.py	benchmark: rychlost embeddingu a konstrukce indexu (využití typu float32)	https://github.com/tisnik/most-popular-python-libs/blob/master/faiss-transfomers/transformerE.py
19	transformerF.py	benchmark: rychlost embeddingu a konstrukce indexu (využití typu float16)	https://github.com/tisnik/most-popular-python-libs/blob/master/faiss-transfomers/transformerF.py
20	transformerG.py	uložení modelu i indexu do souboru pro porovnání velikostí	https://github.com/tisnik/most-popular-python-libs/blob/master/faiss-transfomers/transformerG.py

21	pyproject.toml	soubor s projektem a definicí všech potřebných závislostí	https://github.com/tisnik/most-popular-python-libs/blob/master/faiss-transfomers/pyproject.toml

Demonstrační příklady vytvořené v Pythonu a popsané v článcích ,i v článku dnešním jsou taktéž uloženy do repositáře https://github.com/tisnik/most-popular-python-libs/. Následují odkazy na jednotlivé příklady:

#	Příklad	Stručný popis	Adresa
1	faiss-1.py	seznamy souřadnic bodů v rovině	https://github.com/tisnik/most-popular-python-libs/blob/master/faiss/faiss-1.py
2	faiss-2.py	konstrukce matice se souřadnicemi bodů	https://github.com/tisnik/most-popular-python-libs/blob/master/faiss/faiss-2.py
3	faiss-3.py	konstrukce indexu pro vyhledávání na základě vzdálenosti	https://github.com/tisnik/most-popular-python-libs/blob/master/faiss/faiss-3.py
4	faiss-4.py	nalezení nejbližších bodů k zadaným souřadnicím – výpis indexů nalezených bodů	https://github.com/tisnik/most-popular-python-libs/blob/master/faiss/faiss-4.py
5	faiss-5.py	nalezení nejbližších bodů k zadaným souřadnicím – výpis souřadnic nalezených bodů	https://github.com/tisnik/most-popular-python-libs/blob/master/faiss/faiss-5.py
6	faiss-6.py	vyhledávání bodů na základě skalárního součinu bez normalizace vektorů	https://github.com/tisnik/most-popular-python-libs/blob/master/faiss/faiss-6.py
7	faiss-7.py	vyhledávání bodů na základě skalárního součinu s normalizací vektorů	https://github.com/tisnik/most-popular-python-libs/blob/master/faiss/faiss-7.py
8	faiss-8.py	jednoduchý benchmark rychlosti vyhledávání knihovnou FAISS	https://github.com/tisnik/most-popular-python-libs/blob/master/faiss/faiss-8.py

9	faiss-9.py	vizualizace koncových bodů vektorů v rovině	https://github.com/tisnik/most-popular-python-libs/blob/master/faiss/faiss-9.py
10	faiss-A.py	vykreslení nejpodobnějších vektorů získaných na základě L2 metriky	https://github.com/tisnik/most-popular-python-libs/blob/master/faiss/faiss-A.py
11	faiss-B.py	nalezení nejpodobnějších vektorů získaných na základě skalárního součinu: varianta s nenormovanými vektory	https://github.com/tisnik/most-popular-python-libs/blob/master/faiss/faiss-B.py
12	faiss-C.py	nalezení nejpodobnějších vektorů získaných na základě skalárního součinu: varianta s normovanými vektory	https://github.com/tisnik/most-popular-python-libs/blob/master/faiss/faiss-C.py
13	faiss-D.py	vykreslení nejpodobnějších vektorů před jejich normalizací	https://github.com/tisnik/most-popular-python-libs/blob/master/faiss/faiss-D.py
14	faiss-E.py	vykreslení vektorů formou orientovaných šipek	https://github.com/tisnik/most-popular-python-libs/blob/master/faiss/faiss-E.py
15	faiss-F.py	vykreslení vektorů po jejich normalizaci formou orientovaných šipek	https://github.com/tisnik/most-popular-python-libs/blob/master/faiss/faiss-F.py
16	faiss-G.py	vyhledání a vykreslení nejvíce NEpodobných vektorů	https://github.com/tisnik/most-popular-python-libs/blob/master/faiss/faiss-G.py
17	faiss-H.py	vyhledání podobných vektorů se složkami typu float16	https://github.com/tisnik/most-popular-python-libs/blob/master/faiss/faiss-H.py
18	faiss-I.py	jednoduchý benchmark rychlosti vyhledávání knihovnou FAISS: rozdíly mezi float16 a float32	https://github.com/tisnik/most-popular-python-libs/blob/master/faiss/faiss-I.py

19	faiss-index-benchmark-1.py	benchmark: zjištění časové složitosti vyhledávání při použití výchozího indexu L2	https://github.com/tisnik/most-popular-python-libs/blob/master/faiss/faiss-index-benchmark-1.py
20	faiss-index-benchmark-2.py	benchmark: vliv rychlosti vyhledávání na počtu dimenzí vektorů	https://github.com/tisnik/most-popular-python-libs/blob/master/faiss/faiss-index-benchmark-2.py
21	faiss-index-benchmark-3.py	benchmark: rychlosti vyhledání nejpodobnějších vektorů v sadě s proměnným počtem vektorů i proměnným počtem dimenzí (lineární stupnice)	https://github.com/tisnik/most-popular-python-libs/blob/master/faiss/faiss-index-benchmark-3.py
22	faiss-index-benchmark-4.py	benchmark: rychlosti vyhledání nejpodobnějších vektorů v sadě s proměnným počtem vektorů i proměnným počtem dimenzí (logaritmická stupnice)	https://github.com/tisnik/most-popular-python-libs/blob/master/faiss/faiss-index-benchmark-4.py
23	faiss-index-benchmark-5.py	benchmark: využití indexu IVFFlat, výchozí hodnota počtu centroidů	https://github.com/tisnik/most-popular-python-libs/blob/master/faiss/faiss-index-benchmark-5.py
24	faiss-index-benchmark-6.py	benchmark: využití indexu IVFFlat, zvýšená hodnota počtu centroidů	https://github.com/tisnik/most-popular-python-libs/blob/master/faiss/faiss-index-benchmark-6.py
25	faiss-index-benchmark-7.py	benchmark: využití indexu HNSWFlat	https://github.com/tisnik/most-popular-python-libs/blob/master/faiss/faiss-index-benchmark-7.py

26	pyproject.toml	soubor s projektem a definicí závislostí	https://github.com/tisnik/most-popular-python-libs/blob/master/faiss/pyproject.toml

20. Odkazy na Internetu

FAISS: knihovna pro rychlé a efektivní vyhledávání podobných vektorů
https://www.root.cz/clanky/faiss-knihovna-pro-rychle-a-efektivni-vyhledavani-podobnych-vektoru/
FAISS: knihovna pro rychlé a efektivní vyhledávání podobných vektorů (2. část)
https://www.root.cz/clanky/faiss-knihovna-pro-rychle-a-efektivni-vyhledavani-podobnych-vektoru-2-cast/
Knihovna FAISS a embedding: základ jazykových modelů
https://www.root.cz/clanky/knihovna-faiss-a-embedding-zaklad-jazykovych-modelu/
Knihovna FAISS a embedding: základ jazykových modelů (2. část)
https://www.root.cz/clanky/knihovna-faiss-a-embedding-zaklad-jazykovych-modelu-2-cast/
FAISS (Facebook AI Similarity Search)
https://en.wikipedia.org/wiki/FAISS
FAISS documentation
https://faiss.ai/
Introduction to Facebook AI Similarity Search (Faiss)
https://www.pinecone.io/learn/series/faiss/faiss-tutorial/
Faiss: Efficient Similarity Search and Clustering of Dense Vectors
https://medium.com/@pankaj_pandey/faiss-efficient-similarity-search-and-clustering-of-dense-vectors-dace1df1e235
Cosine Distance vs Dot Product vs Euclidean in vector similarity search
https://medium.com/data-science-collective/cosine-distance-vs-dot-product-vs-euclidean-in-vector-similarity-search-227a6db32edb
F16C
https://en.wikipedia.org/wiki/F16C
FP16 (AVX-512)
https://en.wikipedia.org/wiki/AVX-512#FP16
Top 8 Vector Databases in 2025: Features, Use Cases, and Comparisons
https://synapsefabric.com/top-8-vector-databases-in-2025-features-use-cases-and-comparisons/
Is FAISS a Vector Database? Complete Guide
https://mljourney.com/is-faiss-a-vector-database-complete-guide/
Vector database
https://en.wikipedia.org/wiki/Vector_database
Similarity search
https://en.wikipedia.org/wiki/Similarity_search
Nearest neighbor search
https://en.wikipedia.org/wiki/Nearest_neighbor_search#Approximation_methods
Decoding Similarity Search with FAISS: A Practical Approach
https://www.luminis.eu/blog/decoding-similarity-search-with-faiss-a-practical-approach/
MetricType and distances
https://github.com/facebookresearch/faiss/wiki/MetricType-and-distances
RAG – Retrieval-augmented generation
https://en.wikipedia.org/wiki/Retrieval-augmented_generation
pgvector na GitHubu
https://github.com/pgvector/pgvector
Why we replaced Pinecone with PGVector
https://www.confident-ai.com/blog/why-we-replaced-pinecone-with-pgvector
PostgreSQL as VectorDB – Beginner Tutorial
https://www.youtube.com/watch?v=Ff3tJ4pJEa4
What is a Vector Database? (neobsahuje odpověď na otázku v titulku :-)
https://www.youtube.com/watch?v=t9IDoenf-lo
PGVector: Turn PostgreSQL Into A Vector Database
https://www.youtube.com/watch?v=j1QcPSLj7u0
Milvus
https://milvus.io/
Vector Databases simply explained! (Embeddings & Indexes)
https://www.youtube.com/watch?v=dN0lsF2cvm4
Vector databases are so hot right now. WTF are they?
https://www.youtube.com/watch?v=klTvEwg3oJ4
Step-by-Step Guide to Installing “pgvector” and Loading Data in PostgreSQL
https://medium.com/@besttechreads/step-by-step-guide-to-installing-pgvector-and-loading-data-in-postgresql-f2cffb5dec43
Best 17 Vector Databases for 2025
https://lakefs.io/blog/12-vector-databases-2023/
Top 15 Vector Databases that You Must Try in 2025
https://www.geeksforgeeks.org/top-vector-databases/
Picking a vector database: a comparison and guide for 2023
https://benchmark.vectorview.ai/vectordbs.html
Top 9 Vector Databases as of Feburary 2025
https://www.shakudo.io/blog/top-9-vector-databases
What is a vector database?
https://www.ibm.com/think/topics/vector-database
SQL injection
https://en.wikipedia.org/wiki/SQL_injection
Cosine similarity
https://en.wikipedia.org/wiki/Cosine_similarity
Euclidean distance
https://en.wikipedia.org/wiki/Euclidean_distance
Dot product
https://en.wikipedia.org/wiki/Dot_product
Hammingova vzdálenost
https://cs.wikipedia.org/wiki/Hammingova_vzd%C3%A1lenost
Jaccard index
https://en.wikipedia.org/wiki/Jaccard_index
Manhattanská metrika
https://cs.wikipedia.org/wiki/Manhattansk%C3%A1_metrika
pgvector: vektorová databáze postavená na Postgresu
https://www.root.cz/clanky/pgvector-vektorova-databaze-postavena-na-postgresu/
Matplotlib Home Page
http://matplotlib.org/
matplotlib (Wikipedia)
https://en.wikipedia.org/wiki/Matplotlib
Dot Product
https://mathworld.wolfram.com/DotProduct.html
FAISS and sentence-transformers in 5 Minutes
https://www.stephendiehl.com/posts/faiss/
Sentence Transformer: Quickstart
https://sbert.net/docs/quickstart.html#sentence-transformer
Sentence Transformers: Embeddings, Retrieval, and Reranking
https://pypi.org/project/sentence-transformers/
uv
https://docs.astral.sh/uv/
A Gentle Introduction to Retrieval Augmented Generation (RAG)
https://wandb.ai/cosmo3769/RAG/reports/A-Gentle-Introduction-to-Retrieval-Augmented-Generation-RAG---Vmlldzo1MjM4Mjk1
The Beginner’s Guide to Text Embeddings
https://www.deepset.ai/blog/the-beginners-guide-to-text-embeddings
What are Word Embeddings?
https://www.youtube.com/watch?v=wgfSDrqYMJ4
How to choose an embedding model
https://www.youtube.com/watch?v=djp4205tHGU
What is a Vector Database? Powering Semantic Search & AI Applications
https://www.youtube.com/watch?v=gl1r1XV0SLw
How do Sentence Transformers differ from traditional word embedding models like Word2Vec or GloVe?
https://zilliz.com/ai-faq/how-do-sentence-transformers-differ-from-traditional-word-embedding-models-like-word2vec-or-glove
BERT (language model)
https://en.wikipedia.org/wiki/BERT_(language_model)
Levenštejnova vzdálenost
https://cs.wikipedia.org/wiki/Leven%C5%A1tejnova_vzd%C3%A1lenost
IVFFlat (Inverted File Flat) Index
https://skyzh.github.io/write-you-a-vector-db/cpp-05-ivfflat.html
HNSW (Hierarchical Navigable Small Worlds) Index
https://skyzh.github.io/write-you-a-vector-db/cpp-06–02-hnsw.html
Vector Indexing: Your Guide to Understanding and Implementation
https://www.teradata.com/insights/ai-and-machine-learning/what-is-vector-index
Vector Indexing Explained: Everything You Need to Know
https://www.datastax.com/guides/what-is-a-vector-index
Voroného diagram
https://cs.wikipedia.org/wiki/Voron%C3%A9ho_diagram

Seriál: Moderní trendy v Pythonu

Rozšíření PostgreSQL jménem pgvector, embedding a sémantické vyhledávání (1. část)
Knihovna FAISS a embedding: základ jazykových modelů (3. část – role indexů)
Validace dat v Pythonu s využitím knihovny Pydantic

Přečtěte si všechny díly seriálu Moderní trendy v Pythonu nebo sledujte jeho RSS

Neutrální ikona do widgetu na odběr článků ze seriálů

Zajímá vás toto téma? Chcete se o něm dozvědět víc?

Objednejte si upozornění na nově vydané články do vašeho mailu. Žádný článek vám tak neuteče.

Vstoupit do diskuse (3 názory)

Pavel Tišnovský

Vystudoval VUT FIT a v současné době pracuje na projektech vytvářených v jazycích Python a Go.

Témata:

Python

Takze jestli to chapu dobre, tak vsechny ty indexy maji linearni slozitost a stahnout to nejde? (jasne, to je teorie, v praxi dava vyznam mit sice stejnou slozitost, ale prakticky o rad mensi casy,...)

atarist

Sdílet

Obsah

1. Knihovna FAISS a embedding: základ jazykových modelů (3. část – role indexů)

2. Časová složitost vyhledávání při použití výchozího indexu FlatL2

3. Benchmark: zjištění časové složitosti vyhledávání při použití výchozího indexu FlatL2

4. Výsledky prvního benchmarku

5. Vliv rychlosti vyhledávání na počtu prvků (dimenzi) vektorů

6. Výsledky druhého benchmarku

7. Dimenze vektorů vs. jejich počet

8. Benchmarky měřící rychlosti vyhledání nejpodobnějších vektorů v sadě s proměnným počtem vektorů i proměnným počtem dimenzí

9. Výsledky třetího a čtvrtého benchmarku: lineární a logaritmická stupnice

10. Indexy založené na použití sofistikovanějších datových struktur

11. Rozdělení celého prostoru Voroného dekompozicí

12. Konstrukce indexu IVFFlat

13. Benchmark: časy vyhledávání nejpodobnějších vektorů s využitím indexu FlatL2

14. Výsledky pátého benchmarku

15. Benchmark: modifikace počtu buněk při konstrukci indexu FlatL2

16. Výsledky šestého benchmarku

17. Index HNSW (Hierarchical Navigable Small World)

18. Výsledky sedmého benchmarku

19. Repositář s demonstračními příklady

20. Odkazy na Internetu

Rozšíření PostgreSQL jménem pgvector, embedding a sémantické vyhledávání (1. část)