Vlákno názorů k článku Knihovna Pandas: základy práce s datovými rámci od Ludolph - Pokud se tyka zpracovani velkych objemu dat, tak...

Článek je starý, nové názory již nelze přidávat.

27. 11. 2020 9:20

Ludolph

Pokud se tyka zpracovani velkych objemu dat, tak Pandas ma stale znacne problemy (pomaly, velke naroky na pamet, diskutabilni paralelizace).

V pripade velkych dat je lepsi pouzivat Dask (https://dask.org/), ktery Pandas "emuluje" a ma mnohem lepsi vykonove charakteristiky.
27. 11. 2020, 09:21 editováno autorem komentáře
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
27. 11. 2020 12:36

bez přezdívky

podle me dask neni o moc lepsi, neresi problem pomalosti pythonu.

spravna cesta jsou knihovny generujici dotazy pro rychle analyticke databaze
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
29. 11. 2020 14:15

Bez přezůvek

Dask je lepší přesně tak jak to Ludolph popsal. Evidentně nemáš zkušenosti ani s jedním.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
30. 11. 2020 16:32

bez přezdívky

zalezi, cemu rika velke objemy dat
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
2. 12. 2020 11:20

jaromrax

V tomto pripade je to asi cokoliv nad par GB. Jak pisou zle jazyky, pro dataframe pocitejte pro RAM 5-10x puvodni velikosti dat.
Jestli ovsem mate vetsi data, rad se neco dozvim. Ja jsem skoncil na nejakych 50 milionech radku. Do toho objemu jsem byl spokojeny.

Komerční sdělení

Praktické tipy z UX: Od redesignu k optimalizaci výkonu

Vlákno názorů k článku Knihovna Pandas: základy práce s datovými rámci od Ludolph - Pokud se tyka zpracovani velkych objemu dat, tak...

Komerční sdělení

Praktické tipy z UX: Od redesignu k optimalizaci výkonu

Dále u nás najdete

Máte plné zuby AI? Firefox má řešení

Prima v tichosti zpřísnila podmínky přetáčení reklam

JMHZ a změny v daních z příjmů v roce 2026 a 2027

Apple opravil bezpečnostní chybu, která byla v iOS od verze 1.0

Špionáž v Googlu a phishing na Signalu

Malware, ransomware a další online hrozby: Jak se liší?

Pálení žáhy zhoršuje nevhodná večeře. Vadí přejídání i kafe

Miliony webů nesplňují zákon o přístupnosti. Jaký hrozí trest?

Notepad++ opravil chybu zneužívanou k šíření malware

Analýza rozebrala moderování Jílkové v Máte slovo

Ve firmách se pořád věří jediné „pravdě“ z dat. A to je problém

AI jako soudce – zákon na prvním místě

AI se snaží promlouvat i do stavebnictví

Lidé si mohou nechat zdarma vyšetřit znaménka, zrak i cukr

EET není český výmysl. Zjistěte, kde za účtenku můžete vyhrát auto

Google uvádí Gemini 3.1 Pro a přidává působivé benchmarky

Výjimka z EET je nejmenším OSVČ k ničemu, hodí se ale podvodníkům

V USA povolili terapii Optune i pro léčbu rakoviny slinivky

V čem se EET 2.0 liší od EET 1.0? Přinášíme velké srovnání

České firmy pod náletem kyberútoků. Počet vzrostl o pětinu