Vyšiel nový model DeepSeek V3.1 s vylepšenou efektivitou a dlhším kontextom

Včera
DeepSeek
Nový model DeepSeek V3.1 bol oficiálne vydaný 21. augusta 2025. DeepSeek V3.1 je hybridný model, ktorý podporuje dva režimy – režim uvažovania (thinking) a bez uvažovania (non-thinking), čo zlepšuje rýchlosť a efektivitu odpovedí. Model má 685 miliárd parametrov a rozšírenú kontextovú dĺžku až na 128 tisíc tokenov, čo umožňuje spracovanie výrazne dlhších textov či kódov. Model taktiež prináša silnejšie schopnosti agenta pre komplexné viackrokové úlohy a lepšie využívanie nástrojov.

Pri vývoji modelu DeepSeek čelila spoločnosť viacerým problémom, najmä pri ich očakávanom modeli R2. Podľa článkov vo Financial Times a South China Morning Post sa oneskoril kvôli technickým problémom s trénovaním na čipoch Huawei Ascend. Tréning sa preto presunul na Nvidia čipy, zatiaľ čo čipy Ascend zostali využívané iba pre inferenciu. Tento problém bol hlavným dôvodom odkladu vydania modelu R2 od pôvodne plánovaného mája 2025. Narušenie nastalo aj v dôsledku obmedzení v exporte amerických čipov do Číny.

Kvôli týmto problémom prišla spoločnosť o časť svojich zákazníkov, ktorí prešli na nové čínske modely Qwen 3, Kimi K2 či GLM 4.5. Od 5. septembra sa značne tiež zvýši cena modelu, hoci stále je jeho cena zlomkom cien popredných modelov.

Nový model už je dostupný na testovanie cez oficiálnu stránku aj API a prináša zlepšenú efektivitu, dlhší kontext a lepšie agentné funkcie. Model som stihol testovať len veľmi krátko, vygenerovaná Flappy Bird hra bolo o poznanie lepšia ako predchádzajúce verzia.

