Vlákno názorů k článku
Jaká témata vadí čínskému DeepSeeku? od jdobry - A mimochodem si muzete necenzurovanou verzi pustit sami...

Článek je starý, nové názory již nelze přidávat.

30. 1. 2025 16:19

jdobry

A mimochodem si muzete necenzurovanou verzi pustit sami doma
https://www.tecmint.com/run-deepseek-locally-on-linux/

Zkousel jsem 7b (miliard parametru asi) az 14b a i na CPU (bez GPU) Ryzen 4500U to tak nejak fungovalo.
Blbe je, ze takto redukovane modely jsou uzitecne vyrazne mene. A na plnou velikost je nutne vykonejsi HW (procesor i RAM, ne moc rychle to jde i bez akceleratoru)
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
30. 1. 2025 17:00

bez prezdivky ...

Jo tak tohle delat je opravdu doslova genitalni ....

curl -fsSL https://ollama.com/install.sh | sh
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
30. 1. 2025 17:04

jdobry

jojo, poukazka na volny pristup k pocitadlu.
Takze jsem to poustel v PXE kontajneru.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
30. 1. 2025 22:01

Sam a do ma

"Pxe"?🤣
30. 1. 2025, 22:02 editováno autorem komentáře
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
30. 1. 2025 23:53

jdobry

LXC myslim.
:-)
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
30. 1. 2025 17:16

Zopper

Na jednu stranu chápu, na druhou stranu, v čem je vlastně rozdíl oproti stáhnutí si tarballu, rozbalení a "make && make install"? Nebo z něj pustil ten samý install.sh? Buď tomu zdroji věřím dost na to, abych si to instaloval, nebo ne. Pokud podezřívám ten zdroj, že curlu podstrčí jiný skript, jak můžu vědět, že něco nepodstrčí i někde o kus dál?
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
31. 1. 2025 8:24

bez prezdivky ...

Tomu zdroji muzes verit jak chces, ale ty nevis, jestli tam jeste za minutu bude to, co tam je ted. A vymenit to nemusi ani ten kdo to tam zverejnil zejo ...

Pripadne ten odkaz za dalsi minutu muze vist uplne jinam ...nebo te uplne jinam muze poslat cokoli cestou ...

Ale zjevne ze tu vynachazi cela hromada individui, ktery vubec netusej jak net funguje. Protoze se nikdy nikde nestalo treba to, ze by (nejen)domenu/pristup k ni ziskal nekdo jiny.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
31. 1. 2025 9:06

K>

Jo, ten instalacni skript je tragedie, a uvnitr je dalsi hromada curl z ruznych domen.
A jeste horsi je ze ta ollama ma problem jet mimo root.
Holt se asi nenasel nikdo kdo by dotahnul tuhle cast.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
31. 1. 2025 9:15

Jakub Štech

Ollama je scam, mají dobrej marketing ale je to ve finále jen wrapper kolem llama.cpp a dalších projektů. ČÍmž se samozřejmě nijak nechlubí, v blogpostech je to vždycky "po měsíci práce jsme přidali podporu pro architekturu xxx" přitom ve skutečnosti je to "udělali jsme git pull v llama.cpp submodulu" :)

Sestavte si llama.cpp nebo jiný single-binary inference engine, seberte tomu (třeba v systemd) všechny syscally, které to nepotřebuje, a máte jistotu.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
31. 1. 2025 9:25

K>

Je mozne ze to je jen wrapper kolem neceho jineho, ale kdyz se kouknu na download llama, tak to po mne chce nejakou registraci.
Na ollamu tu byl nedavno ve zpravicce jednoduchy navod, tak to se pak snadno zkousi. Na llamu jsem tu nic nenarazil, tak by to asi chtelo aby schopnejsi neco napsali (vyznamny pohled :) ).
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
1. 2. 2025 12:56

tvrdeY

Michate llama což je množina modelů llm od mety a llama.cpp což je nástroj na inferenci (psán v cpp) který nepotřebuje všechny ty pytorch divočiny Ale je.v tom zmatek takže i chápu.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
31. 1. 2025 15:04

Zopper

Takové riziko nezpochyňuji. Jen mi uniká realistický scénář, kdy stáhnutí binárky nebo XXX MB zdrojáků a jejich kompilaci jde považovat za bezpečné a přitom použití instalačního skriptu z toho samého zdroje ne.

Jestli je ten web unesený, tak nemůžu přece věřit vůbec žádnému souboru. A pokud si myslím, že unesený není a jsem ochotný nějaký program z něj pouštět, tak tomu install.sh můžu věřit úplně stejně jako run.py uvnitř balíčku.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
31. 1. 2025 15:44

bez prezdivky ...

Kdyz si neco stahnu, muzu to s necim porovnat (prinejmensim). Kdyz to rovnou z netu spoustim, tak vubec nemam paru co vlastne spoustim.

Kdyz mam neco na disku tak nad tim samozrejme muzu provist celou radu dalsi akci na tema hledani ruznych cervu, zjistovani jak a kam to pripadne bude komunikovat atd atd atd.

Mimochodem, presne totez je kopirovani naprosto cehokoli odkudkoli primo do shellu.

A vubec me neudivuje, ze se prave tohle resi prave tady, protoze distribuce pres distribucni kanaly uz neni v mode zejo, natoz aby nekdo neco cestou kontroloval ...
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
31. 1. 2025 20:32

Zopper

No, tak si to stáhnu, projdu, a je v tom X dalších stahování a rozbalování, klonování různých repozitářů... Co z toho vlastně vyčtu? To, že tam nevidím nic závadného, znamená jen přesně tohle - nevidím to. Pokud tam nebude přímo něco jako install_keylogger, nebo open_backdoor, ale autor si dá trochu práci, tak ta zákeřnost se velmi pravděpodobně bude skrývat někde hloub, dost možná třeba v PyPi nebo NPM, jméno balíčku nebo projektu bude schované za typosquatingem, nebo to bude one-man-show, kterou někdo unesl (xz utils bylo i v repozitářích, hint hint). A celé tohle předpokládá, že vůbec umím shell a další jazyky na takové úrovni, abych to mohl fundovaně přečíst. Což má jen částečný průnik s lidmi, kteří tohle můžou chtít pustit.

Ten install.sh si pořád nějaké procento lidí otevře, ale procházet důkladně celou hierarchii projektu a závislostí a ověřovat, že se nikde nic neskrývá je prakticky nemožné.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
30. 1. 2025 20:10

borisj

ako to potom vlastne takto lokalne funguje?
to akoze ten lokalny model ma v sebe cely "internet" na ktorom to bolo trenovane a dokaze to skladat zmysluplne odpovede na akekolvek otazky?
hlavne ako to je s faktografickymi otazkami. to, ze si to dokaze vymysliet nejaku odpoved na "filozoficku" otazku kde nejde o fakty to chapem, ale ako to dokaze odpovedat na nieco kde ide o fakty?
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
31. 1. 2025 11:54

Jakub Štech

Je to jako dobrý student při zkoušení u tabule. Ano, fakt si toho pamatuje hodně, dost dokáže vyvodit z kontextu a mlhavých vzpomínek, no a zbytek si vycucá z prstu. Vy, uživatel, jakožto zkoušející, musíte umět poznat, kdy Vám ten student věší bulíky na nos :-)

Ono se to nedá úplně dobře představit, ale my (lidstvo) jsme těch textových znalostí zas tak moc nevytvořili, s vhodnou kompresí se to do nějakých desítek GB skutečně nacpat dá, a LLM tohle umí opravdu výborně. S kvantizací se to dá dál redukovat, přičemž klesá rozlišení (ostrost vzpomínek) ale jejich množství a šířka záběru zůstává. Takto zmenšený model má pak větší tendenci tzv. halucinovat (domýšlet si víc než chceme), což by se správně mělo korigovat injekcí faktů z nějaké RAG databáze nebo z hledání na webu (jako když Vám u tabule dějepisář napovídá).
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
31. 1. 2025 12:23

bez prezdivky ...

O tom to neni ...

Dam ti priklad. Mas silnici po ty silnici jezdej auta. Ty chces vedet jak rychle se da dostat z jednoho konce na druhej.

A ted mas moznosti. Stopnes jedno auto. Jenze ten vysledek muze byt umistnen kdekoli od 0 do nekonecna ... rozhodne se neda tvrdit, z takhle rychle/pomalu je to "normalni"

Tudiz stopnes tech aut 10 000 .. a udelas prumer. To sice taky neni uplne koser, ale uz je to lepsi. Pak zacnes eliminovat extremy (nekdo to auto tlacil, nekdo tahnul oslem ...), zacnes resit ze v patek jedou vsichni domu, tudiz pomalejs ... atd atd

Ve finale mas trebas miliony zaznamu (internet), ale vypadne ti z toho jedno cislo. A prave to jedno cislo si zapamatujes. Takze si klidne treba stovky TB zredukoval na jeden B.

Ostatne vis jaka je odpoved na otazku zivota vesmiru a vubec ze?
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
31. 1. 2025 13:25

Ondro

Zredukoval si odpoved na jeden B ale aj tak ta odpoved ti moze byt k nicomu, lebo ta otazka je dost vseobecna na to aby si odpovedajuca strana bola ista, ze tym o co ti presne islo.
Takze tym jednym B sa mozno trafis do jeden otazky. Pri zvysnych to bude viac, ci menej lietat/ta odopoved bude viac, ci menej relevantna.
Takze zreduvanim dat, zredukujes aj presnost odpovedi.
K cim vecsej presnosti/relevantnsoti potrebujes na jednej strane cim lepsi kontext ale zaroven aj dataset.

Ano je to podbne ako pri tej 42. Pocitac vo svojej nedokonalosti dal primeranu odpoved aj z ohladom na kvalitu otazky.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
31. 1. 2025 15:11

borisj

ano zredukoval si 10000 zaznamov na 1B, ale z toho jedneho bajtu uz nikdy nezistis kolko z tych aut islo 90tkou, kolko 100kou, kto isiel najrychlejsie, kto najpomalsie uz budes mat len 1 priemernu rychlost

na take to vseobecne kecanie to dobre je, ale tam kde treba tvrde fakty tak tam sa tomu neda verit, lebo ono si ich nie, ze nemapata, ono si ich vymysla a je len nahoda ci ten statisticky model trafi spravnu postupnost slov a cisel, alebo nie
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
31. 1. 2025 15:48

bez prezdivky ...

Jenze to te nezajima, a tady jde o princip. Ta "AI" nema v sobe "cely internet" ona ma v sobe prave takovyhle jednotlivosti. A presne proto taky neumi odpovidat na faktograficky dotazy, protoze na ne odpovedi nema.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
31. 1. 2025 17:12

biny

Tak ale každý soudný člověk snad ví, že těhle modelů se prostě na tvrdá fakta neptáme, ne? Umí to pracovat s jazykem, ale není to znalostní báze.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
30. 1. 2025 20:55

MystiX

Došel jsem ke stejnému závěru. Zhruba 14-15B ještě běží na grafice s 12GB VRAM a běží to rychle. Běží to i na stařičké i5 pořád rychleji než se to dá číst. Ale 2x větší model už není použitelný ani na Ryzenu 9. Nejspíš se to škáluje exponenciálně a využívá to jedno jádro. Na opravdu velké modely to asi bude chtít grafiku s cenou v milionech korun a složit se na to s tisícem dalších lidí - dává to smysl jedině pro cloud a při tom, kolik provozu nabízí ChatGPT nebo Claude zdarma si myslím, že se jim to skoro nemůže zaplatit - počáteční náklady, měsíční účty za elektřinu, chlazení, ...

Vlákno názorů k článku Jaká témata vadí čínskému DeepSeeku? od jdobry - A mimochodem si muzete necenzurovanou verzi pustit sami...

Dále u nás najdete

Elektronický podpis: slabiny a možnosti přerazítkování

Agentní AI nakupování přichází. I do Česka

Proč přichází éra suverénních datových center?

Máte záložní plán, pokud byste chtěli odjet z ČR?

Osvědčený recept na linecké. Zásadní je správný poměr surovin

Kolik bude stát snížení záloh OSVČ? Každý tvrdí něco jiného

ChatGPT rozšiřuje prostor pro spolupráci

Huawei se ne a ne odporoučet z Česka a Evropy

Nasedl jsem to samořiditelného taxi bez volantu

Mateřská 2026: Jak se zvýší dávka čerstvým maminkám

Průvodce novým vyhledáváním v éře AI. Co musíte vědět o GEO

Algoritmus místo krejčovského metru: AI přepisuje módní průmysl

Nemocenská 2026. Spočítali jsme, kdo dostane za marodění víc

ESET HOME Security Premium - ochrana pro celou domácnost!

AI reklama Rohlíku to schytala na sítích. Prý je bezpohlavní

Izraeliský hi-tech exceluje i za války v Gaze

HP chce propouštět a šetřit, argumentuje AI

Pojišťovny přispějí na bílé plomby. Jednou za dva roky na každý zub

Babišův střet zájmů potvrdil soud, Agrofert už přišel o stovky milionů

Samořídicí vozítka začala doručovat jídlo v pražském Karlíně

Vlákno názorů k článku
Jaká témata vadí čínskému DeepSeeku? od jdobry - A mimochodem si muzete necenzurovanou verzi pustit sami...