Myslíte, že na ten dataset je zapotřebí SSD nebo stačí HDD? Jakože jestli se z toho jednou naučí a pak už na to nesáhne nebo jestli se s tím datasetem pracuje při každém dotazu?
Na ten dataset je třeba trochu víc místa :) Používá se jen pro trénování. Z toho trénování vypadnou mnohagigabytové tabulky čísel, které jsou pro člověka naprosto nesrozumitelné.
Přesně tak, běžný uživatel ten dataset vůbec nepotřebuje. Stáhne si již natrénované tabulky, které předhodí té AI. Trénování navíc vyžaduje obrovský výpočetní výkon.
díky za upřesnění. Myslíte, že je možné trénovat na vlastních datech a výsledek připojit k tomu co je už natrénováno? Nebo musím přidat svá data do jednoho velkého datasetu a nechat to natrénovat všechno znovu?
To se nedá jednoznačně říct. Třeba v rozpoznávání obrazu se občas vezme nějaká obecná konvoluční neuronová sít a přitrénuje se na nějakých specifických datech. Ušetří se tím hodně.
Ale berte to tak. že je to stále černá magie, kde se funguje trochu stylem pokus-omyl.