Článek je fajn, ale tohle fakt ne:
"úspěšnost na těchto trénovacích obrázcích měla být okolo 97,5 %."
úspěšnost klasifikace nikdy nesmíte testovat na trénovacích datech. Na testování je nutné použít data testovací. Jinak výsledek naprosto o ničem nevypovídá. (je triviální udělat algoritmus, který bude mít 100% úspěšnost na trénovacích datech)
+1. Já jsem takhle napsal algoritmus na obchodování na forexu, naučil jsem ho na prvních 7 měsících letošního roku a světe div se, v tom samém období dokázal na testovacím účtu počáteční vklad zdvacetinásobit :-)
Kolega mi kladl na srdce, že je třeba hned 3 různé množiny dat: 1. na učení strategií, 2 na výběr nejlepších strategií a 3. na ověření, že ty nejlepši fungují.
Ja myslim ze u burzy je metodicka chyba v tom, ze neni mozne aby vsichni meli zisky, protoze penize se proste presouvaji od jednoho k druhemu, jeden musi mit zisk druhy ztratu.
Jenze vsichni chteji zisky mit (muj predpoklad - pokud se tam nachazi nejaky masochista ktery jde na burzu s cilem tam prodelat tak se omlouvam)
Takze to jako celek podle me nemuze fungovat.
Navrhuju se na burzu vykaslat a zabyvat se misto toho aktivitami typu win-win.
Ty se vezmou treba z toho, ze ta firma ma uspesne vyrobky a ze to lidi kupuji. U tech tezko rict, ze tim prodelavaji - pro ne to treba ma tu cenu a je to ok. Dal se to muze projevit tak, ze lidi ty prachy neutratili u konkurencni firmy a ta uz tim muze tratit, ale to se projevi treba na jine burze nebo taky na zadne. A pokud na te burze je dodavatel obou tech firem, tak tam uz je to uplne jasny.
Je to tedy samozrejme slozitejsi (a ja nejsem ekonom :-) ), ale chtel jsem tim rict, ze urcite lze mit burzu kde jsou vsichni v zisku proste proto, ze je to otevreny system.
Souhlasím, samozřejmě na jiných obrázcích než naučených klasifikace bude horší. Správně by se mělo testovat na jiných (testovacích) datech a učení provádět do okamžiku než se síť začně přeučovat (příliš zaměřovat na detaily), tedy do okamžiku než úspěšnost klasifikace začne na testovacích datech klesat. Ale pro zjednodušení se v příkladu testuje na těch samých obrázcích a pak je v zipu několik obrázků, na kterých učení neprobíhalo a lze pro ně ověřit, že se klasifikují dobře.
Ono je to trosku jinak.
Klasifikace by se mela testovat samozrejme na testovacich datech, nikoliv trenovacich, ale pro uplnost se obvykle udava i presnost klasifikace na trenovaci mnozine - pro pripad, ze by nebyla 100%. Ono zrovna prave u neuronovych siti se clovek muze zamyslet nad tim, jestli nahodou neni sit s 100% presnosti na trenovacich datech preucena.
když tak omluvte hloupou otázku. moc o neuronových sítích nevím, ale jak se dá ta síť "přeučit"? já myslel, že množstvím získaných dat se výsledek neustále zpřesňuje. teoreticky pokud by tedy hodnotila testovací obrázky a já ji vždy řekl, kde udělala chybu - zpřesňuje se ne? a od určité doby už by prakticky neměla potřebovat můj zásah.
A. Představte si obrovskou neuronovou síť. Nastavení vah na jednotlivých synapsích je víceméně "paměť". A když je ta síť hodně velká a proběhne strašně moc iterací, tak si neuronová síť výsledky z trénovací množiny prostě "zapamatuje". No jo, jenže pak přijde nový vstup (z testovací množiny) a ty miliony drobných pravidel na něj nezafungují, protože je o trochu jiný.
B. Oproti tomu jiná, menší a míň trénovaná neuronová síť se naučí jen pár pravidel (takové, které fungovaly na velké množství vstupů z trénovací množiny). Když se pak potká s novým vstupem, tak je daleko větší pravděpodobnost, že tyhlety obecnější pravidla zafungují.
Ještě formulováno jinak:
A. si "našprtá" všechna data, ale u nového vstupu je bezradný, protože neví, která jsou důležitá.
B. si odvodí jen pár obecnějších zásad a ty pak aplikuje i u nového vstupu.
(PS: U testovacích obrázků síti už nic neříkáte, tedy se ani nic nezpřesňuje.)