Hlavní navigace

Názor ke zprávičce Algoritmus pozná depresi z vašich příspěvků na Instagramu od Karel - Pro učení se máte pravdu, chcete dva stejně...

  • Aktualita je stará, nové názory již nelze přidávat.
  • 26. 8. 2016 10:35

    Karel (neregistrovaný) 93.90.162.---

    Pro učení se máte pravdu, chcete dva stejně velké kbelíky příkladů. Co jsem já bodem 3 myslel je ověření výsledků. Skutečné procento diagnostikovaných nemocných v USA je pod 10%. Takže můžeme navrhnout jiný algoritmus. Každého označíte za zdravého. Algoritmus bude mít úspěšnost přes 90%.

    Zkrátka, na učení se opravdu nepotřebujete náhodný vzorek. Ale pokud chcete tvrdit něco v duchu "na 70% správně určí", tak náhodný a reprezentativní vzorek mít musíte. A také pak musíte výsledky podpořit. Pokud by opravdu ten algoritmus měl úspěšnost 70% a skutečný počet lidí s depresemi byl 10%, pak tenhle algoritmus by diagnostikoval trojnásobné množství pacientů, než kolik jich doopravdy je. Čistě proto, že by diagnostikoval špatně 30% z těch 90% zdravých. Pokud by test provedli na správném vzorku, tak by jim spolehlivost klidně mohla vyjít jako 25% a bylo by na první pohled zjevné, že to není dobrá metoda.