Hlavní navigace

Názor k článku Ovládanie hlasom pre mikrokontroléry od Petr M - Tak se taky přidám k chvále článku, shrnu...

  • Článek je starý, nové názory již nelze přidávat.
  • 19. 8. 2018 20:30

    Petr M (neregistrovaný) ---.tmcz.cz

    Tak se taky přidám k chvále článku, shrnu to v několika bodech.

    1) Správně navržený systém je autonomní, pokud to užití zařízení nevyžaduje jinak (např. telefon bude sotva krabička bez nějaké krabičky u někoho dalšího a nějaké telekomunikační infrastruktury). V případě, že lokálně ovládám zařízení na tom samým místě, musí se vše odehrát na tom místě.
    2) Správně navržený systém je spolehlivý. Jenom výčet SPoF mimo kontrolu uživatele je docela dlouhý (LAN, router, konektivita u ISP, infratruktura, aplikace v čmoudu,...)
    3) Soukromí. To nemůže nikdo myslet vážně, trvale nahrávat zvuk v místnosti a posílat to někomu, proti komu je NSA jenom 3x louhovaný pytlík čaje.
    4) Ovládání hlasem nefunguje. Vždycky je to tak, že se vzorkuje zvuk, nějak se přechroupá a nakonec se určuje pravděpodobnost, že uživatel řekl co řekl. Když se práh nastaví nízko, jsou tam falešný triggery, když vysoko, je to nespolehlivý. U nás na jednom projektu vycházela váha na cca 30%. I pak to reaguje, kdy nemá. Mám historky z praxe, kdy puštěný rádio dokázalo úplně zmást voice recognition a zařízení se chovalo úplně náhodně. Zákazníci byli nadšení.
    5) Když už, tak na hraní se zvukem je optimální 32b DSP. Vzhledem k 16b vzorkování a 16b koeficientům je to tak akorát. Pro zpracování hlasu je potřeba uvažovat min. 8kHz, tj. vzorkování 16kHz. A tohle tahat skrz 8b RISC prakticky bez pamětí? Kdyby tam byl nějaký TMS320, BlackFin nebo dsPIC neřeknu, ale Arduino?
    6) Kdo říká, že na MCU není diakritika nebo znaková sada dle vlastního výběru?

    Ani se nedivím, že je ten článek anonymní. Autor asi tuší, že po tomhle výkonu by dostal ve vývojové firmě místo maximálně jako svačinářka... Sorry za drsný slova, ale je to tak.