Hlavní navigace

Mozilla zveřejnila sbírku 400 000 hlasových nahrávek

Petr Krčmář

Mozilla v rámci svého projektu Common Voice vytváří svobodný software pro rozpoznávání hlasu. Požádala širokou veřejnost o darování krátkých nahrávek, ze kterých by se mohl její software učit. Organizace nyní celou sbírku zveřejnila, jedná se o 400 000 nahrávek od 20 000 lidí z celého světa. Jedná se o druhou největší zveřejněnou sbírku podobných hlasových vzorků. Zatím jsou pouze v angličtině, ale příští rok by se měla databáze rozšířit také na jiné jazyky.

Společně s nahrávkami Mozilla zveřejnila také algoritmus rozpoznávání zvaný DeepSpeech, který je odvozen od práce čínské společnosti Baidu. Jeho průměrná chybovost je 6,5 %, což je prý na úrovni lidského posluchače. Mírně lepších výsledků dosáhl Microsoft, který ale tvrdí, že jeho technologie má problémy s různými akcenty a zarušenými nahrávkami. Lépe je na tom pravděpodobně Google, který dosahuje chybovosti 4,9 %.

Našli jste v článku chybu?