Mozilla zveřejnila sbírku 400 000 hlasových nahrávek

30. 11. 2017

Sdílet

Mozilla v rámci svého projektu Common Voice vytváří svobodný software pro rozpoznávání hlasu. Požádala širokou veřejnost o darování krátkých nahrávek, ze kterých by se mohl její software učit. Organizace nyní celou sbírku zveřejnila, jedná se o 400 000 nahrávek od 20 000 lidí z celého světa. Jedná se o druhou největší zveřejněnou sbírku podobných hlasových vzorků. Zatím jsou pouze v angličtině, ale příští rok by se měla databáze rozšířit také na jiné jazyky.

Společně s nahrávkami Mozilla zveřejnila také algoritmus rozpoznávání zvaný DeepSpeech, který je odvozen od práce čínské společnosti Baidu. Jeho průměrná chybovost je 6,5 %, což je prý na úrovni lidského posluchače. Mírně lepších výsledků dosáhl Microsoft, který ale tvrdí, že jeho technologie má problémy s různými akcenty a zarušenými nahrávkami. Lépe je na tom pravděpodobně Google, který dosahuje chybovosti 4,9 %.

Našli jste v článku chybu?

Autor zprávičky

Petr Krčmář pracuje jako šéfredaktor serveru Root.cz. Studoval počítače a média, takže je rozpolcen mezi dva obory. Snaží se dělat obojí, jak nejlépe umí.