David Ježek
Dnes
Svobodný zvukový formát Opus má novou verzi specifikace 1.6. Výhledově asi nejvýznamnější novinkou je podpora strojového učení.

Z dalších novinek stojí za zmínku nový modul wideband-to-fullband bandwidth extension (BWE + zde jde o experimentální funkcionalitu založenou na natrénované neuronové sít schopné generovat obsah ve vysoké kvalitě z obyčejného wideband záznamu hlasu). Systém nově umí z 0–8kHz záznamu mluveného slova generovat kvalitnější 8–20kHz záznam. Věc byla prezentována na IEEE workshopu WASPAA 2025 a v současnosti jde i o draft IETF specifikace.

Tvůrci dodávají, že díky tomu lze generovat lépe znějící stopy ze starších Opus souborů, a to bez rozbití kompatibility. Model generující vyšší frekvence funguje pro všechny fonetické informace z uvedeného nižšího frekvenčního pásma, kde jsou ostatně potřebné informace také obsaženy (na rozdíl od případného generování wideband kvality z narrowband „telefonní“ kvality, kde tyto informace často chybí a generování je tak nespolehlivé. Tento model lze dále kombinovat s vylepšeními z wideband na fullband s vzorkovací frekvencí 48kHz – tyto prvky byly začleněny v Opus 1.5.

Dále nechybí mezi novinkami opět experimentální podpora 96kHz vzorkovací frekvence (tzv. Opus HD), výrazné vylepšení pro Deep Redundancy (DRED), nové API 24bitového kodéru/dekodéru a některá další nespecifikovaná vylepšení.

Autor zprávičky

David Ježek

David Ježek

Příznivec open-source rád píšící i o ne-IT tématech. Odpůrce softwarových patentů a omezování občanských svobod ve prospěch korporací.

