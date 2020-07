H.266 je tedy prý tak dobré, že pro srovnatelnou kvalitu videa si vystačí s polovičním datovým tokem oproti H.265. Já si hned na úvod dovolím tvrdit, že to je lež, resp. není to univerzálně a vždy platná pravda. Podobně to nebyla pravda pro H.265 oproti H.264 a podobně to nebyla pravda pro H.264 oproti MPEG-4 ASP, reprezentovanému řekněme kodekem Xvid. Vysvětlím za chvíli.

Malý rychlokurz z historie formátů

Formáty pro digitální video totiž vznikají za určitým konkrétním účelem. Můžete je sice použít i jinde, ale většinou ze sebe uděláte jen hlupáka. Je například hloupost kódovat video o rozlišení 1920×1080 do formátu MPEG-2. Ano, sice tahle kombinace je jako jedna z možných přímo ve specifikaci formátu Blu-ray, ale třeba scéna s přistáním helikoptéry s astronauty v úvodu filmu Capricorn One, což byl jeden z těch raných Blu-rayů authorovaných do MPEG-2, jasně ukazuje, že tohle byla, je a vždy bude fakt nešťastná kombinace.

Podobně je třeba dosti hloupé zkoušet kódovat 8k video do M-JPEG. Jde to, ale dře to. A stejně tak je naopak velmi, opravdu velmi hloupé použít kodek x265 pro kompresi rodinných VHS kazet v rozlišení 352×288 (a zvuk z podélné mono stopy ukládat do 320kbit/s MP3). Na takto nízké rozlišení ten formátů vůbec není optimalizován a 99% jeho benefitů zde nebude fungovat (kolik se třeba do této matice pixelů vejde coding block tree?), navíc je to výlet s kanónem na vrabce.

Zkrátka a jednoduše se to mělo a má takhle:

±320×240/352×288 ~ analog VHS ↠ MPEG-1 (Video CD)

±480p ~ S-VHS, Hi-8, SD video ↠ MPEG-2 (DVD-Video)

… intermezzo v podobě MPEG-4 ASP / DivX 3 / Xvid, …

±2k/1080p/FullHD video/Blu-ray 1920×1080 = H.264 / AVC

(zapomeňe slepé větve jako MPEG-2 a VC-1)

±4k UltraHD video / UHD BD / 3840×2160 = H.265 / HEVC

±8k UltraHD video / 7680×4320 = H.266 (případně AV1)

Dvojnásobná efektivita je fajn, i když nestačí

Představte si 1080p H.264 video jako 100% výchozí bod. Vyžaduje 100% datového toku pro toto rozlišení a standardní „100% hodnotu“ fps (obecně tedy 24 fps, 25 fps, 30 fps). S příchodem filmů (atd.) ve 4k rozlišení stoupl počet obrazových bodů na 400 %, ale kvalita kompresního systému pouze na 200 %. Najednou tedy komprese poskytovala pouze polovinu z potřebné efektivity. Zbytek u fyzických médií musel dohnat datový nosič, tedy z 50GB Blu-ray disků se přešlo na 100GB BDXL disky.

8k rozlišení znamená další čtyřnásobný nárůst počtu bodů, tedy 400 % oproti 4k a celkově 1600 % oproti 2k/FullHD. Komprese nemůže zůstat stále H.265 (to by hypotetický film na 12cm kotoučku zabral ne 50 či 100 GB, ale 400 GB, což je hodnota patrně mimo možnosti i nejpokročilejší reinkarnace Blu-ray disků, tedy profi formátu Archival Disc). H.266 se svojí proklamovanou dvojnásobnou efektivitou snižuje tuto potřebu opět pouze na dvojnásobek, tedy cca 200 GB/film. A to nepočítáme s tím, že by filmy místo obvyklých 24/25/30 fps mohly mít dnes dvojnásobek, či dokonce čtyřnásobek.

Zkrátka i pokud H.266 dostojí své reklamě a bude 2× efektivnější (výše uvedené video to měří dle PSNR, což není vždy vhodné) než H.265 u 8k videa, bude to za prvé vlastně pořád málo. A za druhé to bude platit pro 4k o něco méně, pro FullHD ještě méně a o SD videu se ani nemá smysl bavit.

Má to vůbec ještě smysl?

Jednoho dne narazíme na strop toho, co ještě má smysl, a co už ne. Opět si dovolím analogii: jelikož manželka jistého šéfa v Sony měla ráda Beethovenovu 9. symfonii, má zvukové CD vzorkovací stereo zvuk, 16bitovou přesnost a vzorkovací frekvenci 44,1 kHz. Pánové Nyquist a Shannon jsou spokojeni, zvukové CD je schopno pojmout i 22kHz zvuk (s rezervou strop lidského sluchu, křížence s netopýry nepočítám), i když za cenu jen zhruba 2 vzorků sínusovky o této frekvenci (což je taková nepěkná zubatice).

Právě pro ty netopýry nejen dodnes přežívá třeba fenomén gramofonových desek či elektronkových zesilovačů (byť z jiných důvodů než technické kvality), ale zrodily se i pozdější digi formáty jako SACD a DVD-Audio. A přinesly 24bitovou věrnost a vzorkovací frekvence typu 96 či 192 kHz. Dnes není problém ve zvukové technice potkat i 32bit / 384kHz, což běžný člověk od 24bit / 192kHz fakt nemá šanci poznat, ale představuje to luxusní rezervu pro další digitální zpracování zvuku. Zkrátka vyplatí se pro pozdější zpracování vzorkovat i VÝRAZNĚ víc, než kolik si žádal pan Claude Shannon a kolegové.