Hlavní navigace

Formát H.266 neboli FVC přijde v říjnu 2019 a bude opět efektivnější

Autor: JJ Harrison
David Ježek

Připravovaný video formát H.266, nebo též FVC (Future Video Codec) je momentálně v počáteční fázi plánování. Cílem je o polovinu efektivnější formát než H.265 (HEVC).

Doba čtení: 10 minut

Plán vývoje nástupce

H.266 bude opět určitou evolucí předchozích formátů, cílící na opět vyšší rozlišení. Již loni v říjnu probíhala fáze, kdy se shromažďovaly návrhy na prvky, které by měl formát zahrnout. Nyní se tyto věci posuzují a předpokládá se, že kolem října 2018 by měly vzniknout první testovací modely nového formátu. Přesně o rok později pak první verze standardu.

I nadále však bude probíhat vývoj, finální verze standardu H.266 má vzniknout až koncem roku 2020. V polovině roku 2021 se pak objeví první hardwarové implementace.

UltraHD Blu-ray logo
UltraHD Blu-ray logo

Celé to vlastně koreluje s příchodem 8k éry. Tak jako formát H.264 souvisel s příchodem FullHD videa (a tehdy HD DVD a Blu-ray nosičů) a stejně tak H.265 (nebo něco takového) bylo nezbytné pro rozumný rozvoj UltraHD/4k videa, pro 8k éru jsou i kompresní poměry dosahované H.265 málo. A samozřejmě i 4k videím se bude hodit formát ještě efektivnější než H.265.

Vše ale berme jako předběžné informace, které se mohou změnit. Vychází z toho, co se diskutovalo na nedávném semináři v Londýně, kde se sešli mimo jiné experti z ATEME a Dolby Laboratories.

Co budou požadovat 20. léta?

Formát videa nikdy nevzniká jen tak. Vždy je reakcí na nějakou potřebu či predikcí vývoje. Výrazně to bude platit i pro H.266, případně jakýkoli jiný formát této éry.

Vyšší rozlišení

Ani 4k rozlišení (a rozhodně ne to, které bychom 4k ani nazývat neměli: tedy UltraHD 3840×2160) nebude znamenat náraz na technologický strop. Když si vezmeme dnešní filmovou produkci, tak ta s radostí skočila po možnosti natáčet v 8k rozlišeních (díky kamerám RED ONE a dalším). Objektivy jsou na trhu dostatečně kvalitní, aby toto rozlišení na danou velikost snímače bez problémů přenesly – vždyť vedle tradičně filmařských značek jako Panavision je vyrábí a vyvíjí prakticky všichni, od německých expertů typu ZEISS a Leica, přes japonské foto značky jako Canon a Sony až třeba po levnou korejskou a čínskou vlnu, reprezentovanou třeba značkou Samyang.

Pokud vzpomeneme filmovou éru (která rozhodně neskončila, viz například Christopher Nolan, ale to bych příliš odbočoval), tak ani o filmovém políčku nelze říci, že bychom jeho oskenováním nezískali obraz svými detaily překonávající 4k rozlišení – myslím samozřejmě formáty od Super35 výše (u „šestnáctky“ bych si toto tvrdit v žádném případě nedovolil). Opět závisí na době natáčení filmu, například první generace materiálů typu Kodak 500T jsou viditelně slabší než generace současné, nicméně méně citlivé materiály i před desítkami let poskytovaly vyšší detaily než 3840×2160 či 4096×2160 bodů.

Přehled používaných rozlišení
Přehled používaných rozlišení

Zkrátka můžeme vést sáhodlouhou diskusi o tom, kde Super35, případně 65mm negativ narazí na strop, ale „pětatřicítka“ ještě z 8k těžit může a dovolil bych si drze předpokládat, že „sedmdesátka“ či IMAX jednoho dne využije i 16k (ale to už spadá spíše do éry „H.267“).

Lepší podpora 360° / VR

Zejména díky rozvoji androidího světa, kde za chvíli nebude výjimkou smartphone s třemi objektivy primárního fotoaparátu a 2 objektivy selfie kamerky, žijeme v éře 360° videa. Podporují to i různé malé kamerky typu Ricoh Theta a ač rozhodně nejde o masivní vlnu, 360° video a podpora VR videa jsou věci, které tu s námi budou.

Virtuální realita se nám vrací ve spolupráci s mobilními telefony. Stačí si pořídit „brýle“ Cardboard, do kterých vsunete mobil a ten už zajistí obraz pro obě oči. Existuje jich nepřeberné množství, z papíru i plastu.

360° video je dnes realizováno vlastně poměrně kompromisně. Pro plnohodnotný zážitek, kdy by se uživatel mohl se svým VR zařízením volně rozhlížet po celé scéně a všude měl k dispozici 4k či 8k video, je požadavek na rozlišení řádově větší, než jaký produkují současné přístroje 360°/VR videa nahrávající. Zkrátka podobně jako u 8k (16k, …) je i toto sféra, která ráda využije jakýkoli nárůst rozlišení / kvality videa za současně pokud možno nevzrůstajících datových nároků. Osobně díky chytrému telefonu s 21Mpix fotoaparátem nahrávajícímu H.265 video v 3840×2160 mohu potvrdit, že tyhle věci umí polykat omezený prostor flashového úložiště až nepříjemně vysokým tempem.

Vyšší barevné hloubky a HDR

VHS kvůli své analogové povaze a barevnému modelu, ale stejně tak i DVD kvůli dnes již prehistorické (a čerstvě bez patentového jha) MPEG-2 kompresi a též velmi kompromisnímu kódování barev poskytovaly velmi slabý expoziční rozsah scény a malý rozsah (hloubku) barev. Blu-ray v tomto nepřinesl nijak výrazné zlepšení, to „pravé ořechové“ přináší až UHD Blu-ray či variace na něj v oblasti online streamovacích služeb typu Netflix či Amazon Video.

Tyto moderní formáty totiž přinesly (vedle posuvu ke 4k rozlišením) alespoň přechod od 8bit na 10bit barvy. Najednou se barevný rozsah mohl rozšířit od 16,7 miliónů odstínů na více než 1 miliardu. A vedle větších barevných prostorů také přišlo HDR, což je takový letitý „buzzword“ říkající, že jasový rozsah scény (od černé po bílou) je o hodně větší. Trochu se nám to ale zaseklo na půli cesty, polovina používaných formátů, zejména těch jednodušších ve vysílací sféře, nepracuje s dynamickými metadaty a plnotučné formáty jako placený Dolby Vision (momentální lídr trhu) či otevřený Samsung HDR10+ se vlastně teprve rozjíždějí (o HDR10+ to platí rozhodně).

Ale ani to není konečná. Už H.265 ve verzi 1 přinesla profil Main 10 kódující barvy 10bitově, avšak se vzorkováním 4:2:0. Verze 2 pak ale přinesla řadu dalších profilů, přičemž nejvyšším je Main 4:4:4 12, resp. Main 4:4:4 16 Intra – první jmenovaný umí až 12bit kódování barev, druhý dokonce 16bit a oba podporují vzorkování 4:4:4. Pro fanoušky černé a bílé se sluší dodat, že všechny profily Verze 2 obsahují podporu kódování v monochromatickém profilu se vzorkováním 4:0:0. Verze 3 pak zavádí ještě řadu dalších nových profilů. A to se pořád ještě bavíme o formátu současném, tedy H.265.

Vyšší hodnoty fps

V neposlední řadě tu máme přechod na vyšší počty snímků za sekundu. Hlavní hvězdou tohoto je první Hobbit Petera Jacksona, který byl natáčen rychlostí 48 fps, tedy dvojnásobnou oproti filmařům nativnímu formátu 24 políček za sekundu. Existuje totiž jistý fenomén: čím větší je úhlopříčka pozorovaného obrazu, tím je člověk citlivější na zobrazovací frekvenci, aby film vnímal jako plynulý. Pryč jsou doby malých CRT televizí s 50Hz zobrazením a pomalým dosvitem luminoforu, kde ani tato frekvence půlsnímků (nutno zdůraznit) nevadila. Jenže dnes můžeme mít v obýváku 1,65metrovou TV s rozlišením 3840×2160 a na ní by už 50Hz frekvence půlsnímků každého neuspokojila, zejména ne u nového obsahu točeného digitálně, kde se spousta věcí neschová pod oku lahodící pláštík nepravidelnosti filmového zrna.

Když vzpomeneme prvních dojmů z Jacksonova Hobbita ve 48fps verzi, tak se často shodovaly v tom, že dojem z filmu odpovídá sledování hokejového zápasu. Problém digitálně točeného filmu s vysokou snímkovou frekvencí je i v tom, že běžný smrtelník je navyklý na to, že „film bliká“ (byť ono blikání člověk tolik v kině z 35mm pásu nevnímal – kdo ale zažil 70mm projekce a má vytříbené oko, ten ví co mám na mysli). 

Krrr! 2013 - festival 70mm filmů
Autor: David Ježek

Krrr! 2013 – festival 70mm filmů

To se ale týká lidí, kteří se nenarodili do éry chytrých telefonů a LCD televizí a monitor. Současné -náctileté generace už nemají návyk na 24políček a klasické (lehce mázlé) filmové zrno, nebo jej mají výrazně menší. Jednoho dne budou tyto digitální generace ve většině a vyšší hodnoty fps nebudou kritizovány, naopak vyžadovány. Protože jak už prokázala společnost 3Dfx při své někdejší slavné demonstraci: 60fps je daleko plynulejší než 30fps, když to lidem ukážete hned vedle sebe.

Potřeba vyšších fps tu zkrátka je a s érou 8k rozlišení a obrazovek velikosti dvou, tří, případně více metrů bude nezbytná. Vzato čistě teoreticky: 24fps × 48fps znamená dvakrát vyšší datové nároky. Ono něco z toho samozřejmě ubude díky různým predikcím pohybu a využitím P a B snímků, nicméně datový tok prostě bude o dost vyšší. S tímto se popasovává MPEG svět minimálně už od H.264, kdy i běžné fotoaparáty začaly nahrávat video v 1080/60p a nejinak tomu bude i pro H.266.

Nebude toho málo, ale mohla by stačit evoluce

Nastínil jsem několik problémů, které musí tvůrci budoucích standardů v oblasti digitálního videa řešit, resp. zohlednit při návrhu. Zejména to platí tam, kde budou hardwarové implementace, natvrdo „zadrátované“ v logice čipů a kde už pak nelze se standardem dále hýbat. To pro svět licencemi zatížených formátů MPEG platí beze zbytku.

Vezmeme-li si poslední současný formát, tedy H.265 (fakticky celým názvem ITU-T H.265, případně též známý jako High Efficiency Video Coding (HEVC), resp. MPEG-H Part 2, resp. standard ISO/IEC 23008–2), tak dojdeme k několika klíčovým zjištěním. Oproti předchůdci H.264 tento nový formát zavádí více směrů intra predice, větší rozsah a větší největší velikost „makrobloků“ (už se jim zde říká Coding Tree Units a mají více podskupin), větší rozsahy pro predikci zejména B snímků, kvalitnější kódování entropie a tak bychom mohli pokračovat do dalších detailů.

Jedno z vylepšení v H.265
Autor: MulticoreWare

Jedno z vylepšení v H.265

Většina těchto věcí souvisela s tím, že vzrostlo rozlišení videa, na které formát cílil. Když si vezmeme jako příklad DVD video s 720×576, tak u něj bylo možné reálně očekávat, že se makroblok velikosti 8×8 pohne mezi snímky jen několika málo směry. U Blu-ray s 1920×1080 už toto vzrostlo a u UltraHD s 3840×2160 opět. I proto muselo dojít ke zjemnění vyhodnocování struktur a pohybů v obraze a příchod 8k rozlišení začínajících na 7680×4320 a příchod vyšších snímkových frekvencí tuto nutnost opět násobně zvýší.

Je to mimochodem přesně ten důvod, proč ve většině případů nemá smysl kódovat DVD-Video či DVB-T signál (bez ohledu na jeho kvalitu) pomocí H.264 či H.265, neboť tyto formáty svým nastavením parametrů prostě cílí na rozlišení vyšší a v SD rozlišeních jsou s každou další generací méně a méně efektivní. Pro H.266 to zase bude platit o kus víc.

Na druhou stranu ale základní principy formátu H.266 mohou stát na základech předchozích generací: DCT, Motion Vector Predicion, Entropy Coding, CABAC, případně Variance Adaptive Quantization, kterou světu dala implementace x264, aby následně byla portována i do encoderů pro MPEG-2 či MPEG-4 ASP („DivX/XviD“). Jen je potřeba přihodit do kolébky pokrok v dalších kompresních technikách, což je právě to, o co s H.266 primárně půjde a proč vývoj ještě nějakou dobu potrvá. Jinak by rozdíl oproti hypotetické řadě nových profilů „H.265 Version 4“ byl vlastně nulový.

Viděno optikou AV1

Konkurence nespí a je to zatraceně dobře. Nedávno jsme vydali zprávičku, že se sice projekt otevřeného formátu AV1 (AOMedia Video 1 od Alliance for OpenMedia) o něco zpozdí, nicméně zas o tolik to nebude. Rozhodně ale doporučuji vaší pozornosti jedno nedávné video, kde o projektu AV1 a jeho stavu pohovořil Timothy Terriberry, který na něm v Mozille pracuje.

Pro mě osobně naprosto nejdůležitější a nejúžasnější věcí na AV1 není ani to, jestli/o kolik bude lepší než H.265 či že bude mít nulové licenční poplatky. Těší mě věc jiná: Timothy tvrdí, že dle jejich měření vykazuje AV1 nejlepší kompresní výsledky nejen v porovnání s H.265 (tedy v UltraHD rozlišení apod.), ale skrze celé spektrum rozlišení. Tedy že představuje velký pokrok v kompresním poměru i pro videa s SD rozlišeními. Pro mě osobně je tak projekt AV1 nadějí v tom, že díky němu budu moci jednoho dne výrazně zmenšit obří várku SD videí typicky kódovaních 2-pass XviDem, a to pokud možno dříve, než se oněch zhruba 500 DVD±R disků, na kterých je mám vypálena, odebere do křemíkového nebe.

U AV1 zatím drhne ještě jedna věc: formát nebude mít hned tak nějakou pořádnou hardwarovou implementaci. Pokud bude dokončen letos, tak první vlna zařízení s podporou AV1 bude tento formát počítat „softwarově“, čímž je myšleno procesorem či GPU v čipu. Můžeme předpokládat buď nativní (de)kodéry, případně využití OpenCL (apod.), ale z energetického hlediska nepůjde o tak efektivní věc jako nativní podpora v hardwaru. Pokud se u H.266 podaří dodržet výše uvedený harmonogram, mohl by se oproti AV1 s plnou hardwarovou podporou zpozdit klidně jen o jeden a půl roku.

Na druhou stranu za AV1 už stojí prakticky všichni: provozovatelé služeb, výrobci hardwaru atd. Nedávno se přidal i Apple. Zdá se, že po šílenství s patentovými pooly na H.265 už prostě nikdo velký nechce riskovat problémy s licencemi na technologie v MPEG balíku a tak si raději vyvíjí vlastní systém. A pokud třeba Google nepustí H.266 do svého světa – a tím myslím Android, Youtube, Chrome – tak může mít MPEG-LA a další navázané organizace problém. Toto má poměrně slušný potenciál na vleklé právní tahanice o to, co v AV1 (případně budoucím AV2 atd.) porušuje či neporušuje patentová práva někoho malého, kdo až do příchodu AV1 mohl žít z poplatků za dílčí MPEG technologie v H.264/265/266 použité.

Našli jste v článku chybu?