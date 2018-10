Vojtěch Pavlík: Meltdownem to neskončilo. L1TF, POP SS, TLBleed a další

Současné procesory intenzivně využívají takzvané spekulativní vykonávání. Tím se lépe využívají zdroje v procesoru, který je schopen při vykonávání jedné instrukce připravovat další krok. Problémem jsou skoky, protože není možné jednoduše zjistit další instrukci. Procesor k tomu má jakési „orákulum“, které se podle předchozích výsledků skoků stačí odhadnout, kam bude kód pokračovat. Pokud se trefí, má práci hotovou ve chvíli, kdy je potřeba. Pokud se netrefí, práce se zahodí. Není to na škodu, protože nás to nic nestojí. Vždycky se to predikcí může jen zlepšit. Moderní procesory jsou schopny predikovat až 300 instrukcí napřed a systém učení se stále zlepšuje, aby byl odhad co možná nejpřesnější.

Dalším způsobem, jakým se zrychluje práce procesoru, je keš. Keš v procesoru je velmi drahá, i nejnovější procesory mají L1 keš o velikosti 32 KB. Kromě samotných dat je potřeba mít uloženou také informaci o tom, co v paměti je a dá se použít pro zrychlení práce.

Už na začátku letošního roku se objevil útok Spectre v1, který tyto principy zneužívá. Nejprve vytvoříme smyčku, která naučí prediktor, že se vždycky skáče na začátek smyčky. Zároveň zaplníme keš vlastním smetím, abychom z ní vymazali veškerá data linuxového jádra. Poté zavoláme jadernou funkci a snažíme se přečíst z paměti informaci, kterou by nám jádro za normálních okolností nikdy nedalo. V rámci spekulativního vykonávání se obsah paměti načte, ale poté procesor zjistí, že celá spekulace byla chybná a všechny stopy zahladí. Ovšem načtená paměť je v keši a ta funguje nezávisle, proto si pak útočník může změřit, jak dlouho mu trvá načtení dané stránky a podle toho zjistí, zda je v keši.

Tímto postranním kanálem si pak může postupně přečíst celou paměť. V jádře ale musí být vhodná funkce, kterou je možné takto zneužít. Proto vývojáři provedli statickou analýzu kódu a všechny zneužitelné funkce upravili tak, aby byly bezpečné. To jsme všechno udělali, ztratili jsme nějaký výkon, ale všechno je v pořádku. Ovšem existuje řada dalších cest, jak skryté mechanismy procesoru zneužít.

Procesor například implementuje další predikční jednotku, která sleduje návraty z funkcí. Když někam skočíme, musíme také vědět, kam se vrátit. Uvnitř procesoru se pak udržuje rychlý zásobník skoků, ve kterém je uloženo šestnáct posledních adres pro návrat z nejnovějších skoků. Vytvoříme funkci, která rekurzivně zavolá šestnáctkrát sama sebe a pak vyskočí pomocí GOTO. Tím jsme zaplnili zásobník daty o skocích, ze kterých se už nikdy nevrátíme. Poté jádro spustí další proces, který se stane obětí a při prvním RET se spekulativně skočí na námi připravenou adresu. Tohle ale není tak nebezpečné, protože si nemůžeme přesně vybrat index a zajistit, kam přesně se pak skočí. Dá se to vylepšit, ale už to není tak účinné. Oprava probíhá tak, že se tabulka RSB vyprázdní před každým skokem do jádra. Opět nás to stojí výkon, jako všechno.

Další zajímavý útok zneužívá líné přepínání jednotky pro práci s plovoucí čárkou (FPU). V dobách procesorů 386 totiž existoval samostatný matematický koprocesor 387, který byl k hlavnímu CPU připojen pomocí relativně pomalé sběrnice. Přenášet neustále stav všech registrů touto sběrnicí by bylo velmi pomalé. Většina procesů ovšem s plovoucí řadovou čárkou nepracuje, takže není potřeba koprocesor do akce zapojovat. Existuje tedy flag, který při použití koprocesoru vyvolá výjimku a procesor pak ví, že při přepnutí kontextu je potřeba stav koprocesoru uložit. Data tedy přenášíme jen v případě, že koprocesor někdo používal, to přineslo obrovské zrychlení. Při spekulativním vykonávání se tento bit opět nekontroluje, takže jsme schopni si přečíst obsahy registrů jiných procesů. To není tak nebezpečné, ale pokud v registrech budou například prvočísla, už nám to pomůže dostat se k privátnímu klíči. Oprava se provádí tak, že jádro při každém přepnutí procesů uloží stav koprocesoru. Naštěstí to Intel už dnes umí velmi rychle, takže nás to už nestojí tak velký výkon. Používají se k tomu moderní instrukce FXSAVE a FXRSTOR.

Jeden z nových útoků využívá také velmi staré instrukce pro přepínání zásobníků, při jejichž použití jsou zakázána přerušení. Útočník si nejprve zapne krokování kódu a poté uprostřed přepínání zásobníků zavolá syscall a skočí do jádra. To se opět dá na úrovni jádra ošetřit, zjistíme, jestli k přerušení došlo s uživatelského prostoru a ošetříme to. Procesor je ale tak složitý, že některé kombinace instrukcí prostě nečekáte a dokáže vás překvapit instrukce z roku 1981.

Další útok zneužívá takzvaného hyper-threadingu, který dokáže lépe využít některé části procesoru. Vytváří dvě virtuální jádra, která ale sdílejí některé části skutečného procesoru, včetně L1 keše. Útok na tento systém představil Percival už v roce 2005, ale šlo o poměrně komplikovanou věc, která nebyla příliš dobře využitelná. Procesor kvůli rychlé práci s virtuální pamětí používá takzvanou TLB (Transaction Lookaside Buffer), což je tabulka pro rychlé vyhledávání adres ve fyzické paměti. Nedávno byl oznámen útok TLBleed, který vylepšuje Percivalův útok a zneužívá sdílenou TLB k odhadování toho, co běží na vedlejším jádře. Útok je ještě slabší, protože je v praxi neproveditelný. Proto jsme se na jeho řešení vykašlali, jako všichni.

Když procesor přepíná tabulky virtuálních paměti, stojí ho to poměrně dost času. Proto byl vymyšlen takzvaný supervisor bit, který určuje, zda do dané stránky může běžný proces. Umožňuje to namapovat paměť jádra do paměti procesu a znepřístupnit ji. Když pak proces volá funkce jádra, nemusí se přepínat kontexty a šetříme výkon. To je dobrý nápad, ale pak se ukázalo, že ve spekulativním režimu se bit nekontroluje. Tím vznikl útok Meltdown, který je notoricky známý.