No nezlobte se na mne, ale že by si tohle někdo chtěl koupit domu soudruhy z intelu určitě ani nenapadlo a jestli ano tak jako vtípek u oběda, kterému se celá jídelna zasmála. Tohle je velmi specifický produkt, pro který sice není velký trh, ale vzhledem k tomu, že řádově PB disky nikdo jiný asi nenabízí (nejsem si toho vědom), tak na tom intel může dobře vydělat. - Ostatně proč by to jinak dělal.
lol ... deduplikace na mailech udela naprosto vpohode -60%, v extremnich pripadech i -90% objemu dat. Bez komprese.
To sis jeste nevsim ze prevazna vetsina mailu se posila nekolika lidem, a navic se v odpovedi prevazne tam a zpet posila stale totez? Ze ty netusis jak deduplikace funguje?
Vím přesně jak deduplikace funguje. Jaký nasazujete produkt, který Vám dejme tomu na Vašem emailovém serveru těch 60% dat ušetří? Uživatel m. se chlubil, že má snad 6 PB emailu, tak by mě zajímalo, co jemu vyjde, když bude data deduplikovat...
Když budete deduplikovat na úrovni databáze, tak by mohla být efektivita poměrně dobrá. Jak říkáte, duplicitní emaily atp. Na nižších úrovních to začne být těžší. Pro dobrý výkon musí být blok, který se hashuje fixní velikosti. Běžný email má prý velikost 75 kB, z čehož usuzuji, že při rozdělení na 4 kB bloky by se dalo vytěžit dostatek podobných částí.
Myslím si, že nejlépe deduplikace funguje na zálohy. Tam z principu existuje velká míry duplicitních dat. V praxi jsem ale jinde moc úžasné deduplikační faktory neviděl. Možná mám jen smůlu. Nejlépe mě přesvědčíte a jiné poučíte, když ukážete Vaše data.