Je to zajímavé. Ovšem asi ne vždy vhodné použít – předpokládám, že tvorba otisků a jejich ukládání něco časově a prosotrově stojí. Navrch otisk musí být mnohem menší než ukládaná data (jinak to nemá smysl) a je otázka, jaká je pravděpodobnost kolize (různá data budou mít stejný otisk).
Vlákno názorů ke zprávičce ZFS dostal podporu deduplikace
4. 11. 2009 17:57
Re: velikost tabulky otisků
>> že tvorba otisků a jejich ukládání něco časově a prosotrově stojí
Mám zato, že ZFS otisky tak jako tak dělá kvůli odhalování „silent corruption“.
>> jaká je pravděpodobnost kolize
Snad by se data měla bajt po bajtu porovnat, když se rovná hash – divil bych se, kdyby to tak nedělali.

