Článek je zajímavý. Nějak jsem ale nepochopil, proč je vůbec uvedeno to porovnání s ext3... Na konci je napsáno, že testy nemají vůbec žádnou vypovídající hodnotu, neni pak takový testování naprd? :-D Buď skutečně nemá žádnou vypovídající hodnotu, pak ale nemá ve článku co dělat, nebo nějakou vypovídající hodnotu má, ale pak ve článku zase nemá co dělat ten alibismus autora...
Tu větičku na konci jsem uvedl, protože opravdu neručím za výsledky. Třeba nějakej daemon si u testu s ext3 začne něco dělat, a tak se samozřejmě ext3 zhorší výsledek. A nemusí to být jen softwarová chyba. Těch faktorů je opravdu hodně. Test je uveden jen pro informaci, neříká že ext3 nebo reiser4 je lepší či horší. Také testuji měřící metodiku, kterou se snažím co nejvíce vylepšit. Až se rozhodnu porovnávat souborové systémy, vezmu čistou instalaci, kde toho poběží minimum, nový disk a pak teprve budu moct říct "Tenhle souborový systém je lepší než tamten". Snad jsem to objasnil, pro jistotu můj alibismus změním :)
Ta veta na konci je opravdu priserna. Chapu, proc jste ji napsal, ale formulace je opravdu tragicka. V soucasne podobe to vypada, ze ty testy jsou opravdu uplne k nicemu.
Zmente to, at to vyjadruje skutecne vyhrady k vysledkum:
1. Testy nevypovidaji o celkove kvalite filesystemu (mohl jste udelat vic rozdilnych testu)
2. Metodika testu neni perfektni
Poznamka k bodu 2 - zadna metodika neni nikdy perfektni a zadne mereni neni "presne"
No a k bodu jedna bych měl, že to opravdu nevypovídá o kvalitě FS. Co je to kvalita FS? Rychlost? Spolehlivost? Jak měřit spolehlivost? :) Já se chci spíš bránit faktu, že někde můžou mít také porovnávací testy a ty budou mít úplně opačné výsledky. Který test je pak správně?
Není jeden univerzální výsledek, univerzálně nejlepší FS. Testy by se musely provést v reálném provozu a vycházet z celkové odezvy daného stroje.
Třeba na notebooku mi je fuk, zda se film smaže za jednu nebo dvě sekundy, ale podstatné je, jestli mi opera naběhne za tři nebo za pět sekund. Jistě, nejsou to závratné rozdíly, ale co si budeme povídat - právě tato drobná zdržení dráždí nejvíce :-)
U Reiser4 oceňuji především transparentní kompresi, kterou jiné FS zatím moc nenabízejí. Podle některých testů je odezva systému na komprimovaném disku až dvakrát větší, protože CPU se většinou fláká (platí zvláště na desktopu). Samozřejmě nemá smysl na komprimovaný oddíl nahrávat mp3 a filmy.
Kdyz uz delate nejake testy, tak byste to mel delat trosku vedecky. Kdyz uz nic jineho, tak ten test opakovat nekolikrat (10x ?) a pak ty hodnoty zprumerovat nebo vynest do grafu (prehlednejsi).
Pokud se obavate o zasah nejakeho daemona do vysledku mereni, doporucuji to provadet z nejakeho live CD, kde vetsinou moc deamonu nebezi.
Take nechapu porovnani ze zastaralym ext3, kdyz jste sam psal, ze jste zkousel i ext4. Daleko hodnotnejsi by bylo porovnani etx4 a reiser4.
Mozna by stalo za to si vytvorit script, co by vam automaticky vytvarel souborovy oddil s urcitym file systemem a pak provadel testy s kopirovanim, presouvanim a mazanim souboru a adresaru. Vysledky testu ukladat do souboru a ten pak analyzovat vyse uvedenym zpusobem. Takove testovani by bylo opravdu hodnotne. Mozna by to stalo za samostatny clanek.
Děkuji za nápady. Plánuji napsat článek zabývající se pouze testováním souborových systémů a tam si dám opravdu záležet na metodice. Vyhradím si na to zvláštní stroj se systémem, který nebyl určen nikdy na nic jiného. Skript na testování mám a každým článkem ho doplňuji o další testy. Porovnání s ext3 jsem zvolil, protože byl Reiser4 původně stavěn vedle ext3 a chtěl jsem, aby se čtenáři mohli těšit na porovnání ve zmiňovaném článku :) Skript má výstup do HTML a není problém ho upravit na výstup do nějakého grafu. Bude zveřejněn spolu s článkem.
Na to, aby nebezely nepotrebne procesy pomuze init S. Pro objektivitu opakovanych mereni je potreba vyprazdnit diskovou cache, k tomu by snad melo stacit odmountovat a opet primountovat dany oddil.
Najdôležitejšie je IMHO nespúšťať testy na prázdnom oddieli, pretože tam je napr. lineárne hľadanie voľných blokov v zozname u ext3 rovnako rýchle (alebo rýchlejšie) než ich hľadanie v B+ alebo B* strome (podobne u ostatných jednoduchších štruktúr).
Ideálne spustiť 3-4 várky testov, napr. s 30%, 60%, 90% a 97% zaplnením oddielu. Súbory na oddiel nakopírovať pri každom teste rovnaké, pár veľkých (5-10x ~100MB-1GB), viac stredných (10-100x 1-50MB) a spústu malých (10000-100000x 1kb-20kB), potom nejakú časť z nich zmazať, zopár súborov nakopírovať naspäť a až potom pustiť test (simuluje to skutočné použitie, možno to mazanie a kopírovanie párkrát zopakovať). Spraviť na to skript zrejme nebude nič zložité.
Mit na to zvlast jeden stroj je sice hezke, ale podle me i kontraproduktivni. On jinak se souborovy system chova kdyz je novy, prazdny a jinak kdyz ho pul roku pouzivate. Behem prace snim po nejake delsi obdobi, se udela hromada zmen v datech na nem ulozench, spousta souboru se zmensi, zvetsi, smaze, vytvori atd.... Uzivatel, pro ktereho jsou pak ty testy (predpokladam, ze cilovym publikem je uzivatel, ktery se rozhoduje, ktery filesystem zvolit) urcene nebude mit prazdny, nebo nove naformatovany filesystem s nekolika novymi soubory. Jeho zajima jak se to bude chovat i za 2 roky pouzivani.
Chapu ale ze se to hodne blbe testuje.