Akonáhle sa niekto pokúsi z návštevnosti serverov zaradených do prieskumu vyvodiť akýkoľvek záver, musíme hovoriť o štatistike. Pokiaľ by sme ostali pri konštatovaní že na rozsiahlej vzorke serverov, vybranej pre nás, bežných čitateľov neznámym spôsobom, používali návštevníci uvedené OS v uvedenom pomere, tak o štatistike (s určitou výhradou) hovoriť nemusím. Vo všetkých ostatných prípadoch áno. Tá výhrada sa týka faktu, že aj pre takýto prieskum musí byť metodikou definované, čo sa považuje za návštevu (ako sa vyhodnotí dĺžka pripojenia, počet prerušení, počet navštívených stránok na serveri atď.).
Pokiaľ chceme výsledky zovšeobecniť, tak je to štatistika a, paradoxne, práve veľmi veľká vzorka vyvoláva podozrenie, že pôjde o štatistiku nekvalitnú. Pri takto rozsiahlej vzorke je totiž veľmi ťažké (až nemožné)dodržať pravidlá náhodného výberu.
verím, že tam sú, a čítať sa mi ich nechce. Žiaľ, viem o tom priveľa a viem, že je to zložité. Nepodozrievam takéto firmy, že robia štatistiku celkom zle, skôr si myslím, že vzhľadom na problémy, ktoré som naznačil, sa nedá robiť celkom dobre. Aby som vedel vybrať vzorku serverov, musel by som viac vedieť o ich štruktúre (geografická poloha, prevládajúce krajiny návštevníkov, zameranie, úspešnosť), aby som vedel identifikovať OS návštevníkov, musel by som vyriešiť problém, čo s meniacimi sa IP, čo s návštevníkmi, ktorí sa pripájajú z jednej IP pod viacerými OS, ako hodnotiť dĺžku pripojenia, počet prerušení, musel by som eliminovať "OS-specific behaviour".
Každopádne, nespochybňujem podiel Linuxu, ale tvrdím, že je príliš nízky, než aby sa v ňom dali vyhodnocovať trendy.
A já zase naopak tvrdím, že v té řadě 24 měsíců je průkazný a viditelný patrný silný růstový trend, který nevykazuje známky viditelné statistické chyby a šumu. Lepší statistiky než porovnání vývoje webových statistik od několika společností asi neexistují a přes veškeré nedostatky mohou poskytnou základní představu a orientaci o skutečném zastoupení a patrných trendech.