Vlákno názorů k článku Databázový server na platformě Intel 32bit od Radim Kolar - Diky za hezke reakce na clanek. Pokud...

  • Článek je starý, nové názory již nelze přidávat.
  • 23. 3. 2004 11:55

    Radim Kolar (neregistrovaný)

    Diky za hezke reakce na clanek. Pokud chcete vice detailni informace tak mne
    poslete email o co presne by byl zajem. Mam k dispozici pomerne znacne
    mnozstvi ruznych benchmarku delanych pro interni potrebu (disky, raidy,
    kazetaky, rozparcelovani databaze, ...) a statistiky selhani hw a zalohovacich
    medii.

    poznamky k jednotlivym tematum:

    1) Disky SCSI, PATA, SATA
    Shrnuti: raw transfer rate ma nejvetsi SATA +9%, PATA +0, SCSI -6%. Pri provozu databaze se tento typ zateze nevyskytuje (kdyz nepocitam backup). Pokud date
    indexy na SATA disk tak pri 70 uzivatlich delajicich updaty velkych indexu
    jde vykon dolu o 230% oproti SCSI. Nektere lepsi disky se ve verzi
    IDE ani nedelaji.

    2) Systemovy IDE disk

    Systemovy disk slouzi na vyhrazenem db serveru pouze k tomu aby to nabootovalo
    a spustilo databazi, pak se uz muze vyhodit. Kdyz se podivam na jeho
    statistiku tak jedine pristupy zpusobuje cron, syslogy si nechavam posilat jinam. Starsi Linux kernely 2.4 opravdu tuhly pokud zarvalo IDE. Ty posledni jiz
    jedou SCSI pri IDE havarii ok.

    3) Atomicky zapis sektoru u IDE
    nevim jak ve specifikaci, ale bezne pouzivane disky to umeji jiz hodne dlouho.
    Testoval jsem to.

    4) Co v DB serveru ovlivuje vykon

    Pri vice uzivatelich je to rozhodne v prvni rade CPU. Jeste jsem nevidel DB
    server ktery by mel load

  • 23. 3. 2004 13:03

    Veldrane (neregistrovaný)

    AD 2) problem je v tom ze intel servery maji vetsinou kompletni scsi architekturu, prolianty od hp dokonce ide vubec nepodporuji a to i kdyz ho pripojite na stejnou ksandu jako cdromka.
    AD 4,5) opet zalezi pouze na typu aplikace - co napr. sber nejakych technologickych dat, kdy se do databaze rve spousta udaju a sem tam nekdo pusti nejake batche ktere vygeneruji nejake vystupy.
    AD 6) odpovedel ste si v podstate sam - pokud se z databaze hlavne cte pak vykon RAID5 bohate staci.
    AD 7) jaky HW raid radice ste testoval ???
    AD 8) zalezi na aplikaci jak s indexy nalozi
    AD 9) zalohovani na DAT uz sem opravdu dlouho dlouho nevidel. Za to jsem byl jiz nekolikrat svjedkem jak unaveny a zlomeny admin zkousel ruzne DDS a obnova se ne a ne podarit (chyba admina, jednou za cas je dobre udelat kontrolni restore). Rychlost zalohovani a obnovy je take velmi dulezita. Vetsinou je treba se vejit do nejakeho zalohovaciho okna. Co se tyka diskove cache jako uloziste dat pro zalohy - je to vynikajici vjec. Nicmene v internich smernicich firmy je vetsinou klauzule o zalohach, ktere by meli byt ulozeny mimo budovu firmy (z duvodu pozaru atd), aby i tehdy kdy po budovje zbydu dira v zemi mohla firma sva data obnovit a fungovat dal.

  • 23. 3. 2004 13:08

    pc (neregistrovaný)

    > Pri vice uzivatelich je to rozhodne v prvni rade CPU.
    > Jeste jsem nevidel DB server ktery by mel load < 1
    > a cekal az se data prectou z disku.

    Mylite se - pokud tedy oznacujete jako "load" udaj vypisovany prikazem uptime ci top. Toto cislo ukazuje prumerny pocet procesu ve stavu "runnable" (R) ci "uninterruptible sleep" (D). Uninterruptible sleep je obvykle pro ty, co cekaji na disk. Takze kdyz procesy cekaji na disk a zatez procesoru je nulova, budete mit load >= 1. Zkuste si dat
    dd if=<scsi disk> of=/dev/null a uvidite. Relevantni udaj je procento zateze procesoru (napr. v topu).

  • 23. 3. 2004 20:33

    Radim Kolar (neregistrovaný)

    > Takze kdyz procesy cekaji na disk a zatez procesoru je nulova, budete mit
    > load >= 1. Zkuste si dat
    dd if=<scsi disk> of=/dev/null a uvidite.

    zkusil jsem to na Freebsd 5.2 a load mam 0.01 - dle ocekavani. Pokud
    to na linuxu vykazuje opravdu load 1, tak to pocita linux zjevne spatne.

  • 24. 3. 2004 13:11

    dejf (neregistrovaný)

    Jo, jde o to ze FreeBSD D procesy do zateze vetsinou samo nepocita, linux ano. Ani jedno neni spatne, je to proste jinak.
    ALE dosahnout loadu 1 pri dd if=scsidisk of=null znamena, ze mate zatracene rychle scsi a zatracene pomaly pocitac. Asi jako kdybych do sveho PII nacpal SCSI320.
    Dosahnout tohohle loadu s ide diskem pochopitelne neni problem pri naprosto libovoulne konfiguraci. Osobne jsem to testoval od 386 po Athlon2200+ a bylo jedno jestli ten disk mel 120MB nebo 120GB, zatez byla 100% po dobu presunu (testoval jsem i 386/120GB a athlon/120MB a leccos mezi tim)

  • 23. 3. 2004 16:40

    Miroslav Petříček (neregistrovaný)

    > Nejlepsi volba je 0+1 na vicekanalovem radici.

    To ano, ale teď tady píšete něco docela jiného než ve článku, kde jste naopak psal:

    > RAID-0 (striping): Velmi vhodný pro provoz databází, optimální je použití tří disků...Proto se nedoporučuje dělat RAID-0 přes více než tři disky, což poskytuje vhodný poměr výkonu ku bezpečnosti.

    To jste myslel asi tak, že naděje, že odejde jeden ze dvou disků je při provozu datábaze přijatelnější než naděje že odejde jeden ze tří disků?

    Ve skutečnosti je to tak, že se konfigurace odvíjí od počtu disků - máme-li dva tak se použije RAID-1, máme-li čtyři tak RAID 10 nebo RAID 1+1 a rozdělení db lokací do logických jednotek.

    Spolehlivost je totiž v drtivé většině případů důležitější než výkon.