A 3ware raid kártya esete a wd diszkekkel
Csak a napló kedvéért: a 3ware hardver raid kártyák nem működnek (bizonyos) diszkekkel.
Hozzávalók
- 9650SE-8LPML (Bios BE9X 4.08.00.004)
- WD Caviar Green kétféle sorozatból (WDC WD15EADS-00P8B0 és WDC WD15EARX-00PASB0)
- Linux CentOS (RedHat Linux klón) 5 és 6
- 3ware tw_cli kliens program
A jelenség
Az éjszakai "raid verify" során (különösen, ha közben fut más is, pl. egy backup) az éppen ellenőrzött diszk kiesik a raidből.
A "tw_cli /c0 show" parancs DEVICE-ERROR-t jelez.
Ha valamelyik diszk éppen új helyre allokál egy pár hibás szektort, akkor a raid azonnal szétesik.
Ha az érintett diszket kivesszük a raid konfigurációból, majd visszarakjuk, akkor újraépítés után a raid rendben üzemel.
tw_cli /c0/p0 remove tw_cli /c0 rescan tw_cli /c0/u0 start rebuild disk=p0 tw_cli /c0 show
Az okok
A WD "consumer" diszkjei hajlamosak igen sok időt eltölteni a szektorok áthelyezésével. (Feltehetőleg ez más gyártók diszkjeire is igaz, a Seage Barracuda sorozatról is olvasni hasonlót.)
A WD azt írja a honlapján, hogy emiatt hardver raid konfigurációkba ezen diszkjeit nem is ajánlja. Ezért vannak kifejezetten raidekbe szánt eszközei.
Amelyek persze jóval drágábbak...
A raid diszkek gyorsabban válaszolnak a kontrollernek, nem molyolnak annyit "némán".
Háttérinfó: TLER (Time-limited error recovery)
Megoldás
WD raid diszket veszünk.
Mivel a kérdés alapvetően szoftveres, és az árkülönbség elég nagy, ezért aztán más megoldások is születtek
A WDTLER kis programka szoftveresen állítja a TLER időt bizonyos WD diszkeken.
Linux alatt erre a célra a smartctl is használható (a smartmontools-5.42 már támogatja ezt a funkciót). Lekérdezhetjük, hogy a diszk támogatja-e ezt a lehetőséget:
./smartctl -l scterc -d 3ware,0 /dev/twa0
A WD15EADS-00P8B0 diszk igen. A fenti kontroller esetében 20 másodperc a javasolt beállítás:
./smartctl -l scterc,200,200 -d 3ware,0 /dev/twa0
A WDC WD15EARX-00PASB0 (és az EADS sorozat újabb példányai) nem támogatják ezt a lehetőséget (miért is?):
Warning: device does not support SCT Error Recovery Control command
További példák ebben a fórumban.
- Mészáros Tamás's blog
- Login to post comments