A 3ware raid kártya esete a wd diszkekkel

Csak a napló kedvéért: a 3ware hardver raid kártyák nem működnek (bizonyos) diszkekkel.

Hozzávalók

  • 9650SE-8LPML (Bios BE9X 4.08.00.004)
  • WD Caviar Green kétféle sorozatból (WDC WD15EADS-00P8B0 és WDC WD15EARX-00PASB0)
  • Linux CentOS (RedHat Linux klón) 5 és 6
  • 3ware tw_cli kliens program

A jelenség

Az éjszakai "raid verify" során (különösen, ha közben fut más is, pl. egy backup) az éppen ellenőrzött diszk kiesik a raidből.

A "tw_cli /c0 show" parancs DEVICE-ERROR-t jelez.

Ha valamelyik diszk éppen új helyre allokál egy pár hibás szektort, akkor a raid azonnal szétesik.

Ha az érintett diszket kivesszük a raid konfigurációból, majd visszarakjuk, akkor újraépítés után a raid rendben üzemel.

tw_cli /c0/p0 remove
tw_cli /c0 rescan
tw_cli /c0/u0 start rebuild disk=p0
tw_cli /c0 show

Az okok

A WD "consumer" diszkjei hajlamosak igen sok időt eltölteni a szektorok áthelyezésével. (Feltehetőleg ez más gyártók diszkjeire is igaz, a Seage Barracuda sorozatról is olvasni hasonlót.)
A WD azt írja a honlapján, hogy emiatt hardver raid konfigurációkba ezen diszkjeit nem is ajánlja. Ezért vannak kifejezetten raidekbe szánt eszközei.
Amelyek persze jóval drágábbak...

A raid diszkek gyorsabban válaszolnak a kontrollernek, nem molyolnak annyit "némán".
Háttérinfó: TLER (Time-limited error recovery)

Megoldás

WD raid diszket veszünk.

Mivel a kérdés alapvetően szoftveres, és az árkülönbség elég nagy, ezért aztán más megoldások is születtek

A WDTLER kis programka szoftveresen állítja a TLER időt bizonyos WD diszkeken.

Linux alatt erre a célra a smartctl is használható (a smartmontools-5.42 már támogatja ezt a funkciót). Lekérdezhetjük, hogy a diszk támogatja-e ezt a lehetőséget:

./smartctl -l scterc -d 3ware,0 /dev/twa0

A WD15EADS-00P8B0 diszk igen. A fenti kontroller esetében 20 másodperc a javasolt beállítás:

./smartctl -l scterc,200,200 -d 3ware,0 /dev/twa0

A WDC WD15EARX-00PASB0 (és az EADS sorozat újabb példányai) nem támogatják ezt a lehetőséget (miért is?):

Warning: device does not support SCT Error Recovery Control command

További példák ebben a fórumban.