so nach langer Zeit mal wieder.
Heute hatte ich nach neuen Festplatten ausschau gehalten und da die Preise im Moment sehr niedrig sind sollte es u.U. gleich ein 2TB Modell werden.
Da man einer Festplatte ja nunmal einige Daten anvertraut, muss man erstmal wissen, ob man ihr vertrauen kann.
Meine Recherche habe ich auch auf den CCC IRC-Channel ausgeweitet gehabt wobei ich nur ein Samsung und ein WesternDigital Model in Frage kamen.
Bei den Samsung HDDs schlug ich schnell auf einen unschönen Bug in der Firmware welcher dazu führt, dass wenn man den ATA-Standardbefehl "IDENTIFY DEVICE" ausführt sie einfach ihren WriteCache über Bord wirft.
Natuurlich hat Samsung einen Patch bereitgestellt, aber da dieser nur per DOS einspielbar ist und auch noch die gleiche Versionsnummer wie die fehlerhafte Firmware ausgibt, war die Samsung aus der Auswahl raus.
Also war meine Wahl auf das WestlicheDigitalModell gefallen, als ich meine Entscheidung bekannt gab, gab mir BugBlue einen Hinweis auf einen WD-Firmware Bug, verdammt unschön.
http://wdc.custhelp.com/app/answers/detail/a_id/3263
Erstmal erschien das kein Problem, da das zur Auswahl stehende Modell nicht betroffen war, doch dann.
Es sind ja bereits Festplatten im einsatz und ja auch welche von WD.
Also schnell per ssh nachgeguckt ob sie betroffen sind.
sudo smartctl /dev/sda -a | egrep 'Load_Cycle|Power_On|Model|Firmware|Capacity' | sed 's/0x.*-//'
1. Platte: OK
2. Platte: nOK
Verdammt, also doch betroffen:
Model Family: Western Digital RE2-GP family
Device Model: WDC WD1000FYPS-01ZKB0
Firmware Version: 02.01B01
User Capacity: 1,000,204,886,016 bytes
9 Power_On_Hours 10125
193 Load_Cycle_Count 825199
der Load_Cycle_Count zählt die Parkvorgänge des Lese-/Schreibkopfes wobei demnach bereits >800k mal ein und ausgeparkt wurde :( sehr unschön.
Nach kuzer recherche war ich soweit, zu wissen, dass dies die Lebensdauer der Platte auch beträchtlich senken kann und die oben genannten Werte schon viel zu hoch sind.
Normal seinen <10>
sudo hdparm -S 242 /dev/sdb
Wobei ich vor dem Byte, in dem die Zeit angegeben wird, warnen muss.
Auszug aus der manpage von hdparm
The encoding of the timeout value is somewhat peculiar. A value of zero means "timeouts are disabled": the device will not automatically enter standby mode. Values from 1 to 240 specify multiples of 5 seconds, yielding timeouts from 5 seconds to 20 minutes. Values from 241 to 251 specify from 1 to 11 units of 30 minutes, yielding timeouts from 30 minutes to 5.5 hours. A value of 252 signifies a timeout of 21 minutes. A value of 253 sets a vendor-defined timeout period between 8 and 12 hours, and the value 254 is reserved. 255 is interpreted as 21 minutes plus 15 seconds. Note that some older drives may have very different interpretations of these values.
Damit wird die Spin-Down-Time gesetzt, was dazu führt, dass auch der Kopf nicht geparkt wird wobei ich das ganze natürlich gerne immer haben wollte, also schnell
/dev/sdb {
spindown_time = 242
}
in die /etc/hdparm.conf eingetragen.
Gott sei dank war das Problem damit erstmal beseitigt.
Eigentlich natürlich eine unschöne Lösung, besonders da die Platte schon über den Lebenszeit-Höchstwert von 300k gelangt war :( den WD angibt.