Neue Festplatte für den Fileserver [Update: Bitte mal über die Smart Werte meiner alten Platte schauen!]

AW: Neue Festplatte für den Fileserver

So, ich melde mich nochmal :)
Die WD Red läuft jetzt knappe 100h, scheint also alles paletti zu sein.

Ich würde euch allerdings bitten, mal über meine Seagate 7200.14 zu schauen, da ich die Smart-Werte ziemlich seltsam finde:

Code:
=== START OF INFORMATION SECTION ===
Model Family:     Seagate Barracuda 7200.14 (AF)
Device Model:     ST2000DM001-1CH164
Serial Number:    *********
LU WWN Device Id: ***************
Firmware Version: CC24
User Capacity:    2.000.398.934.016 bytes [2,00 TB]
Sector Sizes:     512 bytes logical, 4096 bytes physical
Device is:        In smartctl database [for details use: -P show]
ATA Version is:   8
ATA Standard is:  ATA-8-ACS revision 4
Local Time is:    Sun Jul 13 17:13:22 2014 CEST
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

General SMART Values:
Offline data collection status:  (0x00) Offline data collection activity
                                        was never started.
                                        Auto Offline Data Collection: Disabled.
Self-test execution status:      (   0) The previous self-test routine completed
                                        without error or no self-test has ever
                                        been run.
Total time to complete Offline
data collection:                (  617) seconds.
Offline data collection
capabilities:                    (0x73) SMART execute Offline immediate.
                                        Auto Offline data collection on/off support.
                                        Suspend Offline collection upon new
                                        command.
                                        No Offline surface scan supported.
                                        Self-test supported.
                                        Conveyance Self-test supported.
                                        Selective Self-test supported.
SMART capabilities:            (0x0003) Saves SMART data before entering
                                        power-saving mode.
                                        Supports SMART auto save timer.
Error logging capability:        (0x01) Error logging supported.
                                        General Purpose Logging supported.
Short self-test routine
recommended polling time:        (   1) minutes.
Extended self-test routine
recommended polling time:        ( 255) minutes.
Conveyance self-test routine
recommended polling time:        (   2) minutes.
SCT capabilities:              (0x3085) SCT Status supported.

SMART Attributes Data Structure revision number: 10
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x000f   117   099   006    Pre-fail  Always       -       151011480
  3 Spin_Up_Time            0x0003   094   094   000    Pre-fail  Always       -       0
  4 Start_Stop_Count        0x0032   099   099   020    Old_age   Always       -       1407
  5 Reallocated_Sector_Ct   0x0033   100   100   010    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x000f   100   253   030    Pre-fail  Always       -       34360385489
  9 Power_On_Hours          0x0032   096   096   000    Old_age   Always       -       3856
 10 Spin_Retry_Count        0x0013   100   100   097    Pre-fail  Always       -       0
 12 Power_Cycle_Count       0x0032   099   099   020    Old_age   Always       -       1044
183 Runtime_Bad_Block       0x0032   100   100   000    Old_age   Always       -       0
184 End-to-End_Error        0x0032   100   100   099    Old_age   Always       -       0
187 Reported_Uncorrect      0x0032   100   100   000    Old_age   Always       -       0
188 Command_Timeout         0x0032   100   099   000    Old_age   Always       -       9 9 10
189 High_Fly_Writes         0x003a   100   100   000    Old_age   Always       -       0
190 Airflow_Temperature_Cel 0x0022   067   048   045    Old_age   Always       -       33 (Min/Max 29/52)
191 G-Sense_Error_Rate      0x0032   100   100   000    Old_age   Always       -       0
192 Power-Off_Retract_Count 0x0032   100   100   000    Old_age   Always       -       150
193 Load_Cycle_Count        0x0032   079   079   000    Old_age   Always       -       43977
194 Temperature_Celsius     0x0022   033   052   000    Old_age   Always       -       33 (0 13 0 0)
197 Current_Pending_Sector  0x0012   100   100   000    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0010   100   100   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x003e   200   200   000    Old_age   Always       -       0
240 Head_Flying_Hours       0x0000   100   253   000    Old_age   Offline      -       1138h+39m+43.128s
241 Total_LBAs_Written      0x0000   100   253   000    Old_age   Offline      -       12393747549
242 Total_LBAs_Read         0x0000   100   253   000    Old_age   Offline      -       12338627329

SMART Error Log Version: 1
No Errors Logged

SMART Self-test log structure revision number 1
Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
# 1  Short offline       Completed without error       00%      3766         -

SMART Selective self-test log data structure revision number 1
 SPAN  MIN_LBA  MAX_LBA  CURRENT_TEST_STATUS
    1        0        0  Not_testing
    2        0        0  Not_testing
    3        0        0  Not_testing
    4        0        0  Not_testing
    5        0        0  Not_testing
Selective self-test flags (0x0):
  After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.

Was meint ihr zu diesen Werten?
 
AW: Neue Festplatte für den Fileserver [Update: Bitte mal über die Smart Werte meiner alten Platte schauen!]

Ich würde auf jeden Fall die Pre-Fail-Werte im Auge behalten. Die Platte ist in der Vergangenheit extrem heiß gewesen - 52° sind viel zu viel, daher höchstwahrscheinlich auch die Seek-Error-Rate- und Raw-Read-Error-Rate-Werte. Da die Ausfallwahrscheinlichkeit ab 45° stark ansteigt, würde ich 1) sicherstellen, dass die Platte notfalls gekühlt wird und 2) die genannten Werte sich nicht mehr rapide nach oben ändern.

MfG Jimini
 
AW: Neue Festplatte für den Fileserver [Update: Bitte mal über die Smart Werte meiner alten Platte schauen!]

8 Suchfehler (34360385489 dez = 00080009dfd1 hex, die ersten 16 Bit/4 Stellen sind die Suchfehler, also 8, die letzten 32 Bit/8 Stellen sind die Suchvorgänge)
9 Command Timeouts.

Da die Aktuellen Zustandswerte (Value) wieder auf optimalen 100 stehen sind diese Fehler wohl älter und können ignoriert werden.

@Jimini:
Da die 7200.14 für 0-60° C zugelassen ist glaube ich nicht das die Fehler durch 52° C entstanden sind.
Auch gibts keine Lesefehler: 151011480 dez = 000009004098 hex = 0 Fehler.
 
Zuletzt bearbeitet:
AW: Neue Festplatte für den Fileserver [Update: Bitte mal über die Smart Werte meiner alten Platte schauen!]

@Jimini: Die 52°C sind von (jetzt schon) vorgestern abend, als ich viel Zeug auf die Platte geschoben habe.
Die Platte war allerdings nur kurz auf der Temperatur. Hab dann einen Ventilator davor gestellt.

> siehe auch den Thread im OS/Linux-Unterforum ;)

Also kann ich die Platte erstmal ohne ernste Bedenken weiter nutzen ?
 
AW: Neue Festplatte für den Fileserver [Update: Bitte mal über die Smart Werte meiner alten Platte schauen!]

"Temperaturen von mehr als 45 Grad Celsius machten besonders Laufwerken, die mindestens drei Jahre alt sind, zu schaffen. Jüngeren Platten bereiteten dagegen geringe Betriebstemperaturen zwischen 15 und 30 Grad Celsius besondere Probleme. Geht es nach den Ergebnissen der Studie, wiesen Platten mit einer durchschnittlichen Betriebstemperatur von 40 Grad Celsius die geringsten Ausfallraten auf." (Google-Studie zur Ausfallursache von Festplatten | heise online)
Es war die letzten Tage aber auch nicht richtig heiß - für die nächsten heißen Tage würde ich mir auf jeden Fall eine Kühlungsmöglichkeit einfallen lassen. Ja, die Platte kannst du weiter nutzen, ich würde allerdings die Werte im Auge behalten. Normalerweise loggt der Linux-Kernel I/O-Fehler mit, diese solltest du dann somit auch im Syslog finden können.

@ Inzersdorfer: wenn es keine Fehler gab, sollte dann nicht der WORST-Wert höher als 99 und der RAW-Wert auf Null stehen? Vielleicht liegt es an der Uhrzeit, aber ich verstehe "151011480 dez = 000009004098 hex = 0 Fehler." nicht.

MfG Jimini
 
AW: Neue Festplatte für den Fileserver [Update: Bitte mal über die Smart Werte meiner alten Platte schauen!]

Bei Seagate gilt sowohl für die Suchfehlerraten als auch für die Lesefehlerrate der geteilt auszuwertende hexadezimale Rohwert (Erste 16 Bit / 4 Stellen Anzahl der Fehler, letzte 32 Bit / 8 Stellen Anzahl der Vorgänge). Bei den Suchfehlern sinkt dabei mit steigender Anzahl der Vorgänge der aktuelle Wert auf 60 um dann, wenn keine Fehler auftauchen, kontinuierlich wieder anzusteigen, das gilt Sinngemäß auch bei den Lesefehlern, daher können hier Aktueller und Schlechtester Wert nicht ohne Berücksichtigung der Zusammenhänge bewertet werden.
 
AW: Neue Festplatte für den Fileserver [Update: Bitte mal über die Smart Werte meiner alten Platte schauen!]

So,

ich hau jetzt einfach nochmal die SMART Werte rein. Wäre super, wenn ihr die nochmal vergleich könntet:

Code:
smartctl 5.41 2011-06-09 r3365 [x86_64-linux-3.2.0-4-amd64] (local build)
Copyright (C) 2002-11 by Bruce Allen, http://smartmontools.sourceforge.net

=== START OF INFORMATION SECTION ===
Model Family:     Seagate Barracuda 7200.14 (AF)
Device Model:     ST2000DM001-1CH164
Serial Number:    **********
LU WWN Device Id: *************
Firmware Version: CC24
User Capacity:    2.000.398.934.016 bytes [2,00 TB]
Sector Sizes:     512 bytes logical, 4096 bytes physical
Device is:        In smartctl database [for details use: -P show]
ATA Version is:   8
ATA Standard is:  ATA-8-ACS revision 4
Local Time is:    Mon Jul 21 17:18:55 2014 CEST
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

General SMART Values:
Offline data collection status:  (0x00) Offline data collection activity
                                        was never started.
                                        Auto Offline Data Collection: Disabled.
Self-test execution status:      (   0) The previous self-test routine completed
                                        without error or no self-test has ever
                                        been run.
Total time to complete Offline
data collection:                (  617) seconds.
Offline data collection
capabilities:                    (0x73) SMART execute Offline immediate.
                                        Auto Offline data collection on/off support.
                                        Suspend Offline collection upon new
                                        command.
                                        No Offline surface scan supported.
                                        Self-test supported.
                                        Conveyance Self-test supported.
                                        Selective Self-test supported.
SMART capabilities:            (0x0003) Saves SMART data before entering
                                        power-saving mode.
                                        Supports SMART auto save timer.
Error logging capability:        (0x01) Error logging supported.
                                        General Purpose Logging supported.
Short self-test routine
recommended polling time:        (   1) minutes.
Extended self-test routine
recommended polling time:        ( 255) minutes.
Conveyance self-test routine
recommended polling time:        (   2) minutes.
SCT capabilities:              (0x3085) SCT Status supported.

SMART Attributes Data Structure revision number: 10
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x000f   115   099   006    Pre-fail  Always       -       98814008
  3 Spin_Up_Time            0x0003   095   094   000    Pre-fail  Always       -       0
  4 Start_Stop_Count        0x0032   099   099   020    Old_age   Always       -       1409
  5 Reallocated_Sector_Ct   0x0033   100   100   010    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x000f   100   253   030    Pre-fail  Always       -       73015135492
  9 Power_On_Hours          0x0032   096   096   000    Old_age   Always       -       4048
 10 Spin_Retry_Count        0x0013   100   100   097    Pre-fail  Always       -       0
 12 Power_Cycle_Count       0x0032   099   099   020    Old_age   Always       -       1046
183 Runtime_Bad_Block       0x0032   100   100   000    Old_age   Always       -       0
184 End-to-End_Error        0x0032   100   100   099    Old_age   Always       -       0
187 Reported_Uncorrect      0x0032   100   100   000    Old_age   Always       -       0
188 Command_Timeout         0x0032   100   099   000    Old_age   Always       -       9 9 10
189 High_Fly_Writes         0x003a   100   100   000    Old_age   Always       -       0
190 Airflow_Temperature_Cel 0x0022   059   048   045    Old_age   Always       -       41 (Min/Max 37/46)
191 G-Sense_Error_Rate      0x0032   100   100   000    Old_age   Always       -       0
192 Power-Off_Retract_Count 0x0032   100   100   000    Old_age   Always       -       151
193 Load_Cycle_Count        0x0032   078   078   000    Old_age   Always       -       44063
194 Temperature_Celsius     0x0022   041   052   000    Old_age   Always       -       41 (0 13 0 0)
197 Current_Pending_Sector  0x0012   100   100   000    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0010   100   100   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x003e   200   200   000    Old_age   Always       -       0
240 Head_Flying_Hours       0x0000   100   253   000    Old_age   Offline      -       1167h+56m+22.233s
241 Total_LBAs_Written      0x0000   100   253   000    Old_age   Offline      -       12491581341
242 Total_LBAs_Read         0x0000   100   253   000    Old_age   Offline      -       12493044109

SMART Error Log Version: 1
No Errors Logged

SMART Self-test log structure revision number 1
Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
# 1  Short offline       Completed without error       00%      3766         -

SMART Selective self-test log data structure revision number 1
 SPAN  MIN_LBA  MAX_LBA  CURRENT_TEST_STATUS
    1        0        0  Not_testing
    2        0        0  Not_testing
    3        0        0  Not_testing
    4        0        0  Not_testing
    5        0        0  Not_testing
Selective self-test flags (0x0):
  After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.


Die Platte lief seit der letzten Ausgabe 24/7 durch, also knapp 192 Stunden.
 
AW: Neue Festplatte für den Fileserver [Update: Bitte mal über die Smart Werte meiner alten Platte schauen!]

17 Suchfehler (73015135492 dez = 0011000a8d04 hex, 0011 = 17 dez), also 9 mehr als Zuletzt, ansonsten keine Veränderung, die Temperaturen sind auch zufriedenstellend. Kontrolliere weiter die Anzahl (Rohwert) der Suchfehler, steigen diese stärker an oder gibt es bei dem Lesen/Schreiben bestimmter Dateien Probleme sollte die Platte ersetzt werden.
 
AW: Neue Festplatte für den Fileserver [Update: Bitte mal über die Smart Werte meiner alten Platte schauen!]

Was bedeutet "steigen stärker an"? Ab wann sollte ich mir Sorgen machen?
Kann der Wert auch wieder sinken?
Kann es vielleicht daran liegen, dass der Wert gestiegen ist, weil ich gerade einiges auf die Platte kopiert habe?
 
AW: Neue Festplatte für den Fileserver [Update: Bitte mal über die Smart Werte meiner alten Platte schauen!]

Wenn übermehrere Tage jeweils einige Dutzend weitere Suchfehler dazukommen oder es bei Operationen
zu unerwarteten Verzögerungen beziehungsweise zu Aussetztern kommt.

Suchfehler kommen von mechanischen Problemen des Positionierungssystems der Schreib/Lesekopfgruppe.
 
AW: Neue Festplatte für den Fileserver [Update: Bitte mal über die Smart Werte meiner alten Platte schauen!]

Okay, heute ist die Platte bei 19 (dez).

Edit: Ich habe gerade mal nachgeschaut, die Garantie läuft noch bis nächsten Januar.
Die Daten sichere ich gerade. Falls die Platte also abraucht, wird sie einfach ausgetauscht :)
 
Zuletzt bearbeitet:
AW: Neue Festplatte für den Fileserver [Update: Bitte mal über die Smart Werte meiner alten Platte schauen!]

Und wieder ist der Wert "Seek Error Rate" um einen angestiegen > 85900053776 = 14 Hex > 20 dez
Der Threshold liegt bei 30. Scheinbar steigt der Wert kontinuierlich an. Wenn er bei 30 angekommen ist,
kann man dann die Festplatte einschicken? Wäre das ein Garantiegrund?
 
AW: Neue Festplatte für den Fileserver [Update: Bitte mal über die Smart Werte meiner alten Platte schauen!]

Der Aktuelle Wert (Value) muß unter 30 sinken, dann wird von der Platte ein BAD/Schlecht ausgegeben.

Wenn du der Platte nicht mehr vertraust tausche sie auf Garantie aus.
 
AW: Neue Festplatte für den Fileserver [Update: Bitte mal über die Smart Werte meiner alten Platte schauen!]

Und was sagt mir dann der RAW Wert?

Kann ich meine Platte einfach so umtauschen?
 
AW: Neue Festplatte für den Fileserver [Update: Bitte mal über die Smart Werte meiner alten Platte schauen!]

Kann ich meine Platte einfach so umtauschen?
Wenn ein Pre-Fail-Wert unterhalb des Thresholds liegt, ja. Daher bezweifle ich nach wie vor, dass sich einige der Pre-Fail-Werte irgendwann wieder erholen, wie hier oder in einem anderen Thread dargestellt wurde - dies hat mir der Seagate-Support bestätigt.
Zur Not rufst du halt vor dem Umtausch beim Händler oder Hersteller an.

MfG Jimini
 
AW: Neue Festplatte für den Fileserver [Update: Bitte mal über die Smart Werte meiner alten Platte schauen!]

@Jimini
Entschuldige bitte, aber ich habe dir doch den Beleg dafür geliefert, dass das so ist (zumindest bei manchen Marken). Warum zweifelst du noch daran? Das kann ich jederzeit wiederholen und das Verhalten forcieren. Ich habe diese Platte noch, die im vorderen Bereich offensichtlich Oberflächenschäden hat. Durch entsprechende Partitionierung kann ich nach belieben den problematischen und den fehlerfreien Bereich traktieren und so die Smart-Änderungen in die eine oder die andere Richtung erzwingen.

Bezüglich der Support-Anfrage. Ich stelle immer wieder fest, dass Support-Mitarbeiter allgemein selten genug Ahnung von der entsprechenden Technik haben, um spezifische Fragen (die tiefer ins Detail gehen) korrekt beantworten zu können. Mag sein, dass bei Seagate Festplatten tatsächlich der "Schlechteste Wert" bei keinem Attribut wieder zurückgesetzt wird (bei Hitachi HDDs ist das definitiv nicht der Fall). Verlassen auf diese Aussage würde ich mich nicht.
 
AW: Neue Festplatte für den Fileserver [Update: Bitte mal über die Smart Werte meiner alten Platte schauen!]

Entschuldige bitte, aber ich habe dir doch den Beleg dafür geliefert, dass das so ist.
Sorry, ich habe mich blöd ausgedrückt. Ich meinte eigentlich, dass es Blödsinn ist, wenn sich bestimmte Werte wieder erholen, da dies den Sinn des SMART-Monitorings irgendwo ja aushebelt.
Mea culpa!

MfG Jimini
 
AW: Neue Festplatte für den Fileserver [Update: Bitte mal über die Smart Werte meiner alten Platte schauen!]

Und was sagt mir nun dieser RAW-Wert, wenn es doch scheinbar um den "Value" Wert geht?
Was sagt mir z.B. in meinem Fall der dezimal Wert 20?
 
Zurück