Samsung SSD Over Provisioning

geohei

Komplett-PC-Aufrüster(in)
Hallo.

Ich habe eine Samsung SSD 970 EVO Plus 2TB die stark belastet ist und bereits 2 Jahre hinter sich hat. Die gesamte SSD Kapazität ist mit Partitionen belegt (also kein "unallocated"). Ich möchte Over Provisioning (OP) nutzen um Reserven im Fall von bad sectors zur Verfügung zu stellen.

Soweit ich verstanden habe, gibt es 2 Möglichkeiten OP zu benutzen (alles mit Samsung Magician).
1. Man benutzt die von ausgewählte Partition um Platz für OP abzuzwacken.
2. Man belegt nicht die ganze SSD mit Partitionen = man lässt einen Teil der SSD als "unallocated" frei, und die SSD benutzt diesen Teil selbstständig als OP.

Sind beide obigen Aussagen korrekt?

Konnte mittels Google und Forum Suche keine oder widersprüchliche Infos diesbezüglich finden.
 
Der OP Bereich einer SSD hat nichts mit deiner Nutzung oder Partitionen zu tun. Du siehst den Bereich (außerhalb des Magician) gar nicht und kannst ihn nicht partitionieren.

Man kann den OP Bereich in seiner Größe anpassen mit Herstellertools, das sollte man aber erstens möglichst nur bei einer komplett leeren SSD ganz am Anfang tun und es ist zweitens in 99,9% der Fälle nicht notwendig.

Deine SSD hat ab Werk bereits einen OP Bereich eingerichtet und benutzt diesen u.a. als Reservezellen.

Wenn du sagst deine SSD wäre stark genutzt nach 2 Jahren: wie stark denn?
Lies mal die SMART Werte aus (CrystalDiskInfo) damit wir wissen wovon wir reden. Denn oftmals glauben Leute ihre SSDs stark zu benutzen und zu verschleißen weil das Thema stark gehyped ist im Netz und stellen bei genauem hinsehen fest, dass die betroffene SSD ihre "starke Nutzung" noch weitere Jahrzehnte (!) problemlos ertragen wird ohne dass die Reservezellen knapp werden würden. ;-)
 
in 99,9% der Fälle nicht notwendig.
+1
Wenn du sagst deine SSD wäre stark genutzt nach 2 Jahren: wie stark denn?
Soweit ich mich erinnere, seine SSD hatte vor ~halben Jahr nach ~11000 Stunden noch keine 90TBW und 98% rest-life Anzeige.
@geohei wenn Du jetzt ~13000 Stunden, ~110 TBW und ~97%(?) hast (meine grobe Schätzung) - dann würde ich mir keine Sorgen machen. Deine SSD war damals zu ca. 75% belegt ... dann achte einfach, dass sie weiterhin unter 85% bleibt (notfalls mal 90% für kurze Zeit). Normalerweise ist kein zusätzliches OP notwendig und ich empfehle bei solch guten TLC+DRAM-SSDs mindestens ~7% frei zu lassen, aber Deine ist schon überdurchschnittlich belastet (aber immer noch bei weitem nichts Wildes) - bist halt ein Poweruser - es sollte aber locker noch 5x mehr sein, bevor man über zusätzliches OP nachdenkt. (warum "zusätzlich"? - weil eine OS-SSD dann immer noch nicht vollgemacht werden soll, z.B. 10% OP und IMMER NOCH gut 10+% im weiteren Betrieb frei lassen!)
 
Auslöser des Posts war ein Fehler von Macrium Reflect (MR). Ich habe ein Image Backup der ganzen SSD gemacht. Bei der Windows 10 C: Partition (viel benutzt) und bei einer Ubuntu Partition (sehr wenig benutzt) kamen folgende Fehler:
WARNING: 5 Clusters located in bad sectors. Data may be lost" // Windows 10, C:
WARNING: 17 Clusters located in bad sectors. Data may be lost" // ubuntu
Bei diesem Fehler war mir auch nicht klar, ob ich jetzt Daten verloren habe oder nicht. Ich nehme an MR liest nur die Sektoren die vom FS benutzt werden (Intelligent Image Backup). Also sollten Daten futsch sein. Der MR Fehler 23 kam allerdings nicht (fatal). Ganz klar ist das Ganze nicht.
Vom MR Blog : Techie Tuesday: Imaging Disks With Bad Sectors

Hier die CrystalDiskInfo Daten:
Code:
----------------------------------------------------------------------------
 (01) Samsung SSD 970 EVO Plus 2TB
----------------------------------------------------------------------------
           Model : Samsung SSD 970 EVO Plus 2TB
        Firmware : 2B2QEXM7
   Serial Number : ***************
       Disk Size : 2000,3 GB
       Interface : NVM Express
        Standard : NVM Express 1.3
   Transfer Mode : PCIe 3.0 x4 | PCIe 3.0 x4
  Power On Hours : 13216 hours
  Power On Count : 262 count
      Host Reads : 116312 GB
     Host Writes : 115775 GB
     Temperature : 55 C (131 F)
   Health Status : Good (97 %)
        Features : S.M.A.R.T., TRIM, VolatileWriteCache
    Drive Letter : C:

-- S.M.A.R.T. --------------------------------------------------------------
ID RawValues(6) Attribute Name
01 000000000000 Critical Warning
02 000000000148 Composite Temperature
03 000000000063 Available Spare
04 00000000000A Available Spare Threshold
05 000000000003 Percentage Used
06 00000E8A004E Data Units Read
07 00000E78CFE1 Data Units Written
08 00005B86D82C Host Read Commands
09 0000569B2CDB Host Write Commands
0A 0000000011F6 Controller Busy Time
0B 000000000106 Power Cycles
0C 0000000033A0 Power On Hours
0D 000000000060 Unsafe Shutdowns
0E 00000000007A Media and Data Integrity Errors
0F 000000001919 Number of Error Information Log Entries

Der OP Bereich einer SSD hat nichts mit deiner Nutzung oder Partitionen zu tun. Du siehst den Bereich (außerhalb des Magician) gar nicht und kannst ihn nicht partitionieren.
Soweit ich verstanden habe gibt es den OP Bereich des Herstellers der, wie du sagst, dem Benutzer verborgen bleibt. Danach kann der Benutzer aber sein eigenes OP hinzufügen, und zwar:
1. Hellblaue Partitionen - Benutzer kann/muss die Größe des OP angeben. Kann auch 0% sein.
2. Dunkelblaur Bereich - "unallocated" wird immer als OP benutzt, zusätzlich zum Hersteller definierten (nicht sichtbaren) Bereich.
Ist das korrekt?

Wenn diese Theorie stimmt, dann verlängert der OP die Lebensdauer da der Controller mittels wear leveling logic die Benutzung verteilen kann, und somit die Blöcke/Sektoren gleichmässig benutzt.

... - dann würde ich mir keine Sorgen machen.
Mein MR Fehler oben macht mir aber Sorgen ... :(
 
Wenn man ein harter "Vielschreiber" ist wählt man eben seine SSD entsprechend - nicht als günstige EVO version sondern Modelle mit entweder mehr TBW oder gleich profesionelle Laufwerke mit nahezu unzerstörbarem MLC-NAND - das ist dann eben nicht mehr der Grabbeltischpreis.

Aber bei Mengen die hier genannt werden... 115TB nach 13000 Stunden, also rund 8GB pro Stunde an Schreibleistung?
Eine Samsung-TLC-SSD wie ne 970EVO schafft mindestens 2000 Schreibzyklen, auch wenn die garantierte TBW geringer angegeben wird. Eine 2TB-SSD erträgt sofern man sie nicht press voll schreibt und der Controller auch mal Daten aus wearlevelling-Gründen verschieben kann also mindestens 4000 TB.

Bei 8GB/h sind das angenommene Nutzung von 12h am Tag über 100 Jahre rechnerische Lebenszeit! Bevor deine SSD wegen zu viel Schreiben verschlissen ist wird sie an was anderem sterben oder ersetzt werden weil sie zu langsam oder klein ist.

Auslöser des Posts war ein Fehler von Macrium Reflect (MR)
Ich habe keine Ahnung was das Programm macht oder mit seiner Fehlermeldung meint. Aber wenn mans schon "Bad Sectors" meint glaube ich kaum dass das was mit Ersatzzellen einer SSD zu tun hat, denn der Begriff stammt aus Festplattenzeiten... ;-)

Danach kann der Benutzer aber sein eigenes OP hinzufügen, und zwar:
1. Hellblaue Partitionen - Benutzer kann/muss die Größe des OP angeben.
2. Dunkelblaur Bereich - "unallocated" wird immer als OP benutzt, zusätzlich zum Hersteller definierten (nicht sichtbaren) Bereich.
Ist das korrekt?
Die einzige Möglichkeit wie ein Nutzer OP hinzufügen kann ist, über ein Herstellertool den Bereich zu vergrößern und dadurch die nutzbare/angezeigte Kapazität der SSD zu verkleinern. Nochmal: Mit Partitionen usw. hat all das NICHTS zu tun und SSDs benutzen auch NICHT unpartitionierte Bereiche oder leeren Speicher als OP. Das war vor 20 Jahren in den Anfangszeiten noch so als es keine hardwarereservierten OP-Bereiche gab, aber bei modernen SSDs hat es absolut keinen Sinn, Speicher nicht zu partitionieren.

Was korrekt ist ist, dass man SSDs nicht ganz vollschreiben sollte - aber NICHT, weil da irgendwas als Ersatz, OP oder sonstwas benutzt wird sondern weil die SSD langsamer beim Schreiben größerere Mengen wird weil sie erstens weniger Spielraum fürs "organisieren" hat (praktisch nur relevant für DRAM-lose SSDs) und zweitens keinen Platz mehr für PseudoSLC-Caches hat.

dann verlängert der OP die Lebensdauer
Nein. OP verlängert nur die Lebensdauer bei SSDs die EXTREM viel schreiben müssen. Wir reden von Größenordnung Terabytes am Tag (daher kommt der DWPD-Wert...). Da bist du meilenweit von entfernt.
99,999% aller SSDs sterben NICHT weil sie zu viel schreiben mussten sondern aus anderen Gründen.
da der Controller mittels wear leveling logic die Benutzung verteilen kann
Das ist unabhängig vom OP - wearlevelling passiert selbstverständlich im gesamten Speicherbereich, alles andere hätte ja gar keinen Sinn. ;-)
 
Zuletzt bearbeitet:
Mein MR Fehler oben macht mir aber Sorgen ... :(
Dann schau Dir Deine SMART-Werte genauer an und Du wirst sehen, dass die ganze Diskussion über Langlebigkeit und Ausdauer überflüssig ist ... Du hast also:
- Parameter 0E bei 0x7A = 122 Media and Data Integrity Errors. Kritischer Parameter (abgesehen natürlich von 01 und 03) und jeder Wert ungleich Null -> alle roten Flaggen hoch! (der 0F kann hingegen ruhig in Tausende steigen - das hat nicht unbedingt gleich was Schlimmes zu bedeuten). Das können die 22 BAD-Blocks mit 122 Fehlern drin sein, jedoch auch möglich, dass es nur die "Spitze des Eisbergs" ist - ein vollständiger Scan ist dringend nötig.
- Parameter 03 mit dem Wert 0x63 = 99% Available Spare <- das siehst Du doch gleich, dass 1% der Reserveblocks bereits verwendet worden sind. Sollte idealerweise bei 0x64/100% liegen. Manchmal kann man mehrere Petabytes darauf schreiben und manchmal hat man einfach früher Pech als erhofft. Jedenfalls würde jetzt ein Einrichten von OP Dir nichts mehr bringen, denn dadurch wird die SSD nicht plötzlich mehr Blocks in dem Reserve-Pool haben.

Am besten die OS wegklonen und idealerweise nicht von dem Klon booten, sondern eine weitere SSD mit Windows drauf in der Hinterhand haben. Dann Samsung Magician benutzen:
1744859691067.png

Und danach die SMART-Werte aus dem Programm Deiner Wahl screenshot-en und nochmal posten.
 
Ergänzend zum Post von @massaker :

Media and Data Integrity Errors: Contains the number of occurrences where the controller detected an unrecovered data integrity error. Errors such as uncorrectable ECC, CRC checksum failure, or LBA tag mismatch are included in this field.

Bad sectors sollten in diesem Wert nicht enthalten sein, die haben eigene SMART Attribute (C5 und C6)
 
Bad sectors sollten in diesem Wert nicht enthalten sein
Die Bad BLOCKS sieht man in den standardisierten NVME-Smart-Werten nicht mehr, deswegen schrieb ich ja:
Das können die 22 BAD-Blocks mit 122 Fehlern drin sein
Aber Anzahl der nicht korrigierbaren Fehler und %% der restlichen Reserveblocks ist schon ausreichend um rechtzeitig alarmiert werden.
die haben eigene SMART Attribute (C5 und C6)
Nein, HATTEN sie mal - bei HDDs. Die Attribute, zumindest den C5 haben einige SATA-SSDs noch drin, z.B. SATA-SSDs von Crucial. Bei Samsung sind es schon andere - B7 (und B3 für benutzte Reserveblöcke). Nochmal: solche Attribute (C5 und C6) hat der standardisierte NVME-SMART nicht mehr!
 
Sorry für die späte Antwort.
Zeitlich war hier Land unter die letzten Tage ...
Wenn man ein harter "Vielschreiber" ist wählt man eben seine SSD entsprechend - nicht als günstige EVO version sondern Modelle mit entweder mehr TBW oder gleich profesionelle Laufwerke mit nahezu unzerstörbarem MLC-NAND
Ok, die nächsten SSDs werden welche mit MLC-NAND wenn viel benutzt.
Auch klar jetzt, dass ich noch weit vom EOL der SSD entfernt bin.
Umso mehr stelle ich mir aber dann die Frage, wieso es zu diesen Fehlern kommen konnte. Macrium Refelct (MR) macht Backups - bei laufenden OS oder mittels Windows PE.
WARNING: 5 Clusters located in bad sectors. Data may be lost" // Windows 10, C:
WARNING: 17 Clusters located in bad sectors. Data may be lost" // ubuntu
Aber wenn mans schon "Bad Sectors" meint glaube ich kaum dass das was mit Ersatzzellen einer SSD zu tun hat, denn der Begriff stammt aus Festplattenzeiten... ;-)
"Bad sectors" ist in der Tat nicht eindeutig.
"Clusters" ebenfalls ...
Was korrekt ist ist, dass man SSDs nicht ganz vollschreiben sollte - aber NICHT, weil da irgendwas als Ersatz, OP oder sonstwas benutzt wird sondern weil die SSD langsamer beim Schreiben größerere Mengen wird weil sie erstens weniger Spielraum fürs "organisieren" hat (praktisch nur relevant für DRAM-lose SSDs) und zweitens keinen Platz mehr für PseudoSLC-Caches hat.
Wenn man beispielsweise 10% der gesamten user capacity frei läßt (= nicht partitioniert), dann wird man ja quasi somit gezwungen nicht die gesamte Kapazität zu nutzen, was Deinem "nicht ganz vollschreiben" ja entspricht.
- Parameter 0E bei 0x7A = 122 Media and Data Integrity Errors.
Wie entsteht dieser SMART Wert?
Wurde versucht zu lesen und es konnte nicht gelesen werden?
- CRC konnte Fehler korrigieren - kein Datenverlust - Reserveblock wurde aktiviert?
- CRC konnte Fehler nicht korrigieren - Datenverlust?
Passierte der Fehler beim Schreiben (AFAIK findet bei Schreiben keine Prüfung statt)?
- Parameter 03 mit dem Wert 0x63 = 99% Available Spare ... Jedenfalls würde jetzt ein Einrichten von OP Dir nichts mehr bringen, denn dadurch wird die SSD nicht plötzlich mehr Blocks in dem Reserve-Pool haben.
Würde OP nicht die Wahrscheinlichkeit weiterer 0x7A Fehler reduzieren?
Und danach die SMART-Werte aus dem Programm Deiner Wahl screenshot-en und nochmal posten.
Die SMART Werte #4 waren bereits die nach einem "Full Scan" mit Magician.
Media and Data Integrity Errors: Contains the number of occurrences where the controller detected an unrecovered data integrity error.
Wenn das beim Lesen passierte bedeutet das wohl Datenverlust!
Auf der anderen Seite zeigt Magician einen blauen Kreis = GOOD an.
Kein einziger Status der gazen Liste ist nicht blau (= GOOD).
Es sollte seitens des Controllers/Firmware doch möglich sein eine klare Aussage zu machen ob es möglicherweise(!) zu Datenverlust kam oder nicht.
Bad sectors sollten in diesem Wert nicht enthalten sein, die haben eigene SMART Attribute (C5 und C6)
Weder DiskCrystalInfo noch Magician zeigen Tag C5/C6 an.
Aber das mat @massaker ja bereits geklärt.
Aber Anzahl der nicht korrigierbaren Fehler und %% der restlichen Reserveblocks ist schon ausreichend um rechtzeitig alarmiert werden.
Also SMART Tags 0E und 05 als relevant betrachten.
Einerseits wurde hier geschrieben, dass besagte SSD noch lange nicht am Limit ist - andererseits ist von "unrecovered data integrity error" die Rede.

Zusammenfassend ...

Was gesagt wurde:
- OP spielt im Zusammenhang der MR Fehler und SMART Tags 0E & 05 keine Rolle.

Was an Fragen bleibt:
- Sind jetzt Daten verloren gegangen - ja, nein, vielleicht?
- Wenn Daten kaputt sind, warum zeigt Magician dann, dass alles "GOOD" ist?
 
Zuletzt bearbeitet:
Zurück