Nach dem Corsair MP700 PCIe 5.0 NVMe SSD-Test unter Linux, bei dem viele Leser von Dateisystemfehlern überrascht waren, wenn sie keine zusätzliche Kühlung wie den passiven M.2-Kühlkörper des Motherboards hinzufügten, und selbst neugierig auf die Situation waren, finden Sie hier weitere Tests, die letztendlich zeigen, wie das funktioniert Das Laufwerk erkennt Dateisystemfehler zuverlässig in höchstens drei Minuten ohne zusätzliche Kühlung.
Nachdem ich die grundlegenden Linux-Tests für die Corsair MP700 2 TB abgeschlossen hatte, führte ich einige weitere Tests durch, um mir die Dateisystemfehler beim Betrieb ohne zusätzliche Kühlung anzusehen. Denn normalerweise würde man davon ausgehen, dass das NVMe-Solid-State-Laufwerk bei übermäßiger Hitze gedrosselt wird, bevor es zu Dateisystemfehlern kommt.
Wie im Testbericht erwähnt, traten bei der Installation von Tests nach einer Neuinstallation von Ubuntu 23.04 einfach Dateisystemfehler auf, ohne dass ich das NVMe-Laufwerk wirklich belasten konnte mit Benchmarks. Daher war ich ziemlich gespannt, wie lange das Laufwerk den Festplatten-Benchmarking-Belastungen standhalten würde, wenn es ohne nachträgliche Kühlung betrieben würde. Um es kurz zu machen: Es dauerte weniger als drei Minuten, bis es zuverlässig zu Fehlern kam.
Beim Remote-Erfassen der dmesg-Protokolle, normalerweise innerhalb von 180 Sekunden nach dem Booten, und beim einfachen Starten eines MariaDB-Servers und Ausführen von mysqlslap zum Ausführen des Datenbankservers, kam es zu Dateisystemfehlern. Bei mehrmaliger Wiederholung geschah dies immer innerhalb von drei Minuten und die über das NVMe HWMON sysfs gemeldete Temperatur des NVMe-Laufwerks lag immer bei etwa 87 Grad. Für das, was es wert ist, das Technische Daten des MP700 beschreiben einen Temperaturbereich von-40 °C bis 85 °C.
Aus den gesammelten Protokollen, zumindest unter Linux Es sieht so aus, als ob der NVMe-Controller ausfällt, was wiederum zu Fehlern im EXT4-Dateisystem führt. Beispiel:
[ 177.187278] nvme nvme0: Controller ist ausgefallen; wird zurückgesetzt: CSTS=0xffffffff, PCI_STATUS=0xffff
[ 177.187283] nvme nvme0: Ist auf Ihrem Gerät ein fehlerhafter Energiesparmodus aktiviert?
[ 177.187285] nvme nvme0: Versuchen Sie „nvme_core.default_ps_max_latency_us=0 pcie_aspm=off“ und melden Sie einen Fehler
[ 177.235051] nvme 0000:19:00.0: Der Energiestatus kann nicht von D3cold auf D0 geändert werden, auf das Gerät kann nicht zugegriffen werden
[ 177.235151] nvme nvme0: Gerät wird nach Reset-Fehler deaktiviert:-19
[ 177.251298] nvme0n1: Kapazitätsänderung von 3907029168 auf 0 erkannt
[ 177.251308] EXT4-fs-Warnung (Gerät nvme0n1p2): ext4_end_bio:343: E/A-Fehler 10 beim Schreiben in Inode 55194516 Startblock 125091905)
[ 177.251310] Puffer-E/A-Fehler auf Gerät nvme0n1p2, logischer Block 129128830
[ 177.251312] EXT4-fs-Warnung (Gerät nvme0n1p2): ext4_end _bio:343: E/A-Fehler 10 beim Schreiben in Inode 55193889, Startblock 273991222)
[ 177,251316] Puffer-E/A-Fehler auf Gerät nvme0n1p2, logischer Block 124816449
[ 177,251317] Puffer-E/A-Fehler auf Gerät nvme0n1p2, logischer Block 273 715766
[ 177.251322] EXT4-fs-Warnung (Gerät nvme0n1p2): ext4_end_bio:343: E/A-Fehler 10 beim Schreiben in Inode 29884642 Startblock 129404287)
[ 177.251327] EXT4-fs-Warnung (Gerät nvme0n1p2): ext4_ end_bio:343: E/A-Fehler 10 beim Schreiben in Inode 55194516, Startblock 125091902)
[ 177.251327] EXT4-fs-Warnung (Gerät nvme0n1p2): ext4_end_bio:343: E/A-Fehler 10 beim Schreiben in Inode 29884642, Startblock 129404288)
[ 1 77.251329 ] Puffer-E/A-Fehler auf Gerät nvme0n1p2, logischer Block 124816446
[ 177.251331] EXT4-fs-Warnung (Gerät nvme0n1p2): ext4_end_bio:343: E/A-Fehler 10 beim Schreiben in Inode 30164735 Startblock 129396193)
[ 17 7.251331 ] EXT4-fs-Warnung (Gerät nvme0n1p2): ext4_end_bio:343: E/A-Fehler 10 beim Schreiben in Inode 55194516 Startblock 125091875)
[ 177.251332] Puffer-E/A-Fehler auf Gerät nvme0n1p2, logischer Block 129120737
[ 17 7.251333 ] Puffer-E/A-Fehler auf Gerät nvme0n1p2, logischer Block 124816419
[ 177.251334] EXT4-fs-Warnung (Gerät nvme0n1p2): ext4_end_bio:343: E/A-Fehler 10 beim Schreiben in Inode 55194516 Startblock 125091852)
[ 17 7.251336 ] Puffer-E/A-Fehler auf Gerät nvme0n1p2, logischer Block 124816396
[ 177.251336] EXT4-fs-Warnung (Gerät nvme0n1p2): ext4_end_bio:343: E/A-Fehler 10 beim Schreiben in Inode 30164735 Startblock 129396194)
[ 17 7.251338 ] EXT4-fs-Warnung (Gerät nvme0n1p2): ext4_end_bio:343: E/A-Fehler 10 beim Schreiben in Inode 55194516 Startblock 125091849)
[ 177.251339] Puffer-E/A-Fehler auf Gerät nvme0n1p2, logischer Block 124816393
[ 17 7.251341 ] Puffer-E/A-Fehler auf Gerät nvme0n1p2, logischer Block 124816371
[ 177,251343] Puffer-E/A-Fehler auf Gerät nvme0n1p2, logischer Block 124816353
[ 177,251345] Abbruch des Journals auf Gerät nvme0n1p2-8.
[ 177.251353] EXT4-fs-Fehler (Gerät nvme0n1p2) in ext4_reserve_inode_write:5906: Journal wurde abgebrochen
[ 177.251358] EXT4-fs-Fehler (Gerät nvme0n1p2): ext4_journal_check_start:83: comm kworker/u64:9: Detect ed abgebrochen Journal
[ 177.251359] Puffer-E/A-Fehler auf dem Gerät nvme0n1p2, logischer Block 220726066, asynchrones Schreiben der Seite verloren
[ 177.251360] Puffer-E/A-Fehler auf dem Gerät nvme0n1p2, logischer Block 243826688, synchrones Schreiben der Seite verloren
[ 177.251362] EXT4-fs-Fehler (Gerät nvme0n1p2): ext4_dirty_inode:6110: inode #55194516: comm systemd-journal: mark_inode_dirty error
[ 177.251365] Puffer-E/A-Fehler auf dem Gerät nvme0n1p2, logischer Block 1211 47223, asynchroner Seitenschreibvorgang verloren
[ 177.251366] JBD2: E/A-Fehler beim Aktualisieren des Journal-Superblocks für nvme0n1p2-8.
[ 177.251367] EXT4-fs-Fehler (Gerät nvme0n1p2) in ext4_dirty_inode:6111: Journal wurde abgebrochen
[ 177.251369] Puffer-E/A-Fehler auf Gerät nvme0n1p2, logischer Block 121141967, asynchrones Schreiben der Seite verloren
[ 177.2 51372 ] Puffer-E/A-Fehler auf Gerät nvme0n1p2, logischer Block 121110852, asynchrones Schreiben der Seite verloren
[ 177.251373] EXT4-fs-Fehler (Gerät nvme0n1p2) in ext4_reserve_inode_write:5906: Journal wurde abgebrochen
[ 177.251375] Puffer-E/A Fehler bei dev nvme0n1p2, logischer Block 121110544, Lost Async Page Schreiben
[177.251376] EXT4-FS-Fehler (Gerät NVME0N1P2): ext4_dirty_inode: 6110: Inode #55193889: mar 177.251376] EXT4-fs-Fehler (Gerät nvme0n1p2): ext4_journal_check_start:83: comm mariadbd: Abgebrochenes Journal erkannt
[ 177.251377] Puffer-E/A-Fehler auf Gerät nvme0n1p2, logischer Block 121110529, asynchrones Schreiben der Seite verloren
[ 177.251378] Puffer-E/A-Fehler auf dem Gerät nvme0n1p2, logischer Block 0, synchrones Seitenschreiben verloren
[ 177.251379] Puffer-E/A-Fehler auf dem Gerät nvme0n1p2, logischer Block 120587356, asynchrones Seitenschreiben verloren
[ 177.251381] Puffer-E/A Fehler auf Entwickler nvme0n1p2, logischer Block 58, asynchrones Schreiben der Seite verloren
[ 177.251384] EXT4-fs-Fehler (Gerät nvme0n1p2) in ext4_dirty_inode:6111: Journal wurde abgebrochen
[ 177.251386] EXT4-fs (nvme0n1p2): vorheriges I/O-Fehler beim Superblock erkannt
[ 177.251386] EXT4-fs-Fehler (Gerät nvme0n1p2): ext4_journal_check_start:83: comm systemd-journal: Abgebrochenes Journal erkannt
[ 177.251391] EXT4-fs-Fehler (Gerät nvme0n1p2): ext4_journal_check_start: 83: comm rs:main Q:Reg: Abgebrochenes Journal erkannt
[ 177.251399] EXT4-fs (nvme0n1p2): Vorheriger E/A-Fehler im Superblock erkannt
[ 177.251406] EXT4-fs (nvme0n1p2): E/A Fehler beim Schreiben des Superblocks
[ 177.251407] EXT4-fs (nvme0n1p2): Dateisystem wird erneut schreibgeschützt bereitgestellt
[ 177.251409] EXT4-fs (nvme0n1p2): Ungeschriebene Extents konnten nicht in geschriebene Extents konvertiert werden – möglicher Datenverlust! (Inode 29884642, Fehler-30)
[ 177.251413] EXT4-fs (nvme0n1p2): Konvertieren ungeschriebener Extents in geschriebene Extents fehlgeschlagen – potenzieller Datenverlust! (Inode 30164735, Fehler-30)
[ 177.251415] EXT4-fs (nvme0n1p2): E/A-Fehler beim Schreiben des Superblocks
[ 177.251415] EXT4-fs (nvme0n1p2): E/A-Fehler beim Schreiben des Superblocks
[ 177.251417] EXT4-fs (nvme0n1p2): Vorheriger E/A-Fehler im Superblock erkannt
[ 177.251420] EXT4-fs (nvme0n1p2): E/A-Fehler beim Schreiben des Superblocks
[ 186.476141] EXT4-fs-Fehler ( device nvme0n1p2): __ext4_find_entry:1663: inode #63307794: comm apport: reading directory lblock 0
[ 186.476151] buffer_io_error: 4 callbacks suppressed
[ 186.476152] Buffer I/O error on dev nvme0n1p2, logical block 0, lost Seite schreiben synchronisieren
[ 186.476154] EXT4-fs: 2 Rückrufe unterdrückt
[ 186.476154] EXT4-fs (nvme0n1p2): E/A-Fehler beim Schreiben des Superblocks
[ 186.476170] EXT4-fs-Fehler (Gerät nvme0n1p2): __ext4_find_entry:1663: inode #63307794: Comm Apport: Leseverzeichnis lblock 0
[ 186.476174] Puffer-E/A-Fehler auf dem Gerät nvme0n1p2, logischer Block 0, Synchronisierungsseitenschreibvorgang verloren
[ 186.476174] EXT4-fs (nvme0n1p2 ): E/A-Fehler beim Schreiben des Superblocks
[ 186.476184] EXT4-fs-Fehler (Gerät nvme0n1p2): __ext4_find_entry:1663: inode #63307794: Comm Apport: Leseverzeichnis lblock 0
[ 186.476187] Puffer-E/A-Fehler auf Entwickler nvme0n1p2, logischer Block 0, Synchronisierungsseitenschreibvorgang verloren
[ 186.476188] EXT4-fs (nvme0n1p2): E/A-Fehler beim Schreiben des Superblocks
[ 186.476197] EXT4-fs-Fehler (Gerät nvme0n1p2): __ext4_find_entry:1663: Inode #63307794: Kommunikationsapport: Verzeichnis lblock 0 lesen
[ 186.476199] Puffer-E/A-Fehler auf dem Gerät nvme0n1p2, logischer Block 0, Synchronisierungsseitenschreibvorgang verloren
[ 186.476200] EXT4-fs (nvme0n1p2): I/O-Fehler beim Schreiben des Superblocks
Das NVMe-Laufwerk war mit MariaDB-Aufgaben beschäftigt, daher hätte es nicht versuchen sollen, in einen Zustand mit niedriger Energieverwaltung zu wechseln – ohne thermische Drosselung… Das habe ich auch getan Probieren Sie die in der dmesg-Ausgabe empfohlenen Kerneloptionen „nvme_core.default_ps_max_latency_us=0 pcie_aspm=off“ aus. Aber letztendlich hat keine dieser Optionen zum Deaktivieren des PCI Express Active State Power Management (ASPM) oder zum Ändern der maximalen NVMe-Latenz geholfen.
[ 164.581235] nvme nvme0: Controller ist ausgefallen; wird zurückgesetzt: CSTS=0xffffffff, PCI_STATUS=0xffff
[ 164.581240] nvme nvme0: Ist auf Ihrem Gerät ein fehlerhafter Energiesparmodus aktiviert?
[ 164.581241] nvme nvme0: Versuchen Sie „nvme_core.default_ps_max_latency_us=0 pcie_aspm=off“ und melden Sie einen Fehler
[ 164.641482] nvme0n1: I/O Cmd(0x2) @ LBA 203495560, 32 Blöcke, I/O-Fehler (sct 0x3/sc 0x71)
[ 164.641490] E/A-Fehler, dev nvme0n1, Sektor 203495560 op 0x0:(READ) flags 0x80700 phys_seg 4 prior class 2
[ 164.669173] nvme 0000:19:00.0: Nicht möglich um den Energiestatus von D3cold auf D0 zu ändern, Gerät nicht zugänglich
[ 164.669278] nvme nvme0: Gerät wird nach Reset-Fehler deaktiviert:-19
[ 164.693186] E/A-Fehler, Entwickler nvme0n1, Sektor 3089104896 op 0x1:(WRITE) flags 0x0 phys_seg 1 prior class 2
[ 164.693195] EXT4-fs warning (device nvme0n1p2): ext4_end_bio:343: E/A-Fehler 10 beim Schreiben in Inode 55194123 Starting Block 386138112)
[ 164.693198] nvme0 n1: Kapazitätsänderung erkannt von 3907029168 auf 0
[ 164.693200] Puffer-E/A-Fehler auf Gerät nvme0n1p2, logischer Block 385862656
[ 164.693211] EXT4-fs-Warnung (Gerät nvme0n1p2): ext4_end_bio:343: E/A-Fehler 10 beim Schreiben in den Inode 55194123 Startblock 129390649)
[ 164.693213] Puffer-E/A-Fehler auf Gerät nvme0n1p2, logischer Block 129115193
[ 164.693213] EXT4-fs-Warnung (Gerät nvme0n1p2): ext4_end_bio:343: E/A-Fehler 10 beim Schreiben in Inode 2 9884650 Startblock 273996343)
[ 164.693215] Puffer-E/A-Fehler auf Gerät nvme0n1p2, logischer Block 129115194
[ 164.693217] Puffer-E/A-Fehler auf Gerät nvme0n1p2, logischer Block 129115195
[ 164.693219 ] Puffer-E/A Fehler auf Gerät nvme0n1p2, logischer Block 129115196
[ 164.693220] EXT4-fs-Warnung (Gerät nvme0n1p2): ext4_end_bio:343: E/A-Fehler 10 beim Schreiben in Inode 55194123 Startblock 129390653)
[ 164.69322 4] EXT4-fs-Warnung (Gerät nvme0n1p2): ext4_end_bio:343: E/A-Fehler 10 beim Schreiben in Inode 55194123 Startblock 129390637)
[ 164.693226] Puffer-E/A-Fehler auf Gerät nvme0n1p2, logischer Block 129115181
[ 164.693228] EXT4-fs-Warnung (Gerät nvme0n1p2): ext4_end_bio:343: E/A-Fehler 10 beim Schreiben in Inode 55194123 Startblock 129390598)
[ 164.693229] Puffer-E/A-Fehler auf Gerät nvme0n1p2, logischer Block 129115142
[ 164.693231] Puffer-E/A Fehler auf Gerät nvme0n1p2, logischer Block 129115143
[ 164.693232] EXT4-fs-Warnung (Gerät nvme0n1p2): ext4_end_bio:343: E/A-Fehler 10 beim Schreiben in Inode 55194123 Startblock 129390595)
[ 164.69323 4] Puffer-E/A Fehler auf Gerät nvme0n1p2, logischer Block 129115139
[ 164.693235] EXT4-fs-Warnung (Gerät nvme0n1p2): ext4_end_bio:343: E/A-Fehler 10 beim Schreiben in Inode 55194123 Startblock 129390578)
[ 164.69323 6] Puffer-E/A Fehler auf Gerät nvme0n1p2, logischer Block 129115122
[ 164.693238] EXT4-fs-Warnung (Gerät nvme0n1p2): ext4_end_bio:343: E/A-Fehler 10 beim Schreiben in Inode 55194123 Startblock 129390566)
[ 164.69324 0] EXT4-fs-Warnung (Gerät nvme0n1p2): ext4_end_bio:343: E/A-Fehler 10 beim Schreiben in Inode 55194123, Startblock 129390563)
[ 164,693278] Puffer-E/A-Fehler auf dem Gerät nvme0n1p2, logischer Block 120619365, asynchrones Schreiben der Seite verloren
[ 164. 693285 ] Puffer-E/A-Fehler auf Gerät nvme0n1p2, logischer Block 127926285, asynchrones Seitenschreiben verloren
[ 164,693293] Puffer-E/A-Fehler auf Gerät nvme0n1p2, logischer Block 62, asynchrones Seitenschreiben verloren
[ 164,693302] EXT4-fs Fehler (Gerät nvme0n1p2): ext4_check_bdev_write_error:223: comm mariadbd: Fehler beim asynchronen Zurückschreiben von Metadaten
[ 164.693323] Journal wird auf Gerät nvme0n1p2-8 abgebrochen.
[ 164.693329] EXT4-fs-Fehler (Gerät nvme0n1p2) in ext4_dirty_inode:6111: E/A-Fehler
[ 164.693329] Puffer-E/A-Fehler auf Gerät nvme0n1p2, logischer Block 243826688, verlorenes Schreiben der Synchronisierungsseite
[ 164.693 334] JBD2: E/A-Fehler beim Aktualisieren des Journal-Superblocks für nvme0n1p2-8.
[ 164.693334] Puffer-E/A-Fehler auf dem Gerät nvme0n1p2, logischer Block 0, Schreiben der Synchronisierungsseite verloren
[ 164.693336] EXT4-fs (nvme0n1p2): E/A-Fehler beim Schreiben des Superblocks
[ 164.693340] Puffer E/A-Fehler auf Gerät nvme0n1p2, logischer Block 0, Synchronisierungsseitenschreibvorgang verloren
[ 164.693341] EXT4-fs (nvme0n1p2): E/A-Fehler beim Schreiben des Superblocks
[ 164.693353] EXT4-fs-Fehler (Gerät nvme0n1p2): ext4_journal_check_start:83: comm rs:main Q:Reg: Abgebrochenes Journal erkannt
[ 164.693364] Puffer-E/A-Fehler auf Entwickler nvme0n1p2, logischer Block 0, Synchronisierungsseitenschreibvorgang verloren
[ 164.693368] EXT4-fs (nvme0n1p2 )?-only
[ 164.693378] Puffer-E/A-Fehler auf Entwickler nvme0n1p2, logischer Block 0, verlorenes Schreiben der Synchronisierungsseite
[ 164.693380] EXT4-fs (nvme0n1p2): E/A-Fehler beim Schreiben des Superblocks
[ 164.693455 ] EXT4-fs (nvme0n1p2): ext4_do_writepages: jbd2_start: 13262 Seiten, ino 55194123; err-30
[ 164.727715] Prozess 10715(apport) hat RLIMIT_CORE auf 1 gesetzt
[ 164.727716] Kern wird abgebrochen
[ 164.915069] Prozess 10732(apport) hat RLIMIT_CORE auf 1 gesetzt
[ 164.915071] Abbruch core
[ 164.947259] Prozess 10736(apport) hat RLIMIT_CORE auf 1 gesetzt
[ 164.947261] Kern wird abgebrochen
[ 164.981899] Prozess 10747(apport) hat RLIMIT_CORE auf 1 gesetzt
Ich habe Dieses Verhalten habe ich bei der Inland TD510 PCIe 5.0 NVMe SSD überhaupt nicht gesehen, aber auch dieses Laufwerk ist standardmäßig mit einem aktiven Kühlkörper ausgestattet.
Nachdem ich die EXT4-Dateisystemfehler korrigiert und einen passiven NVMe-Kühlkörper an den MP700 angeschlossen hatte, habe ich 24 Stunden lang anspruchsvolle I/O-Benchmarks mit MariaDB, PostgreSQL, FIO, ClickHouse und anderen Workloads durchgeführt und es lief ohne Probleme… Immer noch recht warm bis in die niedrigen bis mittleren 80er-Jahre, aber nie irgendwelche Dateisystemfehler oder NVMe-Controller-Berichte im Kernel-Protokoll. Es wird jedoch interessant sein zu sehen, ob dieses Verhalten auch unter Windows auftritt oder ob ein Unterschied im NVMe-Treiber die Situation beeinflusst.
Auf jeden Fall würde ich jedoch empfehlen, mit dem Upgrade auf PCIe 5.0 NVMe-Consumer-Speicher zu warten, bis attraktivere Optionen verfügbar sind, die schneller und zuverlässiger sind und die Preise beginnen, besser mit PCIe 4.0 zu konkurrieren Preise für NVMe-Laufwerke. Wenn Sie sich jedoch als Erstanwender jetzt für eine PCIe 5.0 NVMe SSD entscheiden, würde ich Ihnen empfehlen, wirklich sicherzustellen, dass Sie über eine ausreichende Kühlung verfügen.