A Corsair MP700 PCIe 5.0 NVMe SSD Linux alatti felülvizsgálatát követően sok olvasó meglepődött a fájlrendszeri hibákon, amikor nem adnak hozzá extra hűtést, például az alaplap passzív M.2-es hűtőbordáját, és kíváncsiak a helyzetre, íme további tesztek arról, hogyan A meghajtó hűtés nélkül három percen belül, vagy annál rövidebb idő alatt megbízhatóan észleli a fájlrendszer-hibákat.

Miután a Corsair MP700 2TB alapszintű Linux-tesztelést kihagytam, további tesztelést végeztem, hogy megvizsgáljam a fájlrendszer-hibákat, amikor hűtés nélkül fut. Mivel végül is általában azt feltételeznénk, hogy az NVMe szilárdtestalapú meghajtó túlmelegedés esetén lelassul, mielőtt egyenesen a fájlrendszeri hibákig érne.

Amint az áttekintésben említettük, egyszerűen a tesztek telepítésekor ütköztem fájlrendszeri hibákba az Ubuntu 23.04 tiszta telepítése után, és még az NVMe meghajtót sem tudtam ténylegesen igénybe venni. benchmarkokkal. Szóval nagyon kíváncsi voltam arra, hogy mennyi ideig bírja a meghajtó a lemez benchmarking munkaterhelése alatt, ha utólagos hűtés nélkül fut. Röviden, kevesebb, mint 3 perc telt el a tiszta rendszerindításig, mielőtt megbízhatóan hibát észleltek.

A dmesg naplók távolról történő gyűjtése, általában a rendszerindítást követő 180 másodpercen belül, és egyszerűen elindít egy MariaDB-kiszolgálót, és futtatja a mysqlslap-t az adatbázis-kiszolgáló használatához, fájlrendszeri hibák léphetnek fel. Ezt többször megismételve, ez mindig három percen belül megtörténik, és az NVMe HWMON sysfs-en keresztül jelentett NVMe meghajtó hőmérséklete mindig 87 fok körül volt. Amit megér, a MP700 műszaki adatai-40 °C és 85 °C közötti hőmérséklet-tartományt vázolnak fel.

Az összegyűjtött naplókból, legalábbis Linux alatt úgy tűnik, hogy az NVMe vezérlő leáll, ami viszont az EXT4 fájlrendszer hibáihoz vezet. Például:

[ 177.187278] nvme nvme0: a vezérlő nem működik; visszaáll: CSTS=0xffffffff, PCI_STATUS=0xffff
[ 177.187283] nvme nvme0: Az eszközén engedélyezve van a hibás energiatakarékos mód?
[ 177.187285] nvme nvme0: Próbáld ki az”nvme_core.default_ps_max_latency_us=0 pcie_aspm=off”parancsot, és jelents egy hibát
[ 177.235051] nvme 0000:19:00 [ 177.235151] nvme nvme0: Eszköz letiltása alaphelyzetbe állítási hiba után:-19
[ 177.251298] nvme0n1: kapacitás változást észlelt 3907029168-ról 0-ra
[ 177.251308] ex01308] ex01308] figyelmeztetés end_bio:343: 10. I/O hiba írás az 55194516 inode kezdőblokkjába, 125091905)
[ 177.251310] Puffer I/O hiba az nvme0n1p2 eszközön, 129128830 logikai blokk
[ 177.251312] figyelmeztetés EX0Tvicents2. end_bio:343: 10. I/O hiba írás az 55193889 inode kezdőblokkba 273991222)
[ 177.251316] Puffer I/O hiba az nvme0n1p2 eszközön, 124816449 logikai blokk
[ 177.2513889 blokk 173991222 Buffern2p,7 715766
[ 177.251322] EXT4-fs figyelmeztetés (eszköz nvme0n1p2): ext4_end_bio:343: 10. I/O hiba a 29884642 kezdőblokk 129404287 kezdőblokkjába írva 4_end_bio:343: 10. I/O hiba írás az 55194516 inode kezdőblokkba 125091902)
[ 177.251327] EXT4-fs figyelmeztetés (eszköz nvme0n1p2): ext4_end_bio:343: I/O hiba 10 írás az 55194516 kezdőblokkba <846428) 177.251329 ] Puffer I/O hiba az nvme0n1p2 eszközön, logikai blokk 124816446
[ 177.251331] EXT4-fs figyelmeztetés (eszköz nvme0n1p2): ext4_end_bio:343: I/O hiba 10 írás a 6. inode 1330 kezdőpontja: 13319396 77.251331 ] EXT4-fs figyelmeztetés (eszköz nvme0n1p2): ext4_end_bio:343: I/O hiba 10 írás az 55194516 inode kezdőblokkba 125091875)
[ 177.251332] Puffer I/O hiba az eszközön <1p2br17 blokk0 nv2br17 77.251333 ] puffer io hiba az nvme0n1p2 eszközön, logikai blokk 124816419
[ 177.251334] EXT4-fs figyelmeztetés (eszköz nvme0n1p2): ext4_end_bio:343: 10. I/O hiba, 10-es I/O hiba írás a 8-as inode-ba [5216]99. 77.251336 ] Puffer I/O hiba az nvme0n1p2 eszközön, logikai blokk 124816396
[ 177.251336] EXT4-fs figyelmeztetés (eszköz nvme0n1p2): ext4_end_bio:343: I/O hiba 10 írás a 6. inode 1913-as kezdőpontja: 134319396 77.251338 ] EXT4-fs figyelmeztetés (eszköz nvme0n1p2): ext4_end_bio:343: I/O hiba 10 írás az 55194516 inode kezdőblokkba 125091849)
[ 177.251339] Puffer I/O hiba az eszközön [ 177.251343] Puffer I/O hiba az nvme0n1p2 eszközön, 124816353 logikai blokk
[ 177.2516353.
[ 177.251353] EXT4-fs hiba (eszköz nvme0n1p2) az ext4_reserve_inode_write:5906-ban: A napló megszakadt
[ 177.251358] EXT4-fs hiba (eszköz nvme0n4ckjournal: ex_reserve_inode_write:5906) 64:9: Az észlelés megszakítva napló
[ 177.251359] Puffer I/O hiba a fejlesztőn nvme0n1p2, logikai blokk 220726066, elveszett az aszinkron oldal írása
[ 177.251360] Puffer I/O hiba a fejlesztőnél nvme0n1p2, logikai blokk elveszett 628 oldal, 82 logikai blokk 628 oldal [ 177.251362] EXT4-fs hiba (eszköz nvme0n1p2): ext4_dirty_inode:6110: inode #55194516: comm systemd-journal: mark_inode_dirty error
[ 177.25136] hiba a buffer13p1, log0 blokkban 21147223, elveszett az aszinkron oldal írása
[ 177.251366] JBD2: I/O hiba az nvme0n1p2-8 napló szuperblokkjának frissítésekor.
[ 177.251367] EXT4-fs hiba (eszköz nvme0n1p2) az ext4_dirty_inode:6111-ben: A napló megszakadt
[ 177.251369] Puffer I/O hiba a fejlesztőn nvme0n1p2, írási 1 logikai blokk77[br>7. blokk17. 251372 ] Puffer I/O hiba a dev nvme0n1p2-en, logikai blokk 121110852, elveszett async oldal írás
[177.251373] ext4-fs hiba (NVME0N1P2 eszköz) ext4_reserve_inode_write: 5906: Journal Aborted
[177.251375] Buffer I/Write: hiba a fejlesztőn nvme0n1p2, logikai blokk 121110544, elveszett az aszinkron oldal írása
[ 177.251376] EXT4-fs hiba (eszköz nvme0n1p2): ext4_dirty_inode:6110: inode #55119309:dirty_err8m:dmainirty br> [ 177.251376] EXT4-fs hiba (eszköz nvme0n1p2): ext4_journal_check_start:83: comm mariadbd: Megszakított napló észlelve
[ 177.251377] Puffer I/O hiba a fejlesztőn br> [ 177.251378] Puffer I/O hiba a fejlesztőn nvme0n1p2, logikai blokk 0, szinkronizálási oldal írása megszakadt
[ 177.251379] Puffer I/O hiba a dev nvme0n1p2 logikai blokkban 120587356, elveszett aszinkron oldal írása
[ 177.1.] I3/O puffer]251 hiba a fejlesztőn nvme0n1p2, 58-as logikai blokk, elveszett az aszinkron oldal írása
[ 177.251384] EXT4-fs hiba (eszköz nvme0n1p2) az ext4_dirty_inode:6111-ben: A napló megszakadt
[ 177.25]s1p2nT486]s1./O hiba észlelve a szuperblokknál
[ 177.251386] EXT4-fs hiba (eszköz nvme0n1p2): ext4_journal_check_start:83: comm systemd-journal: Megszakított napló észlelve
[ 177.251391] ex0devicenfjon: ex01391. urnal_check_start: 83: comm rs:main Q:Reg: Megszakított napló észlelése
[ 177.251399] EXT4-fs (nvme0n1p2): előző I/O hiba észlelve a szuperblokknál
[ 177.251406] EXT4-fs (nvme0n1p2): I/O hiba a szuperblokk írása közben [ 177.251407] EXT4-fs (nvme0n1p2): Csak olvasható fájlrendszer újracsatolása
[ 177.251409] EXT4-fs (nvme0n1p2): nem sikerült az íratlan kiterjedéseket írott kiterjedésekké konvertálni–lehetséges adatvesztés! (inode 29884642, hiba-30)
[ 177.251413] EXT4-fs (nvme0n1p2): nem sikerült az íratlan kiterjedéseket írott kiterjedésekké konvertálni–lehetséges adatvesztés! (inode 30164735, hiba-30)
[ 177.251415] EXT4-fs (nvme0n1p2): I/O hiba a szuperblokk írása közben
[ 177.251415] EXT4-fs (nvme0n1p2): szuper I/O-hiba
[ 177.251417] EXT4-fs (nvme0n1p2): előző I/O hiba észlelve a szuperblokknál
[ 177.251420] EXT4-fs (nvme0n1p2): I/O hiba szuperblokk írása közben
[ 186.251441] EXT (4761441) eszköz nvme0n1p2): __ext4_find_entry:1663: inode #63307794: comm apport: lblock 0 könyvtár olvasása
[ 186.476151] buffer_io_error: 4 visszahívás elnyomva
on I061dev5n error2.47618n Bufferme n1p2, logikai blokk 0, elveszett szinkronizálási oldal írása
[ 186.476154] EXT4-fs: 2 visszahívás letiltva
[ 186.476154] EXT4-fs (nvme0n1p2): I/O hiba szuperblokk írása közben
[ 186.476170] nvme error (vicen170]nvme: __ext4_find_entry:1663: inode #63307794: comm apport: lblock 0 könyvtár olvasása
[ 186.476174] Puffer I/O hiba a dev nvme0n1p2, logikai blokk 0, szinkronizálási oldal elveszett. 0n1p2 ): I/O hiba a szuperblokk írása közben
[ 186.476184] EXT4-fs hiba (eszköz nvme0n1p2): __ext4_find_entry:1663: inode #63307794: comm apport: lblock 6/7 könyvtár olvasása lblock 18
4. nvme0n1p2 fejlesztőn, 0. logikai blokk, elveszett szinkronizálási oldal írási
[ 186.476188] EXT4-fs (nvme0n1p2): I/O hiba a szuperblokk írása közben
[ 186.476197] EXT4-fs hiba (eszköz n36find_1pt4:6find_n_1pt4): inode #63307794: comm apport: lblock 0 könyvtár olvasása
[ 186.476199] Puffer I/O hiba a dev nvme0n1p2, logikai blokk 0, szinkronizálási oldal írása elveszett
[ 186.476200] (EXT4-0/1) Hiba történt a szuperblokk írása közben

Az NVMe meghajtó MariaDB-feladatokkal volt elfoglalva, ezért nem kellett volna alacsony energiagazdálkodási állapotba kerülnie – a hőszabályozás hiányában… Szóval én is megtettem próbálja ki a dmesg kimenetben ajánlott”nvme_core.default_ps_max_latency_us=0 pcie_aspm=off”kernelbeállításokat. de végül a PCI Express Active State Power Management (ASPM) letiltására vagy az NVMe maximális késleltetési idejének módosítására vonatkozó lehetőségek egyike sem segített.

quote>[ 164.581235] nvme nvme0: a vezérlő nem működik; visszaáll: CSTS=0xffffffff, PCI_STATUS=0xffff
[ 164.581240] nvme nvme0: Az eszközén engedélyezve van a hibás energiatakarékos mód?
[ 164.581241] nvme nvme0: Próbálja ki az”nvme_core.default_ps_max_latency_us=0 pcie_aspm=off”parancsot, és jelentse a hibát
[ 164.641482] nvme0n1: I/O I/O Cmd, 3/92 Err20,4 ror (sct 0x3/sc 0x71)
[ 164.641490] I/O hiba, dev nvme0n1, szektor 203495560 op 0x0:(READ) flags 0x80700 phys_seg 4 prio class 2
[601:01:0] 601:01643.0: Nem lehet a tápellátás állapotának módosítása D3cold-ról D0-ra, az eszköz nem elérhető
[ 164.669278] nvme nvme0: Eszköz letiltása visszaállítási hiba után:-19
[ 164.693186] I/O hiba, dev nvme0n1, szektor 308910481:(opWRITEx)9 flags 0x0 phys_seg 1 prio class 2
[ 164.693195] EXT4-fs figyelmeztetés (eszköz nvme0n1p2): ext4_end_bio:343: 10. I/O hiba írás az 55194123 inode-ba, kezdő blokk 3861) 93n 386161931. 0n1: kapacitásváltozás észlelése 3907029168-tól 0-ig
[ 164.693200] Puffer I/O hiba az nvme0n1p2 eszközön, logikai blokk 385862656
[ 164.693211] EXT4-fs figyelmeztetés (az eszköz nvme0t40 beírása: hiba nvme0t41p:2) de 55194123 kezdőblokk 129390649)
[ 164.693213] Puffer I/O hiba az nvme0n1p2 eszközön, logikai blokk 129115193
[ 164.693213] EXT4-fs figyelmeztetés (az eszköz nvme0o in3ode_3:0 írása: ex:O3ode_1p2): 29884650 kezdőblokk 273996343)
[ 164.693215] Puffer I/O hiba az nvme0n1p2 eszközön, logikai blokk 129115194
[ 164.693217] Puffer I/O hiba az eszközön nvme0n1p2, logical I/O error on device nvme0n1p2, logikai ] Puffer I/O hiba az nvme0n1p2 eszközön, logikai blokk 129115196
[ 164.693220] EXT4-fs figyelmeztetés (eszköz nvme0n1p2): ext4_end_bio:343: 10. I/O hiba írás az 55194123 inode 551941293 kezdőblokkba 10 24] EXT4-fs figyelmeztetés (eszköz nvme0n1p2): ext4_end_bio:343: I/O hiba 10 az 55194123 inode kezdő blokkba írásakor, 129390637)
[ 164.693226] Puffer I/O hiba az eszközön nvme0n1p2, logikai EXT4-fs figyelmeztetés (eszköz nvme0n1p2): ext4_end_bio:343: I/O hiba 10 az 55194123 inode kezdőblokkba való íráskor, 129390598)
[ 164.693229] Puffer I/O hiba az nvme0n1p2 eszközön, <211 blokk 14129316141. puffer io hiba az eszközön, nvme0n1p2, logikai 129115143
[ 164.693232] EXT4-fs figyelmeztetés (eszköz nvme0n1p2): ext4_end_bio:343: 10. I/O hiba írás az 551941293 inode 55195163 kezdőblokkba 10.9.9 34] Puffer I/O hiba az nvme0n1p2 eszközön, logikai blokk 129115139
[ 164.693235] EXT4-fs figyelmeztetés (eszköz nvme0n1p2): ext4_end_bio:343: 10. I/O hiba írás az 55194129 inode 551941213 kezdőblokkjába 10 36] Puffer I/O hiba az nvme0n1p2 eszközön, logikai blokk 129115122
[ 164.693238] EXT4-fs figyelmeztetés (eszköz nvme0n1p2): ext4_end_bio:343: 10. I/O hiba írás az 551941263 inode 551941263 kezdőblokkba 10.9.9 40] EXT4-fs figyelmeztetés (eszköz nvme0n1p2): ext4_end_bio:343: I/O hiba 10 írás az 55194123 inode kezdőblokkba 129390563)
[ 164.693278] Puffer I/O hiba a fejlesztőnél nvme0n1p2, logikai 6 oldal elveszett, 61 blokk 3.693285 ] Puffer I/O hiba a fejlesztőn nvme0n1p2, logikai blokk 127926285, elveszett az aszinkron oldal írása
[ 164.693293] Puffer I/O hiba a dev nvme0n1p2, 62. logikai blokk, elveszett aszinkron oldal írása
[ 9T344.s]6 hiba (eszköz nvme0n1p2): ext4_check_bdev_write_error:223: comm mariadbd: Hiba az aszinkron metaadatok visszaírása közben [ 164.693323] A napló megszakítása az nvme0n1p2-8 eszközön.
[ 164.693329] EXT4-fs hiba (eszköz nvme0n1p2) in ext4_dirty_inode:6111: IO hiba
[ 164.693329] Puffer I/O hiba a fejlesztőnél nvme0n1p2,
logikai blokk 9 628 oldal,
syn.2c18 page 628 3334] JBD2: I/O hiba az nvme0n1p2-8 napló szuperblokkjának frissítésekor.
[ 164.693334] Puffer I/O hiba az nvme0n1p2 fejlesztőn, 0 logikai blokk, elveszett szinkronizálási oldal írása
[ 164.693336] EXT4-fs (nvme0n1p2): I/O hiba a
6 szuperblokk írása közben [1640]993340. I/O hiba a fejlesztőn nvme0n1p2, 0. logikai blokk, elveszett szinkronizálási oldal írási
[ 164.693341] EXT4-fs (nvme0n1p2): I/O hiba a szuperblokk írása közben
[ 164.693353] EXT4-fsnvme)0n1p2: ext4_journal_check_start:83: comm rs:main Q:Reg: Megszakított napló észlelése
[ 164.693364] Puffer I/O hiba a dev nvme0n1p2 0 logikai blokknál, elveszett szinkronizálási oldal írása
[ 164.693p36f8]sn ): I/O hiba a szuperblokk írása közben
[ 164.693369] EXT4-fs hiba (eszköz nvme0n1p2): ext4_journal_check_start:83: comm mariadbd: Megszakított napló észlelve
[ 164.693370] fájlrendszer olvasása EXv2370]0.-only
[ 164.693378] Puffer I/O hiba a fejlesztőn nvme0n1p2, 0 logikai blokk, elveszett szinkronizálási oldal írási
[ 164.693380] EXT4-fs (nvme0n1p2): I/O hiba a szuperblokk írása közben
9 3 165 ] EXT4-fs (nvme0n1p2): ext4_do_writepages: jbd2_start: 13262 oldal, ino 55194123; hiba-30
[ 164.727715] Az 10715-ös folyamat (apport) RLIMIT_CORE értéke 1
[ 164.727716] A mag megszakítása
[ 164.915069] Az 10732(apport) folyamat
R1716.16. unalmas mag
[ 164.947259] Az 10736 (apport) folyamat RLIMIT_CORE értéke 1
[ 164.947261] A mag megszakítása
[ 164.981899] Az 10747 (apport) folyamat RLIMIT1_CORE-re van állítvaMiután kijavítottam az EXT4 fájlrendszer hibáit, és egy passzív NVMe hűtőbordát csatoltam az MP700-hoz, 24 órán át lefújtam az igényes I/O benchmarkokat a MariaDB, PostgreSQL, FIO, ClickHouse és más munkaterhelésekkel, és probléma nélkül futott…. Még mindig eléggé felmelegszik a 80-as évek mélypontjára és közepére, de soha semmilyen fájlrendszeri hiba vagy NVMe-vezérlő nem jelent a kernelnaplóban. Érdekes lesz látni, hogy ez a viselkedés Windows alatt is előfordul-e, vagy valamilyen NVMe illesztőprogram-különbség befolyásolja a helyzetet.

Mindenesetre azt javaslom, hogy várjon a PCIe 5.0 NVMe fogyasztói tárhelyre való frissítéssel, amíg nem lesz elérhető vonzóbb, gyorsabb és megbízhatóbb lehetőség, és az árak elkezdenek versenyezni a PCIe 4.0-val. NVMe meghajtó ára. Ha mostanában valamelyik PCIe 5.0 NVMe SSD-t választja, bár korai felhasználóként, azt javaslom, hogy valóban gondoskodjon a megfelelő hűtésről.

“Miután gondosan áttekintette a TechPowerUp és a Phoronix legutóbbi jelentéseit, a Phison szeretném elismerni az új Phison PS5026-E26 vezérlőt használó termékekről szóló véleményekben található problémát. Komolyan vesszük ezt az ügyet, és elkötelezettek vagyunk a gyors megoldás mellett.

Firmware-mérnöki csapatunk már elkülönítette a problémát, és megtette a szükséges lépéseket. A hőfojtószelep-görbe módosítása a jelentést követő órákon belül. Az új firmware-nek azonban át kell esnie a Phison szigorú érvényesítési folyamatán, mielőtt partnereink kiadhatnák azt az ügyfeleknek. Biztos lehet benne, hogy partnereink értesítik a végfelhasználókat, amint az érvényesített frissítés elérhetővé válik.

Fontos megjegyezni, hogy minden hűtőborda nélkül szállított E26 SSD-t hűtőbordával történő használatra tervezték. A legtöbb PCIe Gen5-tel szállított alaplap kifejezetten a Gen5 SSD-khez tervezett hűtést is tartalmaz. A „csupasz meghajtás” lehetőséget kínáljuk, hogy lehetővé tegyük ügyfeleink számára meglévő hűtőtermékeik használatát.

Ki kívánjuk hangsúlyozni elkötelezettségünket amellett, hogy kiváló minőségű termékeket és megoldásokat kínáljunk ügyfeleinknek, és továbbra is szorgalmasan fogunk dolgozni annak érdekében, hogy elégedettségüket. Köszönjük türelmét és megértését a folyamat során.”

Tehát ezt egy firmware-frissítéssel kell megoldani. Most pedig nézzük meg, hogy ezek a firmware-frissítések mennyire működnek a Linux-felhasználók számára… Néhány szállító legalább bootolható NVMe firmware-frissítések kezelése, miközben csak néhány kiválasztott tesz meg mindent az LVFS+Fwupd támogatással, hogy a Linux-felhasználók számára egyszerű legyen.

Categories: IT Info