Berikutan semakan Corsair MP700 PCIe 5.0 NVMe SSD di bawah Linux dengan ramai pembaca terkejut dengan ralat sistem fail apabila tidak menambah penyejukan tambahan seperti pasif M.2 heatsink papan induk dan ingin tahu tentang situasi itu sendiri, berikut adalah lebih banyak ujian tentang bagaimana ini. pemacu pasti akan memukul ralat sistem fail dalam tiga minit atau kurang tanpa penyejukan tambahan.
Selepas mendapatkan ujian asas Linux untuk Corsair MP700 2TB, saya melakukan beberapa ujian lanjut untuk melihat ralat sistem fail semasa berjalan tanpa sebarang penyejukan tambahan. Oleh kerana, selepas semua, seseorang biasanya akan menganggap bahawa pemacu keadaan pepejal NVMe akan pendikit sebelum secara langsung sampai ke titik ralat sistem fail jika terdapat haba yang berlebihan.
Seperti yang dinyatakan dalam semakan, saya hanya mengalami ralat sistem fail semasa memasang ujian selepas pemasangan Ubuntu 23.04 yang bersih dan tidak dapat benar-benar menekankan pemacu NVMe dengan penanda aras. Jadi saya agak ingin tahu untuk melihat berapa lama pemacu akan bertahan di bawah beban kerja penandaarasan cakera apabila dijalankan tanpa sebarang penyejukan selepas pasaran. Singkat cerita, kurang daripada 3 minit menggunakan but bersih sebelum melakukan kesilapan dengan pasti.
Apabila mengumpul log dmesg dari jauh, biasanya dalam masa 180 saat but dan hanya memulakan pelayan MariaDB dan menjalankan mysqlslap untuk menggunakan pelayan pangkalan data akan terdapat ralat sistem fail. Mengulangi ini beberapa kali, ia akan sentiasa berlaku dalam masa tiga minit dan suhu pemacu NVMe yang dilaporkan melalui sysfs NVMe HWMON sentiasa sekitar 87 darjah. Untuk nilainya, Spesifikasi teknikal MP700 menggariskan julat suhu-40C hingga 85C.
Daripada log yang dikumpul, sekurang-kurangnya di bawah Linux nampaknya pengawal NVMe turun yang seterusnya membawa kepada ralat sistem fail EXT4. Contohnya:
[ 177.187278] nvme nvme0: pengawal tidak berfungsi; akan menetapkan semula: CSTS=0xffffffff, PCI_STATUS=0xffff
[ 177.187283] nvme nvme0: Adakah peranti anda mempunyai mod penjimatan kuasa yang rosak didayakan?
[ 177.187285] nvme nvme0: Cuba”nvme_core.default_ps_max_latency_us=0 pcie_aspm=off”dan laporkan pepijat
[ 177.235051] nvme 0000:19:00.0: Tidak dapat menukar keadaan kuasa peranti daripada D0, tidak boleh cold kepada D0 br>[ 177.235151] nvme nvme0: Melumpuhkan peranti selepas kegagalan tetapan semula:-19
[ 177.251298] nvme0n1: mengesan perubahan kapasiti daripada 3907029168 kepada 0
[ 177.251308] EXT4.251308 amaran 43: Ralat I/O 10 menulis kepada inode 55194516 blok permulaan 125091905)
[ 177.251310] Ralat Penimbal I/O pada peranti nvme0n1p2, blok logik 129128830
[ 177.251310] Amaran I/O penampan pada peranti nvme0n1p2, blok logik 129128830
[ 177.251312] Edevice: 1. 343: Ralat I/O 10 menulis kepada inode 55193889 blok permulaan 273991222)
[ 177.251316] Ralat I/O Penampan pada peranti nvme0n1p2, blok logik 124816449
[ 177.251316] Ralat I/O penampan pada peranti nvme0n1p2, blok logik 124816449
[ 177.251317 ralat logik pada peranti 177.251317] 766
[ 177.251322] Amaran EXT4-fs (peranti nvme0n1p2): ext4_end_bio:343: Ralat I/O 10 menulis kepada inode 29884642 blok permulaan 129404287)
[ 177.251327] E-device (177.251327) EXT:343: Ralat I/O 10 menulis kepada inode 55194516 blok permulaan 125091902)
[ 177.251327] Amaran EXT4-fs (peranti nvme0n1p2): ext4_end_bio:343: I/O ralat 10 menulis kepada inode 29847 6.[ 177.251331] Amaran EXT4-fs (peranti nvme0n1p2): ext4_end_bio:343: Ralat I/O 10 menulis pada inode 3016742.
51331 ] Amaran EXT4-fs (peranti nvme0n1p2): ext4_end_bio:343: I/O ralat 10 menulis kepada inode 55194516 blok permulaan 125091875)
[ 177.251332] Penampan I/O ralat pada peranti nvme0n2 7 blok1p2. 51333 ] Ralat penampan I/O pada peranti nvme0n1p2, blok logik 124816419
[ 177.251334] Amaran EXT4-fs (peranti nvme0n1p2): ext4_end_bio:343: Ralat I/O 10 menulis kepada inode 551942 551942
151942 51336 ] Ralat penampan I/O pada peranti nvme0n1p2, blok logik 124816396
[ 177.251336] Amaran EXT4-fs (peranti nvme0n1p2): ext4_end_bio:343: Ralat I/O 10 menulis kepada inode 3016742.
51338 ] Amaran EXT4-fs (peranti nvme0n1p2): ext4_end_bio:343: Ralat I/O 10 menulis kepada inode 55194516 blok permulaan 125091849)
[ 177.251339] Ralat I/O penampan pada peranti nvme0n62 9. 51341 ] Ralat penampan I/O pada peranti nvme0n1p2, blok logik 124816371
[ 177.251343] Ralat I/O penimbal pada peranti nvme0n1p2, blok logik 124816353
[ 177.251343] Peranti aborting nv2me.n on1
[ 177.251353] Ralat EXT4-fs (peranti nvme0n1p2) dalam ext4_reserve_inode_write:5906: Jurnal telah dibatalkan
[ 177.251358] Ralat EXT4-fs (device nvme0n1p2): ext4_starutwork: ext4_starutter: 8 ted digugurkan jurnal
[ 177.251359] Ralat Penampan I/O pada dev nvme0n1p2, blok logik 220726066, tulis halaman tak segerak hilang
[ 177.251360] Ralat Penimbal I/O pada dev nvme0n1p2, tulis blok logik 24382668, tulis penyegerakan blok logik 24382668 [ 177.251362] Ralat EXT4-fs (peranti nvme0n1p2): ext4_dirty_inode:6110: inode #55194516: comm systemd-journal: mark_inode_dirty error
[ 177.251365 pada Buffer I/meO1 1 , tulis halaman tak segerak hilang
[ 177.251366] JBD2: Ralat I/O semasa mengemas kini superblock jurnal untuk nvme0n1p2-8. kesilapan ext4-fs (peranti nvme0N1p2) dalam ext4_dirty_inode: 6111: jurnal telah dibatalkan
[177.251369 ] Ralat penimbal I/O pada dev nvme0n1p2, blok logik 121110852, tulis halaman tak segerak hilang
[ 177.251373] Ralat EXT4-fs (peranti nvme0n1p2) dalam ext4_reserve_inode_write:5906: Jurnal telah dibatalkan ralat pada dev nvme0n1p2, blok logik 121110544, tulis halaman tak segerak hilang
[ 177.251376] Ralat EXT4-fs (peranti nvme0n1p2): ext4_dirty_inode:6110: inode #55193889: comm_Reg:tyr. 177.251376] Ralat EXT4-fs (peranti nvme0n1p2): ext4_journal_check_start:83: comm mariadbd: Mengesan jurnal digugurkan
[ 177.251377] Ralat Penimbal I/O pada dev nvme0n1p12, 1 penyegerakan logik 10n1p12, 1 blok 10 penyegerakan logik 1 251378] Ralat I/O penampan pada dev nvme0n1p2, blok logik 0, tulis halaman penyegerakan hilang
[ 177.251379] Ralat I/O penampan pada dev nvme0n1p2, blok logik 120587356, tulis halaman tak segerak hilang
[ 177.251381] Penampan ralat pada dev nvme0n1p2, blok logik 58, tulis halaman tak segerak hilang
[ 177.251384] Ralat EXT4-fs (peranti nvme0n1p2) dalam ext4_dirty_inode:6111: Jurnal telah dibatalkan
[ 177.251386] EXTme0nfs (n2) sebelumnya/O ralat untuk superblock dikesan
[177.251386] EXT4-FS Ralat (peranti nvme0n1p2): ext4_journal_check_start: 83: comm Systemd-Journal: Jurnal yang dikesan
[177.251391] 83: comm rs:main S:Reg: Dikesan jurnal digugurkan
[ 177.251399] EXT4-fs (nvme0n1p2): ralat I/O sebelumnya kepada superblock dikesan
[ 177.251406] EXT4-fs (nvme0n1p2): I/O ralat semasa menulis superblock
[ 177.251407] EXT4-fs (nvme0n1p2): Memasang semula sistem fail baca sahaja
[ 177.251409] EXT4-fs (nvme0n1p2): gagal menukar takat tidak bertulis kepada takat bertulis–potensi kehilangan data! (inode 29884642, ralat-30)
[ 177.251413] EXT4-fs (nvme0n1p2): gagal menukar takat tidak bertulis kepada takat bertulis–potensi kehilangan data! (inode 30164735, ralat-30)
[ 177.251415] EXT4-fs (nvme0n1p2): Ralat I/O semasa menulis superblock
[ 177.251415] EXT4-fs (nvme0n1p2):
ralat semasa menulis superblock >[ 177.251417] EXT4-fs (nvme0n1p2): ralat I/O sebelumnya kepada superblock dikesan
[ 177.251420] EXT4-fs (nvme0n1p2): Ralat I/O semasa menulis superblock
[ 186.476141] (Ralat 186.476141] EXT4 peranti nvme0n1p2): __ext4_find_entry:1663: inode #63307794: comm apport: membaca direktori lblock 0
[ 186.476151] buffer_io_error: 4 panggilan balik ditindas
[ 186.47615] devlogical block I/On , hilang tulis halaman penyegerakan
[ 186.476154] EXT4-fs: 2 panggilan balik ditindas
[ 186.476154] EXT4-fs (nvme0n1p2): ralat I/O semasa menulis superblock
[ 186.476170] EXT4-fs ralat (peranti npvme)0 (nvme0n1p2): __ext4_find_entry:1663: inode #63307794: comm apport: membaca direktori lblock 0
[ 186.476174] Ralat Penampan I/O pada dev nvme0n1p2, blok logik 0, halaman penyegerakan hilang menulis
[ 186.476174] (186.476174.47n) ): Ralat I/O semasa menulis superblock
[ 186.476184] Ralat EXT4-fs (peranti nvme0n1p2): __ext4_find_entry:1663: inode #63307794: comm apport: membaca direktori lblock 0
[ 186]476 Ralat I/O pada dev nvme0n1p2, blok logik 0, tulis halaman penyegerakan hilang
[ 186.476188] EXT4-fs (nvme0n1p2): Ralat I/O semasa menulis superblock
[ 186.476197] Ralat EXT4-fs (peranti nvme0n1p2: 1/6__exttry4: 186.476197): inode #63307794: comm apport: membaca direktori lblock 0
[ 186.476199] Ralat penampan I/O pada dev nvme0n1p2, blok logik 0, tulis halaman penyegerakan hilang
[ 186.476200] EXT4-fs (nvme0n): Ralat O semasa menulis superblock
Pemacu NVMe sibuk dengan tugas MariaDB, jadi ia tidak sepatutnya cuba memasuki keadaan pengurusan kuasa rendah–kekurangan pendikitan haba… Jadi saya juga melakukannya cuba pilihan kernel”nvme_core.default_ps_max_latency_us=0 pcie_aspm=off”yang disyorkan dalam output dmesg. tetapi akhirnya kedua-dua pilihan tersebut untuk melumpuhkan Pengurusan Kuasa Keadaan Aktif (ASPM) PCI Express atau menukar kependaman maks NVMe tidak mempunyai sebarang bantuan.
[ 164.581235] nvme nvme0: pengawal tidak berfungsi; akan menetapkan semula: CSTS=0xffffffff, PCI_STATUS=0xffff
[ 164.581240] nvme nvme0: Adakah peranti anda mempunyai mod penjimatan kuasa yang rosak didayakan?
[ 164.581241] nvme nvme0: Cuba”nvme_core.default_ps_max_latency_us=0 pcie_aspm=off”dan laporkan pepijat
[ 164.641482] nvme0n1: I/O Cmd(0x2) @ 495 Errors 203, LBA 203 (sct 0x3/sc 0x71)
[ 164.641490] Ralat I/O, dev nvme0n1, sektor 203495560 op 0x0:(READ) bendera 0x80700 phys_seg 4 prio class 2
6690.914
669014.: Tidak dapat untuk menukar keadaan kuasa daripada D3cold kepada D0, peranti tidak boleh diakses
[ 164.669278] nvme nvme0: Melumpuhkan peranti selepas kegagalan penetapan semula:-19
[ 164.693186] Ralat I/O, dev nvme0n1, sektor 3089104896:(WRITE) flags 0x0 phys_seg 1 prio class 2
[ 164.693195] Amaran EXT4-fs (peranti nvme0n1p2): ext4_end_bio:343: I/O ralat 10 menulis kepada inode 55194123 blok permulaan 38613811: 386138111214138111: v. perubahan kapasiti yang dikesan daripada 3907029168 hingga 0
[ 164.693200] Ralat penampan I/O pada peranti nvme0n1p2, blok logik 385862656
[ 164.693211] Amaran EXT4-fs (peranti nvme0n1p2_biot: exit: ext: 10/4. 194123 blok permulaan 129390649)
[ 164.693213] Ralat penampan I/O pada peranti nvme0n1p2, blok logik 129115193
[ 164.693213] Amaran EXT4-fs (peranti nvme0n1p2): ext4.3_8 4650 blok permulaan 273996343)
[ 164.693215] Ralat Penimbal I/O pada peranti nvme0n1p2, blok logik 129115194
[ 164.693217] Ralat Penimbal I/O pada peranti nvme0n1p2, blok logik 1291br15 19. menawarkan I/O ralat pada peranti nvme0n1p2, blok logik 129115196
[ 164.693220] Amaran EXT4-fs (peranti nvme0n1p2): ext4_end_bio:343: Ralat I/O 10 menulis kepada inode 55194123 br20 permulaan 6399)E639 Amaran XT4-fs (peranti nvme0n1p2): ext4_end_bio:343: I/O ralat 10 menulis kepada inode 55194123 blok permulaan 129390637)
[ 164.693226] Penampan I/O ralat pada peranti nvme0n1p2, 128 blok 129
logik 129 Amaran 4-fs (peranti nvme0n1p2): ext4_end_bio:343: I/O ralat 10 menulis kepada inode 55194123 blok permulaan 129390598)
[ 164.693229] Penampan I/O ralat pada peranti nvme0n1p2, 1br15 blok 141
15 142 I/O ralat pada peranti nvme0n1p2, blok logik 129115143
[ 164.693232] Amaran EXT4-fs (peranti nvme0n1p2): ext4_end_bio:343: Ralat I/O 10 menulis kepada inode 55194123 br3994123 blok permulaan 592912399941239959999 menawarkan I/O ralat pada peranti nvme0n1p2, blok logik 129115139
[ 164.693235] Amaran EXT4-fs (peranti nvme0n1p2): ext4_end_bio:343: Ralat I/O 10 menulis kepada inode 55194123 blok permulaan 55194123[ 164.693238] Amaran EXT4-fs (peranti nvme0n1p2): ext4_end_bio:343: Ralat I/O 10 menulis pada inode 55194123 br40 blok 5694123 [ 164.693278] Ralat I/O penampan pada dev nvme0n1p2, blok logik 125 tulis 360
285 ] Ralat I/O Penampan pada dev nvme0n1p2, blok logik 127926285, tulis halaman tak segerak hilang
[ 164.693293] Ralat I/O Penampan pada dev nvme0n1p2, blok logik 62, tulis halaman tak segerak hilang
[ 164.693293] Ralat I/O penimbal pada dev nvme0n1p2, blok logik 62, tulis halaman tak segerak hilang
[ 164.693302] ralat (peranti nvme0n1p2): ext4_check_bdev_write_error:223: comm mariadbd: Ralat semasa metadata tulis balik async
[ 164.693323] Menggugurkan jurnal pada peranti nvme0n1p2-8.
[ 164.693329] Ralat EXT4-fs (peranti nvme0n1p2) dalam ext4_dirty_inode:6111: Kegagalan IO
[ 164.693329] Ralat penampan I/O pada dev nvme0n1p2, blok logik 2438266 penyegerakan 2438266 JBD2: Ralat I/O semasa mengemas kini superblock jurnal untuk nvme0n1p2-8.
[ 164.693334] Ralat Penampan I/O pada dev nvme0n1p2, blok logik 0, tulis halaman penyegerakan hilang
[ 164.693336] EXT4-fs (nvme0n1p2): Ralat I/O semasa menulis superblock
[ 164.693340 Ralat I/O pada dev nvme0n1p2, blok logik 0, tulis halaman penyegerakan hilang
[ 164.693341] EXT4-fs (nvme0n1p2): Ralat I/O semasa menulis superblock
[ 164.693353] Ralat EXT4-fs (peranti nvme0n1p2): ext4_journal_check_start:83: comm rs:main Q:Reg: Mengesan jurnal digugurkan
[ 164.693364] Ralat I/O Penampan pada dev nvme0n1p2, blok logik 0, tulis halaman penyegerakan hilang
[ 164.693368] Ep2 ): Ralat I/O semasa menulis superblok
[ 164.693369] Ralat EXT4-fs (peranti nvme0n1p2): ext4_journal_check_start:83: comm mariadbd: Dikesan jurnal yang digugurkan
[ 164.693370] EXT4-n1f mount (bacaan semula fail EXT4-n1):-sahaja
[ 164.693378] Ralat penampan I/O pada dev nvme0n1p2, blok logik 0, tulis halaman penyegerakan hilang
[ 164.693380] EXT4-fs (nvme0n1p2): Ralat I/O semasa menulis superblock
[ 1455.693 ] EXT4-fs (nvme0n1p2): ext4_do_writepages: jbd2_start: 13262 muka surat, ino 55194123; err-30
[ 164.727715] Proses 10715(apport) mempunyai RLIMIT_CORE ditetapkan kepada 1
[ 164.727716] Menggugurkan teras
[ 164.915069] Proses 10732(apport) mempunyai RLIMIT_CORE yang ditetapkan kepada 164716. teras
[ 164.947259] Proses 10736(apport) mempunyai RLIMIT_CORE ditetapkan kepada 1
[ 164.947261] Menggugurkan teras
[ 164.981899] Proses 10747(apport) mempunyai RLIMIT_CORE telah ditetapkan kepada 1
blockIn> Tidak melihat kelakuan ini sama sekali dengan Inland TD510 PCIe 5.0 NVMe SSD tetapi sekali lagi pemacu itu dilengkapi dengan heatsink aktif secara lalai.Selepas membetulkan ralat sistem fail EXT4 dan melampirkan heatsink NVMe pasif pada MP700, saya melepaskan 24 jam untuk menuntut penanda aras I/O dengan MariaDB, PostgreSQL, FIO, ClickHouse dan beban kerja lain dan ia telah berjalan tanpa masalah… Masih agak hangat ke tahap rendah hingga pertengahan 80-an, tetapi tidak pernah sebarang ralat sistem fail atau pengawal NVMe melaporkan dalam log kernel. Ia akan menjadi menarik untuk melihat sama ada tingkah laku ini berlaku di bawah Windows juga atau jika beberapa perbezaan pemacu NVMe menjejaskan keadaan.
Walau bagaimanapun, saya akan mengesyorkan agar menunggu untuk menaik taraf kepada storan pengguna NVMe PCIe 5.0 sehingga terdapat lebih banyak pilihan menarik yang tersedia yang lebih pantas, lebih dipercayai dan harga telah mula bersaing dengan lebih baik dengan PCIe 4.0 Harga pemacu NVMe. Jika menggunakan mana-mana PCIe 5.0 NVMe SSD sekarang walaupun sebagai pengguna awal, saya akan mengesyorkan agar anda benar-benar memastikan anda mempunyai penyejukan yang mencukupi.