หลังจากรีวิว Corsair MP700 PCIe 5.0 NVMe SSD ภายใต้ Linux โดยที่ผู้อ่านหลายคนรู้สึกประหลาดใจกับข้อผิดพลาดของระบบไฟล์เมื่อไม่ได้เพิ่มการระบายความร้อนเพิ่มเติม เช่น ฮีทซิงค์ M.2 แบบพาสซีฟของเมนบอร์ด และอยากรู้เกี่ยวกับสถานการณ์ด้วยตัวเอง ต่อไปนี้คือการทดสอบเพิ่มเติมเกี่ยวกับวิธีการในท้ายที่สุด ไดรฟ์จะโจมตีข้อผิดพลาดของระบบไฟล์ได้อย่างน่าเชื่อถือภายในสามนาทีหรือน้อยกว่าโดยไม่ต้องเพิ่มความเย็น
หลังจากทำการทดสอบ Linux ขั้นพื้นฐานสำหรับ Corsair MP700 2TB แล้ว ฉันได้ทำการทดสอบเพิ่มเติมโดยดูที่ข้อผิดพลาดของระบบไฟล์เมื่อทำงานโดยไม่มีการระบายความร้อนเพิ่มเติม เนื่องจากตามปกติแล้ว เรามักสันนิษฐานว่าไดรฟ์โซลิดสเทต NVMe จะเร่งความเร็วก่อนที่จะถึงจุดที่เกิดข้อผิดพลาดของระบบไฟล์ทันทีหากมีความร้อนมากเกินไป
ตามที่กล่าวไว้ในบทวิจารณ์ ฉันพบข้อผิดพลาดของระบบไฟล์เมื่อทำการติดตั้งการทดสอบหลังจากติดตั้ง Ubuntu 23.04 ใหม่ทั้งหมด และไม่ได้ใช้งานไดรฟ์ NVMe อย่างจริงจัง ด้วยเกณฑ์มาตรฐาน ดังนั้นฉันจึงค่อนข้างอยากรู้ว่าไดรฟ์จะอยู่ได้นานแค่ไหนภายใต้ปริมาณงานการเปรียบเทียบดิสก์เมื่อรันโดยไม่มีการระบายความร้อนหลังการขาย เรื่องสั้นสั้น ๆ มันใช้เวลาน้อยกว่า 3 นาทีในการบู๊ตที่สะอาดก่อนที่จะตีข้อผิดพลาดได้อย่างน่าเชื่อถือ
เมื่อรวบรวมบันทึก dmesg จากระยะไกล โดยปกติแล้วภายใน 180 วินาทีของการบูตและเพียงแค่เริ่มเซิร์ฟเวอร์ MariaDB และเรียกใช้ mysqlslap เพื่อใช้งานเซิร์ฟเวอร์ฐานข้อมูล อาจมีข้อผิดพลาดของระบบไฟล์ ทำซ้ำหลายครั้ง สิ่งนี้จะเกิดขึ้นภายในสามนาทีเสมอ และอุณหภูมิไดรฟ์ NVMe ที่รายงานผ่าน NVMe HWMON sysfs จะอยู่ที่ประมาณ 87 องศาเสมอ สิ่งที่คุ้มค่า ข้อมูลจำเพาะทางเทคนิคของ MP700 สรุปช่วงอุณหภูมิ-40C ถึง 85C
จากบันทึกที่รวบรวม อย่างน้อยภายใต้ Linux ดูเหมือนว่าคอนโทรลเลอร์ NVMe หยุดทำงานซึ่งนำไปสู่ข้อผิดพลาดของระบบไฟล์ EXT4 ตัวอย่างเช่น:
[ 177.187278] nvme nvme0: คอนโทรลเลอร์หยุดทำงาน จะรีเซ็ต: CSTS=0xffffffff, PCI_STATUS=0xffff
[ 177.187283] nvme nvme0: อุปกรณ์ของคุณเปิดใช้โหมดประหยัดพลังงานที่ผิดพลาดหรือไม่
[ 177.187285] nvme nvme0: ลอง”nvme_core.default_ps_max_latency_us=0 pcie_aspm=off”และรายงานจุดบกพร่อง
[ 177.235051] nvme 0000:19:00.0: ไม่สามารถเปลี่ยนสถานะพลังงานจาก D3cold เป็น D0 อุปกรณ์ไม่สามารถเข้าถึงได้
[ 177.235151] nvme nvme0: ปิดใช้งานอุปกรณ์หลังจากการรีเซ็ตล้มเหลว:-19
[ 177.251298] nvme0n1: ตรวจพบการเปลี่ยนแปลงความจุจาก 3907029168 เป็น 0
[ 177.251308] คำเตือน EXT4-fs (อุปกรณ์ nvme0n1p2): ext4_end_b io:343: ข้อผิดพลาด I/O 10 ที่เขียนไปยังไอโหนด 55194516 บล็อกเริ่มต้น 125091905)
[ 177.251310] ข้อผิดพลาดบัฟเฟอร์ I/O บนอุปกรณ์ nvme0n1p2 บล็อกตรรกะ 129128830
[ 177.251312] คำเตือน EXT4-fs (อุปกรณ์ nvme0n1p2): ext4_end _bio:343: ข้อผิดพลาด I/O 10 เขียนไปยังไอโหนด 55193889 บล็อกเริ่มต้น 273991222)
[ 177.251316] ข้อผิดพลาด I/O ของบัฟเฟอร์บนอุปกรณ์ nvme0n1p2 บล็อกตรรกะ 124816449
[ 177.251317] ข้อผิดพลาด I/O ของบัฟเฟอร์บนอุปกรณ์ nvme0n1p2 บล็อกตรรกะ 27 3715766
[ 177.251322] คำเตือน EXT4-fs (อุปกรณ์ nvme0n1p2): ext4_end_bio:343: ข้อผิดพลาด I/O 10 เขียนถึง inode 29884642 บล็อกเริ่มต้น 129404287)
[ 177.251327] คำเตือน EXT4-fs (อุปกรณ์ nvme0n1p2): ext4_ end_bio:343: ข้อผิดพลาด I/O 10 ที่เขียนไปยังไอโหนด 55194516 บล็อกเริ่มต้น 125091902)
[ 177.251327] คำเตือน EXT4-fs (อุปกรณ์ nvme0n1p2): ext4_end_bio:343: ข้อผิดพลาด I/O 10 เขียนถึงไอโหนด 29884642 บล็อกเริ่มต้น 129404288)
[ 17 7.251329 ] ข้อผิดพลาดบัฟเฟอร์ I/O บนอุปกรณ์ nvme0n1p2 บล็อกแบบลอจิคัล 124816446
[ 177.251331] คำเตือน EXT4-fs (อุปกรณ์ nvme0n1p2): ext4_end_bio:343: ข้อผิดพลาด I/O 10 เขียนไปยัง inode 30164735 บล็อกเริ่มต้น 129396193)
[ 1 77.251331 ] คำเตือน EXT4-fs (อุปกรณ์ nvme0n1p2): ext4_end_bio:343: ข้อผิดพลาด I/O 10 ที่เขียนไปยังไอโหนด 55194516 บล็อกเริ่มต้น 125091875)
[ 177.251332] ข้อผิดพลาดบัฟเฟอร์ I/O บนอุปกรณ์ nvme0n1p2 บล็อกตรรกะ 129120737
[ 1 77.251333 ] ข้อผิดพลาดบัฟเฟอร์ I/O บนอุปกรณ์ nvme0n1p2 บล็อกแบบลอจิคัล 124816419
[ 177.251334] คำเตือน EXT4-fs (อุปกรณ์ nvme0n1p2): ext4_end_bio:343: ข้อผิดพลาด I/O 10 เขียนไปยัง inode 55194516 เริ่มต้นบล็อก 125091852)
[ 1 77.251336 ] ข้อผิดพลาดบัฟเฟอร์ I/O บนอุปกรณ์ nvme0n1p2 บล็อกแบบลอจิคัล 124816396
[ 177.251336] คำเตือน EXT4-fs (อุปกรณ์ nvme0n1p2): ext4_end_bio:343: ข้อผิดพลาด I/O 10 เขียนไปยัง inode 30164735 บล็อกเริ่มต้น 129396194)
[ 1 77.251338 ] คำเตือน EXT4-fs (อุปกรณ์ nvme0n1p2): ext4_end_bio:343: ข้อผิดพลาด I/O 10 ที่เขียนไปยังไอโหนด 55194516 บล็อกเริ่มต้น 125091849)
[ 177.251339] ข้อผิดพลาดบัฟเฟอร์ I/O บนอุปกรณ์ nvme0n1p2 บล็อกตรรกะ 124816393
[ 1 77.251341 ] ข้อผิดพลาดของบัฟเฟอร์ I/O บนอุปกรณ์ nvme0n1p2 บล็อกแบบลอจิคัล 124816371
[ 177.251343] ข้อผิดพลาดของบัฟเฟอร์ I/O บนอุปกรณ์ nvme0n1p2 บล็อกแบบลอจิคัล 124816353
[ 177.251345] การยกเลิกสมุดรายวันบนอุปกรณ์ nvme0n1p2-8
[ 177.251353] ข้อผิดพลาด EXT4-fs (อุปกรณ์ nvme0n1p2) ใน ext4_reserve_inode_write:5906: Journal ยกเลิก
[ 177.251358] ข้อผิดพลาด EXT4-fs (อุปกรณ์ nvme0n1p2): ext4_journal_check_start:83: comm kworker/u64:9: ตรวจพบว่าถูกยกเลิก สมุดรายวัน
[ 177.251359] ข้อผิดพลาดของบัฟเฟอร์ I/O บน dev nvme0n1p2, บล็อกแบบลอจิคัล 220726066, การเขียนหน้า async หายไป
[ 177.251360] ข้อผิดพลาดของบัฟเฟอร์ I/O บน dev nvme0n1p2, บล็อกแบบลอจิคัล 243826688, การเขียนหน้าการซิงค์หายไป
[ 177.251362] ข้อผิดพลาด EXT4-fs (อุปกรณ์ nvme0n1p2): ext4_dirty_inode:6110: inode #55194516: comm systemd-journal: ข้อผิดพลาด mark_inode_dirty
[ 177.251365] ข้อผิดพลาดของบัฟเฟอร์ I/O บน dev nvme0n1p2 ลอจิคัลบล็อก 12 1147223 การเขียนหน้า async หายไป
[177.251366] JBD2: ข้อผิดพลาด I/O เมื่ออัปเดตซูเปอร์บล็อกเจอร์นัลสำหรับ nvme0n1p2-8
[ 177.251367] ข้อผิดพลาด EXT4-fs (อุปกรณ์ nvme0n1p2) ใน ext4_dirty_inode:6111: Journal ยกเลิก
[ 177.251369] ข้อผิดพลาด I/O ของบัฟเฟอร์บน dev nvme0n1p2 บล็อกตรรกะ 121141967 การเขียนหน้า async หายไป
[ 177.251372 ] ข้อผิดพลาดบัฟเฟอร์ I/O บน dev nvme0n1p2, บล็อกแบบลอจิคัล 121110852, การเขียนหน้า async หายไป
[ 177.251373] ข้อผิดพลาด EXT4-fs (อุปกรณ์ nvme0n1p2) ใน ext4_reserve_inode_write:5906: สมุดรายวันถูกยกเลิก
[ 177.251375] บัฟเฟอร์ I/โอ ข้อผิดพลาดใน dev nvme0n1p2 บล็อกตรรกะ 121110544 การเขียนหน้า async หายไป
[ 177.251376] ข้อผิดพลาด EXT4-fs (อุปกรณ์ nvme0n1p2): ext4_dirty_inode:6110: inode #55193889: comm rs:main Q:Reg: ข้อผิดพลาด mark_inode_dirty
[ 177.251376] ข้อผิดพลาด EXT4-fs (อุปกรณ์ nvme0n1p2): ext4_journal_check_start:83: comm mariadbd: ตรวจพบสมุดรายวันที่ถูกยกเลิก
[ 177.251377] ข้อผิดพลาดบัฟเฟอร์ I/O บน dev nvme0n1p2 บล็อกตรรกะ 121110529 การเขียนหน้า async หายไป
[ 177.251378] ข้อผิดพลาดของบัฟเฟอร์ I/O ที่ dev nvme0n1p2, บล็อกโลจิคัล 0, สูญเสียการเขียนหน้าซิงค์
[ 177.251379] ข้อผิดพลาดของบัฟเฟอร์ I/O บน dev nvme0n1p2, บล็อกตรรกะ 120587356, สูญเสียการเขียนหน้า async
[ 177.251381] บัฟเฟอร์ I/O ข้อผิดพลาดใน dev nvme0n1p2, ลอจิคัลบล็อก 58, การเขียนหน้า async หายไป
[ 177.251384] ข้อผิดพลาด EXT4-fs (อุปกรณ์ nvme0n1p2) ใน ext4_dirty_inode:6111: Journal ยกเลิก
[ 177.251386] EXT4-fs (nvme0n1p2): ก่อนหน้า I ตรวจพบข้อผิดพลาด/O ไปยัง superblock
[ 177.251386] ข้อผิดพลาด EXT4-fs (อุปกรณ์ nvme0n1p2): ext4_journal_check_start:83: comm systemd-journal: ตรวจพบสมุดรายวันที่ถูกยกเลิก
[ 177.251391] ข้อผิดพลาด EXT4-fs (อุปกรณ์ nvme0n1p2): ext4_journal_check_start: 83: comm rs:main Q:Reg: ตรวจพบสมุดรายวันที่ถูกยกเลิก
[ 177.251399] EXT4-fs (nvme0n1p2): ตรวจพบข้อผิดพลาด I/O ก่อนหน้าไปยัง superblock
[ 177.251406] EXT4-fs (nvme0n1p2): I/O เกิดข้อผิดพลาดขณะเขียน superblock
[ 177.251407] EXT4-fs (nvme0n1p2): การต่อเชื่อมระบบไฟล์แบบอ่านอย่างเดียว
[ 177.251409] EXT4-fs (nvme0n1p2): ไม่สามารถแปลงขอบเขตที่ไม่ได้เขียนเป็นขอบเขตที่เขียน–ข้อมูลอาจสูญหาย! (inode 29884642 ข้อผิดพลาด-30)
[ 177.251413] EXT4-fs (nvme0n1p2): ล้มเหลวในการแปลงขอบเขตที่ไม่ได้เขียนเป็นขอบเขตที่เขียน–ข้อมูลอาจสูญหาย! (ไอโหนด 30164735 ข้อผิดพลาด-30)
[ 177.251415] EXT4-fs (nvme0n1p2): ข้อผิดพลาด I/O ขณะเขียน superblock
[ 177.251415] EXT4-fs (nvme0n1p2): ข้อผิดพลาด I/O ขณะเขียน superblock
[ 177.251417] EXT4-fs (nvme0n1p2): ตรวจพบข้อผิดพลาด I/O ก่อนหน้าไปยัง superblock
[ 177.251420] EXT4-fs (nvme0n1p2): ข้อผิดพลาด I/O ขณะเขียน superblock
[ 186.476141] ข้อผิดพลาด EXT4-fs ( อุปกรณ์ nvme0n1p2): __ext4_find_entry:1663: inode #63307794: comm apport: กำลังอ่านไดเรกทอรี lblock 0
[ 186.476151] buffer_io_error: 4 callbacks ระงับ
[ 186.476152] ข้อผิดพลาดของบัฟเฟอร์ I/O บน dev nvme0n1p2 เชิงตรรกะ บล็อก 0 แพ้ การเขียนหน้าซิงค์
[ 186.476154] EXT4-fs: 2 การเรียกกลับถูกระงับ
[ 186.476154] EXT4-fs (nvme0n1p2): ข้อผิดพลาด I/O ขณะเขียน superblock
[ 186.476170] ข้อผิดพลาด EXT4-fs (อุปกรณ์ nvme0n1p2): __ext4_find_entry:1663: inode #63307794: comm apport: กำลังอ่านไดเร็กทอรี lblock 0
[ 186.476174] ข้อผิดพลาด I/O ของบัฟเฟอร์บน dev nvme0n1p2, บล็อกแบบลอจิคัล 0, การเขียนหน้าการซิงค์หายไป
[ 186.476174] EXT4-fs (nvme0n1p2 ): ข้อผิดพลาด I/O ขณะเขียน superblock
[ 186.476184] ข้อผิดพลาด EXT4-fs (อุปกรณ์ nvme0n1p2): __ext4_find_entry:1663: inode #63307794: comm apport: กำลังอ่านไดเรกทอรี lblock 0
[ 186.476187] ข้อผิดพลาด I/O ของบัฟเฟอร์ ใน dev nvme0n1p2, ลอจิคัลบล็อก 0, สูญเสียการเขียนหน้าซิงค์
[ 186.476188] EXT4-fs (nvme0n1p2): ข้อผิดพลาด I/O ขณะเขียน superblock
[ 186.476197] ข้อผิดพลาด EXT4-fs (อุปกรณ์ nvme0n1p2): __ext4_find_entry:1663: inode #63307794: comm apport: กำลังอ่านไดเร็กทอรี lblock 0
[ 186.476199] ข้อผิดพลาด I/O ของบัฟเฟอร์ใน dev nvme0n1p2, บล็อกแบบลอจิคัล 0, การเขียนหน้าการซิงค์หายไป
[ 186.476200] EXT4-fs (nvme0n1p2): I/O เกิดข้อผิดพลาดขณะเขียน superblock
ไดรฟ์ NVMe กำลังยุ่งกับงาน MariaDB ดังนั้นจึงไม่ควรพยายามเข้าสู่สถานะการจัดการพลังงานต่ำ–ขาดการควบคุมความร้อน… ดังนั้นฉันจึงทำเช่นกัน ลองใช้ตัวเลือกเคอร์เนล”nvme_core.default_ps_max_latency_us=0 pcie_aspm=off”ที่แนะนำในเอาต์พุต dmesg แต่สุดท้ายแล้วตัวเลือกเหล่านั้นในการปิดใช้งาน PCI Express Active State Power Management (ASPM) หรือการเปลี่ยนเวลาแฝงสูงสุดของ NVMe ก็ไม่ได้ช่วยอะไรเลย
[ 164.581235] nvme nvme0: ตัวควบคุมไม่ทำงาน; จะรีเซ็ต: CSTS=0xffffffff, PCI_STATUS=0xffff
[ 164.581240] nvme nvme0: อุปกรณ์ของคุณเปิดใช้โหมดประหยัดพลังงานที่ผิดพลาดหรือไม่
[ 164.581241] nvme nvme0: ลอง”nvme_core.default_ps_max_latency_us=0 pcie_aspm=off”และรายงานข้อผิดพลาด
[ 164.641482] nvme0n1: I/O Cmd(0x2) @ LBA 203495560, 32 บล็อก, I/O Error (sct 0x3/sc 0x71)
[ 164.641490] ข้อผิดพลาด I/O, dev nvme0n1, เซกเตอร์ 203495560 op 0x0:(READ) ตั้งค่าสถานะ 0x80700 phys_seg 4 prio คลาส 2
[ 164.669173] nvme 0000:19:00.0: ไม่สามารถ เพื่อเปลี่ยนสถานะพลังงานจาก D3cold เป็น D0 อุปกรณ์ไม่สามารถเข้าถึงได้
[ 164.669278] nvme nvme0: ปิดใช้งานอุปกรณ์หลังจากการรีเซ็ตล้มเหลว:-19
[ 164.693186] ข้อผิดพลาด I/O, dev nvme0n1, เซกเตอร์ 3089104896 op 0x1:(WRITE) ค่าสถานะ 0x0 phys_seg 1 prio คลาส 2
[ 164.693195] คำเตือน EXT4-fs (อุปกรณ์ nvme0n1p2): ext4_end_bio:343: ข้อผิดพลาด I/O 10 เขียนไปยัง inode 55194123 เริ่มต้นบล็อก 386138112)
[ 164.693198] nvme0 n1: ตรวจพบการเปลี่ยนแปลงความจุ จาก 3907029168 ถึง 0
[ 164.693200] ข้อผิดพลาดบัฟเฟอร์ I/O บนอุปกรณ์ nvme0n1p2 บล็อกตรรกะ 385862656
[ 164.693211] คำเตือน EXT4-fs (อุปกรณ์ nvme0n1p2): ext4_end_bio:343: ข้อผิดพลาด I/O 10 เขียนถึงใน รหัส 55194123 บล็อกเริ่มต้น 129390649)
[ 164.693213] ข้อผิดพลาดของบัฟเฟอร์ I/O บนอุปกรณ์ nvme0n1p2 บล็อกตรรกะ 129115193
[ 164.693213] คำเตือน EXT4-fs (อุปกรณ์ nvme0n1p2): ext4_end_bio:343: ข้อผิดพลาด I/O 10 เขียนไปยังไอโหนด 29884650 บล็อกเริ่มต้น 273996343)
[ 164.693215] ข้อผิดพลาดของบัฟเฟอร์ I/O บนอุปกรณ์ nvme0n1p2 บล็อกแบบลอจิคัล 129115194
[ 164.693217] ข้อผิดพลาดของบัฟเฟอร์ I/O บนอุปกรณ์ nvme0n1p2 บล็อกแบบลอจิคัล 129115195
[ 164.6932 19] บัฟเฟอร์ I/O ข้อผิดพลาดบนอุปกรณ์ nvme0n1p2 บล็อกแบบลอจิคัล 129115196
[ 164.693220] คำเตือน EXT4-fs (อุปกรณ์ nvme0n1p2): ext4_end_bio:343: ข้อผิดพลาด I/O 10 เขียนไปยัง inode 55194123 เริ่มต้นบล็อก 129390653)
[ 164.69322 4] คำเตือน EXT4-fs (อุปกรณ์ nvme0n1p2): ext4_end_bio:343: ข้อผิดพลาด I/O 10 เขียนไปยังไอโหนด 55194123 เริ่มต้นบล็อก 129390637)
[ 164.693226] ข้อผิดพลาดบัฟเฟอร์ I/O บนอุปกรณ์ nvme0n1p2 บล็อกตรรกะ 129115181
[ 164.693228 ] คำเตือน EXT4-fs (อุปกรณ์ nvme0n1p2): ext4_end_bio:343: ข้อผิดพลาด I/O 10 เขียนไปยังไอโหนด 55194123 เริ่มต้นบล็อก 129390598)
[ 164.693229] ข้อผิดพลาดบัฟเฟอร์ I/O บนอุปกรณ์ nvme0n1p2 บล็อกตรรกะ 129115142
[ 164.693231 ] บัฟเฟอร์ I/O ข้อผิดพลาดบนอุปกรณ์ nvme0n1p2 บล็อกแบบลอจิคัล 129115143
[ 164.693232] คำเตือน EXT4-fs (อุปกรณ์ nvme0n1p2): ext4_end_bio:343: ข้อผิดพลาด I/O 10 เขียนไปยัง inode 55194123 เริ่มต้นบล็อก 129390595)
[ 164.69323 4] บัฟเฟอร์ I/O ข้อผิดพลาดบนอุปกรณ์ nvme0n1p2 บล็อกแบบลอจิคัล 129115139
[ 164.693235] คำเตือน EXT4-fs (อุปกรณ์ nvme0n1p2): ext4_end_bio:343: ข้อผิดพลาด I/O 10 เขียนไปยัง inode 55194123 เริ่มต้นบล็อก 129390578)
[ 164.69323 6] บัฟเฟอร์ I/O ข้อผิดพลาดบนอุปกรณ์ nvme0n1p2 บล็อกแบบลอจิคัล 129115122
[ 164.693238] คำเตือน EXT4-fs (อุปกรณ์ nvme0n1p2): ext4_end_bio:343: ข้อผิดพลาด I/O 10 เขียนไปยัง inode 55194123 เริ่มต้นบล็อก 129390566)
[ 164.69324 0] คำเตือน EXT4-fs (อุปกรณ์ nvme0n1p2): ext4_end_bio:343: ข้อผิดพลาด I/O 10 เขียนไปยังไอโหนด 55194123 บล็อกเริ่มต้น 129390563)
[ 164.693278] ข้อผิดพลาด I/O ของบัฟเฟอร์บน dev nvme0n1p2 บล็อกตรรกะ 120619365 การเขียนหน้า async หายไป
[ 16 4.693285 ] ข้อผิดพลาดบัฟเฟอร์ I/O บน dev nvme0n1p2 บล็อกโลจิคัล 127926285 การเขียนหน้า async หายไป
[ 164.693293] ข้อผิดพลาด I/O ของบัฟเฟอร์ใน dev nvme0n1p2 โลจิคัลบล็อก 62 การเขียนหน้า async หายไป
[ 164.693302] EXT4-fs ข้อผิดพลาด (อุปกรณ์ nvme0n1p2): ext4_check_bdev_write_error:223: comm mariadbd: ข้อผิดพลาดขณะ async เขียนกลับข้อมูลเมตา
[ 164.693323] ยกเลิกสมุดรายวันบนอุปกรณ์ nvme0n1p2-8
[ 164.693329] ข้อผิดพลาด EXT4-fs (อุปกรณ์ nvme0n1p2) ใน ext4_dirty_inode:6111: IO ล้มเหลว
[ 164.693329] ข้อผิดพลาดบัฟเฟอร์ I/O บน dev nvme0n1p2, โลจิคัลบล็อก 243826688, สูญเสียการเขียนหน้าซิงค์
[ 164.693 334] JBD2: ข้อผิดพลาด I/O เมื่ออัพเดต Journal superblock สำหรับ nvme0n1p2-8
[ 164.693334] ข้อผิดพลาด I/O ของบัฟเฟอร์บน dev nvme0n1p2, ลอจิคัลบล็อก 0, การเขียนหน้าการซิงค์หายไป
[ 164.693336] EXT4-fs (nvme0n1p2): ข้อผิดพลาด I/O ขณะเขียน superblock
[ 164.693340] บัฟเฟอร์ ข้อผิดพลาด I/O บน dev nvme0n1p2, ลอจิคัลบล็อก 0, สูญเสียการเขียนหน้าซิงค์
[ 164.693341] EXT4-fs (nvme0n1p2): ข้อผิดพลาด I/O ขณะเขียน superblock
[ 164.693353] ข้อผิดพลาด EXT4-fs (อุปกรณ์ nvme0n1p2): ext4_journal_check_start:83: comm rs:main Q:Reg: ตรวจพบสมุดรายวันที่ถูกยกเลิก
[ 164.693364] ข้อผิดพลาด I/O ของบัฟเฟอร์ใน dev nvme0n1p2, ลอจิคัลบล็อก 0, การเขียนหน้าการซิงค์หายไป
[ 164.693368] EXT4-fs (nvme0n1p2 ): ข้อผิดพลาด I/O ขณะเขียน superblock
[ 164.693369] ข้อผิดพลาด EXT4-fs (อุปกรณ์ nvme0n1p2): ext4_journal_check_start:83: comm mariadbd: ตรวจพบสมุดรายวันที่ถูกยกเลิก
[ 164.693370] EXT4-fs (nvme0n1p2): การอ่านระบบไฟล์ต่อเชื่อมใหม่-เท่านั้น
[ 164.693378] ข้อผิดพลาด I/O ของบัฟเฟอร์ใน dev nvme0n1p2, ลอจิคัลบล็อก 0, การเขียนหน้าซิงค์หายไป
[ 164.693380] EXT4-fs (nvme0n1p2): ข้อผิดพลาด I/O ขณะเขียน superblock
[ 164.693455 ] EXT4-fs (nvme0n1p2): ext4_do_writepages: jbd2_start: 13262 หน้า, ino 55194123; err-30
[ 164.727715] กระบวนการ 10715(apport) มี RLIMIT_CORE ตั้งค่าเป็น 1
[ 164.727716] ยกเลิก core
[ 164.915069] Process 10732(apport) มี RLIMIT_CORE ตั้งค่าเป็น 1
[ 164.915071] ยกเลิก core
[ 164.947259] Process 10736(apport) มี RLIMIT_CORE ตั้งค่าเป็น 1
[ 164.947261] ยกเลิก core
[ 164.981899] Process 10747(apport) มี RLIMIT_CORE ตั้งค่าเป็น 1
I Haven ไม่พบพฤติกรรมนี้เลยกับ Inland TD510 PCIe 5.0 NVMe SSD แต่อีกครั้งที่ไดรฟ์นั้นติดตั้งฮีทซิงค์ที่ใช้งานอยู่ตามค่าเริ่มต้น
หลังจากแก้ไขข้อผิดพลาดของระบบไฟล์ EXT4 และแนบฮีทซิงค์ NVMe แบบพาสซีฟกับ MP700 ฉันก็เลิกใช้เกณฑ์มาตรฐาน I/O ที่เรียกร้องเป็นเวลา 24 ชั่วโมงด้วย MariaDB, PostgreSQL, FIO, ClickHouse และปริมาณงานอื่นๆ และทำงานได้โดยไม่มีปัญหา… ยังค่อนข้างอุ่นขึ้นในช่วง 80 ต่ำถึงกลาง แต่ไม่เคยรายงานข้อผิดพลาดของระบบไฟล์หรือตัวควบคุม NVMe ในบันทึกเคอร์เนล เป็นเรื่องที่น่าสนใจที่จะดูว่าลักษณะการทำงานนี้เกิดขึ้นภายใต้ Windows เช่นกันหรือหากความแตกต่างของไดรเวอร์ NVMe บางอย่างส่งผลต่อสถานการณ์
อย่างไรก็ตาม ฉันขอแนะนำให้รออัปเกรดเป็นที่เก็บข้อมูลสำหรับผู้บริโภค PCIe 5.0 NVMe จนกว่าจะมีตัวเลือกที่น่าสนใจมากขึ้น ซึ่งเร็วกว่า เชื่อถือได้มากกว่า และราคาเริ่มแข่งขันกับ PCIe 4.0 ได้ดีขึ้น ราคาไดรฟ์ NVMe หากต้องการใช้ PCIe 5.0 NVMe SSD ใดๆ ในตอนนี้แม้ว่าจะเป็นผู้ใช้รายแรกๆ เราขอแนะนำให้ตรวจสอบให้แน่ใจว่าคุณมีการระบายความร้อนที่เพียงพอ