Vor dem Start des Linux 6.5-Zyklus in etwa einem Monat steht ein neuer Linux x86-Optimierungspatch zur weiteren Optimierung von csum_partial in der Warteschlange, der Funktion, die im Kernel zur Berechnung von 32-Bit-Prüfsummen für Datenblöcke verwendet wird. Mit dem neu optimierten csum_partial auf den neuesten Intel/AMD-Prozessoren sind eine deutlich geringere Latenz und ein höherer Durchsatz zu beobachten.
Die csum_partial-Funktion wird im gesamten Kernel vom Netzwerk bis zu Dateisystemen für Prüfsummenzwecke verwendet. Ein neuer Patch, der jetzt in tip/tip.git in der Warteschlange steht, verbessert die Leistung der x86/x86_64 csum_partial-Implementierung. Entwickler Noah Goldstein bemerkte im Patch:
x86/csum: Leistung von „csum_partial“ verbessern
1) Sonderfall für len==40 hinzufügen, da dies der heißeste Wert ist. Dies führt zu einer Latenzverbesserung von ca. 8–9 % und einer Durchsatzverbesserung von ca. 30 % im Fall von len==40.
2) Verwenden Sie mehrere Akkumulatoren in der 64-Byte-Schleife. Dies verbessert die ILP erheblich und führt zu einer Latenz-/Durchsatzverbesserung von bis zu 40 % (besser für mehr Iterationen).
Der Patch wird im x86/misc-Zweig von TIP in die Warteschlange gestellt, bis das Linux 6.5-Mergefenster beginnt. Es ist immer eine Freude, die endlosen Leistungsoptimierungen des Linux-Kernels zu sehen.