Nakapila bago ang Linux 6.5 cycle na magsisimula sa humigit-kumulang isang buwan ay isang bagong Linux x86 optimization patch para sa karagdagang pag-tune ng csum_partial, ang function na ginagamit sa loob ng kernel para sa pagkalkula ng mga 32-bit na checksum sa mga bloke ng data. Ang mas mababang latency at mas mataas na throughput ay makikita sa bagong na-optimize na csum_partial sa pinakabagong mga processor ng Intel/AMD.

Ang csum_partial function ay ginagamit sa buong kernel mula sa networking hanggang sa mga file-system para sa mga layunin ng check-summing. Ang isang bagong patch na nakapila na ngayon sa tip/tip.git ay nagpapahusay sa pagganap ng x86/x86_64 csum_partial na pagpapatupad. Binanggit ng developer na si Noah Goldstein sa patch:

x86/csum: Pahusayin ang performance ng `csum_partial`

1) Magdagdag ng espesyal na case para sa len==40 dahil iyon ang pinakamainit na value. Ang net ay isang ~8-9% latency improvement at isang ~30% throughput improvement sa len==40 case.

2) Gumamit ng maraming accumulator sa 64-byte na loop. Ito ay kapansin-pansing nagpapabuti sa ILP at nagreresulta sa hanggang 40% latency/throughput na pagpapabuti (mas mabuti para sa higit pang mga pag-ulit).

Ang patch ay naka-queue sa x86/misc branch ng TIP hanggang sa magsimula ang Linux 6.5 merge window. Palaging isang kagalakan na makita ang walang katapusang pag-optimize ng pagganap sa Linux kernel.

Categories: IT Info