DeepSparse 1.5 vrijgegeven voor snellere AI-inferentie op CPU's

Neural Magic’s DeepSparse AI-inferentie-runtime blijft”GPU-klasse prestaties op CPU’s”nastreven en levert met de nieuwe DeepSparse 1.5-release nog snellere prestaties voor CPU-inferentie.

DeepSparse biedt toonaangevende CPU-gebaseerde inferentieprestaties en ik heb er veel gebruik van gemaakt op Intel-en AMD-CPU’s en gebruik het vaak onder mijn CPU-benchmarks arsenaal. Ik ben verheugd om te zien dat er met DeepSparse 1.5 nog meer prestatieverbeteringen zijn. De release-opmerkingen van DeepSparse 1.5 noemen de volgende prestatieverbeteringen:

-Inferentielatentie voor ongestructureerde sparse-quantized CNN’s is tot 2x verbeterd.
-Inferentiedoorvoer en latentie voor dichte CNN’s is tot 20% verbeterd.
-Inferentiedoorvoer en latentie voor dichte transformatoren is tot 30% verbeterd.
-De volgende operators worden nu ondersteund voor prestaties:
Neg, Unsqueeze met niet-constante invoer
MatMulInteger met twee niet-constante invoer
GEMM met constante gewichten en 4D-of 5D-invoer

DeepSparse 1.5 voegt ook een ONNX-evaluatiepijplijn toe voor OpenPiPaf, YOLOv8-segmentatiepijplijnen, ondersteuning voor het gebruik van hwloc om de CPU-topologie te bepalen om de prestaties binnen Kubernetes-clusters te verbeteren, en diverse andere verbeteringen. Aan de andere kant lijkt DeepSparse 1.5 nog steeds geen ondersteuning te bieden voor Python 3.11.
Downloads (als je geen pip gebruikt) en meer informatie over de DeepSparse 1.5-release van Neural Magic via GitHub.

DeepSparse 1.5 vrijgegeven voor snellere AI-inferentie op CPU’s

Published by IT Info on June 8, 2023

IT Info

Verizon komt dichter bij de prepaidgrootheid van T-Mobile met hete nieuwe multiline-kortingen

IT Info

Linux 6.5 VirtIO GPU DRM-stuurprogramma Sync Object uAPI voor Vulkan toevoegen

IT Info

Mesa 23.2 ontvangt Asahi AGX Gallium3D-wijzigingen voor OpenGL 3.1 + GLES 3.0

DeepSparse 1.5 vrijgegeven voor snellere AI-inferentie op CPU’s

Published by IT Info on June 8, 2023

Related Posts

IT Info

Verizon komt dichter bij de prepaidgrootheid van T-Mobile met hete nieuwe multiline-kortingen

IT Info

Linux 6.5 VirtIO GPU DRM-stuurprogramma Sync Object uAPI voor Vulkan toevoegen

IT Info

Mesa 23.2 ontvangt Asahi AGX Gallium3D-wijzigingen voor OpenGL 3.1 + GLES 3.0