OpenBLAS como o popular A implementação de BLAS/LAPACK de alto desempenho de código aberto teve um novo lançamento com mais trabalho específico de CPU/arquitetura, bem como algumas novas otimizações comuns.

OpenBLAS 0.3.16 foi lançado no domingo e com este lançamento algumas das mudanças incluem:

-Adicionada detecção de tipo de CPU para Intel Ice Lake SP enquanto a detecção de Tiger Lake foi corrigida.

-A detecção do tipo de CPU também está em vigor para as CPUs Centaur/Zhaoxin mais novas.

-CPUs AVX-512 devem ter melhor desempenho SGEMV_N e SGEMV_T para casos de tamanhos N pequenos.

-Melhorias de desempenho em torno de xGER, xSPR, xSPR2, xSYR, xSYR2, xTRSV, SGEMV_N e DGEMV_N para tamanhos de entrada pequenos e argumentos consecutivos.

-Melhorias de desempenho para xGETRF, xPORTF e xPOTRI para tamanhos de entrada pequenos.

-Suporte inicial para Arm Cortex-A55.

-Corrigido o build do OpenBLAS para o Apple M1 ao usar GCC/GFortran.

Downloads e mais detalhes sobre todas as alterações do OpenBLAS 0.3.16 via GitHub .

Categories: IT Info