OpenBLAS como o popular A implementação de BLAS/LAPACK de alto desempenho de código aberto teve um novo lançamento com mais trabalho específico de CPU/arquitetura, bem como algumas novas otimizações comuns.
OpenBLAS 0.3.16 foi lançado no domingo e com este lançamento algumas das mudanças incluem:
-Adicionada detecção de tipo de CPU para Intel Ice Lake SP enquanto a detecção de Tiger Lake foi corrigida.
-A detecção do tipo de CPU também está em vigor para as CPUs Centaur/Zhaoxin mais novas.
-CPUs AVX-512 devem ter melhor desempenho SGEMV_N e SGEMV_T para casos de tamanhos N pequenos.
-Melhorias de desempenho em torno de xGER, xSPR, xSPR2, xSYR, xSYR2, xTRSV, SGEMV_N e DGEMV_N para tamanhos de entrada pequenos e argumentos consecutivos.
-Melhorias de desempenho para xGETRF, xPORTF e xPOTRI para tamanhos de entrada pequenos.
-Suporte inicial para Arm Cortex-A55.
-Corrigido o build do OpenBLAS para o Apple M1 ao usar GCC/GFortran.
Downloads e mais detalhes sobre todas as alterações do OpenBLAS 0.3.16 via GitHub .