概述
vitis-blas-library

Vitis™ BLAS 庫是標準基本線性代數子程序 (BLAS) 的性能優化實現方案,旨在為多種不同的應用(如基於多層感知器 (MLP) 的機器學習、計算機視覺和定量金融等)帶來 Xilinx 平台上的開箱即用加速。

Vitis BLAS 庫 API(如通用矩陣乘法 (GEMM) 和通用矩陣向量乘法 (GEMV))可用作支持 C、C++ 和 Python 函數接口的預編譯加速器。直接在應用中調用它們,無需任何額外的硬件配置。使用 Vitis BLAS 庫 API 嵌入並替換 CPU 和基於 GPU 的 BLAS 運算,以快速針對 Xilinx 平台的性能優勢進行原型設計和評估。

Vitis BLAS 庫原語及內核不僅可提高靈活性和控製性,同時還可設計自己獨特的加速算法,用於在邊緣、本地或雲部署。


性能基準

矩陣大小 Vitis BLAS GEMM API
(Tops/Sec)
Intel® MKL(16 個線程,無緩存)(Tops/Sec) 加速
256 0.059195 0.001 59x
512 0.287016 0.02 14x

數據類型: int16
CPU: 2 Intel(R) Xeon(R) CPU E5-2640 v3 @2.60GHz,每個處理器 8 個內核,每個內核 2 個線程。
Xilinx:Vitis BLAS 庫 v1.0 在 Alveo U200 運行
FPGA 執行時間包括主機與器件之間的數據傳輸

入門