在北京舉行的2018XDF賽靈思開發(fā)者大會(huì)上,浪潮聯(lián)合賽靈思宣布推出全球首款集成HBM2高速緩存的FPGA AI加速卡F37X。
據(jù)介紹,F(xiàn)37X是專為AI設(shè)計(jì)的尖端FPGA加速卡,它采用Xilinx Virtex UltraScale+架構(gòu),提供285萬個(gè)系統(tǒng)邏輯單元和9024個(gè)DSP單元,可在不到75W典型應(yīng)用功耗提供28.1TOPS的INT8計(jì)算性能和460GB/s的超高數(shù)據(jù)帶寬,相比單DDR4 DIMM提升20倍。
性能數(shù)據(jù)顯示,浪潮F37X在AI圖像識(shí)別實(shí)時(shí)推理場(chǎng)景,基于GoogLeNet深度學(xué)習(xí)網(wǎng)絡(luò)模型,當(dāng)BatchSize=1時(shí)性能高達(dá)8600 images/s,是CPU性能的40倍。F37X典型應(yīng)用功耗僅為75瓦,性能功耗比高達(dá)375Gops/W。此外,F(xiàn)37X板載24GB DDR4內(nèi)存及雙端口100Gbps高速網(wǎng)絡(luò)接口。F37X設(shè)計(jì)為全高半長(zhǎng)PCI-E 3.0板卡,緊致的尺寸可使得單臺(tái)AI服務(wù)器支持更多加速卡設(shè)備,從而提供極限計(jì)算與通信性能。
F37X可支持C/C++、OpenCL和RTL三種主流的編程語言開發(fā)環(huán)境。相應(yīng)SDx工具套件內(nèi)含SDAccel?、Vivado?及SDK工具,應(yīng)用已有的OpenCV、BLAS、Encoder、DNN、CNN等加速庫,實(shí)現(xiàn)對(duì)主流深度學(xué)習(xí)框架如Caffe、TensorFlow、Torch、Theano等的支持,適用于機(jī)器學(xué)習(xí)推理、視頻轉(zhuǎn)碼、圖像識(shí)別、語音識(shí)別、自然語言處理、基因組測(cè)序分析、NFV、大數(shù)據(jù)分析查詢等各類應(yīng)用場(chǎng)景,實(shí)現(xiàn)高性能、高帶寬、低延遲、低功耗的AI計(jì)算加速。