首页 > 技术 > 内容

FPGA的Block RAM级联架构给AI/ML带来超高数据流通量

时间:2025-12-03  作者:Diven  阅读:0

随着数据中心、人工智能、自动驾驶、5G、计算存储和先进测试等应用的数据量和数据流量不断增大,不仅需要引入高性能、高密度FPGA来有着其并行计算和可编程硬件加速功能,而且还对大量数据在FPGA芯片内外流动提出了更高的要求。于是,在FPGA芯片中集成包括片上二维网络(2D NoC)和各种最新高速接口的新品类FPGA芯片应运而生,成为FPGA产业和相关应用的新热点。

拉开这场FPGA芯片创新大幕的是全球最大的独立FPGA技术和产品提供商Achronix半导体公司,其采用7nm工艺打造的Achronix Speedster7t FPGA不仅拥有诸多高性能外围Hard IP,而且是全球首次在FPGA的逻辑阵列上集成了2D NoC,一经推出就在市场得到了积极的响应,并引来竞争对手的模仿和跟随。

Speedster7t这款专门针对人工智能/机器学习(AI / ML)和高带宽应用进行优化的高性能、高密度FPGA,包括了革命性的二维片上网络(2D NoC)、新型机器学习处理器(MLP)、400G以太网和PCIe Gen5端口,以及高带宽GDDR6和DDR4/5存储控制器。Speedster7t FPGA架构如图1所示。

图1 Speedster7t FPGA结构图

Achronix Speedster7t FPGA除了在外围Hard IP上都采用目前业内领先的大带宽高速率IP,在内部的可编程逻辑的架构中也做了大量的优化去进一步提高内部可编程逻辑的性能,从而适配外围IP超高带宽需求。本文首先谈谈Speedster7t FPGA的片上SRAM,也就是Block RAM针对传统的结构所做出的一些优化。

Speedster7t FPGA中可编程逻辑的架构

Speedster7t FPGA中内部的可编程资源是按列排布,包括LUT、FF、ALU、MUX、MLP、Block RAM、LogIC RAM。如图2所示。

图2 Speedster7t FPGA可编程逻辑结构

其中MLP、Block RAM、LogIC RAM是集成在一起,之间的连接用的是专有的走线,不占用可编程逻辑走线资源,这样做的目的主要是为了提高性能,同时也可以节省可编程逻辑走线资源,这个架构对于AI,还有需要用到MLP的一些复杂算法的性能优化是非常明显的,在我们的MLP系列文章中会详细讲到,这里我们只重点说一下Block RAM。

Speedster7t FPGA的Block RAM特点

Speedster7t FPGA内部的Block RAM是一个容量为72k bit的简单双端口RAM,有一个读端口,一个写端口。两个端口的时钟完全独立,并且可以完全独立的配置读写位宽。可以灵活的配置成简单双端口RAM或者ROM

Block RAM的主要特性如表1所示。

表1 Block RAM的关键特性

Block RAM框图如图3所示。

图3 Block RAM内部结构

Speedster7t FPGA的Block RAM级联结构

Speedster7t FPGA的Block RAM最大的特点是增加了Block RAM间的级联走线,级联走线是BRAM间专有的连线,不占用可编程逻辑的走线资源,可以极大的提升多个Block RAM级联的性能。图4显示了Block RAM间级联走线的架构。

图4 Block RAM级联结构

由图4可以看出,读写地址线和数据线都有专有的级联线连接。这样的架构在一些场景中都会有应用,比如:需要从外部端口接收数据或者从GDDR6读数据去初始化大量Block RAM的场景,AI的神经网络就是一个典型的应用,在每一层的卷积算法中,系统都会从GDDR6读出图像数据和权重数据放入每个引擎的Block RAM中,引擎计算完毕以后再存入到GDDR6中供下一次运算使用。

有了这样的级联架构,我们在写入数据去初始化大量Block RAM的时候不需要外部数据有很大的扇出,直接通过同一列Block RAM的级联线就可以轻松完成,具体实现可以参考Achronix MLP_Conv2D参考设计。另外一个例子就是在需要多个Block RAM去构成更大容量的RAM的时候,如果利用级联线可以大大提升系统的性能。我们针对这个专门做了一个工程比较一下,生成一个位宽64bit,深度16384的一个简单双端口RAM,需要用到16个Block RAM。我们分别用专有级联线和内部可编程逻辑去拼深度两种方法来对比。可以看到用专有的级联线资源更省,而且性能有了很大的提高。

使用专有的级联线资源占用和性能:

使用可编程逻辑资源占用和性能:

后面我们会继续深入了解Speedster7t FPGA可编程逻辑的各种特性,并且会用一些例子来说明如何更高效的利用这些特性,以将Speedster7t这款业界首创的高数据带宽FPGA芯片与更多的创新智能化应用结合起来。

Achronix也提供Speedcore嵌入式FPGA硅知识产权(IP)产品,用来帮助用户在应用规模进一步扩大后,去开发带有eFPGA逻辑阵列的ASIC或者SoC产品,由Achronix的ACE FPGA开发工具提供支持,从而可以重用FPGA开发成果,这是Achronix在率先引入2D NoC和MLP之外,另一个层面上的创新。

参考文献:

Achronix website www.achronix.com

Achronix Speedster7t IP component UG090

猜您喜欢


按钮指示灯附件是现代设备中不可少的重要组成部分,其参数直接影响到设备的性能和用户体验。亮度是一个关键参数,通常以流明(lm)或坎德拉(cd)来衡量,确保在各种环...
2016-06-14 00:00:00
NAND FLASH是应用于存储设备中的非易失性存储技术,其主要优势体现在以下几个方面。NAND FLASH具有较高的存储密度。与传统的存储介质相比,NAND ...
2013-12-03 00:00:00
在选择鼠标垫时,有几个关键参数值得关注。首先是尺寸,鼠标垫的大小直接影响使用体验。常见的尺寸有小型、中型和大型,用户可以根据自己的桌面空间和使用习惯进行选择。其...
2013-04-29 00:00:00
MEMS加速度计通过微结构内发生的电容、电阻或电荷(压电)变化来检测机械加速度,现已成为仅次于压力传感器,应用量排名第二的MEMS器件。MEMS加速度计一直以来...
2023-12-08 09:07:00
粉尘检测仪是用于监测空气中粉尘浓度的重要设备,应用于工业、环保和科研领域。根据不同的工作原理和应用场景,粉尘检测仪可分为几种主要类型。光散射式粉尘检测仪是最常见...
2008-12-30 00:00:00
Petri网是一种系统的、数学的和图形的描述和分析工具,它具有强大的描述并发、异步、分布、并行、不确定/随机性的信息处理系统的能力,目前已被广泛应用于计算机通讯...
2019-01-01 16:28:00
在现代电子设备中,USB转换模块是非常重要的配件。了解其参数能够帮助用户选择合适的产品。数据传输速率是关键参数,常见的有USB 2.0(480 Mbps)和US...
2019-01-26 00:00:00
现代电子设备中,连接器的选择至关重要。SOW6_7.5X4.68MM作为一种新型连接器,以其优异的性能和灵活的应用受到广泛关注。本文将对SOW6_7.5X4.6...
2025-02-24 11:35:58
Panasonic(松下)作为全球知名的电子品牌,其产品以高品质和可靠性。作为电子电路中常见的元件,可调电阻在电路调节和控制中有着着重要作用。那么,Panaso...
2012-08-26 04:01:58
快劳夹是创新的办公工具,专为提升工作效率而设计。采用高品质的材料,确保耐用性和可靠性。快劳夹的独特设计使得文件整理变得更加轻松,能够快速夹住多页文件,避免了传统...
2009-07-23 00:00:00