首页 > 技术 > 内容

Altera FPGA硬核浮点DSP模块解决方案提高运算性能

时间:2025-11-28  作者:Diven  阅读:0

1、 FPGA浮点运算推陈出新

以往FPGA在进行浮点运算时,为符合IEEE 754标准,每次运算都需要去归一化和归一化步骤,导致了极大的性能瓶颈。因为这些归一化和去归一化步骤一般通过FPGA中的大规模桶形移位寄存器实现,需要大量的逻辑和布线资源。通常一个单精度浮点加法器需要500个查找表(LUT),单精度浮点要占用30%的LUT,指数和自然对数等更复杂的数学函数需要大约1000个LUT。因此随着DSP算法越来越复杂,FPGA性能会明显劣化,对占用80%~90%逻辑资源的FPGA会造成严重的布线拥塞,阻碍FPGA的快速互联,最终会影响时序收敛。

为解决以上问题, 2010年Altera在DSP Builder高级模块库中引入了融合数据通路设计。将基本算子组合在一个函数或者数据通路中,通过分析数据通路的位增长,选择最优归一化输入,为数据通路分配足够的精度,尽可能消除归一化和去归一化步骤。这一优化平台将定点DSP模块与可编程软核逻辑相结合,避免了大量使用这类桶形移位寄存器。与使用几种基本IEEE 754算子构成的等价数据通路相比,减少了50%的逻辑,延时减小了50%。并且,这一方法总的数据精度一般高于使用基本IEEE 754浮点算子库的方法。

在Altera Arria 10和Stratix 10器件中的硬核浮点DSP模块开发出来之前,融合数据通路方法的浮点运算性能和效率是业界领先的。表1显示了Cholesky求解器运行在Stratix V版DSP开发套件上的结果,形式是Ax = B,使用了DSP Builder高级模块库中的融合数据通路设计流程。一般来说Cholesky的输入矩阵函数规模大、延时长,因此很难在FPGA硬件中实现,但具有融合数据通路的DSP Builder模块库的浮点运算占用的逻辑只是基本浮点乘法器的3到4倍,并会在每一时钟周期产生一个结果,从而可实现相应规模的 Cholesky求解。

随着Altera DSP模块体系结构的进步和软件工具的不断优化,目前Altera已可在FPGA中实现高性能浮点运算,Altera的Arria 10和Stratix 10器件中的硬核浮点DSP模块就是业界领先的浮点解决方案的代表。

2 、硬核浮点DSP提高设计效能,加快上市

在Arria 10和Stratix 10器件中的硬核浮点DSP模块不仅提高了运算性能,还可加快产品上市时间。在提高运算性能方面,主要体现在三个方面:

一是可节省逻辑资源的使用。采用Arria 10和Stratix 10器件中的硬核浮点DSP模块,FPGA系统克服了前述提到的限制性能的挑战。在过去,需要使用定点乘法器和FPGA逻辑来实现浮点运算功能,Altera的硬核浮点DSP几乎不使用现有FPGA浮点计算所需要的逻辑资源,并且,桶形移位寄存器可在硬核DSP模块中实现,就避免了使用宝贵的FPGA资源运行归一化和归一化函数。采用硬核浮点DSP模块内置这一创新体系结构,不仅节省了很多的逻辑资源,时序收敛或者fMAX要求也不再受限于次优布线,从而保证了使用80%至90%逻辑资源的FPGA仍能保持较高的fMAX性能。

二是提高了数字精度。硬核浮点DSP模块支持很多复数浮点运算,包括累乘法、加减法等,其浮点输出都符合IEEE 754标准,从而保证了在具有高分辨率要求的应用中其数值的一致性。过去FPGA实现浮点运算是在内部数据通路上使用二进制补码表示。在算法输入输出时,这一内部二进制补码表示与IEEE 754格式相互转换。这在解决桶形移位寄存器占用资源方面非常重要,但实际输出值与MATLAB/Simulink模型值相比会有所偏差。但是,在采用了Arria 10和Stratix 10器件中的硬核浮点模块后,实际输出值与Simulink模型显示的高度一致。

三是提高了能效。Arria 10和Stratix 10器件还在FPGA业界实现了能效最高的浮点,每瓦分别是50 GFLOP和100 GFLOPS,极大地减少了以前进行浮点运算时所需要的逻辑和布线资源,从而大幅度降低了内核动态功耗。

而在加快产品上市方面,FPGA中集成的硬核浮点DSP支持很多常见的DSP模型和仿真环境,可无缝实现优化浮点运算。在从军事领域的雷达到通信系统等各种应用中,Arria 10和Stratix 10器件为设计人员提供了更高效的设计,平均可将设计时间缩短6-12个月。一方面是因为不需要额外的转换过程。在前几代FPGA中要实现高性能浮点运算,需要进行转换,将浮点转换为定点,在FPGA中实现,在定点实现中分析、转换并验证浮点算法。这种转换过程一般步骤繁琐。这一过程完成后,还需验证转换过程当中的准确率。如果设计方面有任何的修改或变化,都需要重新把这些流程再进行一遍,持续进行转换。另一方面是因为Altera提供了易用的设计工具。Altera优异的DSP设计工具包括为硬件设计人员、基于模型的设计人员提供的DSP Builder,以及为软件编程人员提供的面向OpenCL的软件开发套件(SDK)。利用这些工具,设计人员完全不需要浮点到定点的转换过程,相应地在实现过程中也不需要调试,在几分钟内就可以完成系统定义和仿真,直至系统实现。当使用DSP Builder或者面向OpenCL的SDK设计算法,设计人员能够将开发精力集中在算法定义和迭代上,而不是设计硬件,帮助缩短了开发和验证时间。

猜您喜欢


贴片电阻的规格型号由四位数字代码表示,例如「1002」。前两位数字表示有效数字,后两位数字表示数量级(10的幂次方)。以「1002」为例,有效数字为10,数量级...
2025-04-14 15:02:22
随着科技的不断进步,碳化硅(SiC)材料在电子元器件中的应用越来越,尤其是在二极管领域。碳化硅二极管因其优异的电气性能和热性能,成为了高效能电源管理和电力电子设...
2025-03-29 19:00:35
贴片排阻作为电子元器件中的重要组成部分,应用于各种电路设计和制造中。四川永星作为国内知名的电子元器件生产企业,其生产的贴片排阻以质量稳定、性能优良而受到市场青睐...
2024-05-10 04:28:13
FPGA的特点是并行执行,但如果需要处理一些具有前后顺序的事件,就需要使用状态机。状态机是一种用于处理具有前后顺序的事件的计算机模型,包含现态、条件、动作和次态...
2023-05-22 14:24:00
贴片电阻作为电子电路中不可或缺的元件,其封装类型多种多样,直接影响着电路板的设计和性能。了解常见的贴片电阻封装类型,对于电子爱好者和工程师都至关重要。目前市面上...
2025-04-14 15:03:17
贴片电阻200Ω是一种应用于电子电路中的基础元件。体积小巧,性能稳定,是电路设计中很重要的一部分。200Ω的阻值在电路中主要用于限流、分压、阻抗匹配等功能,确保...
2024-11-29 10:26:02
电容是电路中常见的元件,应用于电子设备中。许多人在使用电容时,容易忽视正负极的问题。接下来,我们将探讨电容正负极接反的后果。 电容失效如果电容正负极接反,电容可...
2025-04-02 01:01:39
潮湿场所施工,为了安全起见,降低照明电源电压是必要的,但并非所有情况都必须限制在六伏以下。 六伏这个数值常被提及,主要是因为在特定情况下被认为是相对安全的电压,...
2024-08-11 00:00:00
手阀是常见的控制流体流动的设备,应用于工业、农业和家庭等多个领域。主要功能是通过手动操作来开启或关闭管道中的流体,确保系统的安全与稳定。手阀通常由阀体、阀杆和阀...
2009-08-09 00:00:00
电阻作为电子元器件中的基础组件,其性能的优劣直接影响整个电路的稳定性和寿命。特别是在恶劣环境下工作的电子设备,防硫化电阻的需求日益增长。Walsin(华新)作为...
2019-07-29 22:06:30