云服务器FPGA架构及其电源方案初探

时间:2025-11-01  作者:Diven  阅读:0

作者:Cyntec

云服务器FPGA架构及其电源方案初探

前言

随着高性能计算和人工智能技术的快速发展以及大数据的爆发式增长,人工智能的算法设计理念发生了转变。人工建立算法的做法被计算机通过从大数据中自动学习的方法所取代,使得计算机视觉、语音识别、自然语言处理等关键领域都出现了重大突破。深度学习是这些领域中最常使用的技术,也被业界大为关注。深度学习模型需要极为大量的数据和计算能力,只有更好的硬件加速条件,才能满足现有数据和模型规模继续扩大的需求。现有的解决方案使用图形处理单元(GPU),尽管 GPU 对深度学习算法而言在性能方面是更好的选择,但其功耗太高使得应用也受到很大限制。

今天的 CPU 一直无法满足当前计算密集型应用(如机器学习、数据分析和视频处理等)的需求。加上网络与存储方面日益明显的瓶颈,云服务供货商转而采用加速器来提高其云数据中心的整体吞吐量和效率。

亚马逊、微软和百度等大型云端服务供货商已宣布在其超大规模数据中心部署 FPGA 技术,推动其服务业务在竞争极为激烈的市场不断发展。FPGA 能与高度灵敏的云计算环境形成全面互补,因为不仅可程序设计性,而且还能针对任何新应用或新算法进行硬件优化。

图 一 服务器部署 FPGA 的架构

随着时间的推移,FPGA 可重配置及可再程序设计的固有能力或许是其在快速发展领域中的最大优势。FPGA 可利用动态重配置,在不到一秒的时间内针对不同设计快速变化,从而可针对新的工作负载进行硬件优化。 FPGA 能提供复杂多变超大规模应用所需的灵活性、应用广度和功能速度,这是 GPU 和定制 ASIC 无法实现的。其实FPGA不仅在计算的加速具有良好效果,其也可以应用于数据中心存储和网络的加速,FPGA可为云服务计算、存储、网络带来综合的提升。

FPGA作为一个加速卡,已经有几十年的历史。但是在数据中心应用有所不同,FPGA首先要提供云服务,能够满足大规模部署和运维的需求,满足云服务的特性,包括远程监控管理、在线动静态逻辑的重构,也需要支持各种虚拟机访问以及支持各种驱动兼容性,整个加速卡也需要有更高的RAS特性,这些在服务器里面,可能是比较通用的性质,但是先前的FPGA加速卡,并没有这类应用场景需求,也不具备这些特性,存在很大缺失。FPGA更重要的是FaaS(FPGA as a ServICe)服务,方案能够将软件、算法和硬件板卡集成,以软硬一体化的形式。FaaS围绕深度学习预测、视音频处理、基因测序、金融分析、IoT等热点行业提供了非常完备的解决方案。

图 二 FaaS(FPGA as a Service)

云端运算数字多台并联DC-DC电源模块,可应用之输入电压范围从8.0~15V,输出电压则为0.6~1.8V,IC操作频率为500KHz,搭载尺寸13.5x13.7mm,双组电感,感值为0.2uH电感,另为了满足数字化的需求及提供监控方法,我们采用I2C通讯协议作为客户取得模块内部信息,如下表。

表 3 设计目标规格

1. 电路架构

根据下图三为整合具备数字及并联能力的控制IC与高积体MOSFET及双线圈厄流器(Power Choke),透电路设计,计算出电感之感量需求,以及减少铜线线圈及磁性粉材量,进而开发出市面上大功率数字DC-DC 模块。图四为四组并联线路,依据单组模块进行并联使用,可在现有输出60A以下再增加输出电流至200A,采用PM-Bus Interface 控制方法,并且利用I2C传输接口控制各模块输出电压、侦测输出电流、温度以及控制每个模块电流均流。

图三、云端运算数字DC-DC电源模块(Block diagram)

图四 云端运算数字DC-DC电源模块并联模式(Block diagram)

2. 电性特性比较

根据计算结果与实测分析,我司生产制作大功率数字DC-DC 产品,其效率优于市面上产品,因为我们采用堆栈制程,将电感堆栈至模块上方,利用铜柱搭接,增加电流路径,降低损耗,并且选用高积体 MOSFET 减少开关切换的损耗,依据以上原因进而提高满载整体效率。

图五、模块效率量测

3. 模块并联均流

MSN12AD60-RUD 该模块具备自动均流的功能,并且此功能再多颗模块并联时,也能够及时运算并且调整各组模块的电流一致性,防止在并联时模块发生功率不一致。图量测模块电感电流

图六、模块输出电流均流

图七、动态模块输出电流均流

4. PMBus通讯协议测试

因我司研发的大功率数字模块,采用PMbus通讯协议并且利用I2C传输,可以藉由PC搭配GUI与DONGLE(图19) 进而对模块进行数据读取与控制输出电压,因此这边针对该功能进行测试。

图八、PMbus 系统架构

图 九、GUI实测状态

Cyntec利用GUI该套软件,可以直接监控模块目前状况以及,错误讯息,上图可以发现监测部分输入电压、输出电压以及电流与温度,右侧可以显示目前模块的状态,是否有错误讯息。

图 十Labview 测试状态

Cyntec利用Labview 撰写程序仿真MCU在工作的时候,送入PMbus 讯号,也是可以监控模块目前状态以及系统参数。

猜您喜欢

在选择切割板时,了解其参数非常重要。切割板的材质是关键因素,常见的有木质、塑料和玻璃等,每种材质都有其独特的优缺点。木质切割板天然环保,但需定期保养;塑料切割板...
2022-04-21 00:00:00


韩国科学家近期取得了一项突破性的研究成果——成功研制出一款基于半导体光纤的多功能传感器。这款传感器具有模拟人类多种感觉器官的独特能力,能够感知光、压力、气味以及...
2025-02-11 09:48:00

现代电子设备中,连接器的质量直接影响到设备的性能和稳定性。CONN_33.52X2.5MM_TM作为高性能连接器,因其独特的设计和优良的性能而受到青睐。本文将深...
2025-04-24 09:01:46

贴片电阻上的1001标识并非直接代表阻值,而是采用数字编码表示。其中前三位数字100代表有效数字,最后一位数字1代表10的几次方,也就是乘数。因此,贴片电阻10...
2024-11-29 10:26:26

现代工业和电子设备中,连接器的作用不可忽视。CONN_4X6MM_TM作为一种广泛使用的连接器,因其独特的设计和优越的性能,被广泛应用于各种设备和系统中。本文将...
2025-03-05 01:22:25

螺栓型铝电解电容因其优越的性能和稳定性,应用于电子设备中。其规格尺寸通常包括直径、高度和引脚间距等。常见的直径范围为10mm到35mm,高度则在20mm到100...
2009-11-22 00:00:00

挂锁是日常生活中常见的安全工具,其参数直接影响到使用效果和安全性。挂锁的材质是一个重要参数,常见的有钢、不锈钢和锌合金等,不同材质的挂锁在防锈、耐用性和抗撬性方...
2013-04-10 00:00:00

现代电子设备中,集成电路(IC)封装形式的选择至关重要。SOP(小型封装)是一种广泛应用的封装类型,其中SOP-8封装因其小巧的体积和良好的散热性能而受到青睐。...
2025-02-24 14:29:50

地贴警示标识根据用途和设计的不同,可以分为以下几类:安全警示类地贴主要用于提醒人们注意潜在的危险,比如滑倒、跌落等安全隐患。这类标识通常采用鲜明的颜色和图案,确...
2013-09-12 00:00:00