SRAM型FPGA在轨会遇到的问题及其影响

时间:2025-09-12  作者:Diven  阅读:0

深夜醒来,翻开枕边诗集,遥想当年,苏老举杯邀歌,写出了千古流传的《水调歌头》,“我欲乘风归去,又恐琼楼玉宇,高处不胜寒。起舞弄清影,何似在人间。”如今想来,苏老先生字里行间难掩对严寒天宫的向往,又终觉人间美好,我等后生晚辈做科研工作更是要脚踏实地。

SRAM型FPGA在轨会遇到的问题及其影响

在遥远的天宫,卫星工作的环境非常恶劣。卫星运行期间,不可避免地遭遇地球辐射带质子、银河宇宙线粒子、太阳宇宙线粒子轰击,这些辐射粒子,极易引起电子元器件的性能退化、逻辑功能错误、状态锁定等,从而导致电子设备的功能错误及异常,进而危害卫星的功能有着乃至运行安全。

SRAM型FPGA属于核心元器件,因此对SRAM型FPGA进行抗辐照加固设计非常必要。今天贫道主要给大家布道一下SRAM型FPGA在轨会遇到的问题及其影响。

1SEE分类

SRAM型FPGA空间应用下面临的主要问题是单粒子效应和总剂量效应。如图1所示,单粒子效应包括单粒子闩锁SEL,单粒子翻转SEU,单粒子瞬变SET和单粒子功能中断SEFI。SEL属于硬错误,可能会导致FPGA器件损伤。而SEU,SET和SEFI则属于软错误,一般不会对器件造成损伤,但会影响FPGA功能。

图1 元器件单粒子效应的分类

2TID

经常听说某国产元器件TID指标大于100Krad or 150K rad,为啥要定义这个指标呢?不同轨道的航天器遭受的年剂量是不一样的,比如LEO轨道遭受的只有几Krad[si],GEO轨道年剂量可能达到100Krad[si],而MEO轨道年剂量最高可达数百Krad[si]。

这里提到的指标是典型的3mm铝屏蔽下的年剂量,乘以卫星的使用寿命,并考虑2~3倍的抗辐射设计余量(RDM),就是型号任务通常的抗总剂量要求。为了满足总剂量的要求,可以通过设备机箱进行屏蔽,也可以通过整星设计,设备机箱结合其结构件组合屏蔽。一般到元器件层面总剂量指标大于100Krad能满足型号任务的需求。

3SEL

目前主流的SRAM型FPGA是CMOS工艺,由于天然的寄生效应,一个NMOS和一个PMOS串联起来产生PNPN结构。受单粒子效应的影响,PNPN会处于导通状态且不断电会一直处于导通状态,影响管子使用寿命。随着导通的管子数量增多,外在表现就是电流会阶梯型上升。某国产宇航级的FPGA会在芯片内部进行SEL特殊加固设计, 指标达到84 Mev.cm^2/mg板级设计不需要考虑额外的抗SEL设计。

工业级的FPGA则必须要在板级设计中考虑电源的监测和管理。由于电路的阶梯型上升特点,只对一级电源进行监测缺点是灵敏度不够,发现不了潜在的闩锁。最好对每路电源进行监测,提高灵敏度,一旦发生异常,采取断电重启。

图2 CMOS电路中的寄生效应

图3 发生SEL后电流阶梯型上升

4SEFI

SEFI分为应用级SEFI和器件级SEFI。如表1所示,器件级SEFI包括POR SEFI,SelectMAP SEFI,FAR SEFI和全局信号的SEFI。一般需要通过外部的刷新电路对器件级SEFI进行监测,并采取相应的应对措施。某国产宇航级的FPGA会在芯片内部进行SEFI特殊加固设计,指标达到37 Mev.cm^2/mg,极大增强了FPGA在轨稳定运行的能力。

图4 刷新芯片监测FPGA SEFI流程

表1 SEFI类型与解决措施

应用级SEFI需要把由SEU导致的用户层面逻辑功能异常刨除掉,专注一些基础性的一般性的东西,否则应用级SEFI就是一个模糊不清的概念。本文中应用级SEFI指的是时钟SET、复位毛刺和MMCM/PLL/DCM的功能异常,下面对应用级SEFI分类进行说明。

1)时钟SET

如图5所示,尽管对电路做了TMR加固,但时钟信号的SET会导致该时钟域下的所有寄存器发生SEU,最终Voter判定结果错误,TMR加固失效。

图5 时钟毛刺

对时钟网络推荐采用GTMR策略,时钟IO不做TMR,对BUFG做TMR。加固前单点失效路径是整个时钟routing,加固后单点失效路径是IO到BUFGs的交汇处,通常单点失效路径截面大为减少。

图6 GTMR有效降低时钟网络SET概率

2)复位毛刺

FPGA加载时用GSR来控制寄存器和状态机初值,因此并不需要额外产生复位信号来做初值控制。比如,不需要复位的寄存器(如数据流相关的寄存器)不设计外部复位,用GSR做初值控制。对复位毛刺很敏感的寄存器和状态机,可以改用同步复位,同步复位比异步复位消耗资源多一些,但比异步复位对毛刺敏感性低。

图7 异步复位同步释放电路

如果外部异步复位扇出较多的寄存器,可以用GTMR加固策略。复位信号经过3个BUFG走全局时钟专用网络,单路复位毛刺翻转影响不了另外两路复位信号对应的寄存器。

3)MMCM/PLL/DCM

MMCM/PLL/DCM的LOCK信号为高并不代表功能一定正常,因此建议开发缓解方案,例如通过计数器来检测MMCM/PLL/DCM输出故障。一旦MMCM/PLL/DCM发生故障,进行复位操作。

5SEU

单粒子翻转SEU可以发生在FPGA任意的资源上,比如配置SRAM、配置逻辑电路、用户逻辑DFF和块存储器等。

配置SRAM的SEU直接影响的是查找表LUT的值和互连资源的连接关系。查找表值的错误会导致用户逻辑功能出错,逻辑错误向下传播还可能导致时序单元出错。此外如果LUT用作了分布式RAM或者移位寄存器SRL,那么还会导致存储数据出错。

互连出错可能导致用户逻辑连接出错,连接错误向下传播可能导致时序单元出错。互连出错还可能导致互连产生短路,引起静态功耗增加。

触发器DFF的SEU会导致用户逻辑状态出错和FSM状态机出错。流水寄存器状态出错的影响仅限于单个时钟周期,因此影响比较小。FSM状态机出错可能会造成严重的影响。如图8 所示,状态机如果发生翻转至为定义的状态,那会导致状态机锁死,用户功能无法恢复。

图8 状态机发生SEU导致锁死

BRAM块存储器发生SEU可能会造成功能出错。当BRAM资源用作ROM,ROM存储重要的参数,重要参数发生错误会导致用户功能受到严重影响。比如FPGA内部跑软核,程序存储在FPGA内部的BRAM资源中,BRAM程序区的SEU会导致指针乱跳,程序跑飞。

图9 软核存储器发生SEU导致程序跑飞

战术

对于SRAM型的FPGA而言,单粒子效应SEE可产生严重的影响。贫道今天给大家介绍了SEE的各个细分,包括SEL、SEFI、SEU和SET。那么针对不同细分,有什么解决方法,该采取什么样的应对措施,又如何验证措施的有效性呢?欲知后事如何、且听下回分解。

审核编辑:汤梓红

猜您喜欢

0603,这个看似简单的数字组合,实际上是贴片电阻封装尺寸的代号,它代表着电子元器件世界里的微小而重要的组成部分。对于非专业人士来说,理解这个名称或许有些困难,...
2025-04-14 15:04:03

声光报警器是重要的安全防护设备,应用于火灾、入侵等紧急情况下的报警。了解声光报警器的参数,有助于选择合适的产品。声响强度是关键参数,通常以分贝(dB)表示,强度...
2014-03-11 00:00:00

贴片电阻上的数字和字母,如同神秘代码,代表着它的阻值。学会解读这些代码,就能快速识别电阻大小。一般来说,三位数的编码遵循以下规则:前两位数字表示有效数字,第三位...
2024-11-26 11:30:03

现代电子产品和设备中,连接器的选择非常重要。TERMINAL_7.8X11.1MM作为常见的连接器类型,因其独特的尺寸和设计,应用于各种电子领域。本文将深入探讨...
2025-04-22 18:30:11

现代电子设备和工业自动化领域,连接器的选择非常重要。TERMINAL_25.4X8.7MM_TM作为一种高效的连接解决方案,因其独特的设计和优越的性能受到广泛关...
2025-03-08 06:16:59

三极管(BJT)是重要的电子元件,应用于各种电子电路中。主要作用是放大和开关信号。作为半导体器件,三极管可以将微弱的输入信号放大成更强的输出信号,这一特性使得在...
2008-10-23 00:00:00

电子测量和电路设计中,采样电阻的作用不可小觑。采样电阻不仅能提高电路的精度,还能有效地保护敏感元件。本文将深入探讨采样电阻阻值表的相关知识,帮助读者更好地理解其...
2025-04-18 23:30:09


水平仪是常用的测量工具,应用于建筑、装修和工程等领域。其主要优势体现在以下几个方面。水平仪能够精确测量水平和垂直角度,确保施工的准确性,避免因误差造成的后续问题...
2008-09-23 00:00:00

电位器作为调节电压和电流的重要器件,应用于各种电子设备中。捷比信(Jiebixin)作为知名的电位器制造商,其产品因品质优良、性能稳定而受到行业认可。本文将围绕...
2023-08-20 23:59:49