基于直方图算法的FPGA设计架构

时间:2025-11-01  作者:Diven  阅读:0

引言

基于直方图算法的FPGA设计架构

直方图统计在图像增强和目标检测领域有重要应用,比如直方图均衡,梯度直方图。直方图的不同种类和统计方法请见之前的文章。本章就是用FPGA来进行直方图的计算,并且利用FPGA的特性对计算过程进行加速。安排如下:

首先基于直方图算法进行FPGA架构设计,这里主要考虑了如何加速以及FPGA资源的利用两个因素;最后基于system Verilog搭建一个验证系统。

FPGA设计架构

不论是图像灰度直方图还是梯度直方图,本质上是对数据的分布进行计数。从FPGA角度来看,只关心以下几点:

1) 根据数据大小确定其分布区间,统计分布在不同区间的数据个数,区间的大小可以调节,比如灰度直方图区间为1,梯度直方图通常大于1;

2) 如何利用FPGA对直方图统计进行加速,以及如何考虑到芯片有限资源;

首先来考虑加速方式,直方图统计过程用伪代码表示为:

For(int i=0;i Index = get_index(data[i]);

Hist[index]++;

}

Get_index函数是为了确定数据属于哪个区间,如果区间大小为1,那么index就是数据自身。如果区间是平均分布,那么就需要进行数据的大小比较。如果区间大小是2的幂次,那么index只需要数据进行移位得到。

FPGA在加速计算中最主要就是利用并行化和流水线,并行化就是将一个任务拆解成多个子任务,多个子任务并行完成。而流水线是在处理一个子任务的时候,下一个来的子任务也可以进行处理,处理模块不会等待。流水线本质上是对子任务也进行“分割”,分割的每一块可以在处理模块中同时进行。

统计N个数据,可以将N分成M份,在FPGA上同时进行M个统计,用伪代码表示为:

For(int k=0;k //并行化

For(int i=0;i Index = get_index(data[k][i]);

Hist[k][index]++;

}

}

如果区间不是2的幂次,就需要比较器,这样并行M次,就需要M个同等比较器,这对资源消耗很大。因此目前设计仅仅支持2的幂次的区间。整个设计架构如图1.2。

图2.1 流水线处理

图2.2 直方图统计架构

主要分为以下几个模块:

1)statis:这个是核心计算模块,统计数据分布。ram中存放直方图统计数据,地址对应着数据分布区间。这里有一个问题需要考虑,在对ram中直方图统计数据计数时,需要读出然后计数。如果ram读端口没有寄存器,那么读出来直接加1,再写入。但是这样并不好,因为ram不经过寄存器时序不好。所以增加了一级寄存器,这样就造成了写入的延时,那么有可能下一次数据来临也会读取同样地址的数据,此时读取到的直方图数据就是还没有写入的。为了解决这个问题,判断进入的前后两个数据是否相同,如果相同就不写入而继续计数,如果不同就写入。并行多个statis模块的代码为:

genvar i;

generate

for(i=0;i

statis #(

.PIX_BW(PIX_BW),

.HIST_BW(HIST_BW),

.ADDR_BW(HIST_LEN_BW),

.BIN_W(BIN_W)

)u_statis(

.clk(clk),

.rst(rst),

.clr(clr),

.enable(1‘b1),

.pix_valid(pix_valid),

.pix(img_i[i*PIX_BW +: PIX_BW]),

.hist_rd(branch_hist_rd),

.hist_raddr(branch_hist_raddr),

.hist(branch_hist[i*HIST_BW +: HIST_BW])

);

end

endgenerate

2)serders:这个是并转串。M个statis模块会产生M组hist结果,这些结果还要进行求和,那么就要用到加法树,如果M较大,会造成加法树很大,多以这里加了serders可以调节加法树资源。

3) addTree:加法树。

Module addTree #(

parameter DATA_BW = 32,//bit width of data

parameter TREE_DEPTH = 3,//depth of the add tree

parameter ADD_N = 4//add number

input clk,

input rst,

input [ADD_N*DATA_BW-1:0] adnd_x,

input [ADD_N*DATA_BW-1:0] adnd_y,

input adnd_valid,

output reg[DATA_BW-1:0] finl_sum,

output reg finl_sum_valid

);

reg [TREE_DEPTH-1:0]midl_valid;

genvar dept_i, leaf_i;

generate

for(dept_i=TREE_DEPTH-1;dept_i》=0;dept_i=dept_i-1)begin: ADD_DPET

localparam LEAF_N = 2**dept_i;

wire[DATA_BW-1:0] midl_sum[LEAF_N-1:0];

for(leaf_i=0;leaf_i

reg [DATA_BW-1:0] midl_add_x;

reg [DATA_BW-1:0] midl_add_y;

if(dept_i==TREE_DEPTH-1)begin

always @(posedge clk)begin

midl_add_x midl_add_y end

end

else begin

always @(posedge clk)begin

midl_add_x midl_add_y end

end

adder #(

.DATA_BW(DATA_BW)

u_adder(

.adnd_x(midl_add_x),

.adnd_y(midl_add_y),

.sum(midl_sum[leaf_i])

);

end

if(dept_i==TREE_DEPTH-1)

always @(posedge clk)begin

midl_valid[dept_i] end

else

always @(posedge clk)begin

midl_valid[dept_i] end

end

endgenerate

always @(posedge clk)begin

finl_sum end

always @(posedge clk)begin

if(rst)

finl_sum_valid else

finl_sum_valid end

endModule

4) accum:累加器。如果加法树没有完成M个hist数据的求和,那么就需要通过累加器来完成。

图2.3 对ram的处理

验证结构

1) img_trans:这个是随机化图像数据定义,主要通过SV中constraint来对图像大小做一些约束;

class img_trans;

rand int img_w;

rand int img_h;

rand int img_blank;

rand logIC[`PIX_BW-1:0] img[`MAX_IMG_W*`MAX_IMG_H];

constraint img_cfg_cnst{

img_w img_w 》 0;

img_w % `PARALL == 0;

img_h img_h 》 0;

img_blank img_blank 》= 0;

}

extern function void write(input string f_name);

endclass

2) driver:产生image并且发送给DUT,同时通过mailbox发送给ref_model用于对比;

class img_obj;

logIC [`PIX_BW-1:0] img_que[$];

endclass

class driver;

int img_w;

int img_h;

int img_blank;

logic [`PARALL*`PIX_BW-1:0] img;

logic [`PIX_BW-1:0] img_ele;

img_obj imgObj;

img_trans imgTrans;

extern task drive(mailbox img_mbx, virtual img_inf.test imgInf);

endclass

3) ref_model:自己统计直方图和DUT的结果进行比对;

class ref_modl;

logic [`PIX_BW-1:0] img;

int addr;

img_obj imgObj;

int hist[`HIST_LEN];

extern task calc(input logic clk, mailbox img_mbx);

extern task comp(virtual img_inf.test imgInf);

extern task run(input logic clk, mailbox img_mbx, virtual img_inf.test imgInf);

extern function void clear();

endclass

图3.1 验证架构图

最后添加一下modelsim仿真波形文件和结果,纯粹为了增加篇幅。

图3.2 modelsim仿真波形和结果

猜您喜欢

干燥剂在我们的日常生活中是重要配件,尤其是在食品、药品和电子产品的包装中。选择合适的干燥剂时,有几个关键参数需要考虑。首先是吸湿能力,这是干燥剂最核心的指标,通...
2018-04-29 00:00:00

贴片电阻上的124标记代表其阻值为120,000欧姆,也就是120千欧,通常简写为120kΩ。 这是一种简洁的编码方式,方便工程师和技术人员快速识别元件参数。具...
2024-11-29 10:26:11

数字万用表是常用的电子测量工具,应用于电路维修和电子元件测试。其中,测量二极管的好坏是其基本功能。二极管作为电子元件,主要用于单向导电,因此判断其好坏对于电路的...
2025-04-07 05:30:34

贴片电阻虽然体积小巧,但在电路中扮演着重要的角色。它能够限制电流,稳定电压,但如果电压过高,就可能导致电阻击穿,造成电路故障。那么,贴片电阻多少电压能击穿呢?实...
2024-11-26 11:29:57

保险丝作为重要的保护元件,起到了防止过载和短路的关键作用。UTL(尤提乐)作为知名的保险丝品牌,高品质的产品和多样的规格受到市场认可。本文将详细介绍UTL尤提乐...
2023-10-19 23:48:30

贴片电阻本身不能直接测量电流。电阻的作用是限制电流,其阻值与流经它的电流及两端电压呈正比关系(欧姆定律:I=U/R)。因此,要测量通过贴片电阻的电流,需要借助其...
2024-11-26 11:29:15

贴片电阻1210的功率并非一个固定值,而是取决于具体厂商和型号。1210指的是电阻的封装尺寸,长3.2mm,宽2.5mm。一般来说,1210封装的贴片电阻功率范...
2024-11-26 11:30:10

肖特基整流二极管是重要的半导体器件,应用于电源电路、开关电源和高频电路中。其独特的结构和工作原理使其在整流效率和开关速度上具有显著优势。本文将详细解析肖特基整流...
2025-04-05 23:31:38

功能介绍放开头, 使用便捷无需愁。这是全网最详细、性价比最高的STM32实战项目入门教程,通过合理的硬件设计和详细的视频笔记介绍,硬件使用STM32F103主控...
2024-08-15 16:26:00