更全的杂志信息网

适用于数字信号的多路复用器辅助并行乘法器

更新时间:2016-07-05

0 引言

移动应用要求高速和低复杂度的无线通信系统,这就需要研究人员设计和开发实现信号处理算法和技术的最佳方法.显然,以乘法为中心的快速傅立叶变换(FFT)构成了常用信号和图像处理方法的构造块,其中包括离散哈特利变换、滤波算法、JPEG、MP3和MPEG编码.且大多数基本信号处理操作(即,卷积、线性滤波和离散余弦变换(DCT))均采用乘法和乘积累计方法,这需要设计一种在功率要求、计算复杂度和时延等方面高效而快速的乘法器.另外,为实现用于移动通信应用的高速集成电路,要求使用配备有专用乘法及累积(MAC)单元的数字信号处理器(DSP)和高级微控制器.因此,二进制乘法器构成了MAC单元的一个组成部分,高效乘法器的设计将引导“在通信系统中使用高速VLSI电路”方面取得重大进展.

1 现有的二进制乘法器

本节讨论了文献中存在的各种二进制乘法器.华莱士树乘法器[1]是一种快速乘法器,当采用n位数作为乘法器输入时,可产生n个部分积.华莱士树乘法器是一种进位存储加法器,当乘法器输入超过32位时,由于需要更多加法器,且减慢了乘法过程,致使计算过程变得复杂.低功耗高速VLSI可通过布斯算法(BA)和改良布斯算法(MBA)等不同多路转换算法予以实现.

即使布斯乘法器[2]为n个输入生成n/2个部分积,但由于存在2的补码操作,且需相加重叠部分积,以生成乘数结果,因此,增加了计算复杂度.Erle等[3]基于Verilog寄存器传输级别模型,对高效非迭代流水线式执行过程采用二进制位保存方法,相比于面积法,这可实现更好的延迟和计算性能.Vazquez等[4]提出了一种基于多操作数树结构生成简化部分积的并行乘法器架构.而Khan等[5]则采用布斯算法引入了一种高能效的16位乘法器架构.其中,必须以2的补码形式处理输入数据,但他们所进行的工作忽略了实现乘法器架构的硬件需求.另外,Rao和Dubey[6]提出了使用改良布斯算法和压缩加法器来实现高速算术电路的高速乘法器.而Baba和Rajaramesh则提出了一种并行乘法器,其一半部分积通过使用改良布斯编码器生成,另一半部分积则由通过扩展符号位生成.其中,使用进位存储加法器(CSA)和超前进位加法器作为构造块来加速乘法运算.最后需提及的是Arvind Chakrapani等[8],他们提出了一种基于分离器的并行乘法器,该乘法器可将N乘法器输入的部分积减少N/2.尽管部分积和延迟的数量有所减少,但在使用二进制乘法产生部分积的过程中,仍然存在计算复杂度问题.为避免复杂度以及提高乘法器的速度,在此提出了一种基于多路复用器的并行乘法器,能够有效地进行二进制乘法.

2 基于改良分离器的二进制乘法器

文章提出的MAPM采用4×1多路复用器和加法器来计算乘数乘积.此方法的主要优点是无需乘法运算,仅需进行加法运算.MAPM使用部分积生成器(PPG)作为其构造块,这需使用三个4×1多路复用器(M1、M2和M3).其中,PPG负责生成N/2个部分积,然后,使用华莱士树加法器(WTA)将其相加,进而推导乘数乘积.

PPG以一对被乘数位和乘数位作为输入来生成相应的部分积.图1所示为使用三个4×1多路复用器构建的PPG的框图,表1中给出了将执行的基于被乘数位的不同运算.当乘数位对为<00>时,输出为零;当为<01>时,输出为被乘数位;当为<10>时,输出为被乘数的两倍,以此类推,其规律是:将被乘数位左移一次.

图1 部分积生成器(PPG)的框图

为有效计算I3=11×<a1a0>,需要两个4×1多路复用器,每个多路复用器均计算整个乘积的一部分积.第一个多路复用器(M1)计算后两个LSB位,而第二个多路复用器(M2)则计算前两个MSB位.计算所得的4位数便为乘积,并作为I3的输入给出.多路复用器M1和M2的选择表分别如表2和表3中所示.

PPG旨在基于每对被乘数位,生成部分积.其中,可使用N/2级(各级均包含一个PPG和一个WTA)来构建一个N×N MAPM,之后将N/2个部分积相加,从而产生乘法器输出.

当乘数位为<11>时,涉及更高的计算复杂度,在此情况下,输出为乘法器位的三倍,这通过使用两个4×1多路复用器M1和M2进行计算.其中,多路复用器M1和M2的作用是在被乘数<b1b0>=<11>时计算乘积,与乘数b的值(位数)无关,即,所产生的部分积等于以二进制表示的b值的三倍.而M3则用于生成<b1b0>的所有可能值的部分积,因此,选择线<b1b0>由多路复用器M1、M2和M3共用.

其中y∈d×1表示混合像元,d为高光谱遥感图像的波段数,n表示噪声或模型误差,A∈d×m表示端元光谱库(其中d≪m),m为光谱库中端元光谱的个数,x∈m×1为对应于光谱库A的丰度向量。如前所述,每个混合像元y含有的地物光谱数量有限,故基于端元光谱库A表达混合像元y的丰度x是稀疏的[14]。

使用PPG和WTA构建的N×N MAPM的框图如图2中所示.其中,被乘数α=(αN-1 …α2α1α0),乘数位 b =(bN-1 …b2b1b0).所提出的MAPM的显著优点表面在获得乘法器输出的计算复杂度方面(即,复杂度较低),无需任何乘法运算.由于所提出的MAPM操作以“级”表示,因此,该方法以N×N乘数的算法形式呈现.

表1 M3的被乘数位对及其输出

选择线b1b0输出00 I0 =<0000>01 I1=<00α1α0>10 I2=<0α1α00>11 I3=<M2(1) M2(0)M1(1)M1(0)>

表2 4×1多路复用器M1的选择表

选择线b1b0输出00 00 01 11 10 10 11 01

表3 4×1多路复用器M2的选择表

选择线b1b0输出00 00 01 00 10 01 11 10

图2 N×N多路复用器辅助并行乘法器(MAPM)的框图

图3 所提出的用于8位二进制无符号数字的MAPM的仿真波形

图4 所提出的用于8位二进制有符号数字的MAPM的仿真波形

表4 传统乘法器与无符号数字MAPM的对比分析

设备利用率 华莱士树形乘法器布斯乘法器基于分离器的并行乘法器(SBPM)拟多路复用器辅助并行乘法器(MAPM)多路复用器 -10位 4:1 MUX(4)4位 4:1 MUX(1)2位 4:1 MUX(2)总XORs 65 58 42 15 1位XOR2 19 27 12 06 1位XOR3 46 31 30 09分割数量 86/960(8%)10位8:1 MUX(5) 10位 4:1 MUX(4)88/960(9%) 71/960(7%) 26/960(2.7%)4输入LUT的数量150/1920(7%)160/1920(8%) 131/1920(6%) 117/1920(6%)计算时间 47.635 ns 41.428 ns 34.595 ns 31.873 ns

表5 传统乘法器与有符号数字MAPM的对比分析

设备利用率 布斯乘法器 基于分离器的并行乘法器(SBPM)拟多路复用器辅助并行乘法器(MAPM)10位4:1 MUX(4)4位 4:1 MUX(1)2位 4:1 MUX(2)总XORs 59 42 16 1位XOR2 35 12 07 1位XOR3 24 30 09分割数量 108/960(11%) 71/960(7%) 26/960(2.7%)4输入LUT的数量 203/1,920(10%) 131/1,920(6%) 117/1920(6%)计算时间 47.635 ns 34.639 33.07 ns多路复用器 1位4:1多路复用器(16)10位8:1多路复用器(4) 10位4:1 MUX(4)

所提出的MAPM架构的功能通过仿真方式进行验证,而其复杂度则通过使用Xilinx ISE工具生成的综合报告进行分析.由于相比于其他乘法器,所提出的乘法器在产生完整乘数乘积时,仅生成一半部分积,因此复杂度较低.

◎HIB: B型流感嗜血杆菌感染占肺炎的1/3左右。因为在流感患者身上首次发现而得名,实际与流感无关,疫苗就是HIB。部分地区现在没有单独的HIB,只有百白破+HIB四联疫苗和百白破+HIB+灭活脊灰五联疫苗。

神经纤维瘤病2型新突变位点分析(附1例报告)… ……………………… 俞立强,蒋觉安,蒋建华,等 288

为考虑二级风险因素间的相互影响,例如,提供给RBC的原始线路数据错误(e13),最后将生成的错误静态速度曲线发送给了车载设备,因此,采用ANP来确定二级风险因素的权重。计算过程以“数据及系统资源错误(C1)”为例,构造风险因素比较判断矩阵(见表3—表6),进而确定风险因素的权重。

各PPG均由选择线控制,其中,选择线是指一对非重叠被乘数位,最低有效位(LSB)对b1和b0作为第一级L1多路复用器的选择线,b3和b2作为第二级L2多路复用器的选择线,以此类推.第级多路复用器由乘法器bN-1和bN-2的最高有效位(MSB)对进行控制.最后,将采用PPG得到的部分积作为WTA的输入,计算乘数乘积.

3 综合结果分析

第零级PPG产生的部分积直接输出给WTA,第一级PPG产生的部分积补充两个零,第二级PPG产生的部分积补充四个零,以此类推,第级PPG产生的部分积在将其作为WTA输入之前,补充N个零.因此,所提出的MAPM可产生每对被乘数位的部分积,进而使得部分积的数量减少一半.

图3和图4中所示的仿真波形验证了所提出的MAPM对有符号和无符号数字的有效性.表4中所示的综合报告分析表明,所提出的用于无符号数字的8×8 MAPM计算乘数乘积所需的时间分别为WTM、布斯乘法器和SBPM所需时间的66.91%、76.93%和92.13%.另外,表5中给出了有符号数字MAPM的综合报告,并与BM和SBPM进行了比较.对于有符号数字,相比于布斯乘法器和SBPM,所提出的MAPM对硬件的要求明显较低.

所提出的MAPM(乘法器)的性能可通过DC以及旨在实现ASIC的技术库进行确定.由此产生的时序和面积报告分别列于表6到表8中.

表6 有符号MPM的时序报告

类型 扇出 负载(fF)摆(ps)延迟(ps)到达(ps)A[1]端口输入 16 7.2 0 +0 0R P[15]端口输出 - - - +0 2758F

表7 无符号MPM的时序报告

类型 扇出 负载(fF)摆(ps)延迟(ps)到达(ps)A[1]端口输入 16 7.2 0 +0 0R P[15]端口输出 - - - +0 2758F

表8 面积特性

有符号MAPM 无符号MAPM单元 146 145单元区域 455 452

由于所提出的MAPM采用以多路复用器为中心的设计,因此,需要七个具有不同规格的多路复用器.但相比SBPM,实现MAPM所需的其他硬件要求显著较低.同样,MAPM的算法可以扩展为有符号数字,其使用一个额外1位双输入Ex-OR门来计算最终积的符号.此外,MAPM的另一项显著优点是消除了布斯乘法器所使用的二进制补码操作和SBPM中所使用的乘法器操作.因此,可在数字信号处理器(DSP)中的高速乘法和累加(MAC)单元的设计中使用MAPM.

是夜,就在我多次痛快淋漓地排泄之后,依旧不能熟睡。不过,我的状态好多了,虽说不能熟睡,毕竟是能睡了。尽管仅睡了一个多小时便被咳嗽震醒了。老婆嫌我吵,便睡眼朦胧地抱着枕头跑去小屋了。也幸亏她去了小屋,不然,这一夜她又要失眠了。我咳罢又睡,睡罢再咳醒,一夜竟然如此折腾了四、五回。

4 结论

所提出的MAPM克服了传统并行乘法器在硬件要求和计算时间方面的局限性.从综合报告中可以看出,相比于WTM、布斯乘法器和SBPM,使用MAPM无符号数字产生乘积的时间延迟分别短了15.76、9.55和2.72 ns.同时,所提出的MAPM的有符号数字计算时间比BM和WTM分别短14.56 ns和1.569 ns.因此,仅需较少硬件便可实现计算操作的低复杂度,因此MAPM可用于执行高速电路中的信号处理算法和技术.

参考文献:

[1] Wallace CS. A suggestion for a fast multiplier[J]. IEEE Transactions on Electronic Computers, 1964(13): 14–17.

[2] Booth AD. A signed binary multiplication technique[J].Q J Mech Appl Math,1951(4): 236–240.

[3] Erle MA, Hickmann BJ, Schulte MJ . Decimal floatingpoint multiplication[J]. IEEE T Comput, 2009(58):902–916.

[4] Vazquez A, Antelo E, Montuschi, P . Improved design of high-performance parallel decimal Multipliers[J]. IEEE T Comput, 2010(59): 679–693.

[5] Khan MZA, Saleem H, Afzal S, Naseem J . An Efficient 16-Bit Multiplier based on Booth Algorithm[J].Int J Adv Res Tech ,2012(1): 16–18.

[6] Rao MJ, Dubey S . A high speed Wallace tree multiplier using modified Booth algorithm for fast arithmetic circuits[J]. IOSR J Electr Commun Engg, 2012(3):7–11.

[7] Baba S K, Rajaramesh D. Design and implementation of advanced modified Booth encoding Multiplier[J]. Int J Engg Sci Invention ,2013(2): 60–68.

[8] Arvind Chakrapani, Elanchezian T, Karthikeyan G,Divya N, Kabilarasan K, Chinchu Joseph . A Low Complexity Splitter Based Parallel Multiplier for DSP Applications[J].P Natl Acad Sci India A, 2015(85): 277-281.

王锦毅
《福建师大福清分校学报》2018年第02期文献

服务严谨可靠 7×14小时在线支持 支持宝特邀商家 不满意退款

本站非杂志社官网,上千家国家级期刊、省级期刊、北大核心、南大核心、专业的职称论文发表网站。
职称论文发表、杂志论文发表、期刊征稿、期刊投稿,论文发表指导正规机构。是您首选最可靠,最快速的期刊论文发表网站。
免责声明:本网站部分资源、信息来源于网络,完全免费共享,仅供学习和研究使用,版权和著作权归原作者所有
如有不愿意被转载的情况,请通知我们删除已转载的信息