DSP并行处理系统设计

来源:教案设计 发布时间:2022-10-25 20:30:08

下面是小编为大家整理的DSP并行处理系统设计,供大家参考。

DSP并行处理系统设计

 

 DSP 并行处理系统的设计

 我从中国知网上找了篇论文——《多 DSP 并行处理系统的设计与开发》。在简单阅读后,我结合并行处理与分布式系统这一课程,谈谈自己的一些理解和收获。

 虽然 DSP 技术得到了飞速的发展,出现了高速 DSP 芯片,但是在图像、视频以及大数据处理场合地方,使用单个 DSP 芯片还往往还是显得捉襟见肘,不能满足系统的需求,这就迫切需要把多个 DSP 组成互联系统,以增强整体数据处理能力减少任务的执行时间。

 各 DSP 厂家为适应这种需求,先后推出了并行 DSP。并行 DSP 在传统DSP 基础上提供了如下两大功能:与外部设备交换数据的外部总线、串口、中断、握手等信号线;专门的并行控制口线,能够方便地构成多 DSP 并行处理系统。

 多 DSP 并行处理系统的基本性能取决于组成系统的几个要素:处理单元、并行处理系统网络结构、并行算法、任务分配方法,他们之间紧密联系、互相依赖。多 DSP 并行处理系统设计的核心是实现多 DSP 之间的通信控制及数据交换。

 并行处理系统网络包括处理单元通信口、矩阵开关组成的网络硬件,以及控制路由选择、消息转发、虚通道等操作的网络软件。其功能主要是为各处理单元提供数据交换的通道,并负责子任务传送和控制调度信号的传递。处理单元之间的网络结构大致可分为两类:一种是共享总线或共享存储器系统,称之为紧耦合式并行系统;另一种是各处理单元有各自独立的数据存储器而通过通信口相连的分布式并行系统,称为松耦合式系统。

 文章中列举了现今世界上两家顶级 DSP 芯片制造商(ADI 公司和 TI 公司)

 的两款性能优异的并行 DSP 芯片—— ADSP21060/4TMS320C40/60 。在对两种通用并行 DSP 性能参数比较之后,得出结论:

 ADSP21060/40 在速度上更快一些, 特别是做 FFT 运算,而且它的片内RAM 很大。TMS320C40/60 通信口的使用则更加灵活,可以收发全双工工作,并且可分裂成 12

 个单向通信口,而 DSP21060/40 的通信口是半双工工作的。所以在做系统设计时,我们可以根据实际问题的特点, 选择一款合适的芯片——不要最好,而要最合适。

 针对 ADSP21060/40 这款芯片,多 DSP 并行处理系统可有以五种结构形式:

 共享总线式多 DSP 并行处理系统、基于 Link 口的多 DSP 并行处理系统、基于

 SPORT 的多 DSP 并行处理系统、基于 HPI/IDMA 的多 DSP 并行处理系统、基于数据交换的多 DSP 并行处理系统。具体选择那一种方式,应视具体情况而定。文章中详细介绍了五种结构形式,下面对共享总线的结构简单描述下。

 共享总线就是系统中所有 DSP 的外部总线(地址、数据和访问控制总线)都直接连接在一起,各 DSP 片内存储器和 IO Port 寄存器(也映射成存储器地址)以及挂接在总线上的外部存储器、外设都作为共享资源被各个 DSP 访问。每个 DSP 有唯一的 IDx,使用总线请求信号/BRx 中的一个作为它使用外部总线的请求, 并根据固定优先或循环优先机制来获取总线控制权而成为主处理器,其它均为从处理器,处理器寻址空间被统一映射。主处理器对从处理器的访问是通过读写(/RD 、 /WR) 和确认 (ACK) 等控制信号握手完成的,并可在主从处理器间建立 DMA (Direct Memory Access) 传输。另外,主处理器还可以向所有从处理器作广播式数 据传送:在存储映射空间中有一块存储区定义为广播式数据区,向它写入数据等价于向所有处理器同时写入此数据,而确认信号 ACK 则由所有从处理器“相与” 合成。共享总线系统对总线访问是直接的,具有速度快、迟延小的优点,在实现数据共享的过程中常常省去了数据传输步骤,从而也节省了宝贵的片内存储器资源。ADI 公司的 SHARC 系列高性能浮点 ADSP2106X 提供了共享总线所必要的控制握手信号线/BR1-6、ACK、/SW 以及片内总线仲裁功能,使最多 6 片 ADSP2106X 无需外部控制电路直接相连就可以组成一个存储空间统一、 DSP 相 互之间既紧密耦合又相对独立、数据传送效率极高的共享总线式并行处理系统, 如图 1 所示。

 ADSP2106X (ID1) 并行总线接口 ADSP2106X (ID2) 并行总线接口 ADSP2106X (ID3) 并行总线接口

  地址 / 数据总线控制信号线

 共享存储器及外设 监控引导 EEPROM

 系统外部接口等

 图一 基于ADSP2106X的共享总线式并行处理系统

  ADSP2106X 适于组成共享总线系统的独到之处是它有大容量的片内存储 器,使 ADSP2106X 大多数时间下的取指令、存取数据都是在各自片内完成的, 与外部总线无关。这样各片ADSP2106X 可以较高的效率独立工作,外部总线的压力也大大减轻。但其缺点主要在于对总线的特别依赖,当处理器数目增加、处理器间数据交换频繁时,总线瓶颈的限制将突显出来。因此共享总线系统适于处理器数目较少的场合。在对实时性要求很高的场合,可将众多ADSP2106X 分组为若干共享总线子系统,子系统之间可用其它通信链路口连接,这样组成的混合式多处理器系统可以达到比单纯的分布式存储系统更高的工作效率。

 此外,我也查找了些资料,对比了解下不同连接的拓扑结构的优缺点。

 共享总线系统使多个处理单元共同使用一套数据总线,存储器所占用的地址段在各 DSP 中通常是相同的,这种结构的优点是简单,当DSP 数目较少(少于 6 个)时,可以达到较高的加速比;但当处理单元个数较多时,共享总线将造成频繁的总线冲突和等待,引起各处理单元等待总线令牌的时间大大增加。除此之外, 处理单元的连接方式很多,例如树形、星形、网孔、超立方体结构等。

 树形和星形网络的优点是网络管理容易,数据通信时寻径简单,缺点是处理单元数目很多时,“根”节点或中央节点处理单元的输入/输出吞吐量太大,易造成通信瓶颈。网孔结构将处理单元的互连从一维扩展到二维空间,大大增强了网络的运算能力和通信能力,使并行处理系统的加速能力提高。

 网孔结构和超立体结构充分利用了任务的并行度,具有较高加速比的潜力。相对而言,二维网孔结构的通信容量基本上能满足要求,而复杂度适中,将它改进成二维网环可以具备超立方体的某些优点,因此采用这种结构来完成多种的实时信号处理比较理想。

 超立体结构以多维形式进一步增强了网络的通信能力,它的优点是网络全对称,在节点连接特性、通信路径长度、算法的嵌入特性、与其它连接形式的兼容性之间提供了很好的平衡性,但随着处理单元个数的增多,对网络硬件的要求也相应增加。

 文章中主要描述了 DSP 并行处理系统的硬件连接拓扑结构。实际上,要得到

 一个高性能的 DSP 并行处理系统,并行算法、任务分配方法也是很重要的。任务分配和并行算法的好坏直接影响并行处理系统的性能。

推荐访问:并行 设计 系统 dsp并行处理系统的设计 dsp并行操作
上一篇:新能源汽车维护与故障诊断--全套教案73页(行云新能配套比亚迪E5教案)
下一篇:幼儿园小班美术教案《堆雪人》

Copyright @ 2013 - 2018 小艾秘书网 All Rights Reserved

小艾秘书网 版权所有 湘ICP备11019447号-75