“老猫师傅”通过精心收集,向本站投稿了5篇DSP数字信号处理器在科里奥利质量流量计上的应用,以下是小编整理后的DSP数字信号处理器在科里奥利质量流量计上的应用,希望你喜欢,也可以帮助到您,欢迎分享!
- 目录
篇1:DSP数字信号处理器在科里奥利质量流量计上的应用论文
艾默生过程管理旗下的高准(Micro Motion)公司新近推出MVD多参数数字变送器,它以DSP数字信号处理技术的使用为特点,显示了高准公司在科里奥利质量流量测量技术上的雄厚实力。
高准 MVD多参数数字技术提供了一个模式化的结构来重新定义传感器和变送器,并使流量计工作得更灵巧。DSP数字信号处理器的核心处理器与传感器安装在一起,把来自科里奥利传感器中的模拟信号转换为数字信号,并产生一个正比于质量流量的电子信号。
1000系列和2000系列两种变送器可与核心处理器之间通过普通的4线电缆相连接,它们将输出最终测量信号、提供显示和一些其他的功能。变送器也可以一体地与核心处理器安装在一起。
一 什么是DSP数字信号处理器
DSP数字信号处理器是一个实时处理信号的微处理器。家用电脑的微处理器根据储存在存储器里的数据进行工作,这对于结算支票或玩电子游戏是合适的,但它不能处理某些现实世界里的东西,如音频信号、视频信号、医疗传感器的信号或来自于科里奥利传感器的信号。这里我们需要一个非常快的微处理器对这些信号做各种我们想要做的分析。
家用电脑需要显示器、磁盘驱动器、打印机、软件和一些连接电缆,像家用电脑里的微处理器一样,DSP数字信号处理器也需要支持的软件和硬件。在DSP的世界里,我们需要做的第一件事就是要把现实世界里的信号转换成为DSP世界里的信号,所用的装置被称为“模拟―数字转换器”。
我们也需要一些软件去操作“数字化”信号,让我们举一个例子来看看我们用软件可做些什么。在远距离通话中,我们有时会听到自己声音的回声,这令人气恼。人的耳朵习惯于过滤掉短回声,但是长回声使通信非常困难。电话公司复制了你的声音然后在合适的时间加到它的反向以消除回声,不是回声没有发生,它只是被非常复杂的DSP数字信号处理软件过滤掉了。在科里奥利流量计里,我们使测量管在一个已知的频率下振动,因此任何在此振动频率范围之外的频率都是“噪声”,需要除掉它们以准确地确定质量流量。例如,一个50Hz或60Hz的信号很可能来源于与附近动力线的耦合。如何在实际上“过滤”这些多余的信号则需要一些更多的在那时刻所得到的背景信息,图1表明了噪声如何出现在原转换器信号上,以及被过滤后的最终信号。
600)this.width=600“ border=0>
既然我们已经处理了信号,就需要把它从数字世界再转换回到现实世界,完成这项任务的装置是“数字―模拟转换器”。 我们需要一些存储器来储存DSP数字信号处理程序,也需要一些控制装置去实现DSP数字信号处理器。
篇2:DSP数字信号处理器在科里奥利质量流量计上的应用论文
和家用电脑处理数据带来的好处一样,DSP数字信号处理技术也给处理现实世界的信号带来了同样的好处:DSP数字信号处理器比传统的模拟处理器要小得多,这正是我们如何能把所有技术都封装到核心处理器中并使传感器智能化的原因;比起传统的模拟处理器,DSP数字信号处理器使用了更小的能量和更少的元件,并提高了可靠性;DSP数字信号处理器的精确度至少比类似的模拟处理器高一个数量级,这意味着即使较差的传感器信号也能得出较好的最终测量值;通过软件更新,核心处理器可适用于其他的传感器类型。对于高准产品来说,这意味着市场开拓更快;对于用户来说,这意味着更少的备用部件。
三 和DSP数字信号处理器有关的一些数学知识
自然界存在的信号一般是连续的,并可被连续变化的电压信号所表示。科里奥利流量计的信号也是连续信号,当我们通过一个模拟―数字转换器来发送信号时,事实上我们已把信号量化为离散的或数字化的样本。例如,假设我们通过一个12位的ADC以每秒1000个样本的采样率来传送转换器的电压,每毫秒我们将信号量化为212=4096个可能的级别之一。图2显示了一个已被量化后的信号。
600)this.width=600” border=0>
ADC运行一秒我们可采集1000个转换器电压的样本,我们称样本的数目为N。如果需要,我们可把所有的采样值加在一起,然后除以N来计算转换器电压的平均值。以一个类似的形式我们可计算信号的标准偏差,平均值代表我们想测量的实际信号,而标准偏差代表噪声信号。平均值的平方除以标准偏差的平方被称作信噪比或SNR。信噪比越高,被分析的数据的质量就越高。这些计算可用于计算被测变量的值。过滤和减小带宽(技术上叫作十倍程下降率)可用于提高信噪比和质量流量的精确度。
四 傅立叶分析
傅立叶分析是以法国数学家和物理学家 Jean Baptiste Loseph Fourier的名字命名的分析方法。
傅立叶认为任何连续的周期信号可被适当选择的正弦信号波的总和所描述。取一个连续的周期信号并把它转换为一族正弦波被定义为进行一个傅立叶变换。傅立叶变换在数学上很复杂,但我们只需大致了解即可。核心处理器取已量化的转换器信号并进行了信号的傅立叶变换,如图3所示。
600)this.width=600“ border=0>
五 数字滤波
图3中信号的频谱,只有一个信号数据,其余的都是噪声,100Hz的信号代表了测量管的振动频率。我们也看到了在200Hz、300Hz、400Hz等频率处的信号,这些被称为二次、三次和四次谐波。我们还看到了一个来源于动力线耦合的60Hz的小信号。
这些数据在DSP的存储器里只是一个表格,我们想做的是抛弃任何实际测量中所不需要的信息,也就是要忽略掉100Hz测量管频率之外的信息,这被称为数字滤波。
注意到在图3中只有一个信号在100Hz测量管频率附近,在较老的传感器中,通常确定信号附近什么是数据和什么是噪声都是非常困难的。高准传感器在测量管工作频率附近有一个格外高的信号纯度,这就是高准质量流量计具有高精确度的一个重要原因。
六 DSP数字信号处理技术对高准质量流量计的实际意义
与使用时间常量去阻抑和稳定信号相比,使用DSP数字信号处理技术的主要好处之一是能够以一个被提高了的采样率去过滤实时信号,这使得流量计对流量的阶跃变化的`响应时间快多了。使用MVD多参数数字变送器的响应时间比使用模拟信号处理的传统变送器快2~4倍,更快的响应时间会提高短批量控制的效率和精确度。在发动机测试装置里,我们能更好地测量发动机对燃料喷射的阶跃变化的响应。用一个紧凑的校验装置还能提高现场校验高准流量计的能力。图4是MVD多参数数字科里奥利变送器、压力变送器和普通科里奥利变送器对流量的阶跃变化的响应。
600)this.width=600” border=0>
DSP数字信号处理技术另一个颇有价值的实例是气体测量。气体测量是一个更富有挑战性的应用,因为高速气体通过流量计会引起相对较严重的噪声。通过高准Elite系列传感器,与流量信号混杂的噪声已被减至最小。现在DSP数字信号处理技术能更好地滤波,并进一步减小了质量流量计对噪声的敏感度。采用MVD多参数数字变送器测量气体的结果在重复性和精确度上都有了显著提高,效果如图5、图6所示。
600)this.width=600“ border=0>
600)this.width=600” border=0>
七 未来
DSP数字信号处理技术提供了一个“通往处理的窗户”,今天,当浏览这个窗户时,首先集中在测量管振动频率附近的信号上。实际上,有意地抛弃了其余的信息,很可能正是隐藏在这些“无用的”数据里的信息会铺平通往新的诊断技术的道路。例如,频谱分析可能会引导我们取得在夹杂空气或团状流动流体测量上的进展,流体在测量管内壁的附着也是另一个有希望被DSP数字信号处理技术检测到的故障,频谱的变化也很可能被用于预测传感器的故障。
八 总结
今天,DSP数字信号处理技术通过给予质量流量计一个更快、更可靠、更高效、更稳定、更灵活的的解决办法,体现了它的价值。这也使得我们的传感器更灵巧。对于未来,高准公司充满了信心,DSP数字信号处理技术将在推动流量测量上显示出巨大的潜力。
篇3:在DSP处理器上并行实现ATR算法
摘要:介绍了由DSP芯片构成的多处理器并行系统的结构和性能以及在多处理器并行系统上并行实现ATR算法需要考虑的要总是,着重研究了在指令级并行DSP处理器上实现ART算法的并行化软件开发方法,对ATR算法的实用化和工程化具有重要的参考价值。
关键词:DSP 自动目标识别(ATR) 并行算法 处理器 软件设计
自动目标识别(ATR)算法通常包括自动地对目标进行检测、跟踪、识别和选择攻击点等算法。战场环境的复杂性和目标类型的不断增长使ATR算法的运算量越来越大,因此ATR算法对微处理器的处理能力提出了更高的要求。由于通用数字信号处理芯片能够通过编程实现各种复杂的运算,处理精度高,具有较大的灵活性,而且尺寸小、功耗低、速度快,所以一般选择DSP芯片作为微处理器来实现ATR算法的工程化和实用化。
为了保证在DSP处理器上实时地实现ATR算法,用算法并行化技术。算法并行化处理的三要素是:①并行体系结构;②并行软件系统;③并行算法。并行体系结构是算法并行化的硬件基础,并行算法都是针对特定的并行体系结构开发的并行程序。根据DSP处理器的数目,ATR算法的并行实现可以分为处理器间并行和处理器内并行。处理器间并行是指多个DSP处理器以某种方式连接起来的多处理器并行系统,ATR算法在多个处理器上并行招待。根据处理器使用存储器的情况,多处理器并行系统又可分为共享存储器多处理器并行系统和分布式多处理器并行系统。处理器内并行是指在单个DSP处理器内通过多个功能单元的指令级并行(ILP)来实现ATR算法的并行化。本文分别对在共享存储器多处理器并行系统、分布式多处理器并行系统和指令级并行DSP处理器上并行实现ATR算法进行了探讨。
1 在共享存储器多处理并行系统上实现ATR算法
在共享存储器多处理器并行系统中,各个处理器通过共享总线对所有的存储器进行操作,实现各个处理器之间的数据通信。而在任一时刻,只允许一个处理器对共享总线进行操作。所以处理器对存储器进行读/写操作时就必须先获得对共享总线的控制权,这通过总线仲裁电路实现。然而,由于所有的处理器只能通过一条共享总线对存储器进行访问,这在处理器数目比较多或者处理器之间频繁交换数据的情况下容易引起总线冲突和等待而降低整个并行系统的运行速度。共享存储器多处理器并行系统的优点是结构简单,当处理器的数目较少时,可以达到较高的加速比。
ADSP2106x处理器支持最为常用的共享存储器多处理器并行系统,组成多处理器系统的每一片ADSP2106x的片内存储器统一编址,任一ADSP2106x可以访问其它任何一片ADSP2106x的片内存储器。由于片内SRAM为双口存储器,因而这种访问并不中断被访问处理器的正常工作。每个处理器片内SRAM既是该处理器的局部存储器,又是共享存储器的部分。在不增加辅助电容的情况下,通过外部总线接口直接相连的处理器数量最多为6个。由于每个处理器的工作程序放在其片内的双口SRAM中,因此各个处理器可以实现并行处理,这是ADSP2106x的存储器结构所决定的。
ATR算法在共享存储器多处理器并行系统中实现时,在编写并行算法程序方面应当重点考虑的问题包括:
(1)均衡地把任务分配给各个处理器
ATR算法在共享存储器多处理器并行系统中实现任务级并行,因此必须把ATR算法划分为计算量均衡的多个任务,把各个任务分配给多个处理器,才能发挥多处理器并行系统的最大并行效率。
(2)尽量减少多处理器之间数据通信
由于多处理器只能通过一条共享总线对存储器进行访问,这在多处理器之间频繁交换数据的情况下容易引起总线竞争而降低整个并行系统的运行速度。
(3)利用单个处理器的并行编程特性
充分应用单个处理器的并行编程特性,有利于缩短各个处理器上任务的运行时间。例如,ADSP2106x的32位浮点运算单元包含一个乘法器、一个加法器和移位逻辑电路,它们并行工作;比特倒转寻址在傅立叶变换运算时非常有用;循环寻址在作卷积、数字滤波运算时经常用到等。
篇4:在DSP处理器上并行实现ATR算法
在分布式多处理器并行系统中,多处理器有各自独立的存储器,多个处理器通过通信口相连构成分布式多处理器并行系统。分布式多处理器并行系统的加速比和处理器的数目呈线性关系,所以只要增加处理器的数目,分布式多处理器并行系统的处理能力就能够成比例地增加。分布式多处理器比较适合于构成大规模并行系统。
目前,计算量过大仍然是制约许多有效的ATR算法实时实现的个主要因素。ATR算法在分布式多处理器并行系统上实时实现是一个很有潜力的研究领域,特别在地基和天基雷达信号处理系统中有广阔的应用前景。分布式多处理器并行系统的连接方式有线形、树形、星形、网孔和超立方体结构等。树形和星形网络的优点是网络管理容易、数据通信进寻径简单;缺点是树形网络的根节点处理器和星形网络的中央节点处理器的输入/输出吞吐量大,易造成通信瓶颈。所以树形和星形网络不适合ATR算法各个任务数据通信量较大的应用场合。
在分布式多处理器并行系统中并行实现ATR算法目前还处于研究的初始阶段,在编写并行算法程序应当重点考虑两个方面:
(1)各处理器任务的均衡分配
在分布式多处理器并行系统中处理器的数目通常较多,
只有合理地对众多的处理器均衡地分配任务,才能最大地发挥并行系统的总体性能,提高并行系统的加速比。
(2)处理器节点间的高效通信
在分布式多处理器并行系统中数据通信都是点对点通信。即两个相邻的处理器之间通过通信口通信。因此需要合理安排各个处理器节点在网络结构中的.位置,尽可能地缩短处理器节点间的通信路径长度,从而实现处理器节点间的高效数据通信。
篇5:在DSP处理器上并行实现ATR算法
在单片DSP处理器内通过多个功能单元的指令级并行(ILP)实现ATR算法的并行化处理,目前适合ATR算法实时处理的指令级并行芯片是TI公司的TMS320C6x系列DSP。TMS320C6x系列DSP处理器是第一个使用超长指令字(VLIW)体系结构的数字信号处理芯片。下面以TMS320C62x定点系列DSP为例说明指令级并行的原理和ATR并行算法软件开发方法。
3.1 VLIW体系结构
TMS320C62x的内核结构如图1所示。内核中的8个功能单元可以完全并行运行,功能单元执行逻辑、位移、乘法、加法和数据寻址等操作。内核采用VLIW体系结构,单指令字长32位,取指令、指令分配和指令译码单元每周期可以从程序存储器传递8条指令到功能单元。这8条指令组成一个指令包,总字长为256位。芯片内部设置了专门的指令分配模块,可以将每个256位的指令分配到8个功能单元中,并由8个功能单元并行运行。TMS320C62x芯片的最高时钟频率可以达到200MHz。当8个功能单元同时运行时,该芯片的处理能力高达1600MIPS。
(本网网收集整理)
3.2 基于TMS320C62x的并行算法软件开发方法
基于TMS320C62x的并行编译系统支持C语言和汇编语言开发并行程序代码。通常,开发ATR并行算法按照代码开发流程的三个阶段进行并行程序设计:第一阶段是开发C代码;第二阶段是优化C代码;第三阶段是编写线性汇编代码。以上三个阶段不是必须的,如果在某一阶段已经实现了ATR算法的功能和性能要求,就不必进入下一阶段。
(1)开发C代码
开发C代码需要考虑的要点包括:
①数据结构
TMS320C62x编译器定义了各种数据结构的长度:字符型(char)为8位,短整型(short)为16位,整型(int)为32位,长整形(long)为40位,浮点型(float)为32位,双精度浮点型(double)为64位。在编写C代码时应当遵循的规则是:避免在代码中将int和long型作为同样长度处理;对于定点乘法,应当尽可能使用short型数据;对循环计数器使用int或者无符号int类型,避免不必要的符号扩展。
②提高C代码性能
应用调试器的Profile工具可以得到一个关于C代码中各特定代码段执行情况的统计表,也可以得到特定代码段招待所用的CPU时钟周期数。因此可以找出影响软件程序总体性能的C代码段加以改进,通常是循环代码段影响软件程序总体性能。
③数据的定标
由于TMS320C62x是定点系列芯片,不支持浮点操作。在程序编写过程中,应当尽量采用定点的数据结构。而实际处理的数据通常都是浮点的,所以需要把浮点数据通过定标转化为整型数据处理,提高程序的处理速度。数据的定标是十分关键的步骤,既要使数据处理精度满足性能要求,又要防止在数据处理过程中出现溢出。
(2)优化C代码
优化C代码包括向编译器指明不相关的指令、循环展开、循环合并、使用内联函数、使用字访问短整型数据和软件流水等方法。
①向编译器指明不相关的指令
为使指令并行操作,编译器必须确定指令间的相关性,只有不相关的指令才可以并行执行。如果编译器不能确定两条指令是不相关的,则认为是相关的,安排它们串行招待。用户可通过如下方法指明相关的指令:
・关键字const可以指定一个目标,const表示一个变量或者一个变量的存储单元保持不变,使用const可以提高代码的性能和适应性。
・一起使用-pm选项和-03选项可以确定程序优先级。在程序优先级中,所有源文件都被编译成一个模块,从而使编译器更有效地消除相关性。
・使用-mt选项向编译器说明在代码中不存在存储器相关性,即允许编译器在无存储器相关性的假设下进行优化。
②循环展开
循环展开就是把循环计数小的循环展开,成为非循环形式的串行程序,或者把循环计数大的循环部分展开,减少循环迭代次数,增加单个循环内的代码,使得循环内的操作可以均匀分布在各个功能单元上,保持DSP处理器的各个功能单元满负荷运行。
③循环合并
如果两个循环计数差不多、循环执行互不相同的操作,可以把它们合并在一起组成一个循不。当两个循环的负荷都不满时,这是非常有用的。
④使用内联函数
TMS320C62x编译器提供的内联函数是直接映射为内联指令的特殊函数,内联函数的代码高效、代码长度短。用户可以使用内联函数并行优化C代码。
⑤使用字节访问短整型数据
内联函数中有些指令是对存储在32位寄存器的高16位和低16位字段进行操作的。当有大量短整型数据进行操作时,可以使用字(整型数)一次访问两个短整型数据。然后使用内联函数对这些数据进行操作,从而减少对内存的访问。
⑥软件流水
软件流水是用来安排循环指令,使这个循环多次迭代并行执行的一种技术。在编译时使用-o2和-o3选项,编译器可对循环代码实现软件流水;使用-o3和-pm选项,使优化器访问整个程序,了解循环次数;使用_nassert内联函数,防止冗余循环产生;使用投机执行(_mh选项)消除软件注流水循环的排空,从而减少代码尺寸。
在嵌套循环中,编译器仅对最里面的循环执行软件流水,因此对招待周期很少的内循环作循环展开,外循环进行软件流水,这样可以改进C代码并行执行的性能。使用软件流水还应当注意:尽管软件流水循环可以包含内联函数,但是不能包含函数调用;在循环中不可以有条件终止指令;在循环体中不可以修改循环控制变量。
(3)编写线性汇编代码
编写线性汇编代码是并行算法软件开发流程的第三个阶段。了提高并行算法软件代码的性能,对影响并行程序速度的关键C代码可以用线性编重新编写。编写线性汇编代码不需要指明使用的寄存器、指令的并行与否、指令的延迟周期和指令使用的功能单元,汇编优化器会根据情况确定这些住处。优化线性汇编代码的方法包括:为线性汇编指令指定功能单元,使得最后的汇编指令并行执行;使用字访问短整型数据;使用软件流水对循环进行优化。编写线性汇编代码的工作量非常大,需要很长的开发周期,而且开发后的汇编代码不能像C代码那样移植在其它的DSP平台上。
应用上述并行程序开发方法,在TMS320C6201 EVM板上实现了宽带毫米波雷达目标时延神经网络识别算法。经过实际测试,并行算法程序执行时间为0.850ms,满足了目标识别算法的实时性需求。
★ 在时光里作文
★ 作文在双休日里
DSP数字信号处理器在科里奥利质量流量计上的应用(推荐5篇)




