基于TMS320C6000的优化策略分享

消耗积分:1 | 格式:rar | 大小:0.2 MB | 2017-10-25

分享资料个

分享到：标签：TMS320C6000 优化编程 DSP
　　1 TMS320C6000的硬件设计和指令系统
　　TMS320C6000系列DSP（数字信号处理器）是TI公司最新推出的一种并行处理的数字信号处理器。它是基于TI的VLIW技术的，其中，TMS320C62xx是定点处理器，TMS320C67xx是浮点处理器。本文主要讨论TMS320C6201。该处理器的工作频率最高可以采用50MHz，经内部4倍频后升至200MHz，每个时钟周期最多可以并行执行8条指令，从而可以实现1600MIPS的定点运算能力，而且完成1024定点FFT的时间只需70μs。
　　1.1 TMS320C6000的硬件结构
　　基于TMS320C6000的优化策略分享

　　图1是TMS320C6000 CPU的结构图。
　　TMS320C6000的CPU有两个数据通道A和B，每个通道有16个32位字长的寄存器（A0～A15，B0～B15），四个功能单元（L，S，M，D），每个功能单元负责完成一定的算术或者逻辑运行。A、B两通道的寄存器并不是完全共享，只能通过TM320C6000提供的两个交换通道1X、2X，才能实现处理单元从不同通道的寄存器堆那里获取32位字长的操作数。
　　TMS320C6000的地址线为32位，存储器寻址空间是4G。C6201片内集成有1Mbit SRAM——512Kbit的程序存储器（根据需要可全部配置成Cache）和512Kbit的数据存储器。通过片内的程序存储空间控制器，CPU一次可以取出256bit，即一次最多可以取出8条32位指令。
　　C6201有32位的外部存储接口EMIF为CPU访问外围设备提供了无缝接口。外围设备可以是同步动态存储器（SDRAM）、同步突发静态存储器（SBSRAM）、静态存储器（SRAM）、只读存储器（ROM），也可以是FIFO寄存器。
　　为了便于进行多信道数字信号处理，TMS320C6000配备了多信道带缓冲能力的串口McBSP。McBSP的功能非常强大，除具有一般DSP串口功能之外，还可以支持T1/E1、ST-BUS、IOM2、SPI、IIS等不同标准。McBSP最多支持128个信道;支持多种数据格式（8/12/16/20/24/32bit）的传输;可自动进行u律、A律压扩。其工作速率可达到1/2时钟速率。
　　TMS32C6000提供的16位主机接口（HPI）使得主机设备可以直接访问DPS的存储空间。通过内部或外部存储空间，主机和DSP可以交换信息。主机也可以利用HPI直接访问映射进存储空间的外围设备。
　　DSP器件一般都带有DMA控制器，可以在CPU操作的后台进行数据传输。TMS320C6201的DMA控制器有4个独立的可编程通道，可以同时进行四个不同的DMA操作，每个通道的优先级可以通过编程设定。每个通道可以根据需要传输8/16/32bit的数据，并且DMA控制器可以访问全部32位的地址空间。此外，还有一个辅助通道允许DMA控制器响应主机通过HPI口发来的请求。
　　1.2 指令系统
　　C62xx和C67xx共享同一个指令集。C67xx可以使用所有的C62xx指令，但因为C67xx是浮点芯片，怕以C67xx的指令集中有一些指令只能用于浮点运算。TMS320C6201CPU的设计采用了类似于RISC的结构，指令集简单、运算速度快。8个功能单元负责不同功能的运算，指令和功能单元之间存在一个映射关系。其中，L单元有23条指令，M单元有20条指令，S单元29有条指令，D单元有26条指令。
　　TMS320C6201的大部分指令都可在单周期内完成，都可以直接对8/16/32bit数据进行操作。同时，TMS320C6201指令集针对数字信号处理算法提供了一引起特殊指令：为复杂计算提供的40bit的特殊操作的加法运算;有效的溢出处理和归一化处理;简洁的位操作功能等。TMS320C6201中最多可以有8条指令同时并行执行;所有指令均可条件执行。以上所有特点提高了指令的执行效率、减小了代码长度、大大减少了因跳转引起的开销、提高了编码效率。
　　流水线操作是DSP实现高速度、高效率的关键技术之一。TMS320C6000只有在流水线充分发挥作用的情况下，才能达到1600MIPS的速度。C6000的流水线分为三个阶段：取指、解码、执行、总共11级。和以前的C3x、C54x相比，有非常大的优势，主要表现在：简化了流水线的控制以消除流水线互锁;增加流水线的深度以消除传统流水线结构在取指、数据访问和乘法操作上的瓶颈。其中取指、数据访问分为多个阶段，使得C6000可以高速地访问存储空是。
　　2 优化编程的几个方法
　　使用TMS320C6000进行程序设计时，首先的感觉是汇编指令集太小了。C6000在设计时采用了一种类RISC机的结构，运算速率特别快，但是指令集却非常简单。象DSP算法中常用的乘加指令、循环操作指令等，在C54x和C3x中两条指令就可以完成的功能，而在C6000中却需要一个循环体，所以它的程序设计一般比较复杂。要想充分发挥C6000的运算能力，必须从它的硬件结构出去，最大限度地利用八个功能单元，使用软件流水线，尽量让程序无冲突的并行执行。
　　并行处理的长处在于，在处理彼此之间没有承接关系的运算时，在CPU资源允许的情况下可以并行完成。但对于前后有承接关系或者判断、跳转频繁的情况，就无法发挥并行的优势。一般循环体都满足并行处理的条件，并且循环体往往是程序中耗时最长的地方。因此进行C6000应用开发时应将优化重点放在循环体上。为了降低开发难度，C6000提供了很多在高级语言（如ANSI C）一级对程序进行优化的方法。在应用满足实时性处理要求时，应尽量采有这种方法。但是这种方法的效率比较低，C语言优化最好的例子是点乘，这种循环使用C语言进行优化可以百分之百地的利用CPU资源，程序的并行性达到最好。但是我们在做20点的点乘时发现它耗时是汇编语言程序的3倍。所以如果系统的实时性要求比较高，就不能使用这种优化方法了。
　　这时可以考虑使用线性汇编语言进行开发。线性汇编语言是TMS320C6000中独有的一种编程语言，介于高级语言和低级语言之间。因为在用手写汇编语言进行应用开发时，开发者除了要精通C6000的指令系统之外，还必须为指令分配功能单元、考虑指令的延这和功能单元之间的配合以及合理分配使用32个寄存器，才能写出高效的并行指令，发挥C6000的威力。上面任何一个方面出现问题，都会严重影响算法的效率。
　　线性汇编语言的指令系统和汇编语言的指令系统完全相同，但是它有自己的汇编优化器指令系统，用于和汇编性汇编语言时不需要考虑指令的延时、寄存器的使用和功能单元的分配，完全可以按照高级语言的方式进行编写。当然由于它不是高级语言，有许多编程的限制。例如，在优化循环体时，不能使用跳转到循环体之外的跳转指令;另外计数顺只能使用减计数，如果使用加计数，优化器将不能工作等等。但总的说来，它的代码效率远远高于高级语言，而且开发难度和开发周期比汇编语言要小得多。
　　在实际开发过程中需要具体情况具体分析，选择一种高效、快捷的开发方法。以下结合应用开发中的几个模块来简述我们使用的优化方法。

下载并关注上传者 低至0.43元/天 开通VIP 免费下载

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

发评论

相关下载
相关文章

下载排行榜

继电保护原理
2024-08-21 27次下载

下载
BK4819模拟双向无线电集成电路数据手册
2024-08-05 12次下载

下载
TPL0501 256抽头单通道数字电位器数据表
2024-07-31 11次下载

下载
18W电源方案CR6212BSJ+CR3004SLD-实物样机图
2024-08-06 6次下载

下载
LTK51468带频率同步功能、超低底噪、低EMI、2x70W 立体声音频功率放大器数据手册
2024-08-12 5次下载

下载
信号完整性与电源完整性-电源完整性分析
2024-08-12 5次下载

下载

基于TMS320C6000的优化策略分享

德州仪器DSP的TMS320C6748技术手册

TMS320C6745/6747数字信号处理器数据手册

TMS320C55xDSP应用系统设计

在仿真环境下实现TMSC系列DSP的程序自引导

如何将ADS7842连接到TMS320C5400和TMS320C6000 DSP的详细资料概述

关于TMS320C6000 DSP的复位电路

TMS320C55x DSP EMIF与TMS320C6000 DSP EMIF存储器接口的特点比较

TMS320C6000上的手动调谐环路和控制代码的详细资料概述

如何从TMS320C54X到TMS320C55X的代码迁移详细英文资料概述

在TMS320C6000和TMS320C5000设备中使用MCBSP的特点详细概述

TMS320C6000EABI的迁移指南详细资料概述

TMS3C6000 DSP的五个最有效的优化代码详细介绍

TMS320C6000汇编语言工具v7.4用户指南详细资料概括

TMS320C6000数字信号处理器（DSP)设备程序的介绍和优化指导

TMS320C6000 程序指南

TMS320C6000 DSP 优化应用报告

TMS320C6000系列DSP优化介绍

TMS320C6474 DSP 多路缓冲串口（McBSP）用户指南

TMS320C6000汇编语言工具 v6.1 用户指南

TMS320C6474 DSP天线接口用户指南

TMS320C6000最优编译器

TMS320C6000汇编语言攻击V7.6用户指南

TMS320C6000 DSPBIOS 5.x应用程序接口参考指南

TMS320C6000 DSP 外设概览 参考指南

TMS320C64x+ DSP 大字节DSP库 程序员参考

TMS320F28x 优化C／C++编译器用户指南

TMS320C6000系列DSP的软件优化

基于TMS320C6000DSPS系统的Flash引导自启动设计

TMS320C6000系列DSP主机引导方式的实现

基于TMS320C6000系列DSP的Flash编程方法

TI DSP实时操作系统

北京革新创展科技有限公司-TI TMS320F28335 C2000开发套件

基于TMS320的高速系统的示例数据集

基于TMS320C6203 DSP芯片实现G．729ab声码器的应用方案

基于TMS320DM642多媒体芯片实现视频监控系统的应用方案

低功耗数字信号处理器TMS320C5405的性能特点及应用

超低功耗浮点DSP TMS320C6745/47的特点性能及应用范围

基于TMS320C6000系列DSP器件实现嵌入式系统的优化设计

回顾TI面向网络DSP应用的DSP TMS320C642x概述

采用DSP器件TMS320C32实现存储器接口的应用设计

采用C6000系列DSP器件的大容量无线传输技术的研究

基于ADSP218x系列和TMS320C62x系列实现串行引导方案的设计

基于TMS320C6000高性能DSP实现I2C总线接口的软硬件设计

通过采用PCI9052接口实现TMS320C6713芯片与PC机间的高速数据传输

基于TI TMS320C6748定点/浮点DSP C674x处理器

采用TMS320C6713B与TMS320F2812实现大功率变流器通用控制平台的设计

tms320c6000系列dsp的flash启动设计

TMS320C6748和TMS320C6747芯片对比

TMS320C6000 DSP芯片介绍

dsp tms320c6000基本作用的认识

基于TMS320C6455系列DSP的中断系统的使用

浅谈TMS320C6000系列中断设置问题

TMS320C6000 DSP的编程实现 浅谈TMS320C6000编程

DSP320C6000的指令列表汇集

TMS320C6000芯片结构图和基本特性

tms320c6000系列dsp编程工具与指南 浅谈dsp编程

介绍 TMS320C64x 的c代码优化

介绍 TMS320C64x 多极高速缓冲存储器

TMS320C6474：多核数字信号处理器

TMS320C6472:定点数字信号处理器

下载排行榜

继电保护原理

BK4819模拟双向无线电集成电路数据手册

TPL0501 256抽头单通道数字电位器数据表

18W电源方案CR6212BSJ+CR3004SLD-实物样机图

LTK51468带频率同步功能、超低底噪、低EMI、2x70W 立体声音频功率放大器数据手册

信号完整性与电源完整性-电源完整性分析

TMS320C6000 DSP 外设概览参考指南

TMS320C64x+ DSP 大字节DSP库程序员参考

TMS320C6000 DSP的编程实现浅谈TMS320C6000编程

tms320c6000系列dsp编程工具与指南浅谈dsp编程