第二章 TMS320C6000体系结构
2.1 TMS320C6000系列概述
2.1.1 TMS320C6000简介
1997年,美国TI公司发布了新一代DSPs芯片TMS320C6000,包括定点系列和浮点系列,其中定点系列是TMS320C62xx,浮点系列是TMS320C67xx,二者相互兼容。*早推出的C6201的运算速度已经达到1600MIPS,在业界**突破1000MIPS,在数字信号处理器处理能力上创造了新的里程碑,并因此获得美国EDN杂志“1997年度创新大奖”。
2000年3月,TI发布了新的C64xx内核,主频1.1GHz,处理速度接近9000MIPS,总体性能比C62xx提高了10-15倍。其中C6414在600MHz主频下,只利用50%的运算能力就可以同时进行单通道MPEG-4视频编码、单通道MPEG-4视频解码和单通道MPEG-2视频编码的处理。
2.1.2 TMS320C6000的结构特点
C6000系列DSPs*主要的特点是在体系结构上采用了Veloci TI甚长指令字(VLIW,Very Long Instruction Word)结构。
VLIW体系结构DSPs中,是由一个��长的机器指令字来驱动内部的多个功能单元(这也是V11w名字的由来)。每个指令字包含多个字段(指令),字段之间相互独立,各自控制一个功能单元,因此可在单周期发射多条指令,实现很高的指令级并行效率。
编译器在对汇编程序进行编译的过程中,决定代码中那些指令合成一个甚长机器指令,在一个周期中并行执行。这种指令上的并行安排是静态的,一旦决定,无论DSPs任何时候运行,它都保持不变。VLIW体系结构也可以看做是一种依赖于编译器的超标量实现方案,而且比一般的超标量结构更易于实现。C6000的VLIW采用了类RISC指令集,使用大的、统一的寄存器堆,结构规整,具有潜在的易编程性和良好的编译性能,在科学应用领域可以发挥良好的作用。TI公司配合C6000推出了世界上**个效率可达60%。70%的汇编语言级C编译器,它产生的代码的平均效率是以往DSPs编译器的3倍。
……