R600架构爆发!1600SP的5870架构介绍
在谈Radeon HD 5800的Cypress(RV870)之前,我们不得不提它的前身R600。AMD-ATI首先以R600(HD2900XT)进入DirectX 10的3D世界,然后演变出经典的RV770(HD4800),再进化到现在的RV870,成为世界上第一个入门DirectX 11的3D世界的显示核心。
拥有320个流处理单元的Radeon HD 2900XT(代号:R600)
AMD-ATi的R600架构被命名为“TeraScale”,是基于SIMD(Single Instruction Multiple Data,单指令多数据)架构,一共内置了高达320个流处理单元(stream processing units)、16个纹理单元(TMU)和16个光栅处理单元(ROP)。虽然R600拥有320个流处理单元,但实际上每5个流处理单元(上图中的小黄点)才组成一个流处理器(Shader Processors),因此以AMD-ATI的流处理器(Shader Processors)来算的话,其实R600只有64个完整的流处理器。
由于每个流处理器中的5个流处理单元是分别负责不同工作的,假如遇到一条指令,只有其中一个单元可以运行,其他四个只能空闲,也就是说320个流处理单元中只有64个单元能运行这条指令,相比NVIDIA的通用流处理器,如G80/G92的128个流处理器都能完成这样的指令。正因为这种R600的效率就显得低下了,这种情况。
拥有800个流处理单元的Radeon HD 4870(代号:RV770)
AMD-ATI当然意识到问题所在,于是在RV770上,首先对“TeraScale”架构进行了优化,并大幅度增加流处理单元,从R600的320个暴增到800个,也就相当于拥有了160个完整的流处理器,纹理单元也相应增加到40个,光栅单元保持16个。RV770性能也因此暴涨,HD 4850/4870在竞争中拥有不少优势。
拥有1600个流处理单元的Radeon HD 5870(代号:RV870)
RV870,又被命名为Cypress,采用了第二代“TeraScale 2”核心架构,相比RV770再次大幅度强化。首先最明显的改变是RV870的流处理单元再次翻倍,达到1600个之多,相比上代RV770有800个流处理单元,刚好两倍。为容纳这个1600个流处理单元,这次工程师把它们分成两部分,左右两个SIMD阵列,分别是20组SIMD阵列,每组80个流处理器(上图红色方形)和4个纹理单元(黄色方形),加起来就是1600个流处理单元、80个纹理单元。光栅处理单元(ROP)也从16个增加到32个,进一步增强填充率。
Cypress(RV870)核心流处理器结构示意图
和R600以来的架构一样,Cypress(RV870)的每个流处理器也是由四个流处理单元、一个特殊功能流处理单元、分支单元、通用目的寄存器等几个模块组成,命名为线程处理器(Thread Processors),与R600的流处理器(Shader Processors)只是命名上不同而已,总共320个(1600/5)。这样的话,在处于1D指令时,Cypress的效率也将好于NVIDIA的GT200。
待机仅27W,HD5870的四大改进
在了解Cypress RV870的架构后,下面我们看看新架构在性能方面作了那些调整和优化。
新的图形引擎:
RV870采用新的图形引擎
Cypress(RV870)采用了新的图形引擎,带来了全新的DirectX 11技术、新的指令集、改进的纹理单元等,更低的资源消耗便能获得更好的性能提升。
改进的抗锯齿(AA)算法:
改进的抗锯齿(AA)算法
之前RV770(HD 4800)抗锯齿技术效率上的改进给玩家们留下了深刻的印象,这次Cypress(RV870)在抗锯齿技术上再次作了较大的优化,使HD 5870拥有更好的抗锯齿性能。
新的各向异性过滤(AF)算法:
新的各向异性过滤(AF)算法
Cypress采用了全新的各向异性过滤(AF)算法,几乎零资源开销的情况下,获得更好的各向异性过滤效果。
实时电源管理:
实时电源管理
Cypress采用了新的电源管理模式,在待机时可降低核心和显存频率以及电压,使HD 5870的待机功耗比HD 4870大幅度降低,根据官方资料显示,其待机功耗只有27W,而HD 4870待机功耗为90W,可以说新的实时电源管理表现相当出色。
上一页 [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] ... 下一页 >>
|