回首页
小熊论坛 | 用户名: 密码: 没有注册?
我现在的位置:小熊在线首页 -> 显卡频道 -> 正文

NVIDIA夺面双雄 GT200全球同步首测

BEAREYES.COM 北京 [ 原创 ] 作者:小熊在线-硬件评测室 日期:2008年06月16日


第17页:Dual-Issue的回归

  Dual-Issue是指标量指令+矢量指令并行处理能力,其实在NVIDIA的产品上,Dual-Issue一直是一个有意思的话题,NV30不支持Co-Issue导致产品并行能力较差,因此在NVIDIA在NV40时期加入了Co-Issue功能,并且命名为Dual-Issue,与之前的Co-Issue相比,执行方式上也更灵活,不仅支持常见的3D+1D,还可进行了2D+2D的操作。而到了G80时期,由于流处理器单元采用了1D标量的处理方式,因此在进行图形运算时Co-Issue功能并没有被开启,不过在进行CUDA通用计算时却可以开启。

  NVIDIA一直对外宣称G80拥有518GFlops的浮点运算能力,而进行图形运算时却只能达到345GFlops,后来在G84/86中在图形运算时也开启了Dual-Issue功能,不过可惜的是在G92中,Dual-Issue功能还是被取消了。

  GT200中终于又可以支持Dual-Issue功能了!GeForce GTX 200的SM当中特殊功能单元(SFU)主要负责复杂算术计算、归属解释和执行浮点MUL指令。通过采用SP的MAD单元,来在每时钟周期执行1个MUL和ADD操作,GeForce GTX 200 GPU当中的单个流处理核心现在几乎可以用全速Dual Issue的方式来进行累加(MAD)操作和MUL操作(3flops/SP)。同时,在相同的时钟周期内采用SFU来进行另外一次MUL操作。优化和直接的测试显示,效率比前代GPU提升93-94%。

  GeForce GTX 200 GPU当中全部的SPA单元,可以提供将近1 Tereaflop的峰值单精度IEEE754浮点运算效能,接近G80的3倍。NVIDIA的演示文档里用3DV的两项GPU物理性能运算来比较Single-Issue与的理论指标,我们后面会有针对Dual-Issue的测试。

《 改善的纹理性能》...继续下一页>>

《Register file寄存器数量翻倍》...返回上一页<<


[1] [2] [3] [4] [5] [6] [7] [8] [9] [10] [11] [12] [13] [14] [15] [16] [17] [18] [19] [20] [21] [22] [23] [24] [25] [26] [27] [28] [29] [30] [31] [32] [33] [34] [35] [36] [37] [38] [39] [40] [41] [42] [43] [44] [45] [46] [47] [48] [49] [50] [51] [52] [53] [上一页] [下一页]

《NVIDIA夺面双雄 GT200全球同步首测》分页索引


第1页:前言
第2页:索引
第3页:超越自我 GT200目标1.5倍G80性能
第4页:GPU发展之路:从CPU手中夺权开始
第5页:谁能主导未来 GPGPU和CUDA差异比较
第6页:CUDA如何调用GPU众多线程
第7页:CUDA要革谁的命?X86处理器很紧张
第8页:夺面双雄第一面:GT200并行计算架构
第9页:让线程满负荷高效工作 SIMT架构解析
第10页:CUDA实例—Folding@home分布式计算
第11页:CUDA走进桌面应用 GPU视频转码比CPU快18X
第12页:CUDA PhysX物理加速
第13页:夺面双雄另一面:GT200图形处理架构
第14页:英雄难过美人关 GT200 Tech Demo解析
第15页:改进的几何着色和流输出
第16页:Register file寄存器数量翻倍
第17页:Dual-Issue的回归
第18页:改善的纹理性能
第19页:更高的像素/纹理比率
第20页:ROP为高分辨率改进 增加到32个
第21页:引入512bit位宽 带宽高达142GB/s
第22页:渲染管线和架构的额外增强
第23页:动态功耗管理
第24页:GTX280/260规格
第25页:更像是一款艺术品 GTX280实物赏析
第26页:GT200 Die Size达576mm2
第27页:GTX280采用P651版型
第28页:GPU、NVIO2、供电单元
第29页:公版GeForce GTX280细节
第30页:公版GeForce GTX280散热器
第31页:XFX GTX 280显卡
第32页:耕昇GTX 280显卡
第33页:耕昇GTX 260显卡
第34页:测试平台说明
第35页:GPU视频转码测试
第36页:Folding@home测试
第37页:3DMark Vantage
第38页:纹理/像素填充测试
第39页:GPU物理性能测试
第40页:LightMark 2007
第41页:Crysis
第42页:ASSASSINS CREED
第43页:Call of Duty 4:Modern Warfare
第44页:Unreal Tournament 3
第45页:BioShock
第46页:Company of Heroes:Opposing Fronts
第47页:Lost Planet: Extreme Condition
第48页:Call of Juarez benchmark
第49页:World in Conflict
第50页:Enemy Territory:Quake Wars
第51页:功耗需求情况
第52页:第七部分:GT200与G80性能比较
第53页:GTX200引领异构计算的未来

全文

BEAREYES.COM 北京 日期:2008年06月16日

网友评论:(请各位网友遵纪守法并注意语言文明,留言仅供参考不代表本站立场) TOP↑
用户名: 密码: 没有注册?
点击排行
留言排行
小熊在线公司版权所有 beareyes.com ©1999-2007 All Rights Reserved
本网站由 北京快网 提供FastDNS智能解析服务