回首页
小熊论坛 | 用户名: 密码: 没有注册?
我现在的位置:小熊在线首页 -> 显卡频道 -> 正文

NVIDIA夺面双雄 GT200全球同步首测

BEAREYES.COM 北京 [ 原创 ] 作者:小熊在线-硬件评测室 日期:2008年06月16日


第5页:谁能主导未来 GPGPU和CUDA差异比较

GPGPU和CUDA实现上的差别

  如果只是显卡从游戏手中夺得了游戏功能也就算了,最近几年的高清视之战也是GPU从CPU手中夺取本来该由CPU处理的工作,而近几年随着通用计算处理器GPGPU(General-Purpose computing on Graphics Processing Units)的提出,在科学和专业领域、医学等领域以颇有建树,CPU的地位更是进一步被GPU所蚕食,民用领域中,实际上我们所说的高清硬件解码也是GPGPU计算的一个初级形态。

  大家也都知道,目前针对GPU实现通用并行计算的CUDA解决方案与GPGPU两者实现有何区别呢?这里笔者陈述一下自己的理解。

  GPGPU和CUDA实现最的差异就在对GPU通用计算的理解层次不同。GPGPU仍旧把GPU当作一块显卡,它使用DirectX和OpenGL这样的图形API实现计算目的,正因为如此,它需要编程人员了解图形AIP和硬件的细节。这样编程模型也限制了随机读取显存和线程协调方式。而CUDA的通用并行计算实现则更彻底,打破了图形API的限制,编程人员不会感觉到和以往在CPU编程的区别。

  比如在图形API中,API框架限制了在预先制定好的内存单元输出32位浮点(渲染目标格式是RGBA*8),这限制了很多新的算法不适合使用图形API来实现。图形API强制用户把数据存储为纹理格式,它需要把长数组打包为2D纹理格式。这对于通用计算不但繁琐,而且必须加入额外的寻址算法,这都会增加额外的开销。

  与此相对应,CUDA使用C的一个扩展来进行并行计算,它允许编程人员使用C编程,不需要把问题转化为图形处理元素来处理,任何能用C编程的程序员能够理所当然的掌握CUDA编程。CUDA对地址单元和存储数量没有任何限制,同时也支持数据存储为标准数组形式,同时能够对任意显存地址进行访问。

  由于GPGPU开发程序需要程序员详细了解专业的图形语言等,因此一直都无法大规模普及,而解决这一问题的关键就是NVIDIA的CUDA。

关于CUDA:

  CUDA是NVIDIA针对GPU的C语言开发环境开发的通用计算平台标准,全称是Compute Unified Device Architecture统一计算设备架构。CUDA可以充分应用GeForce 8/9系列 GPU 流处理单元的浮点运算能力,解决复杂的科学运算问题,诸如地质勘探,生物学,流体力学,金融建模等等。根据NVIDIA的测试,8800显卡在CUDA架构中的峰值运算能力可达520GFlops,因此如果构建SLI双卡系统,可以达到1TFlops(即每秒运算1万亿次)的强大运算能力

《CUDA如何调用GPU众多线程》...继续下一页>>

《GPU发展之路:从CPU手中夺权开始》...返回上一页<<


[1] [2] [3] [4] [5] [6] [7] [8] [9] [10] [11] [12] [13] [14] [15] [16] [17] [18] [19] [20] [21] [22] [23] [24] [25] [26] [27] [28] [29] [30] [31] [32] [33] [34] [35] [36] [37] [38] [39] [40] [41] [42] [43] [44] [45] [46] [47] [48] [49] [50] [51] [52] [53] [上一页] [下一页]

《NVIDIA夺面双雄 GT200全球同步首测》分页索引


第1页:前言
第2页:索引
第3页:超越自我 GT200目标1.5倍G80性能
第4页:GPU发展之路:从CPU手中夺权开始
第5页:谁能主导未来 GPGPU和CUDA差异比较
第6页:CUDA如何调用GPU众多线程
第7页:CUDA要革谁的命?X86处理器很紧张
第8页:夺面双雄第一面:GT200并行计算架构
第9页:让线程满负荷高效工作 SIMT架构解析
第10页:CUDA实例—Folding@home分布式计算
第11页:CUDA走进桌面应用 GPU视频转码比CPU快18X
第12页:CUDA PhysX物理加速
第13页:夺面双雄另一面:GT200图形处理架构
第14页:英雄难过美人关 GT200 Tech Demo解析
第15页:改进的几何着色和流输出
第16页:Register file寄存器数量翻倍
第17页:Dual-Issue的回归
第18页:改善的纹理性能
第19页:更高的像素/纹理比率
第20页:ROP为高分辨率改进 增加到32个
第21页:引入512bit位宽 带宽高达142GB/s
第22页:渲染管线和架构的额外增强
第23页:动态功耗管理
第24页:GTX280/260规格
第25页:更像是一款艺术品 GTX280实物赏析
第26页:GT200 Die Size达576mm2
第27页:GTX280采用P651版型
第28页:GPU、NVIO2、供电单元
第29页:公版GeForce GTX280细节
第30页:公版GeForce GTX280散热器
第31页:XFX GTX 280显卡
第32页:耕昇GTX 280显卡
第33页:耕昇GTX 260显卡
第34页:测试平台说明
第35页:GPU视频转码测试
第36页:Folding@home测试
第37页:3DMark Vantage
第38页:纹理/像素填充测试
第39页:GPU物理性能测试
第40页:LightMark 2007
第41页:Crysis
第42页:ASSASSINS CREED
第43页:Call of Duty 4:Modern Warfare
第44页:Unreal Tournament 3
第45页:BioShock
第46页:Company of Heroes:Opposing Fronts
第47页:Lost Planet: Extreme Condition
第48页:Call of Juarez benchmark
第49页:World in Conflict
第50页:Enemy Territory:Quake Wars
第51页:功耗需求情况
第52页:第七部分:GT200与G80性能比较
第53页:GTX200引领异构计算的未来

全文

BEAREYES.COM 北京 日期:2008年06月16日

网友评论:(请各位网友遵纪守法并注意语言文明,留言仅供参考不代表本站立场) TOP↑
用户名: 密码: 没有注册?
点击排行
留言排行
小熊在线公司版权所有 beareyes.com ©1999-2007 All Rights Reserved
本网站由 北京快网 提供FastDNS智能解析服务