Dual-Issue是指标量指令+矢量指令并行处理能力,其实在NVIDIA的产品上,Dual-Issue一直是一个有意思的话题,NV30不支持Co-Issue导致产品并行能力较差,因此在NVIDIA在NV40时期加入了Co-Issue功能,并且命名为Dual-Issue,与之前的Co-Issue相比,执行方式上也更灵活,不仅支持常见的3D+1D,还可进行了2D+2D的操作。而到了G80时期,由于流处理器单元采用了1D标量的处理方式,因此在进行图形运算时Co-Issue功能并没有被开启,不过在进行CUDA通用计算时却可以开启。

NVIDIA一直对外宣称G80拥有518GFlops的浮点运算能力,而进行图形运算时却只能达到345GFlops,后来在G84/86中在图形运算时也开启了Dual-Issue功能,不过可惜的是在G92中,Dual-Issue功能还是被取消了。
GT200中终于又可以支持Dual-Issue功能了!GeForce GTX 200的SM当中特殊功能单元(SFU)主要负责复杂算术计算、归属解释和执行浮点MUL指令。通过采用SP的MAD单元,来在每时钟周期执行1个MUL和ADD操作,GeForce GTX 200 GPU当中的单个流处理核心现在几乎可以用全速Dual Issue的方式来进行累加(MAD)操作和MUL操作(3flops/SP)。同时,在相同的时钟周期内采用SFU来进行另外一次MUL操作。优化和直接的测试显示,效率比前代GPU提升93-94%。

GeForce GTX 200 GPU当中全部的SPA单元,可以提供将近1 Tereaflop的峰值单精度IEEE754浮点运算效能,接近G80的3倍。NVIDIA的演示文档里用3DV的两项GPU物理性能运算来比较Single-Issue与的理论指标,我们后面会有针对Dual-Issue的测试。