● GTX660/660Ti的显存带宽到底有没有问题
既然问题出在“实际”带宽层面,怀疑的焦点在于有2颗显存颗粒只能享受到1/3的正常带宽,那么测试真实应用环境下的显存带宽就成了我们求证问题的出发点。只要获得了GeForce GTX 660 Ti以及GeForce GTX 660的实际显存带宽数据,并将之与采用常规对称显存体系的其他Kepler架构显卡进行比对,我们就可以判断所谓的带宽会出现瑕疵的问题是否存在了。
图形处理的本质其实就是GPU各单元对各种数学过程进行执行的集合,如果通过常规的图形化测试方法来获取数据,我们就会因为过于拘泥于“图形化”的形式而将测试过程以及结果都包含进一个完整的图形化处理和输出过程中,并因为这些过程的彼此干扰而失去最终结果的“纯净度”。只要绕开图形化的几何关联,直接测试构架底层单元执行对应数学过程的能力,我们才能获得更加准确的结果。
所以,我们决定和以往一样,采用基于Open CL的通用性能测试软件GPCBenchmark来完成数据的收集。尽管我们曾经并依旧对NVIDIA当前Kepler架构驱动的Open CL性能抱有极大的不满,但这些不满主要集中在shared等缓冲层面,所有不涉及shared的测试,比如显存读写能力以及在显存中进行的一系列操作测试而言,GPCBenchmark收集到的数据依旧是正常并且真实的。
我们使用的1.1版本GPCBenchmark测试程序请点此下载。
GeForce GTX 670有效带宽测试
由于不同的应用场合会带来不同的读写操作方式,但无论是图形过程还是通用计算过程都会依赖相同的拷贝过程,所以我们决定采用拷贝测试的结果作为实际带宽测试的基准参考数值。另外,我们引入了采用常规的对称显存布局,显存带宽并无问题的GeForce GTX 670作为对比组来进行数据对比。由于现实操作中的显存带宽必定会低于理论数值,因此只要获得GeForce GTX 660 Ti以及GeForce GTX 660的实际显存带宽与理论带宽之间的比例,并将之与GeForce GTX 670的数据比例进行对比,我们就能得出前两者的显存体系是否存在问题的结论了。很明显,如果GeForce GTX 660 Ti以及GeForce GTX 660的显存实际/理论性能比例低于GeForce GTX 670的比例,这就说明相对于GeForce GTX 660Ti的显存设计存在更低带宽的部分,而不是连续的维持在正常的带宽范围内,这样我们就有充分的理由怀疑GeForce GTX 660 Ti以及GeForce GTX 660在显存体系设计层面层面存在问题了。
测试结果并没有如问题提出者预期的那样,我们的测试显示,在相同主频的前提下,GeForce GTX 660的实际/理论显存带宽比例与GeForce GTX 670相当,而GeForce GTX 660 Ti的比例甚至还要高于GeForce GTX 670,这表明采用非对称显存体系的GeForce GTX 660 Ti不仅不存在所谓的“有2颗显存颗粒只能享受到1/3的正常带宽”的问题,其显存的有效性能比例或者说效率比例(注意,这里讨论的并不是绝对性能)甚至还要强于拥有正常显存体系的显卡。
推荐经销商