Tesla卡和Geforce卡的异同(K20X和Titan对比)

文/Leon@BPQN

Geforce的单核心旗舰Titan,其实就是Tesla K20X的Geforce版本(为追求性能Titan主频略升级)。网上有教程如何把Geforce卡通过改动硬件,“变身”Tesla卡或Quadro卡,瞬间升值数倍,这样岂不是要灭了老黄财路了吗?非也非也,外观改了骨子里的东西是改不了的,Geforce注定只是顽皮的孩子,贪玩、简单、情绪不稳定、智商不低但情商不高,不过一门心思发起疯来那能量也绝逼是无穷的。就算换上西装革履,也掩盖不了他不靠谱的本质。

 

以下的图表援引自网络,有些过时,在图后面有说明。

 

需要指出的是:Titan并未像其他的Geforce卡一样,阉割掉双精度,它的双精度还是非常牛的,能达到1.28TFlops,这一点也奠定了Titan的“准专业卡”地位。

图中的显存容量也是不准确的,目前在售和准在售的卡中,K10是4BG*2(双核心),K20是5GB,K20X是6GB,K40是12GB

面对动辄数天甚至数月的高负荷运算,显存没有ECC简直是要命的!简单理解:有了ECC运算就不会出错—万一出了一点点错,运算结果都是天壤之别!数据运算来不得一点点不稳定和错误,因此Tesla卡仍然是专业计算用户的不二之选。不过如果做视频编辑之类的应用,出一点点错误也不易被察觉,Titan和其他Geforce卡都是不错的选择。

Titan支持CUDA Stream Hyper-Q, Dynamic Parallelism, GPUDirect Peer to Peer;不支持Tesal所具备的ECC, Shuffle指令,GPUDirect RDMA,软件认证以及NVIDIA的技术支持。总体而言,TITAN是一个很好的CUDA程序开发GPU,但不适合于应用部署和集群应用,其他的Geforce卡更是不必提了。

总结,Tesla卡比Geforce卡优越的地方:

硬件上:

(1)显存有ECC
(2)部分芯片内部的DP单元没有阉割
(3)DMA控制器可以全功能运转,双向的DMA控制器(可以有效的利用PCI-E总线)
(4)完整的双精度计算单元(Titan未阉割)


软件上,
(1)有TCC驱动。
(2)在所有平台下支持P2P/IPC等。

老黄知道,为了几个核心的功能,很多人没办法不多花几倍的价钱,否则他们可能要花更多成本去面对难以预期的风险。Tesla卡,贵吗?那要看跟它创造的价值相比,两三万一张,一点都不贵。

 

文中部分的数据引用自网络