NVIDIATeslaP100计算:首先测试卡的表现震惊世界

虽然GTX 1080 / 1070具有强大的性能,他们只能被视为新的Pascal家族的中级标准。真正的杀手是顶芯gp100。它有3840个FP32单精度和双精度1920 fp64 CUDA核心,主要用于高性能计算。
八特斯拉的P100
特斯拉P100作为首发(又称特斯拉似乎P1),只能开3584的单精度,双精度1792核心,甚至是单精度和双精度浮点性能是10.6tflops,高5.3tflops,和4096位16gb hbm2搭配高带宽的内存,并支持NVLink互连总线,以取代传统的PCI-E。
那么最后的表现是什么圣地亚哥超级计算中心的史葛乐grandross沃克,史葛Le Grand,Amazon Web Services的联合制备琥珀测试工具一般的计算模拟,在分子生物学领域,并与特斯拉P100 NVIDIA合作进行了一项测试,包括单、双路、四路。
由于测试中使用的硬件仍然是工程样本,所以操作系统是Linux,测试工具和测试方法是专门为纯计算性能而设计的,因此测试结果反映了纯粹的计算能力,与游戏性能无关。
事实上,核心的gp100不应该出现在消费者层面,和顶级卡如GTX 1080 Ti,GTX TITAN X 2将使用gp102。
在对比的产品,特斯拉M40和麦斯威尔gm2003072架构核心流处理器基于单精度性能超过7tflops,双精度只有0.21tflops,384-bit 12GB GDDR5显存的搭配。
特斯拉K80采用Kepler架构、大芯gk2104992流处理器,单精度和双精度浮点性能8.74,2.91tflops,两套384-bit 12gb GDDR5。
Tesla K40的核心是gk1102880流处理器,单双精度浮点性能4.29,1.43tflops,和384-bit 12gb GDDR5。
GTX 1080,泰坦x,980 Ti和980也加入了对比。此外,有几个纯CPU,包括双向E5-2697 V4 / / 2650 2698 V3 V3,有32 / 32 / 20芯分别。
具体测试的原理,过程中什么都不多说,太强了,只看一看结果简单:



性能测试结果
与前任M40相比,P100的性能有了很大的提高,大多数项目都在50%左右,有些甚至超过80%,有的甚至接近100%!
事实上,在大多数时候,单路P100可以杀死两道M40,有10-20%的主要范围。
消费者的卡牌游戏相比,P100单路径有GTX Titan x四标准等效,也可以看到GTX 1080也非常激烈,大多数情况下,已达到或接近M40的水平,但不够稳定,有时相当于一个单一的泰坦X,有时甚至超过两人。
最遗憾的事是,NV Link总线电源尚未发挥,和双四路P100升降范围一般没有PCI-E为好