内容
最近,我正在考虑将哪种图形卡用于AI培训。我不想太麻烦,但我也希望拥有强大的计算能力。
是否坚持使用游戏笔记本,台式计算机或云计算平台?我在Internet上检查了一些信息,并对其进行了整理,以方便将来进行比较和查询,以及为有需要的朋友提供一些便利。
对于图形卡的深度学习训练功能,我们不仅要关注其具有多少CUDA内核,还要关注其频率,视频内存,视频内存位宽等。更客观的指标是看一下它的单精度性能(FP3 2)性能有多少Tflops。
触发器的理论峰值:
单精度理论峰值= GPU芯片数* GPU Boost频率*内核数*单个时钟周期内可以处理的浮点计算的数量。
单精度理论峰值= FP32内核* GPU Boost Clock * 2。
笔记本图形卡:
人工智能大咖啡的性能比较:
云服务器显卡比较:
这是特定云服务器平台使用的图形卡参数的比较。
在NVIDIA网站上,您可以看到上述图形卡仍在许多云平台中使用。
MX450对抗GTX1650:
网页给出的索引显示,超频MX450的FP32计算能力已超过GTX1650。
GTX1650:128位宽,192GB / s带宽,896个流处理器,频率1350?1486MHZ,4G显存;
MX450:64位宽和80GB / s带宽(支持PCIE 4. 0),896个流处理器,频率1395?1575MHz,2G视频内存;
实际上,MX450视频内存减少了一半。尽管流处理器的数量还不错,但是图形卡的位宽减少了一半,而视频内存的带宽也减少了一半。在某些情况下仍然存在差距。
新一代移动图形卡的性能比较:
GeForce MX 450:896 * 1. 575GHz * 2 = 2. 8 TFlops
GeForce RTX 3060:3840 * 1. 70GHz * 2 = 1 3. 1 TFlops
GeForce RTX 3070:5120 * 1. 62GHz * 2 = 1 6. 6 TFlops
GeForce RTX 3080:6144 * 1. 71GHz * 2 = 2 1. 0 TFlops
RTX30系列台式机图形性能比较:
GeForce RTX 3060:3584 * 1. 78GHz * 2 = 1 2. 8 TFlops
GeForce RTX 3060Ti:4864 * 1. 67GHz * 2 = 1 6. 2 TFlops
GeForce RTX 3070:5888 * 1. 73GHz * 2 = 2 0. 4 TFlops
GeForce RTX 3080:8704 * 1. 71GHz * 2 = 2 9. 8 TFlops
GeForce RTX 3090:10496 * 1. 7GHz * 2 = 3 5. 7 TFlops
JD上报价的显卡基本上没有货,因此借用两张图片并记录价格。
许多商店都有商品,但价格相对较高。某商店技嘉/技嘉RTX3080 10G游戏显卡RTX3080 GAMING OC-10GD Magic Eagle,报价:¥ 1409 9. 00。
每个人都是自由的,坐在长凳上,经常看一下,慢慢地等待,有一天你可以买一个合适的!
摘要:
俗话说,买新的显卡而不是旧的显卡。新的架构更加高效,并且具有更多的计算能力。如您所见,MX450已经能够选出GTX1650。新的RTX30系列移动版本还可以与原始的Daniel Tesla V100和P40竞争。
在选择时,除了要选择哪张显卡外,它还具有多少个独立的视频内存,这还取决于显卡可以运行的最大频率。一些笔记本电脑会限制频率以控制散热问题,而某些游戏制造商将使用台式机图形卡来提高性能。这种游戏本的性能更强,但通常体积更大。
从我的角度来看,为了便于携带,可以使用全功能的RTX3060和较低频率的RTX3070。性能没有太大差异。如果频率很高,则散热是个问题,而且体积会更大。对于台式计算机,RTX3080更好。适当地,RTX3090的性能并没有增加太多,但是价格却要高得多。
徐老2021/3 / 17
本文来自本站,转载请注明本文网址:
http://www.pc-fly.com/a/shenmilingyu/article-367928-1.html
……