配个深度学习的服务器，需要多大内存起步？

点击联系发帖人 时间：2017-08-14 00:47

如何打造一款深度学习服务器如何打造一款深度学习服务器科学观百家号2017年是人工智能井喷的一年，这年头不懂点AI都不好意思谈笑风生。工欲善其事必先利其器，你是否也想配台深度学习服务器来学习一发？GPU我们先来选GPU吧，废话少说这里必须要上老黄最新的核弹！而且我们要4个！NVIDIA TITAN V Volta上某东看了看，一个33999￥，而且有钱还不一定买得到，要不请美帝同学代个购？主板然后是主板，为了上 4 GPU要挑4X16 PCIe并且物理上真的能放4个，最好搭配X99 CPU，然后要大内存插口最好大于4个，并且要上训练时数据IO用的SSD和用来做RAID5的机械硬盘所以SATA接口不能太少，看来看去这款不错华硕（ASUS） X99-E-10G WS好吧价格是6499￥CPU一般来说我们希望CPU的PCIe lanes要多，但是单个民用CPU一把来说就40个，虽说深度学习对CPU性能要求不高，但万一以后遇到有些复杂操作要在CPU上完成，为防止其制约性能，我们就来个英特尔（Intel）Extreme系列 i7 6950X 酷睿十核 2011-V3接口我擦价格11999￥CPU制冷CPU这么好，不能亏待了她，上水冷！美商海盗船（USCorsair）H115i 一体式水冷CPU散热器心疼959RMB内存一般内存要是显存的两倍多大，那就2套4对16G显存吧金士顿（Kingston）骇客神条 Predator内存DDR4 3000主频套条16GB*4一套7199￥，黑心颗粒厂商，内存真TM贵SSD为了保证训练时数据能快速进行IO（IO性能瓶颈一般来说是最大的），所以来块SSD来放当前训练用的数据吧。ImageNet不到200G所以上个240G可以不？Out了！当我们计算量提升、算法能力提升的时候，唯一没有提升的就是数据量，所以这里我们要考虑到更大的数据可能性，例如Google的Open Image就灰常大了，所以不好意思，我们这里要1T闪迪（SanDisk）加强版 960G 固态硬盘2499￥机械硬盘为了存储足够多的数据集，盘要大，并且为了保证我们的心血，要做个RAID，不如就来4个12T的硬盘做RAID5吧希捷 12TB M SATA3 台式机机械硬盘单价4299￥电源算了下功率，得来个1500W的，那就上海盗船巨无霸电源美商海盗船 AX1500i 全模组电源 80Plus金牌额定1500W机箱好了，终于只剩机箱了，东西那么多，要选个大的美商海盗船（UCSorsair）AIR540 白色中塔机箱总价193,944￥我就想入个门啊啊啊啊！正经姿势以上都是我吹的（不过挑选原则基本都对），作为穷屌并没有钱来试验一下到底可不可行以及瓶颈在哪里、有多大。不过可以悄悄转发并@你的老板，买来试试告诉我可不可以作为一个简单的入门，正经推荐如下：这个作为入门真心可以，10k左右即可入手。对于深度学习CPU要求真不高，上面的可以再换个便宜点的CPU。当然如果预算充足可以把显卡换成1080Ti，因为这个显存大，性价比最高。另外如果考虑到将来扩容可以买个更好的主板和功率更大的电源，以上。最后声明！并没有打广告的意思，宣传上如果出了偏差，是要负责的！之后会专门写一篇文章讲述服务器的系统驱动软件配置。同志们再见！本文由百家号作者上传并发布，百家号仅提供信息发布平台。文章仅代表作者个人观点，不代表百度立场。未经作者许可，不得转载。科学观百家号最近更新：简介:创业服务平台，让路不再迷茫作者最新文章相关文章Just For CV
自己配深度学习主机的那些坑
最近花了8400元装了一台深度学习主机，
主板是二手的技嘉GA-Z77P-3D,
CPU是二手的Intel Xeon E3-1230 v2，
显卡技嘉1080ti gaming oc,
内存威刚DDR3 ，
硬盘西部数据240G的SSD。
计划放在家里，可以随时teamviewer远程操作，架得高一点，不让孩子们乱动。通过teamviewer连接，所以没打算配显示器。
下面说说其中的几个坑：
1.电脑城装的win7不敢用，各种劫持和广告，2345的劫持已经和系统深度融合、炉火纯青了，不得不服，不知道多少人偷偷看着这个系统，必须重装。
2.没有显示器，只能用HDMI连接电视，我家电视是海信39N2600。装Ubuntu系统刚进入要安装的时候就黑屏了，幸好发现这篇文章（http://shamangary.logdown.com/posts/773013-install-torch7-cuda-cudnn-nvidia-driver），完美解决，太感谢原作者了！
3.安装完系统，我是采用直接自己手动重新分区，安装ubuntu，没有考虑原有win7,安装ubuntu16.04后，进入不了系统，估计是引导坏了。
4.没办法,我也不知怎么解决，就想干脆安装windows10吧。在微软官网下了win10,用U盘做了启动盘，用HDMI线连接电视安装win10,一路顺畅，不得不说，微软系统还是稳定、bug少。
5.安装完win10,又想干脆再做个ubuntu16.04安装盘，装双系统试试。在2的加持下，这一次安装ubuntu时考虑的是和win10共存的双系统方案，果然安装一路顺畅。
6.给系统联网。有部360随身wifi3代，可惜网上没有ubuntu的驱动，在网上找了好久Linux下的无线网卡，貌似都不理想，有一些但是支持内核版本太低。家里没有网线接路由器，有部旧酷派android手机，使用USB连接主机，使用android的USB共享网络，不需要安装任何驱动，这种网络对主机来说USB线就是根网线，非常完美。为什么那些做无线网卡的不这样搞，这是真正的不需要任何驱动，支持任何系统的无线网卡啊！
7.安装teamviewer。win10下完美。ubuntu下tv只有在HDMI连接电视的时候才能用，不然就黑屏，不连接显示器，ubuntu系统就不启动显卡，不启动显卡，teamviewer就没有画面。经过teamviewer工作人员指点，需要装一个虚拟显示器，就是个接线端子，欺骗显卡工作。于是淘宝上买了一款HDMI的，43大洋。
8.鉴于安卓手机给ubuntu系统USB共享网络还是太麻烦，手机一旦断电需要重新设置USB网络共享，所以还是决定搞个无线网卡，大多数USB无线网卡Ubuntu下都要自己安装驱动，还不一定驱动能编译成功，于是决定搞一台无线路由器，使用client模式，用网线给主机联网，这样才是真正的免驱！最后在京东上买了84大洋的TL-WR800N 300M迷你型无线路由器。
9.目前虚拟显示器和无线路由器还在路上，希望别再有坑。
没有更多推荐了，配深度学习工作站，需要多大内存？ - 知乎有问题，上知乎。知乎作为中文互联网最大的知识分享平台，以「知识连接一切」为愿景，致力于构建一个人人都可以便捷接入的知识分享网络，让人们便捷地与世界分享知识、经验和见解，发现更大的世界。5被浏览<strong class="NumberBoard-itemValue" title="分享邀请回答3 条评论分享收藏感谢收起如何配置一台适用于深度学习的工作站？ - 知乎有问题，上知乎。知乎作为中文互联网最大的知识分享平台，以「知识连接一切」为愿景，致力于构建一个人人都可以便捷接入的知识分享网络，让人们便捷地与世界分享知识、经验和见解，发现更大的世界。<strong class="NumberBoard-itemValue" title="被浏览<strong class="NumberBoard-itemValue" title="7,886分享邀请回答docs.google.com/spreadsheets/d/111PwO4C4Clh16nUaAKACx46scQKaEntd6QGua8_pyIw/edit#gid= 。各位伸手党们可自取。从能耗比上看，Kepler到Maxwell基本上是个渐进式的变化，越往高端走改进越不明显。这也从一个侧面说明了为啥在Maxwell的时代有人还用着老Kepler Titan“再战几年”。新的Pascal架构甩了上两代几条街，在能耗比上完全碾压。有人会问——我在实验室电费不要钱，是不是就可以用旧架构了？完全不是。第一，除去Titan Z这样的2合1怪物以外，前两代的单卡性能被从GTX 1070到Titan Xp全线碾压，而每个工作站上能插的PCI-E通路数量是有限的。第二，电源的功率输出是有限的；在同等算力下老架构需要更多电力，因此如果是洋垃圾或者自组平台的极端情况（4槽全满）下，电源根本没法提供这样的功率输出。从价格上看，常常有一些小伙伴猜测，在同等算力的情况下，上一代产品或许会更便宜。很不幸，上图反驳了这种观点。本图中的价格（横轴，取了log以方便显示）来自于eBay上二手卖家的出价，或者
(一个奇葩购物网站) 上的新品折扣价格。可以明显地看出，在同等算力的情况下新一代Pascal架构产品的二手价格要低于老架构产品的二手价格。另外，在上图中没有显示的是，新架构的产品往往具有更大的显存容量，例如GTX 1060有6G显存，GTX 980有4G显存，而GTX 780 Ti/GTX Titan分别提供了3G和6G的显存。最后，新架构的产品支持更新的CUDA功能集以及GPU加速库版本，从而也会获得另一些额外的性能提升。因此在不同GPU架构间，无脑选Pascal。关于量力而行前两图中的直线（第二张图因为横轴是log scale所以有变形）是对于各点的线性拟合。可以看出无论是功耗还是定价，它们基本上都和计算能力保持了线性相关。这也就意味着老黄的刀砍得非常的准，除了Titan这类高端货外完全是一分钱一分货，不大存在捡便宜的可能。另外，在GPU的世界里投资折旧率很高（看看这三代GPU就知道了），因此有多大的需要就弄多大的卡吧。如果是严肃的科研工作者建议还是上大一些的卡，毕竟在现在多机分布式训练扩展性做得还不大好的时候，什么也比不过在一个卡上算起来快。关于电源电源是最容易被忽视的一个问题！很多小伙伴常常是满心欢喜地把大把显卡、CPU装好，然后发现——电源过载了。而最蛋疼的是一般工作站主机的电源是最高1600w到头，也就是将将撑住4块250w不超频的显卡。关于电源功率的计算我推荐。它的Expert模式极其强大。说回到Z420/Z620上的电源，Z420上搭配的是台湾台达电子生产的DPS-600UB A电源，这里（）有它的介绍。不得不说工作站上的电源就是扎实，不虚标且稳定。总结最后，总结一下整个配置。方案一（入门单卡）：Z420 (E5-1650/32G)+单GTX 1060 = $570 / ￥4,000方案二（高阶单卡）：Z420 (E5-1650/32G)+单GTX 1080 Ti = $1,100 / ￥7,700方案三（入门双卡）：Z420 (E5-1650/32G)+双GTX 1060 = $760 / ￥5,300 （不能上1070，电源功率不够）方案四（高阶双卡）：Z620 (E5-1650/32G)+双GTX 1080 = $1,280 / ￥9,000 （不能上1080 Ti，电源功率不够）希望对你有帮助。24987 条评论分享收藏感谢收起212308 条评论分享收藏感谢收起关于这些用于深度学习的机器配置，合理吗，哪个好？ - 知乎有问题，上知乎。知乎作为中文互联网最大的知识分享平台，以「知识连接一切」为愿景，致力于构建一个人人都可以便捷接入的知识分享网络，让人们便捷地与世界分享知识、经验和见解，发现更大的世界。96被浏览<strong class="NumberBoard-itemValue" title="2分享邀请回答rthpc.com/ImgLists?id=002013忘了问题主的应用场合，是实验室科研还是创业公司做服务器用？3月30日的答案我是站在做服务器的角度考虑的，若是科研使用题主另外一个问题中的回答确实比较中肯，深度学习工作站的性能关键的能够提供足够的PCI-E带宽，目前已上市且易采购到的CPU中支持40通道PCI-E的型号确实的题主最好的选择，毕竟多卡环境足够的带宽支持才是王道，多余的通道插RAID卡或者PCI-E SSD对系统性能的提升也是十分明显的。112 条评论分享收藏感谢收起614 条评论分享收藏感谢收起}

久游无息网

配个深度学习的服务器，需要多大内存起步？

我要回帖

更多推荐