为什么机器学习用gpu用了越多gpu其

谷歌新神经计算专用处理器TPU超越CPU与GPU的原因
  网络巨擘谷歌(Google)日前指出,该公司的Tensor处理器(TPU)在机器学习的测试中,以数量级的效能优势超越英特尔(Intel)的Xeon处理器和Nvidia的绘图处理器(GPU)。在一份长达17页的报告中,Google深入剖析其TPU和测试基准显示比目前的商用芯片更快至少15倍的速度,并提供更高30倍的效能功耗比(P/W)。
  去年五月,Google宣布其ASIC设计是为了加快各种应用在其数据中心服务器的推论作业。现在,该公司将在今年6月的一场计算机架构大会中,透过一篇论文首度公开对于此芯片及其效能的深入研究。
  这份报告提供了有关加速器与Google多元神经网络工作负载的深度观察,并建议工程师在此快速成长的领域中投注更多的学习。
  曾带领超过70位工程师团队设计TPU 的知名硬件工程师Norman P. Jouppi说:&我们希望聘请一些优秀的工程师,并让他们了解我们正在进行高质量的工作,同时也让云端客户知道我们的实力。&
  该计划的其中一位负责人员是美国加州伯克利大学(U.C. Berkeley)退休教授David Patterson,他同时也是一位资深的处理器架构师,在日前一场硅谷的工程师聚会中介绍了这份报告。Google还在部落格中发布Jouppi所撰写关于此芯片的文章。
  如今Google的数据中心仍采用此芯片。不过,关于该芯片使用的范围与未来计划加强的部份,Jouppi并不愿透露任何细节。
  这款40W功率的TPU是一款采用28纳米工艺、70MHz频率运算的芯片,专为加速Google TensorFlow 算法而设计。其主要的逻辑单元包含65,536个8位的乘积累加运算单元和24MB高速缓存,并提供每秒92兆次指令周期。
  在2015年采用Google机器学习芯片而进行的测试中,相较于英特尔(Intel)的Haswell服务器处理器(CPU)和Nvidia的K80绘图处理器(GPU),采用TPU时的运作速度提高了15到30倍,效能提高了30到80倍。该报告中指出:&TPU的相对增量效能功耗比为41到83&&这就是我们为什么客制化ASIC的原因,它让TPU比GPU高出25到29倍的的效能功耗比。&
  2015年的测试使用了英特尔 22纳米工艺的18核心Haswell E5-2699 v3 CPU,其频率频率(速度)为2.3GHz,热设计功耗(TDP)为145W。Nvidia K80 GPU功耗为150W,频率频率最高到875MHz。
图1:TPU(星形)在神经网络推论作业的效能超越英特尔Haswell处理器(圆形),以及Nvidia K80(三角形) (来源:Google)
  TPU内部揭密
  在该报告中提到,TPU所达到的数量级效能优势,很少有别的厂商能做到,也可能让TPU成为特定领域架构的原型。预计接下来将会有许多追随者,而使得标准更为提高。
  事实上,TPU的目标不在于提高数据处理量,而是专注于达到7毫秒(ms)的延迟,使专用加速器发挥功效,因此,它舍弃了高吞吐量的多任务通用处理器所需的许多组件,而用于执行其他许多任务。
  但此ASIC芯片在能耗比的表现上不及英特尔和Nvidia的芯片。在10%的负载状况下,TPU的最大功率消耗为88%。相形之下,K80在10%负载下消耗66%的功率,而英特尔Haswell的最大功耗为56%。
  Google解释,这是由于仅15个月的设计时程相对较短,使得TPU无法加入许多节能方面的功能。
  数据缓冲区约占TPU的37%,媒体访问控制(MAC)组合占30%。虽然TPU比起Nvidia GPU的尺寸更小、功耗更低,但其上的MAC数量却是K80的25倍,芯片上内存容量则为其3.5倍。
  TPU搭载PCIe Gen3 x16总线,并提供256位的内部数据路径。主机CPU将加速器视为浮点运算处理器,透过PCIe总线传达指令。
图2:大部份的TPU主要用于处理MAC数组,以及24MB高速缓存
  TPU使用与GPU加速器相同的Tensorflow软件,开发人员可维持核心驱动器的稳定,必要时调整使用者空间的驱动程序,以因应不断改变的应用。
  Google发现,持续增加的内存带宽对于效能表现的影响最大。平均来说,加速频率速度的效益不大,而当MAC扩增到512x512矩阵时,加快频率速度的效能还将微幅下降。
  该报告中指出,从2015年的测试以来,英特尔已经推出14纳米CPU,Nvidia也推出16纳米GPU了。然而,TPU也可能将其外部DDR3内存升级到像K80所使用的GDDR5内存。
  报告中指出:&未来的CPU与GPU在执行推论时将会更快速。采用2015版GPU内存而重新设计的TPU将会提高两倍到三倍的速度,而且比K80高出70倍、比Haswell更高200倍的效能功耗比。&
  Google宣称在英特尔CPU上执行8位运算相当辛苦。报告中提到:&我们原本只有一款CPU执行8位运算的结果,因为有效地使用其AVX2整数运算指令,效果提升了3.5倍。&
由于其采用数据处理量为导向的架构,即使是改良过的GPU要达到Google的 7nm延迟目标,仍然充满挑战。同时,&这款TPU仍有很大的改进空间,所以这不是一个容易达成的目标。&
& & &图3:ASIC芯片支持PCIe Gen 3 x16总线,并搭载DDR3内存
  开发人员掌握多元化信息
  该报告中提到,研究人员受到热门的ImageNet比赛吸引,已经变得过于投入卷积神经网络(CNN)。现实世界的应用采用更广泛的神经网络类型,报告并强调,多层感知(MLP)占Google AI开发工作的61%。&虽然大部份的架构师一直在加速CNN设计,但这部份只占5%的工作负载。&
  &虽然CNN可能很常见于边缘设备,但卷积模型的数量还赶不上数据中心的多层感知(MLP)和长短期内存(LSTM)。我们希望架构师尽可能地加速MLP和LSTM设计,这种情况类似于当许多架构师专注于浮点运算效能时,大部份的主流工作负载仍由整数运算主导。&
  Jouppi说:&我们已经开始与一些大学合作,扩大提供免费模式。&但他并未透露内容细节。
  这篇报告回顾了二十多年来神经网络的相关数据,包括其竞争对手&&微软(Microsoft)基于FPGA的Catapult计划,加速了网络作业。最初的25W Catapult在200MHz频率上运作3,926个18位MAC,并且以200MHz 频率速度执行5MB内存。Google表示,以Verilog语言设计的固件比起使用TensorFlow软件来说效率更低。
图4:TPU卡可插入服务器的SATA插槽上
  TPU计划于2013年开始,当时并以FPGA进行了试验。该报告中提到:&我们舍弃FPGA,因为我们当时发现它和GPU相比,在效能上不具竞争力,而TPU比起GPU在相同速度或甚至更快的速度下,可以达到更低的功耗。&
  尽管二十多年来,神经网络终于在最近从商用市场起飞了。
  Jouppi说:&我们所有人都被这蓬勃发展的景象吓到了,当初并未预期到会有如此大的影响力。一直到五、六年以前,我都还一直抱持怀疑态度&而今订单开始逐月增加中。&
  相较于传统途径,深度神经网络(DNN)已经让语音识别的错误率降低了30%,这是二十年来最大的进步。这让ImageNet影像辨识竞赛中的错误率从2011年的26%降至3.5%。
  该报告结论还提到,&神经网络加速器存在的理由在于效能,而在其演进过程中,如何达到良好的直觉判断,目前还为时过早。&
关注电子发烧友微信
有趣有料的资讯及技术干货
下载发烧友APP
打造属于您的人脉电子圈
关注发烧友课堂
锁定最新课程活动及技术直播
当人工智能(AI)成为热词之时,一本《人工智能简史》把人工智能这个物种的家世渊源、名字由来、出身血脉...
北京中电华大电子设计有限责任公司 (以下简称“华大电子”)成立于2002年6月,是中国电子华大科技有...
新一代渐变色镀膜工艺的诞生,改变镀膜的厚度和层数,打造出独一无二的镀膜结构色。这一首创专利带来了全新...
本文主要介绍了触摸芯片型号有哪些_触摸芯片型号汇总。“触摸”在此中特指单点或多点触控技术;芯片即是I...
本文主要介绍了摄像头芯片型号有哪些_摄像头芯片型号汇总。摄像头主要有镜头、CCD图像传感器、预中放、...
在人工智能创业大潮下,谁才是AI创业者的摇篮?对此,小编盘点了一份关于人工智能领域的创业校友集,汇集...
厦门新页科技有限公司,成立于2014年10月,注册资金2000万人民币,公司拥有多名来自海内外的教授...
本文主要介绍了wifi芯片型号有哪些_wifi芯片型号汇总,Wi-Fi是一种允许电子设备连接到一个无...
首先需要分析功能需求,然后在平衡资源与速度后,估计速度需求。同样也可以根据之前的设计来确定,根据FP...
进入到2018年以来,全球最大的无线芯片厂商高通正在为一串连环并购而忙碌:在应对博通恶意并购的同时,...
本文主要介绍了单片机芯片型号有哪些_常见单片机芯片型号大全。经典的单片机芯片型号:1、MCS-51系...
据Wareable网站报道,谷歌将在2017年推出一款名为Nexus Band的廉价健身手环,与Fi...
据CNBC网站报道,谷歌今天证实,该公司高管约翰贾尼安德(John Giannandrea)将不再担...
本文开始介绍了芯片概念,其次阐述了芯片的制造过程以及芯片的计量单位,最后介绍了芯片的发展。
RS485芯片已经广泛应用于工业控制,安防系统,智能仪器仪表,多媒体网络,机电一体化产品及多个领域。...
作为想要改变世界的科技界钢铁侠,谷歌自诞生起就发明无数。1999年,公司创始人拉里·佩奇用导航地图开...
俗话说大千世界无奇不有,想必很多小伙伴在吃小吃的时候都存在着这样的疑问,我吃的这一盘到底是不是正宗的...
日下午,南京大学与南京开发区管委会在南京市政府举行签约仪式,共建南京大学人工智能学...
当地时间4月3日,谷歌推出了一款新的移动框架MobileNetV2,基于上一代MobileNet,这...
2月14日,德豪润达发布2017年度业绩快报,公司2017年度实现营业收入420,313.08万元,...
3月2日上午,国星光电隆重举行“国星Micro&Mini LED研究中心”揭牌仪式。公司董事长何勇、...
美国芯片制造商微芯科技周四宣布,该公司已同意以大约83.5亿美元的总价现金收购美国最大的军用和航天半...
好吧,这并不是什么脑筋急转弯,这就是支笔,一支圆珠笔。你一定会觉得小编很无聊,虽然我们从小到大用过铅...
据CNBC报道,谷歌母公司Alphabet在收购英国人工智能(AI)研究公司DeepMind 4年之...
谷歌上周还宣布把Google Assistant扩展至30多种语言。在MWC中,谷歌宣布Google...
EDA领导厂商SpringSoft将在日至6日于加州旧金山举行的第49届设计自动化会...
谷歌的高空气球项目Project Loon为在被Maria飓风肆虐之后的波多黎各的20万居民提供最基...
全球第三大手机企业华为表示它一直都在开发自己的手机操作系统,有说法是被命名为麒麟操作系统,它也曾表示...
昨日, 谷歌 CEO桑达尔·皮查伊(Sundar Pichai)在中国发展高层论坛中,表露出希望借助...
2017年,对想要在中国落地的海外云服务商来说,可能是最艰难的一年。一方面,《网络安全法》正式实施,...
虽然不比谷歌概念新奇,但微软“黑科技”更具厚重感。
据外媒最新消息,谷歌近日又宣布了一个新动作,可能意味着PC互联网时代已经基本结束。谷歌宣布,未来将只...
机器学习/深度学习/人工智能(ML/DL/AI)的关键是了解设备如何对真实事件和刺激作出反应,以及如...
华大半导体有限公司(简称华大半导体)是中国电子信息产业集团有限公司(CEC)整合旗下集成电路企业而组...
AR眼镜可以实现诸多功能,可以看作是一台微型的手机,通过跟踪眼球视线轨迹判断用户目前处于的状态,并且...
谷歌量子 AI 实验室今天发布了新的 72 位量子比特的量子处理器 Bristlecone。
在Turing(图灵)和Ampere(安培)架构到来之前,NVIDIA旗下挖矿和打游戏最猛的单卡就是...
区块链关注的是保持准确的记录、认证和执行,而人工智能则助力于决策、评估和理解某些模式和数据集,最终产...
Owlchemy Labs公司正式被谷歌收购,这也是迄今为止谷歌收购的唯一一家游戏工作室。幸运的是,...
眼球追踪主要是研究眼球运动信息的获取、建模和模拟。一是根据眼球和眼球周边的特征变化进行跟踪,二是根据...
中国移动和路通X2搭载紫光展锐LTE智能车载后视镜平台方案展讯SL8541C,采用精准语音识别系统,...
中国经济观察报报道称,国内大量一线城市曾加入争夺此项目的行列,但最终,西安脱颖而出。西安为获得该项目...
Gotmic: 专注于40-170GHz毫米波芯片设计Gotmic是从瑞典查尔姆斯理工大学产业化独立...
《中国制造2025》期待达到的目标是通过智能制造和智能化工厂来实现企业内部的智能化,而工业互联网在智...
“2017年,我国集成电路产业(芯片)规模日益扩大,实现销售收入5355.2亿元,同比增长23.5%...
台湾股市IC设计厂去年每股获利(EPS)排名洗牌,联发科退居第5位,较前年后退一名;神盾则首度跻身前...
X产品应用的领域非常非常广泛。基本上只要带电的地方,都可能用上X的产品(只是说可能而不是一定,毕竟X...
随着全球半导体竞争格局的改变以及中国产业政策的持续支持,中国IC行业获得了蓬勃发展,在世界舞台上崭露...
“ARM实在太贵了。”信息安全芯片公司Dover Microsystems联合创始人Jothy Ro...
集微网消息,继华为去年发布麒麟970高端芯片中导入AI架构后,日前传出华为海思将推出的麒麟670中端...
近年来,中国芯片进口额屡创新高,进口金额更是早已超过石油进口额,缺“芯”已经称为中国制造的一块“芯”...
人类科技发展再发达,也得面对一个避不开的话题:如何延续生命。所以如果有种方法,能让自己的亲人,长生不...
黄博士认为当前主流FPGA的硬件结构并不是为人工智能定制的,与Google的TPU等ASIC架构比较...
搜遍全网,也没找到详细到芯片级别的拆解报告。自己动手丰衣足食,于是去隔壁赛格买了台比特大陆最热门的蚂...
深圳市航顺芯片技术研发有限公司的5W/7.5W/10W/15W 芯片级无线充电方案正式发布。
原位芯片凭将于2018年内发布国内首个MEMS液体流量传感器,并完成MEMS芯片式胰岛素泵和PoCT...
微系统的核心技术是集成,正在由平面集成向三维集成、由芯片级向集成度和复杂度更高的系统集成发展。
在 Google的I/O大会上,Google对外宣布,YouTubeVR将推出新的功能,用户可以在Y...
当前,智能手机等移动设备在半导体的消耗量占压倒性的多数。从手机近十年的发展历程可见,原来是功能性手机...
设计外包的关键有两方面。其一,进入新领域时,如果设计机构缺乏经验,就必须找寻具有处理新领域设计能力的...
随着全球半导体竞争格局的改变以及中国产业政策的持续支持,中国IC行业获得了蓬勃发展,在世界舞台上崭露...
昨天全国首个CIDM集成电路项目在青岛西海岸新区签约,该项目由青岛西海岸新区管委、青岛国际经济合作区...
2016 年的春天,一场 AlphaGo 和顶级围棋高手李世石的人机世纪对战把全球推上了人工智能(A...
日前外媒报道,比特大陆已经开发出“特殊应用集成电路”(ASIC)芯片,专门用于挖掘以太币,预估今年第...
一年一度的GTC至今已经迎来了第十个年头,虽然它每年或多或少的给网友一些“失望”,但它也终究是代表着...
据亚洲新闻台3月28日报道,华为公司3月27日在巴黎发布新手机P20、P20 Pro后,华为终端掌门...
谷歌大脑联合佐治亚理工学院提出了正向-反向强化学习(Forward-Backward Reinfor...
卡森霍尔盖特(Carson Holgate)正在接受忍者培训。 但这里的忍者指的并不是武术她已经有不...
无论什么行业,都能很AI!无人机和地面机器人也可以有效地支持农业。X部门开创了运货无人机项目Proj...
小鹏汽车董事长何小鹏认为,纯软件和算法的人,是很难真正理解造车的人对安全的恐惧的,但是反过来看,民航...
谷歌推出了一款名为“Just a line”的免费应用程序,它可以让你在AR模式下进行绘画涂鸦。
谷歌为AI人才应届生开56万年薪
定价上,自动驾驶捷豹I-PACE由于是用来提供服务,因此并没有提供价格。不过,捷豹I-PACE今年3...
谷歌旗下的人工智能投资部门Gradient Ventures(梯度风险投资公司),已经为“Ubiqu...
近两年来,边缘计算这个词频繁被提及,得益于前期ETSI、3GPP等国际标准组织的推动,2016年在国...
 展讯SC8810的参数与功能介绍SC8810的工艺说明:采用40纳米CMOS工艺,是一款高集成度、...
Neural Architecture Search基本遵循这样一个循环:首先,基于一些策略规则创造...
随着物联网技术这几年被高度关注,耳熟能详如窄频物联网、LTE-M、Wi-SUN及Sigfox等众多的...
这背后,是谷歌AutoML Vision提供的ML模型。
早在一年前这款芯片就已经引起了广泛重视,跳票半年之久后面市为智能机顶盒注入新活力。它拥有64位 八核...
小编带你认知主板上的主要芯片。时钟芯片需要和14.318MHz的晶振连接在一起,为主板上的其他部件提...
谷歌一直坚信虚拟现实身临其境的力量,但要创建最为逼真的临场感,在VR中展示的内容需要尽可能接近看到的...
88SS88是Marvell最新推出的支持单端口和双端口功能、NVMe 1.3...
从六个方面入手,分析了集成电路芯片在新兴应用领域的发展趋势。从 2010 年开始,在硅麦克风、惯性传...
作为欧盟项目SiGe HBT 工艺为基础的DOTSEVEN (0.7Thz)和 RF2THz SIS...
近来,公司规模已经不再是企业选择云服务商的重要因素,市场对云服务商优劣的判断有了多种标准。
谷歌一直坚信虚拟现实身临其境的力量,但要创建最为逼真的临场感,在VR中展示的内容需要尽可能接近看到的...
相机平台旋转并录制70厘米球体上的大约1000个外向视角大概需要1分钟。这提供了一个两英尺宽的光线量...
“特朗普上周正式打响对华贸易战,引发双方唇枪舌战。经过一周的你来我往,事态不断升级,不过最新消息称,...
将若干张照片拼接起来组成VR场景已经见怪不怪,但想要把光线记录到画面中,却难上加难。谷歌再次将虚拟场...
供应链服务
版权所有 (C) 深圳华强聚丰电子科技有限公司
电信与信息服务业务经营许可证:粤B2-雷锋网按:在日益变得颠覆的AI背后,总有NVIDIA的影子。今天上午,作为NVIDIA全球GTC(GPU Technology Conference)大会中最重要的一站之一,GTC China再次在北京召开了。身着标志性黑色皮衣的教主黄仁勋也在本次大会开始之际,奉上了一场题为“一个全新的计算时代(A NEW COMPUTING ERA)”的主题演讲。按照惯例,NVIDIA基本上每年都会将自身重要的产品发布、更新在5月份美国本土召开GTC上宣布。而全球其他地区的GTC大会则主要是根据各地区的情况进行微调和“重新演示”,本次的GTC China亦是如此。但也正是因为如此,也给了黄教主更多时间去介绍NVIDIA今年的新进展,同时也毫不隐晦的展示出一个结论——NVIDIA不仅仅在AI浪潮中,而且是这波浪潮得以成型推进的重要原因。为什么说GPU是必然的选择?性能这个话题实际上曾出现在今年NVIDIA的数个活动中,就连黄仁勋自己也说了很多遍,正如黄教主今天在Keynote演讲中强调的那样(牙膏厂跪倒在地):过去整体行业都是依赖摩尔定律来推动,但它太老了,太慢了,GPU才是全新的‘超级摩尔定律’,这也是整个行业一次千载难逢的机遇。这种性能发展上的差距与串行/并行运行的原理有着直接的关系,最终的结果就像NVIDIA多次展示的那样,在2010年之后,GPU类处理器内部的数量还保持着快速增长的势头,而CPU已经出现了明显的放缓。应用场景除了性能之外,应用场景的出现则是另外一个重要的点。尤其是NVIDIA在2008年开始打造CUDA架构之后,GPU的用途已经发生了翻天覆地的变化。而长久以来受限于CPU处理能力的人工智能也在那个时刻找到了更加适合的源动力,并且凭借GPU的性能不断提升,极大的拓展了人工智能的能力和适用范围。正如黄仁勋在此次Keynote中再次提及的部分NVIDIA最新“AI产品”:之前雷锋网曾在洛杉矶SIGGRAPH大会上报道过的‘Interactive Ray Tracing(工业渲染预测加速)’,利用语音就能生成的虚拟头像,能够让游戏虚拟角色根据地形做出高度仿真动作的全新算法等等。不过这些技术和全新算法之所以能够成为现实,最关键的原因还是GPU能够提供足够的处理能力。AI云时代的到来在此次大会上,黄仁勋也亲自宣布了一个重要的里程碑进度——国内的三大公有云公司:阿里云、百度云、腾讯云均已经引入了NVIDIA的硬件,并且向B端用户开始提供AI相关能力的服务。传统CPU方案(上)与NVIDIA方案(下)的对比这个改变最大的根源实际上是成本,正如黄仁勋在大会现场举的一个例子:按照传统方案,云服务商可以采购4个机架、共160个CPU服务器,在功耗65千瓦的情况下提供每秒45000张照片的处理能力。而如果换成NVIDIA的产品,你只需要一个装有8片V100 GPU的NVIDIA HGX服务器,同样的每秒45000张照片处理能力,但是你只需要7个服务器插槽,总共的功耗也只有3个千瓦。明显的数字对比,背后是巨大的采购和运营成本差距。换句话说,在AI云处理需求越来越大的当下,不是服务商选择使用NVIDIA的GPU,而是他们“被迫”使用NVIDIA的GPU。黄教主给出了一个非常精要的总结:你用的GPU越多,你省的钱越多!(More GPU,Save More Money!)当然,选择NVIDIA的GPU还有另外一个重要原因,5月份的GTC上NVIDIA曾发布了专门用于云端GPU堆栈处理的技术架构NGC(NVIDIA GPU Cloud)。这种技术架构实际上拥有NVIDIA相应处理器产品的云运营商都有使用,进一步增加了GPU在云端的工作效率和使用率。NVIDIA=AI浪潮的推动者?就在上周,投行EvercorelSI曾对NVIDIA做出了一个最新的预测——后者的股价还有40%的上升幅度,因为投资者依旧“严重”低估了人工智能技术的市场。随后NVIDIA的股票随之大涨5%,也算是NVIDIA与AI浪潮关系紧密的一个侧面证明。在这次大会上,黄仁勋也“重新发布”了NVIDIA GPU的AI优化技术TensorRT,其关键亮点在于人工智能场景下的巨大提升。在同样使用全新的V100 GPU的情况下,TensorRT相比通用的TensorFlow在图像分析场景下还能提升19倍之多,在语义分析场景下更是能提升22倍。黄仁勋在随后的采访环节也给雷锋网解释了,这种“巨幅”提升的秘密——虽然GPU的绝对性能很重要,但是如何将不同的人工智能架构,与不同架构的GPU适配,实际上对后者性能的发挥有着巨大的影响。左侧是普通人工智能架构,右侧是TensorRT优化之后的结果并且TensorRT现在实际已经可以作用于所有常见的人工智能架构,例如:TensorFlow、Caffe2、Chainer、Microsoft Cognitive Tookit、Mxnet、PaddlePaddle、Pytorch、theano。换个角度来说,NVIDIA实际已经在尝试甚至打造出了一套最适用于自身硬件的人工智能架构。也正是因为这个原因,V100才能凭借自身出色的性能,以及全新添加的Tensor Core,在人工智能的相关场景中获得最出色的表现。这种在核心硬件性能上的拓展存在于NVIDIA的所有产品线当中,例如NVIDIA为自动驾驶硬件所搭建的DRIVE Works SDK,能够轻松的调用强大的硬件性能处理各种自动驾驶需求,无论你的传感器是摄像头、毫米波雷达、激光雷达。另外一个具体例子是机器人领域,黄仁勋在此次Keynote演讲中特别提到了自动机器人方向,他还特别强调——这很可能是人工智能下一个最重要的领域。而在今年5月的GTC大会中,NVIDIA也放出了一个对应的“大招”:全新的机器人训练方式“ Isaac”。凭借这种全新技术,用户完全不需要再在机器人实物上进行重复的调试和实验,完全可以将整个场景搬到虚拟世界当中,并且利用GPU的学习能力,让机器自行学会最佳处理方式。最最最关键的是,因为这种模拟运用的实际上也是NVIDIA的GPU,所以它所生成的算法完全能够移植到NVIDIA Jetson这样的终端AI芯片平台之上,直接让终端的机器人凭借之前学习的经验运行。平台战略,爱从另外一个角度来看,NVIDIA在2017年的诸多AI领域更新实际可以概括为一句话——做的越来越多,做的越来越全。例如上文提到的TensorRT,它实际上在各大人工智能架构和NVIDIA的硬件之间搭起了一座“桥梁”。但为什么NVIDIA还要支持这么多种类架构?为什么NVIDIA不自己选择或者打造一套架构?答:平台战略。这同时也是今天黄仁勋在媒体群访环节提到次数最多的四个字。用黄仁勋自己的话来说:众人拾柴火焰高,有些事需要大家一起来做。回到上面的AI架构类问题,打造出CUDA架构的NVIDIA实际上是有机会建立自己的人工智能架构、甚至参考苹果,推出自己的相应的系统,将整个系统的核心部分逐渐闭环,进而加强自身的掌控力。目前NVIDIA正在合作的自动驾驶创业公司但事实是,NVIDIA从人工智能技术最早期就跟全球的各大知名高校有合作,支持他们进行相应技术的开发;在自动驾驶领域,使用NVIDIA DRIVE套件的初创公司已经达到了145家,同时宝马、大众、本田等一批传统车企也和NVIDIA保持着紧密的合作关系;如果算上其他领域,目前NVIDIA自己的Inception创业公司计划的全球规模已经达到了1900家。而如此广泛合作的出发点其实也很简单,黄仁勋在采访环节直接说了出来:NVIDIA提供的是平台,也就是说NVIDIA的平台可以让其他的人去创业,去实现自己公司的梦想。如果说上面这句话还略显模糊,那么黄仁勋在采访环节中回答另外一个竞争性的问题时,则更加直接说出了他自己的想法:NVIDIA正在做的这些事业,没有爱是无法做成的。无论人工智能、自动驾驶这些事业哪一个做成了,我都会很开心。在他说出“爱”的那一瞬间,这个穿着黑色皮衣的“核弹教主”真的有点萌。附:黄仁勋媒体群访摘录问:自主机器的时代什么时候才会来临?黄仁勋:自主机器它需要解决的是三大根本的问题,第一个是为这些自动自主机器打造一个类似于人工智能的平台,第二个问题是给自主机器有一个虚拟的、来学会做机器人的这种环境,第三个问题是我们要想办法把大脑放到自主机器人的框架里面去。NVIDIA明年年初可能就会初步把这三个问题解决好,10-15年之后,大家会看到巨大的变化。问:您认为GPU将来可以覆盖所有的场景,还是说在GPU之外还有更多的场景,更多的CPU也会制造出来,形成我们最终未来计算的一个模式?黄仁勋:首先GPU不会替代CPU,它是携手和CPU共同工作的,这也是我们为什么把它称之为,CPU是通用型的,什么场景都可以适用。但是GPU在一些专门的问题上是能量非常大的。它的性能要比CPU超过10倍,50倍甚至百倍。因此,我们就认为事实上最完美的架构是什么呢?首先我们要把万事皆能的CPU,在加上在某些重大计算挑战方面非常有能量的GPU。所以NVIDIA最终的选择是——我们不会做那些每一次好一点点的通用性的处理器,而是要做在一些专门的领域,性能极好的处理器。后者实际上就是CUDA。问:如果非要选一个,您认为未来在人工智能领域是GPU重要还是FPGA重要?黄仁勋:首先两者差异非常大,FPGA非常灵活,你甚至可以把它用到网卡里,但是GPU没有这么大的灵活性,它只是一种并行计算的加速器。所以GPU是术业有专攻。所以在三年前我们做了一个决定,把我们GPU做成Tensor执行处理器,现在已经成为世界上最优秀的Tensor处理器。问:NVIDIA跟大众这样的车企有合作,也投资了图森未来和景驰这样的公司,你们对于合作是怎么思考的?黄仁勋:首先我们在合作过程中,不是打赌,更不考虑输赢。NVIDIA提供的是平台,也就是说NVIDIA的平台可以让其他的人去创业,去实现自己公司的梦想。我们希望大家都成功。所以NVIDIA作为一家平台供应商,我们的任务是不断的让这个平台与时俱进,让它做得更好,让它不断的进步。NVIDIA绝对不是一个自闭的公司,也不是一个做垂直集成的公司,NVIDIA是一家开放平台型的公司。NVIDIA做得这个事业没有爱是无法做成的。问:NVIDIA还会投资哪些公司?您下一个打算改变的行业是哪个?黄仁勋:NVIDIA所提供的是这样的一个平台,我们提供的平台是针对所有的事物。当然我们也有重点,我们关心几个垂直领域,其中一个就是人工智能,还有一个就是交通运输行业。如果你问我们未来NVIDIA还有哪些重视的行业?当然医疗卫生或者健康产业是我们非常重视的。在这里我们相信我们可以帮助健康产业实现变革。例如新药研发、药物的临床实验、甚至是人群的病症研究等等。问:您怎么看待中国的人工智能崛起?黄仁勋:中国本身在计算机科学方面就是全球一流的。比如腾讯、阿里巴巴、百度,他们都是世界一流公司,又比如李飞飞,她不仅仅是我的好朋友,更是世界一流的人工智能科学家,所以我非常看好中国。因为中国的计算机整个产业的技术水平,本身就达到世界一流。
您可能感兴趣:
摄影手机硬件笔电平板
最新科技资讯下载ZOL APP}

我要回帖

更多关于 为什么机器学习用gpu 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信