显卡中SMX战狼中队全称叫什么么

smx是什么意思_百度知道
smx是什么意思
smx是什么意思
smx 缩写词 abbr. 1.=submultiplexer unit 半多工器SMX
(=sulfamethoxazole) 磺胺甲基异恶唑, 磺胺增效甲片
采纳率:60%
来自团队:
为您推荐:
其他类似问题
smx的相关知识
换一换
回答问题,赢新手礼包
个人、企业类
违法有害信息,请在下方选择后提交
色情、暴力
我们会通过消息、邮箱等方式尽快将举报结果通知您。&>&&>&正文
NVIDIA帕斯卡显卡详细解析:GP100究竟强在哪里
20:25:16 来源:超能网 作者:bolvar 编辑:尘星 浏览:loading
  2016上半年过得差不多了,显卡市场上这一年来基本上没什么新品,不论是AMD还是NVIDIA主推的还是上一代架构的显卡,恍恍惚惚之间28nm工艺的显卡竟然支撑了4年时间,这在以往的GPU升级历史上可不多见。之所以沉寂这么久是双方都在憋大招,AMD新一代显卡架构为14nm工艺的Polaris(北极星),NVIDIA准备的则是16nm工艺的Pascal(帕斯卡),后者在GTC2016大会上首次揭开了面纱,NVIDIA发布的Tesla P100专业卡使用了旗舰GP100核心。
  也许是久未见新工艺新架构显卡,现在看到GP100这样的庞然大物都觉得兴奋了,这几天我们已经被各种Pascal显卡爆料刷屏了。从Kepler到Maxwell架构,NVIDIA钱两次都是选择首发面向主流游戏市场的核心GK104GM204(Maxwell首发的其实是GM107这样的低端核心),GK110、GM200大核心产品通常要晚半年时间,但这次的Pascal显卡就跟当年的GF100费米架构一样选择了大核心首发,历史终于轮回了。
  作为16nm工艺的新一代旗舰,NVIDIA的GP100核心到底有多强?或者说它与目前的架构有什么质的不同?今天的超能课堂上我们就来分析下GP100核心的特色,回顾下它与Kepler、Maxwell架构有什么不同。
Pascal与Kepler Maxwell规格对比
  切入正题之前我们先来了解下GP100核心与Kepler、Maxwell架构的规格,此前NVIDIA官方也公布了GP100核心与GK110、GM200核心的一些对比,这里我们做了一份更详细的规格表,并加入了GM204及GK104这两款游戏显卡核心。
GP100核心与GK110、GM200、GM204、GK104核心规格对比
  这份规格表内容非常多,初看之下会觉得手足无措,不过小编把需要重点关注的地方标红了,简单来说就是GP100核心晶体管密度再次攀升、CUDA核心大幅增加、双精度性能逆天增长、缓存/寄存器容量翻倍、HBM2显存及NVLink总线,这几点基本上能概括GP100核心的特色。
Pascal架构看点之一:
  计算性能是关键,双精度性能逆市回归
  GP100的性能一经公布,给小编的感觉就是NVIDIA这次回归了GK110大核心时代注重双精度运算的设计,而且比之前更加变态——GK110架构中FP64双精度与FP32单精度的比例不过1:3,每组SMX单元中有192个FP32单元,64个FP64单元,但GP100核心中每组SM单元中有64个FP32单元,但有32个FP64单元,FP64与FP32比例是1:2。
  要知道,Maxwell架构中单双精度比砍到了1/32,GK104核心中单双精度比是1/24,这都远远低于Pascal核心,唯一能与之媲美的就是当年Fermi核心的Tesla加速卡了。
  因此在双精度性能上,GP100核心可以说突破天际了,FP64浮点性能可达5.3TFLOPS,而GK110核心不过1.68TFLOPS,GM200核心更是只有可怜的0.21TFLOPS,GP100双精度性能达到了GK110核心的3倍多,是GM200核心的20多倍。
  HPC很多应用需要双精度性能,不过深度计算(deep learning)这样的计算并不需要高精度运算,因为它天生自带纠错能力,而GP100的FP32CUDA核心可以同时执行2个FP16半精度运算,因此FP16浮点性能高达21.6TFLOPS。NVIDIA在TeslaP100之外还推出了基于GP100核心的DGX-1深度学习超级计算机,由8颗GP100核心及2颗16核XeonE5处理器组成,深度计算性能达到了170TFLOPS,号称比250台X86服务器还要强大。
GK110核心架构示意图
GM200核心架构示意图
GP100核心架构示意图
  GP100为了提升计算性能,增强的不仅仅是双精度单元,其L2缓存、寄存器文件也大幅提升,总计拥有4MB L2缓存、14MB寄存器文件。
  总之,NVIDIA的GP100核心为了计算性能可谓煞费苦心,双精度性能简直逆天,不过NVIDIA针对高性能运算所做的设计固然讨好HPC市场,但对游戏市场来说双精度是没多少用处的,反而浪费了晶体管单元,提高了成本及功耗。
Pascal架构看点之二:
   升级16nm工艺,密度、能效提升。
  从AMD的HD7970显卡率先使用28nm工艺开始算起,TSMC的28nm工艺已经陪伴我们四年时间了,期间AMD、NVIDIA数次升级的新核心都没有工艺升级,依然坚持28nm工艺,双方都跳过了20nm工艺、直接进入了性能更好的FinFET工艺节点,只不过AMD选择了三星/GF的14nmFinFET LPP工艺,NVIDIA坚持了老朋友TSMC的16nm FinFET Plus工艺。
TSMC的16nm FinFET工艺优势
  对半导体芯片来说,升级工艺通常意味着晶体管性能提升、功耗下降,同时晶体管密度大幅提升。具体到TSMC的16nm工艺,该公司此前表示其16nm工艺的晶体管密度是28nmHPM工艺的2倍左右,同样的功耗下性能提升38%,同样的速度下功耗降低54%,对比20nm工艺则是20%速度提升、35%功耗下降。
  我们再来看下GP100核心的相关数据:
GP100核心的晶体管密度、频率及TDP功耗
  我们简单地把几款GPU的晶体管密度换算了下(晶体管数量除以核心面积,由于GPU核心的电路复杂,这种算法不一定精确,仅供参考),16nm工艺的GP100核心晶体管密度大约是2510万每平方毫米,算起来晶体管密度比之前28nm工艺的Maxwell、Kepler恰好多一倍。
  至于每瓦性能比,这里使用的是FP32浮点性能与TDP功耗的比值,考虑到上述核心面向的市场不同,我们要知道侧重高性能的GP100与游戏市场的GM204、GK104对比TDP是不公平的,不过最终的结果依然显示出16nm工艺的GP100在每瓦性能比上有明显优势。
  从这一点也可以猜测,未来针对游戏市场的Pascal核心(比如GP104、GP106)问世之后,它们势必要阉割掉GP100核心上很多不必要的功能,优化功耗,所以其每瓦性能比无疑会更出色。
友情提示:支持键盘左右键“← →”翻页
用手机访问
扫一扫,手机浏览
相关新闻:
综合热点资讯
单机游戏下载&&[&& 原创&&]&& 作者:
  ● 高频好助手——SMX单元
  SM是NVIDIA GPU的ALU团簇基本单元,在Kepler中SM部分的改进可谓翻天覆地,NVIDIA采用的全新的SMX单元彻底改变了传统的SM单元的内涵,它在赋予整个体系极高的性能功耗比的同时,直接导致了今天这样完整规格同时默认运行频率极高的Geforce GTX690的诞生。
  Kepler所采用的SMX单元与Fermi的SM单元在逻辑结构上十分近似,都拥有完整的几何前端,线程仲裁机制,ALU团簇,Texture Array以及unified cache/shared和Register。除了没有后端之外,可以说一个SM/SMX单元在结构上已经趋近等同于一颗标准GPU了。
GK104逻辑架构
  与Fermi的SM单元规模对应线程粒度单位warp(32 ALU VS 32 Thread)不同,Kepler的SMX单元急剧放大了ALU团簇的整体规模,其ALU总量从过去的32个增加到了192个。与此同时,SMX单元的线程仲裁管理机制也得到了绝对数量上的放大。负责线程分派和发放管理的Warp Scheduler从过去的2个增加到了4个,与之对应的Dispatch Unit从过去的2个增加到了8个,Warp Scheduler与Dispatch Unit的比例提升变成了1:2。
SMX单元结构
  在放大ALU团簇的同时,NVIDIA还进一步放大了与ALU团簇对应的Register。根据NVIDIA提供的资料,GK104架构中每个SMX的Register较之Fermi的SM放大了一倍,达到了65536X32bit的规模。
  在Unified Cache体系方面,Kepler与传统的Fermi在结构上没有多大的差异,其L1/shared以及L2 cache的大小和比例均未发生变化,仍旧维持64K的L1/Shared以及128K/MC的L2尺寸。整个体系中最值得关注的变动来自L2 cache速度以及带宽的提升,NVIDIA称Kepler的L2 cache目前运行在分频状态下,默认运行频率是核心频率的一倍,这为GK104提供了比过去大得多的L2带宽,这为通用计算性能以及Texture性能的提升创造了有利的条件。
更为强劲的SMX性能
  更大的ALU规模、更多的线程仲裁机制以及更大的寄存器缓冲为SMX带来了全新的性能表现,新的逻辑设计让Kepler的运算单元拥有了2倍于Fermi的性能功耗比。更高的能耗比为单卡双芯的设计减轻了很多功耗层面的负担,因此GeForce GTX690得意以完整的GK104芯片规模运行在更高的频率之上,并以此获得了毫无争议的性能王座。
...提示:支持键盘“← →”键翻页
显卡类型 显卡芯片
投诉欺诈商家:
天津重庆哈尔滨沈阳长春石家庄呼和浩特西安太原兰州乌鲁木齐成都昆明贵阳长沙武汉郑州济南青岛烟台合肥南京杭州东莞南宁南昌福州厦门深圳温州佛山宁波泉州惠州银川
本城市下暂无经销商
4¥49995¥37996¥28997¥32998¥36999¥449910¥9299}

我要回帖

更多关于 中国银行全称 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信