人脸三维扫描仪识别仪怎样串联电路

我们目前在机器学习方面的进展有多可靠?
导语:可以这样说,对机器学习的进展进行正确评估是很微妙的。毕竟,学习算法的目标是生成一个能够很好地泛化到不可见数据中的模型。因此,为了理解当前机器学习进展的可靠性如何,加州大学伯克利分校(UC Berkeley)和麻省理工学院(MIT)的科学家们设计并开展了一种新的再现性研究。其主要目标是衡量当代分类器从相同分布中泛化到新的、真正不可见数据中的程度如何。
可以这样说,机器学习目前主要是由聚焦于一些关键任务的改进上的实验性研究所主导的。但是,性能表现最佳的模型的令人印象深刻的准确性是值得怀疑的,因为用相同的测试集来选择这些模型已经很多年了。为了理解过度拟合(overfitting)的危险,我们通过创建一个真正看不见的图像的新测试集来衡量CIFAR-10分类器的准确性。尽管我们确保新测试集尽可能接近原始数据分布,但我们发现大部分深度学习模型的精确度大幅下降(4%至10%)。然而,具有较高原始精确度的较新模型显示出较小的下降和较好的整体性能,这表明这种下降可能不是由于基于适应性的过度拟合造成的。相反,我们将我们的结果视为证据,证明当前的准确性是脆弱的,并且易受数据分布中的微小自然变化的影响。
在过去五年中,机器学习已经成为一个决定性的实验领域。在深度学习领域大量研究的推动下,大部分已发表的论文都采用了一种范式,即一种新的学习技术出现的主要理由是其在几个关键基准上的改进性性能表现。与此同时,对于为什么现在提出的技术相对于之前的研究来说具有更可靠的改进,几乎没有什么解释。相反,我们的进步意识很大程度上取决于少数标准基准,如CIFAR-10、ImageNet或MuJoCo。这就提出了一个关键问题:
我们目前在机器学习方面的进展有多可靠?
可以这样说,对机器学习的进展进行正确评估是很微妙的。毕竟,学习算法的目标是生成一个能够很好地泛化到看不见的数据中的模型。由于我们通常无法访问真实数据分布,因此替代性地,我们会在单独的测试集上评估一个模型的性能。而只要我们不使用测试集来选择我们的模型,这就确实是一个有原则的评估协议。
图1:从新的和原始的测试集中进行的类均衡随机抽取结果。
不幸的是,我们通常对相同分布中的新数据的访问受限。现如今,人们已经普遍接受在整个算法和模型设计过程中多次重复使用相同的测试集。这种做法的示例非常丰富,包括在单一发布产品中调整超参数(层数等),并且在其他研究人员的各种发布产品的研究上进行架构构建。尽管将新模型与以前的结果进行比较是自然而然的愿望,但显然目前的研究方法破坏了分类器独立于测试集的关键性假设。这种不匹配带来了明显的危险,因为研究社区可以很容易地设计一些模型,但这些模型只能在特定的测试集上运行良好,实际上却不能推泛化到新的数据中。
因此,为了理解当前机器学习进展的可靠性如何,我们设计并开展了一种新的再现性研究。其主要目标是衡量当代分类器从相同分布中泛化到新的、真正不可见的数据中的程度如何。我们聚焦于标准的CIFAR-10数据集,因为它的透明性创建过程使其特别适合于此任务。而且,CIFAR-10现在已经成为近10年来研究的热点。由于这个过程的竞争性,这是一个很好的测试案例,用于调查适应性是否导致过度拟合。
我们的实验是否显示过度拟合?这可以说是对我们的结果进行解释时的主要问题。准确地说,我们首先定义过度拟合的两个概念:
&训练集过度拟合:量化过度拟合的一种方法是确定训练精确度和测试精确度之间的差异。需要注意的是,我们实验中的深度神经网络通常达到100%的训练精确度。所以这种过度拟合的概念已经出现在现有的数据集上。
&测试集过度拟合:过度拟合的另一个概念是测试精确度和基础数据分布的精确度之间的差距。通过将模型设计选择适配于测试集,我们关心的是我们隐含地将模型拟合到测试集。然后,测试精确度作为在真正看不见的数据上性能的精确衡量,将失去其有效性。
图2:新测试集的模型精确度VS原始测试集的模型精确度
由于机器学习的总体目标是泛化到看不见的数据中,所以我们认为,第二个概念,通过测试集自适应性事物过度拟合更为重要。令人惊讶的是,我们的研究结果显示在CIFAR-10上没有出现这种过度拟合的迹象。尽管在这个数据集上有多年的竞争自适应性,但真正持有的数据并没有停滞不前。事实上,在我们的新测试集中,性能最好的模型要比更多已建立的基线更具优势。尽管这种趋势与通过适应性的过度拟合所表明的相反。虽然一个确凿的图片需要进一步的复制实验,但我们认为我们的结果是支持基于竞争的方法来提高精确度分数的。
我们注意到,可以阅读Blum和Hardt的Ladder算法的分析来支持这一说法。事实上,他们表明,通过加入对标准机器学习竞赛的小修改,可以避免那种通过积极的适应性来实现的过度拟合。我们的结果显示,即使没有这些修改,基于测试误差的模型调整也不会导致标准数据集的过度拟合。
分布位移(distribution shift)
尽管我们的结果不支持基于适应性的过度拟合的假设,但仍需要对原始精确度分数和新精确度分数之间的显著差距进行解释。我们认为这种差距是原始CIFAR-10数据集与我们新测试集之间的小分布位移的结果。尽管我们努力复制CIFAR-10的创建过程,但这种差距很大,影响了所有模型,从而出现这种情况。通常,对于数据生成过程中的特定变化(例如,照明条件的变化)或对抗性环境中的最坏情况攻击,我们就会研究分布位移。我们的实验更加温和,并没有带来这些挑战。尽管如此,所有模型的精确度下降了4-15%,误差率的相对增加高达3倍。这表明目前的CIFAR-10分类器难以泛化到图像数据的自然变化中。
未来的研究
具体的未来实验应该探索竞争方法在其他数据集(例如ImageNet)和其他任务(如语言建模)上是否同样对过度拟合具有复原性。这里的一个重要方面是确保新测试集的数据分布尽可能地接近原始数据集。此外,我们应该了解什么类型的自然发生的分布变化对图像分类器是具有挑战性的。
更广泛地说,我们将我们的结果看作是对机器学习研究进行更全面评估的动机。目前,主要的范式是提出一种新的算法并评估其在现有数据上的性能。不幸的是,这些改进在多大程度上可以进行广泛适用,人们往往知之甚少。为了真正理解泛化问题,更多的研究应该收集有洞察力的新数据并评估现有算法在这些数据上的性能表现。由于我们现在在开源代码库中拥有大量预先注册的分类器,因此此类研究将符合公认的统计有效研究标准。重要的是要注意区分机器学习中的当前可再现性性努力,其通常集中在计算的再现性上,即在相同的测试数据上运行发布的代码。相比之下,像我们这样的泛化实验,通过评估分类器在真实新数据(类似于招募新参与者进行医学或心理学的再现性实验)上的性能表现来关注统计再现性。
原文标题:伯克利与MIT最新研究:「CIFAR-10分类器」能否泛化到CIFAR-10中?
文章出处:【微信号:CAAI-1981,微信公众号:中国人工智能学会】欢迎添加关注!文章转载请注明出处。
发布评论请先
工业4.0可确保企业在相关产业维持竞争力,数码转型(digital transformation)是....
我个人是比较认可这个观点的。现阶段,AI还处于很早期,基础设施不成熟(现在AI的硬件、软件OS、交互....
自然语言推理。自然语言推理(NLI)模型接受两个输入句子:一个前提和一个假设。模型必须将前提和假设之....
彼尔姆国立研究大学的物理系大四学生维克多o扎科派洛通过自己的研发,搭建一个可以预测2018年世界杯冠....
SpaCy 是一个具有优秀示例、API 文档和演示应用程序的自然语言处理库。这个库是用 Cython....
一年一度的CES Asia再度揭开帷幕,日至15日,在上海新国际博览中心CES A....
依托“腾讯觅影”AI辅诊引擎和微信智慧医院生态,医院和医疗信息化厂商能实现移动医疗服务的智慧化升级,....
PLASTER 是一个与深度学习有关的框架,为致力于开发和部署基于 AI 的服务的人士提供了全方位指....
每年iOS的更新都是非常具有话题性的,关于今年的WWDC大会上,iOS 12带来了不少有趣的新功能,....
随着人工智能技术变得日趋主流和开源化,网络犯罪份子正采用人工智能,不仅将他们的犯罪活动加速并自动化,....
主要基于机器学习的现实世界人工智能数据项目十分瞩目,并且在很大程度上是成功的。有些首席信息官将人工智....
以一个简单的线性回归模型为例,讨论两种不同的训练方法来得到模型的最优解。
在人工智能领域,机器学习研究与芯片行业的发展,即是一个相因相生的过程。自第一个深度网络提出,深度学习....
很显然,当训练数据集足够大的时候,经验风险最小化这一策略能够保证很好的学习效果——这也就是我们当代深....
随着科学技术的不断发展,机器学习也即将成为高等教育的新机会,有望能够从各个层面实现教育的个性化 。它....
记录表明,机器在图像和物体识别方面的能力远远超过了人类。在一次测试软件识别玩具的能力的实验中,Geo....
在人工智能的今生发展,除了趋势的判断,还应落地到具体应用上。腾讯研究院高级研究员徐思彦的场景和人机回....
语音识别是指我们自然发出的声音需要机器转换成语言符号,通过识别和理解过程把语音信号转变为响应的文本或....
深度学习(Deep Learning)是一种实现ML的技术,是当前AI技术中非常火的话题,由Hint....
从数学的角度来考虑,机器学习问题就是已知n个独立同分布的观测样本,在同一组预测函数中求一个最优的函数....
另一个有趣的tutorial是:Computer Vision for Robotics and D....
人工智能的商业化有三大核心,即技术、数据和场景,科技巨头们拥有数据上的优势,目前的焦点在于人工智能的....
像《我,机器人》这样水平的人工智能多久能被制造出来一直有两种声音,一种是人们认为它很快就能到来,另一....
人脸检测算法的原理简单来说是一个“扫描”加“判定”的过程。即首先在整个图像范围内扫描,再逐个判定候选....
在机器学习中,我们通常会做一种假设:训练样本独立同分布(iid)且训练样本与测试样本分布一致,如果真....
阿里巴巴和亚马逊(Amazon)一样,都是靠着对人工智能(AI)、机器学习与认知运算的投入和投资,获....
作为一名数据工作者,这年头“熟悉机器学习算法”远比“精通Excel”在求职市场上要抢手得多,但前者的....
接着,研究人员从YouTube和摄像机中选取了一些240fps的视频,其中包括The Slow Mo....
当你打开互联网搜索引擎,输入关键词寻找并得到想要的链接时,“机器学习”已经贯穿整个过程:搜索到的内容....
谷歌表示,抢占式GPU(Preemptible GPUs)非常适合短期、容错和批处理工作负载,比如机....
如下图,FPGA作为协处理器,CPU把指令写入内存,FPGA从内存读取指令执行,并把计算结果写入内存....
王教授表示,如果开发者要执行的任务处于非常封闭的环境,和人的常识没有什么关系,这样的任务非常适合机器....
一家名为Spyce的初创企业,并未致力于将技术应用于其他食品业务,而是在波士顿开办了一个使用机器人操....
有时候并不是你的能力不够,也并不是你不够努力,只是缺少了一个正确的引导而已。
随着一些公司竞相利用机器学习技术来赚钱,而这些机器学习技术侧重于教授机器人更像人类那样工作,而许多公....
Pandas 是一个低学习成本高性能的数据结构和数据分析工具。抛开大熊猫憨态可掬的样子不说,「Pan....
研究人员声称,他们应用了一种名为random-forest的计算方法,通过结合机器自我学习和常规统计....
在他们的实验中,Gall和他的团队使用数小时的视频数据来演示不同的烹饪动作(例如煎鸡蛋、拌沙拉等),....
英国BBC主播加里·莱因克尔(Gary Lineker)曾有著名的理论:足球是个很简单的运动,不就是....
FPGA是帮助公司和研究人员解决问题的芯片。FPGA是一种集成电路,可以编程为多种用途。它有一系列“....
受试者工作特征(ROC)曲线是另一个二分类器常用的工具。它非常类似与准确率/召回率曲线,但不是画出准....
BP 神经网络是一类基于误差逆向传播 (BackPropagation, 简称 BP) 算法的多层前....
分析混淆矩阵通常可以给你提供深刻的见解去改善你的分类器。回顾这幅图,看样子你应该努力改善分类器在数字....
拿到数据后我们可以很清楚的看到邮件的内容,但并不是所有的内容都是我们需要的,在这里我们仅提取了邮件中....
在测试中,人们错误地将虚假的睁眼照片误认为是真实的照片,或者说他们不能确定哪些是真实的,认为这样的被....
人工智能大师西蒙曾说过:“学习就是系统在不断重复的工作中对本身能力的增强或者改进,使得系统在下一次执....
用一个例子来更具体地解释 GN。考虑在任意引力场中预测一组橡胶球的运动,它们不是相互碰撞,而是有一个....
为进一步巩固伦敦的技术创新能力,萨迪克汗当天还公布了一个推进智慧伦敦建设的路线图,其中包括改进光纤连....
供应链服务
版权所有 (C) 深圳华强聚丰电子科技有限公司
电信与信息服务业务经营许可证:粤B2-正在初始化报价器买日本马桶盖怎么安装1个回答后坡垴煞哔才去保安公司查看更多后坡垴煞哔才去保安公司1个回答psjwqaod573860房屋抵押贷款最高可以做8成。
房产抵押贷款条件:
1、 年龄在18-55周岁(部分小额贷款机构可接受有小孩或者老人);
2、一般房屋抵押贷款额度为房产评估价格的50~70%(部分银行可能会有所增加);
3、房屋抵押贷款的期限一般为1年-10年(少数银行对与优质客户最长可到30年,不过贷款结束后借款人年龄最高不能超过60岁);
4、房龄最高在20年内(少数银行可做30年内、多数有备用房更容易审批);
5、抵押贷款的贷款利率一般为基准利息上浮10%-20%;
6、有一定还款来源(有效证明主要为银行流水、最好每月有效进账大于,房屋抵押贷款月还款的2倍);
7、个人或公司信用良好(逾期要少,要不银行可能会找借口加利息或者不批款);
8、目前银行可接受的房产类型有商品房、住房、商铺、按揭房、二次抵押贷款、酒店式公寓、写字楼、办公楼等;3个回答想想就烦131我个人觉得安心地板是值得信赖的知名品牌,在一些相关品牌的榜单上,安心都是名列榜首,它主要以强化木地板 实木地板 实木复合地板等辅材为主,产品质量稳定,种类齐全,花色新颖,性价比高,深受用户喜爱,是装修选用门和地板的理想去处。“服务创造价值,品质铸就品牌”是它们的经营理念,它们做到销售、送货、安装一条龙服务,所有产品均由专业人员负责安装,真正做到“买的安心,用的舒心”!2个回答妇妻恩爱你是拨号上网吧,ip地址是由bas分配的,PPPOE拨号后得到的地址是32位掩码,网关与IP地址相同都是正确的,原因和BAS(接入服务器)的工作原理有关。
因为bas将每个用户都当成了一个自己的虚接口
http://blog.chinaunix。net/u/27698/showart_312098。html1个回答xxru05正规厂家生产的中空玻璃家用的一般八九十元左右吧,好点的一百二三左右,具体还要看一下玻璃的厚度和具体要求1个回答若儿蹩噣箜比较有名的木地板是圣象,木地板十大一流品牌有:圣象、德尔、菲林格尔、大自然、扬子、安心、生活家、肯帝亚、林中鹰、联丰,圣象以强化地板出名;菲林格尔是德国品牌,1921年就创立了,德尔的强化地板曾获“中国名牌产品”;安心文昌卫星基地是指定品牌。各有优势,我想说的是,购买时性价比为重,牌子啥的都是浮云。2个回答一点点_4788机箱没的瓦,因为机箱不用电,具体功耗得看你里面配置的高低,一般家用没有独立显卡的整个主机满载也就200瓦多点2个回答绽放色彩336工业方面使用的金属清洗剂牌子有安美润滑、海日清洗、长城等;安美是国内比较大的工业清洗剂生产厂家。1个回答y1垜花儿_1069手机不带录音功能吧1个回答粉丝吧00189我之前用过,无边的能贵一点,你是要给哪里安装,我可以帮你推荐。正在初始化装修神器热门问答1234567891011121314151617181920查看更多正在初始化报价器求教一个关于HIFI的常识问题: (我在这里暂不提我买的什么。避免影响各位的回答思路)3个回答兔子ZV96当然是功放和无源音箱当然是功放和无源音箱草帽仔USszi不一样的风格,音响声场大临场感更强,耳机更细腻。音响可能效果更好【看在2w的价格上】,但音响要想晚上听的可能不会吵到邻居,现场长时间试听才是王道敲可爱不骗人音质上肯定是前者好,后者主要是更加便携其他回答正在初始化装修神器热门问答1234567891011121314151617181920查看更多相关问答3个回答2697abchifi插座有很多牌子的好不好,贝桥N86-901+612-2 HIFI这个品牌的产品不错,口碑很好,我们家也是用这个的。需要用100X2 200支音箱线,价格大概是25元。
3个回答xian5126觉于喜欢音响非专业士说市面能满足要求找见千五千市面飞利浦雅马哈五千两万想烧迷类见要hifi2.0行找逛电器市场店类苏宁美找
3个回答锅烧2009你好,据我了解:
hifi电源插座的价格与它的品牌有一定的关系。外国的牌子hifi电源插座价格会贵于中国牌子的。像有一款日本的hifi电源插座一个要650元,一款美国的hif...1个回答五五车排现在耳机的选择性很多,没必要非要选择名牌的。质量都差不了多少。有的名牌耳机,也是代工的,为您推荐酷奇的带麦hifi耳机质量很不错的。
3个回答无聊人儈喏你好,据我了解:
hifi电源插座的价格与它的品牌有一定的关系。外国的牌子hifi电源插座价格会贵于中国牌子的。像有一款日本的hifi电源插座一个要650元,一款美国的hif...3个回答dpuserAt_你如果要效果好一点的就选择2.0的有源音响,价格大概在200-400之间,还有就 是惠威有一款2.1的有源音响价格在500左右,这个箱子不错,音质很好,如果你要求的只是有声音就行了...3个回答soufunpa11847你好,价格一般是1999元哦,建议你去实体店问问,个人感觉对于喜欢音响的非专业人士来说,市面上能满足要求的不好找,不常见。一千到五千的市面最多是飞利浦和雅马哈的,五千到两万想小烧一...5个回答我就发次哦啊不一样, HIFI功放, 你可以HI起来, 纯功放的意思是立体声功放, 功放还分为分体式、合并式,看问题就知道你还没入门, 建议你买音乐传真A1复刻版烧一烧, 就明白了,此功放保值...2个回答qzuser_复式楼装修一般要20万元,把每块的预算做好,比如地板大概多少钱的,墙地砖多少钱的,灯具多少钱的,油漆多少钱等等。全部在你经济承受范围内计划好,就按照这个标准去买东西,超过的坚决放弃...5个回答中国木门协会_Hi-Fi是英语Hight-Fidelity的缩写,直译为高度保真,它要求音响设备在重放过程中,对声音信号各项指标不失真地放大、处理,以还原声源的本来面貌,强调的是原汁原味,专门用...人工智能在企业的落地是一门大学问,而且是一门艺术性的学问
上周,清华 AI 公开课迎来最后一讲,本讲主题是:落地的人工智能。讲者杨强是香港科技大学讲座教授,华人首个AAAI Fellow和IJCAI理事长,第四范式公司联合创始人。 杨强教授作为邀请讲者,与清华大学海峡研究院大数据 AI 中心专家委员雷鸣等共同探讨了 AI 在当前和未来将产生的影响和落地的场景。
在课程开始,雷鸣老师先概述了对产业有较大影响的技术,以及未来将发生的演变。
从技术角度看,未来对产业产生比较大影响的技术有:
基于视频的信息理解和处理技术。现在,基于静态的图片的处理技术,比如人脸识别、物体识别等,已经达到了可用的水平。但是,在视频分析和处理方面的研究才刚刚开始,还没有非常有效、成熟的技术。
自然语言对话、理解和处理。尤其是半开放环境的对话,难度还很大。
强化学习。未来将在自动驾驶、广告等领域产生影响。
内容生成相关技术。
小样本学习和迁移学习。在样本匮乏的情况下解决问题。
产业在未来可能发生的一些演变:
首先是自动驾驶。以前我们还会讨论自动驾驶是不是有落地的可能,是不是太危险、太科幻了。但现在来看,我们认为自动驾驶的落地只是时间的问题。今年很快,百度的小批量量产自动驾驶汽车就会投入使用,真正实现商业化。
第二是智能医疗。智能医疗最近的发展很快,以医学影像的发展为牵引,在一些特定领域的进展很不错。FDA最近刚给出了AI诊断的第二个license。
智能教育。探讨教育的难度比较大,因为教育不是一个客观问题,是一个交互式的,高维度的问题。所以AI全面介入教育的&智能老师&难度很大,但是以个性化教育作为切入,在一些特定领域,比如作文评分、作业批改、个性化出题等,已经在不断改变教育的生态。
智能助理。去年开始进入一种非常白热化的竞争阶段,未来会进一步的落地,通过迭代,会在更多垂直应用上越做越好。
游戏及娱乐。个性化、娱乐内容的生产。
智能制造。中国是制造大国,如果叠加智能制造,可以大幅度提高中国制造的水平和能力。中国在软件方面发展较快,但硬件上的话,无论是芯片还是其他重要零部件制造,跟国际水平差距还很大。要承认差距的客观存在性,依靠中国巨大的市场,大力加大研发投入。不能仅靠国家,整个产业的企业和国家要一起把这部分发展起来。
智能农业。中国是农业大国,在智能农业上已经有一些发展。比如用无人机进行病虫害巡检、定向农药喷洒、大棚的温控,病虫害检测等,未来都有一些非常实际的应用场景。
整体来看,AI在各个行业都有很多落地的场景,未来AI自身的发展结合落地的场景,应该会产生很多创新。
杨强:一个AI,两种模式
杨强:今天的题目很应景,叫 &落地的人工智能&。这个题目是拿来跟大家探讨的,因为这是一个大题目。人工智能到现在已经 60 多年,几起几落,它的兴衰也是围绕着 &AI是不是可以落地& 进行的。
今天的讲座,第一部分是人工智能概述。
人工智能分为四个发展阶段。初级阶段是感知环境(Perception),我们知道单层的神经网络也叫 perceptron(感知器),是 60 年代就出现的可以简单学习的神经网络。这是 AI 必要的一步,因为要有感知智能,才能收集大量数据,这一阶段需要传感器、互联网、物联网等技术。
第二个阶段是机器学习(machine learning)阶段。能从数据里面学习。第三个阶段是自动推理(reasoning),需要搜索、逻辑、博弈论等技术。最后也是最高阶段是抽象迁移(abstraction),需要有新的理论和系统。
一个AI,两种模式
通用 vs 特殊:有很多人试图解决通用 AI,但现在绝大部分工作还是在特殊的、任务驱动的人工智能。
辅助 vs 自动:比如计算机视觉是辅助型的,相当于给机器戴上了眼镜。无人车是自动型的,因为它的整个运作是自动的,也有自动的学习能力,人类只是为它提供一些必要的资源。
交互 vs 核心:交互型的 AI 是为了跟人沟通,是闭环的。还有一种做法是把 AI 作为一个核心的系统,它的副产品是对人有用,但它可以完全按照自己的方式发展。AlphaGo 就是一个例子。
说到人工智能落地,第一个问题就是什么叫&落地&,谁来规范什么时候AI可以算作&落地了&? 这个标准是首先要建立的。在任何科学与工程领域,都要首先建立测试&成功&的准则,否则就会事倍功半。要知道,智能的测试是非常难以做到公正的,也经历了很多的考验,比如著名的&聪明的汉斯&,是对一匹叫做&汉斯&的马的智能测试,因为一开始没有注意到高维的特征空间,而得到了错误的结论。图灵测试是一种更合理的测试,但也不是唯一的测试。
我认为深度学习的成功主要来自两个方面:第一,层次之间的演化是一种非线性的转化,这种转化如果进行多次,就有可能产生高维空间的 pattern。第二,所有这些加起来,这个网络本身成为一个特征产生器,产生一个高维的空间,在这个空间里,世界上的任何东西(图像、语音等)都会有统一的表达,并且你可以计算它们的距离。
高维度的、统一的特征表达,这就是人工智能想达到的目标。所有的推理、类比、抽象等,都可以在这个空间里得到。但这个空间是通过在数据中学习获得的,这个手段在现阶段是通过大数据,但大数据不是唯一的手段。
AI为什么要有不断创新的能力?
AI 领域每年有上千甚至上万的 paper,是不是说我们就可以躺在 open source 上面,不用创新了?不是的,我们很有必要不断地创新。
一个例子是 GAN,它的一个作用是可以 &鱼目混珠&,生成器可以创造出一些虚假的图片。在金融界就发现有这样的人,他们对深度学习了如指掌,并且可以用AI深度学习的这些手段去欺诈金融的安全系统,因此我们必须要有不断提高的反击的能力。
第二,有些新的学科,比如迁移学习,非常依赖对数据的模拟。GAN 在这个方向是非常有用的工具。
创新的能力也可以体现在跨界的AI应用上。一个例子是斯坦福大学的一个工作,他们的任务是帮助联合国通过卫星图像,让机器自动地给非洲大陆打标签,这些标签指代地区的&贫困程度。& 但是我们看到一个卫星图像,由于标签的缺乏,我们对图像上对应的贫困程度是一无所知的。传统的做法是派人到本地做经济调查,然后把数据收集起来。这样的做法既危险,又耗时,不准确,数据也非常少。
有没有办法自动地做这件事呢?他们想到了迁移学习,而且是多步的迁移学习。第一步是拿 ImageNet 这种图像来学一个切割模型,第二步是比对白天和晚上的卫星图像,以此获得一个初步的经济模型。因为一般认为晚上比较亮的地方是经济发展比较好的区域。由此得出一些 feature 对应经济发达或不发达的地区。最后的结果,用 survey 的方法的准确率是 75%,用迁移学习的方法准确率是 71%。虽然没有人工的那么好,但是非常省力。
我们现在已经有了不少&迁移学习&在产业应用中的实例。如果已经有了大数据产生的模型,那么在一个新的领域,可以用小数据把大模型迁移过来找到这个领域的要点就是找出两个领域的不变量。我们假设一个领域可以用上亿维的特征来描述,那么我们要找两个领域的特征空间共有的部分来做迁移。
网约车识别
这里的一个例子是上海汽车的网约车识别
这个问题是:给定车辆的行驶轨迹,如何判断车辆是否网约车?
我们的策略是引入外部数据来进行迁移学习。外部数据有出租车、公交车的行车轨迹。分两步:首先我们有两个空间,左边是出租车的空间,右边是网约车的空间,我们的目的是把知识从左边搬到右边。但是很明显两边的知识是有差异的,要把这些差异剔除,我们用了半监督学习 + 迁移学习。
这个例子告诉我们,AI 的落地首先要目标清晰,清晰到可以把优化函数用数学公式写下来。
第二,需要去找到合适的数据。
第三,人才需要领域知识,同时也需要 AI 知识,这种跨界的人才才是 AI 真正需要的人才,否则谈不上落地。
然后,我们也来举一个反例。我们都知道,AI的头几个里程碑都是IBM创造的。但是在AI落地的过程中,IBM也遇到了难题。一个例子就是IBM WATSON在医疗领域的落地。&
我们先来看一下IBM WATSON的流程。 首先,当一个问题到来的时候,系统把输入的问题和知识库里的问题加以对比,再按照匹配的概率排序。 如果有匹配度高的问题,那就可以把对应的答案作为输出。 在这个流程中,需要知识库的建立,和问题集的收集。当然,这个流程中又很多依靠机器学习的阶段,比如问题的特征抽取,特征空间的建立,匹配的相似度学习,等。但整个流程的建立还是要依靠专家来进行的。比如,知识库的建立,知识的扩展,以及问答系统在整个医疗系统中的定位等。恰恰因为这些需要人工的地方成为瓶颈,以至于最终用户的定位错误,导致系统并没有完成既定的任务。最后,IBM只能从美国一个很大的医疗机构撤离,也导致了媒体大量的负面报道。
总结起来,这个例子说明,仅仅在一个游戏领域成功(问答的电视大赛),并不表示在开放的实际场景(医疗)就可以取得成功。 首先,IBM& Watson的目标客户群是医生,还是病人? 系统的角色是助手还是替代? 有没有既懂医疗又懂AI的专家在团队中? 系统有没有做到前端和知识库的维护的闭环?这些有关落地的问题,都有待回答。
第一,人工智能是走了很长的路,但是除了深度学习以外,还有很多的领域有待发掘。所以千万不要以为深度学习就是人工智能。
第二,人工智能在企业的落地是一门大学问,而且是一门艺术性的学问,因为还没有到科学的程度。所以一个问题是,AI 是产品,还是技术,还是解决方案?第二个问题是,AI 如果在一个领域落地成功,需要哪些基本条件?
最后,我觉得非常有趣的一个点,是 AI 出现了以后、会出现一个新的、以机器智能为主体的产业和社会。那么这个新的商业社会也可能会部分地颠覆我们已有的商学院的知识。现有的商学院的知识主要是针对人的管理和人的决策。那么 AI 对应的是机器的管理和机器的决策,这个学问现在还是空白。&
原文标题:【清华 AI 公开课】IJCAI理事长杨强:人工智能在企业的落地是一门大学问
文章出处:【微信号:AI_era,微信公众号:新智元】欢迎添加关注!文章转载请注明出处。
发布评论请先
过去两年,消费升级、智慧零售、智慧城市等概念成了大众讨论的热点。
广义上的可解释性指在我们需要了解或解决一件事情的时候,我们可以获得我们所需要的足够的可以理解的信息。
6月25日消息,据报道,对于那些对任天堂(Nintendo)栩栩如生、变幻莫测、有生态色彩的视频游戏....
自然语言推理。自然语言推理(NLI)模型接受两个输入句子:一个前提和一个假设。模型必须将前提和假设之....
彼尔姆国立研究大学的物理系大四学生维克多o扎科派洛通过自己的研发,搭建一个可以预测2018年世界杯冠....
IBM开发的人工智能已经可以与人类展开辩论,讨论的主题很深刻,有“医疗的未来”,还有“体育教育的价值....
从人与人相连接,到万物互联,互联网技术的演进正在给人类社会带来巨大变革。
去年早些时候,“互联网+”曾经被视为“智能制造”的灵丹妙药。经过一段时间的争吵、实践和沉淀,“制造业....
当前信息技术的一个主要矛盾,是急剧增长的数据流与有限带宽之间的矛盾,伴随人工智能与5G技术发展,数据....
依托“腾讯觅影”AI辅诊引擎和微信智慧医院生态,医院和医疗信息化厂商能实现移动医疗服务的智慧化升级,....
PLASTER 是一个与深度学习有关的框架,为致力于开发和部署基于 AI 的服务的人士提供了全方位指....
我们现在正处在4G时代,网速已经可以满足我们绝大部分场景的需求。但是不久的将来,5G通讯技术的成熟,....
云从科技是专注于计算机视觉的人工智能国家队,孵化于中国科学院重庆分院,是唯一一家纯内资的计算机视觉企....
AI作为今后智能手机的发力点,是毋庸置疑的。机器代替人简单思考、测量感知并提供建议。以目前的技术成熟....
全球最大的汽车电子及人工智能物联网芯片公司恩智浦半导体(纳斯达克代码:NXPI,以下简称“恩智浦”)....
除了赛事判决本身运用新科技,观众本身对于对观赛要求也越来越高。IBM曾针对赛事运用“AI Visio....
机器人未来城将重点打造以“智造、创新、人才、示范、金融”五大平台为核心的产业生态圈,实现工业机器人、....
高通在2017财年超过10亿美元的物联网收入后,宣布为物联网应用专门构建新的产品系列。
如今,全球正迈向数字化新时代。以云计算、大数据、人工智能与物联网为代表的数字技术,其能量在持续释放。
中科院计算所陈云霁、陈天石团队将研发的全球首款人工智能处理器命名为“寒武纪”,也意喻着人工智能即将迎....
6月14日,全球研发情报与知识产权管理SaaS服务提供商智慧芽(PatSnap)宣布已经完成3800....
随着人工智能技术变得日趋主流和开源化,网络犯罪份子正采用人工智能,不仅将他们的犯罪活动加速并自动化,....
6月21日,创新工场南京国际人工智能研究院、创新工场人工智能工程院华东总部以及创新奇智(南京)科技有....
韩国棋院排名第20位的洪性志九段(31岁)最近被质疑网络对局中使用人工智能围棋程序(AI)。
未来行业发展势头势必迅猛,这源于近些年前沿科技领域的井喷式发展,其中人工智能、自动驾驶、VR/AR、....
魔术方块是非常有趣的益智玩具,但从难度来说,并不比其他棋类游戏困难,如果人工智能(AI)算法可以在国....
 但是在民用行业无人机应用中,为了应用场景和城市飞行的安全性,飞机的重量必须很轻,载荷的作用距离只有....
主要基于机器学习的现实世界人工智能数据项目十分瞩目,并且在很大程度上是成功的。有些首席信息官将人工智....
作为人工智能的一个重要领域,计算机视觉是一门可以识别并理解图像和场景的计算机及软件系统科学。该领域主....
自2009年开始的第二轮鼓励社会资本办医以来,医疗是无论在软件还是硬件方面都投入大的领域,对于非公医....
本次论坛由中国电子技术标准化研究院、全球异构系统架构联盟中国区域委员会(HSA CRC)主办,由中国....
在人工智能领域,机器学习研究与芯片行业的发展,即是一个相因相生的过程。自第一个深度网络提出,深度学习....
Leap Motion已经开发出了一款惊人流畅的增强现实乒乓球游戏,其不仅展示了其开源项目“北极星”....
近日,格力电器董事长董明珠表示,哪怕投资500亿元,格力也要把芯片研究成功。而引起更大行业震动的是互....
中美贸易战在持续发酵,正业科技近日发布公告表示,公司产品基本没有出口到美国。公司是专业提供高端装备及....
很显然,当训练数据集足够大的时候,经验风险最小化这一策略能够保证很好的学习效果——这也就是我们当代深....
另一个有趣的tutorial是:Computer Vision for Robotics and D....
“人类对抗AI”的悲壮才过去一年,围棋国手们已能放下尊严向AI讨教,但他们要适应的远不止全新的围棋理....
顶级人才有了,基层人才又是如何培养起来的呢?如果单靠高校培养,时间上会有延迟,所以目前业内的基本情况....
人工智能的商业化有三大核心,即技术、数据和场景,科技巨头们拥有数据上的优势,目前的焦点在于人工智能的....
像《我,机器人》这样水平的人工智能多久能被制造出来一直有两种声音,一种是人们认为它很快就能到来,另一....
现今的人工智能技术,特别是以深度学习(机器学习的一个分支)为代表的,需要海量的数据作为基础支撑,并以....
人工智能应该能够增强人们的判断力,帮助人们识别和解决偏见,而不是无形地改变其行为以反映出所期望的结果....
人工智能主管迪恩强调称,这种实验依赖的是认真严肃的医疗咨询,而不仅仅是好奇的软件程序员。谷歌公司正在....
2018年将是人工智能商业落地的元年。一个显著的变化是,去年创始人还在拿数据和算法讲故事,今年则开始....
送餐机器人、购物指引机器人、巡检机器人、教学机器人、政务机器人给人们的生活带来更多的便捷。随着技术不....
供应链服务
版权所有 (C) 深圳华强聚丰电子科技有限公司
电信与信息服务业务经营许可证:粤B2-}

我要回帖

更多关于 人脸三维扫描仪 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信