人工智能与图像处理看走眼的图像都长什么样

能识别能伪造 人工智能在图像处理领域又进一步_机器人,图像识别,视频识别,人工智能_科技动态_中国安防展览网
能识别能伪造 人工智能在图像处理领域又进一步
  【中国安防展览网 科技动态】 数码工具会让越来越多的人都有能力进行伪造。过不了多久,所有人都可以通过人工智能对一张图片或是对视频进行复杂的处理。&  Smile Vector 是一个推特机器人,可以生成任何明星照片微笑的动图,如果输入一张人脸图片,它可以通过深度学习神经网络生成它们微笑的表情。虽然这些图片也许并不完美,但它们完全是自动生成的,这是人工智能在图像处理领域的又一进步。也许不久之后,图片、声音和视频造假都将变得容易。想象一下,假如新版本的 Photoshop 可以像用 Word 编辑文字一样轻松编辑图片,你还会相信自己的眼睛吗?&  这将是一个技术上的飞跃。「我非常确定这将是一个技术上的飞跃,」Smile Vector 的开发者,Victoria 大学设计学院讲师 Tom White 说到。「这不仅意味着我们具有修改图像的能力,更意味着它简便易行,适用于所有人。」White 将它的作品比作对现实世界的「挑衅」,意在宣示人工智能的技术能力。「我觉得现在科技圈以外的人还不知道机器学习能够做什么,你可以想象一下如果我们在 Instagram 中加入这样一个滤镜,你只需选择『大笑』或者『微笑』,图片瞬间就处理好了,所有人在自己的手机上都可以这样做。」&  Smile Vector 只是新技术的冰山一角,我们很难对现代人工智能多媒体处理技术做出全面的概述,但我们能够找出其中一些有意思的应用。例如:从一张 2D 图片中创建 3D 面部模型;使用人类「模型」实时改变视频中人物的面部表情;改变图片中的光源和阴影;为无声视频自动生成声音;在总统选举直播中让特朗普变成秃头;用视频剪辑「复活」朋友等等。这些事例只是其中的一小部分。&  「这一领域正在迅速发展,」Wyoming 大学的计算机科学教授 Jeff Clune 说道。「每个月我都会看到新的产品出现。」Clune 的研究并不包含修改图像,而是直接生成图像。他和他的团队从 2015 年开始通过对象识别训练神经网络。这项研究源自于 2005 年 Quian Quiroga 等人的一项神经学研究,他们确定了当面对某些图像时人类大脑中产生兴奋的神经元,并教导整个网络产生最大化这种刺激的图像。&  在2015年,他们生成的图像是这样:&&  到了2016年,他们的研究有了很大进展:&&  为了生成这些图片,需要在此类图片的数据库上训练神经网络。一旦它学习了足够的蚂蚁、红脚鹬和火山的图像,它可以根据命令生成自己的版本。当前的两个瓶颈是图像分辨率(这些图片都不大于 256&256),还有搜集足够数量标记过的图片来训练神经网络。Clune 表示:「我们当前遭遇的挑战不在于模型本身,而是缺乏更高分辨率的数据集,需要多长时间才能生成出真实的全高清图像?我们无从得知,不过它应该只需要几年,而不是几十年」&  当这些技术完善之后,它们将会很快的流行起来。「风格转换」就是一个很好的例子,这个 APP 应用神经网络把一张图片的风格应用于另外一张图片上。这个方向的一篇重要论文是在 2015 年 9 月份发表的,随后,论文的研究者在 2016 年一月份把他们的研究做成了一个开源的网络应用。6 月,一家俄罗斯初创公司开创性地改善了这些代码,做出了手机 app&&Prisma,这个应用让所有人都可以在手机上制作不同艺术风格的照片,然后将制作的照片分享到社交网络中。Prisma 瞬间成为社交网络的宠儿,今年 11 月,Facebook 发布了自己版本的风格转换应用,在 Prisma 基础上增添了一些新功能。不到一年时间,这个技术完成了从前沿研究到商业产品成型的过程,这就是此类工具发展成型的节奏。&  Clune 认为人工智能图像生成应用在未来将在创意产业中起到重要作用。家具设计师可以使用它作为一个「灵感源(intuition pump)」,在为神经网络提供椅子的数据集后,就可以要求它自动生成这些椅子的变种,这是一种创新的创作方式。图像生成的其他用途可能会在视频游戏和虚拟现实等领域里,根据用户实时说出的内容生成场景。想要条巨龙?只要下达命令就能生成了。研究人员已经在研究这些前沿交互方式了,在下面的图片中,右侧的图像仅仅只是是基于左边的字幕生成的。&&  它显然可以用来搞恶作剧。有一个叫 Face2Face 的程序,它将视频中的人物变成了木偶,让你的表情映射到了他们的脸上。研究人员使用特朗普和奥巴马等人的镜头证明了这一点。在 Adobe 发布的新研究中(Project VoCo),用户可以编辑人类语音,该公司表示它可以像 Photoshop 编辑图片一样用于调整视频中的发音和对话。你现在可以创建政治家、名人、演说家的视频片段,并且不论内容如何。然后你可以在任何社交网络的页面上发布你的剪辑,并看看它会如何迅速遍布整个互联网。&图:Face2Face实时改变视频中人物的口型&  这并不意味着,机器学习编辑工具会让我们的社会变得再无真相。毕竟人类造假的历史由来已久,润饰照片的实践最早都是在暗室里进行的,媒体也经常会把假图片误报成真的。从朝鲜的「导弹发射」到本拉登的「尸体」,这些图片在英国一些小报的页面上随处可见。同样,视频也是一样&&例如,2015 年美国计划生育协会(Planned Parenthood)丑闻,将隐藏拍摄的镜头经过编辑去支持一些耸人听闻的错误言论。&  但我们不能否认的是,数码工具会让越来越多的人都有能力进行伪造。过不了多久,所有人都可以通过人工智能对一张图片或是对视频进行复杂的处理。一旦每个人都能像写 Word 一样快速处理照片,事情一定会变得复杂起来。现在,查验人工智能所做的伪造和处理并不难(模糊处理是一种最常见的方法,低分辨率就会让它「看上去就是假的」),但是研究人员一直在努力改善他们的技术。&  如果每个人都能像专业人员一样既快速又简便地修改一张照片,这个世界会发生什么?&  现实中伪造的事情越来越多,这对阴谋论者来说绝对是一件愉快的事,但同时也会大大降低人们对新闻业的信心。一旦人们知道目前有伪造的图片在新闻业流通,即使他们看到真图,也会开始怀疑,不管原因是什么。(例如,2012 年报道飓风桑迪的博客图片,经证实,里面有伪造的图片,但也有真实的图片)如果新的软件能够让我们像处理图片一样轻松处理音频、视频内容,这其实又削弱了媒体「真实可信」证据的另一大支柱。&  这一领域的人工智能研究者们已经对即将到来的媒体环境有了直接的体验。Clune 说:「我目前正处在让我头晕目眩的现实世界当中。」「人们发给我一些真实的图片,但我还是不禁会想它们看起来像不像是假的。当他们给我发送一些伪造的图片的时候,我又在假设这些图片是真的,因为的确质量很高。渐渐地,我开始在想,我们是不会知道真和假之间的区别的。这取决于人们自我尝试和自我学习的能力。」
声明:凡来源标明“中国安防展览网”的文章版权均为本站所有,如需转载请务必注明出处,违者本网将追究相关法律责任;所有未标明来源为“中国安防展览网”的转载文章目的在于传递更多信息,均不代表本网立场及观点,“中国安防展览网”不对这些第三方内容或链接做任何保证或承担任何责任;如涉及版权等问题,请在内容发表之日起一周内与本网联系,否则视为放弃相关权利。
请输入正确验证码
所有评论仅代表网友意见,与本站立场无关。
2月7号,又一家共享单车倒闭。对于共享单车来说,这个
为回馈广大客户一直以来的陪伴与支持,中国安防展览网
  日,湖北省首届安防行业嘉年华暨湖北省安全
  即日起至日,&大数据环境下安防系统安
  1月9日,国际消费类电子产品展览会(简称CES)在美国拉斯
  安防产业想要实现长久蓬勃发展,就必须告别过去传统发展
  中国安防展览网主办的第八届2017年度中国安防十大品牌评
为了进一步促进西南地区安全防范行业的健康发展,打造“平安
咨询中心服务咨询在线客服媒体合作展会合作502 Bad Gateway
502 Bad Gateway中国网:“中国访谈·世界对话”欢迎您的收看!随着AlphaGo与李世石的世纪大战落下帷幕,人工智能4:1的胜利,让人们不禁问到人工智能究竟有多强大?在未来人工智能到底会给人类带来什么样的影响?本期节目我们特别邀请到广州图普网络科技有限公司CEO李明强做客演播室,和我们一起来聊一聊人工智能的那些事。欢迎您,李总。
李明强:各位网友大家好!
中国网:非常欢迎您今天做客我们的演播室。我们知道图普科技是一家人工智能的创业科技公司,致力于图像识别和视觉检测技术。请您先跟我们介绍一下究竟人工智能技术是什么样的原理呢?
李明强:前段时间大家都被AlphaGo事件吸引了。我们的技术跟AlphaGo的技术有很多相似的地方,或者说都是用人工智能基因学习的技术来做深度学习方面的引擎。我们是基于很多图像的例子,学习出图像识别的引擎出来。都是基于大数据的学习,这跟AlphaGo实际上有异曲同工之处的。反复告诉它什么是对的,什么是错的,像教育一个动物一样。就像你教育猫、狗,教育它坐和站,如果它做得对的话,你就给它奖励,如果它做错了,你就给它惩罚,人工智能也是这样。像教一个小孩子、小动物这样,不断给它正向激励和负向激励,最后才让它学会这个东西。
中国网:就像您说的AlphaGo前段时间非常火,而且其实近年来人工智能的技术也是得到了全世界互联网巨头的青睐,成为了衡量科技创新能力的标志。像谷歌、IBM、微软、苹果、百度这样网络大头也争相开发这样的技术,您认为在世界范围内相比,我国的人工智能技术目前发展到什么样的水平呢?
李明强:我们的人工智能技术相对国外来说在基础研发这个层面,应该说还是有一定差距的。但是人工智能技术和其他技术不一样,因为人工智能技术是需要大数据学习出来的,通过国内互联网之前十年的快速发展,我国的互联网跟国外的差距并不算很大,我们很多的APP比国外很多服务还要好一点,因此这个差距的时间并不是很长。而且中国人口基数很大,很多消费习惯,像支付一类的东西,国内的消费习惯反而更容易被接受,所以我们可以积累大量数据,大量人的行为样本,在数据应用这个方面,我觉得国内做人工智能也有自己的优势。我国的人工智能还是处于早期的阶段,我相信以后还有很多可能性,还有很多的应用场景,这才是人工智能到最后商业价值有多大,能不能落地的关键的要素。
中国网:就像您说的,可能人工智能在我国目前只是一个起步阶段,而且目前在我国呈现出了爆发式或者是井喷式的增长的趋势,您如何看待人工智能未来发展方向呢?
李明强:现在大家都说“互联网+”,以后“互联网+”的意思,就是不会分互联网行业或是传统行业,而是所有行业都会上网,都会通过互联网手段连接起来,而人工智能也是这样一个东西。人工智能是下一次的工业革命,不是哪些行业是人工智能的,哪些行业不是人工智能的,不会这样区分,应该说所有行业都会用人工智能技术去改造它原先的行业。人工智能这个东西就像水和电一样或者就像基础性的改造一样,每一个行业都会因为人工智能或降低了成本,或提高了效益,或是有一些之前完全没有的更好的用户体验,每一个行业都会因此受益。
中国网:可以说人工智能未来的潜力还是非常大的,并且可能在将来人工智能可能会发展成为生活或者行业的必需品,像我们的水电一样变得非常普通。据我所知李总您原来是腾讯的技术专家,并且也是微信立项的创始成员。您选择了人工智能这个领域进行创业,您选择这个领域是出于什么样的考虑,您认为现在是人工智能创业的最佳时期吗?
李明强:我认为现在正好是人工智能爆发的早期阶段,因为人工智能要爆发有三个条件:第一是海量的数据。因为互联网的发展,前面已经积累了大量数据,都躺在很多互联网公司的硬盘里,没有被应用起来。第二是计算能力的提高。计算能力随着摩尔定律以及游戏、高性能计算机行业多年的发展,显卡、GPU高性能计算卡的发展,技术也逐渐成熟了。这个拼图最后的一块就是算法。它能够被验证能利用好这么多的数据,这个算法在2012年一次人工智能的比赛中被验证了,引起了业界广泛的注意。在那之后,人工智能相关的创业公司像雨后春笋一样出现。我是在2012年底离开腾讯的,正好是在这么一个节点。我本身也是做技术出身,我觉得图像识别、人工智能是很酷的事情,因为人最终是要做出机器人的。完全自动化是要机器能完整地看懂,要有眼睛、嘴巴和耳朵,要有人的所有感官系统。机器人现在对听的可以有语音识别,但是对于图片的理解,基本上还是很像一个瞎子一样。这个东西既有强大的市场需求又有突破的曙光,所以我觉得现在是做图像识别、人工智能是很好的切入点。
中国网:可以说在您看来人工智能是既有趣味性,又非常有前景的行业,所以您选择了这样的行业。
李明强:对。
中国网:提到图普科技,很多时候大家会把它跟鉴黄师这样一个称谓联系起来。我们想问一下图普科技的图片识别技术是如何达到具备鉴黄能力的水平?在鉴黄领域有什么样的优势呢?
李明强:我们做的图像识别云服务是很多互联网公司用的一个产品,叫做图普鉴黄接口,来过滤海量的图片。之所以现在大家都会使用这个接口,是因为在互联网发展这几年里,一直都有一个行业叫鉴黄师。这个行业是比较机械式的,所以我们用人工智能替代鉴黄师。我们的图像识别接口服务,除了内容审核、鉴黄这块,还有人脸识别等很多服务。我们希望企业在使用我们的鉴黄服务以外,也可以通过我们搭好一条管线传递其他图像识别和智能服务满足他们的需求,这样他们就不用再去搭建这样的团队,积累这样的技术,只要做好自身的业务就可以了。
我们做好人工智能,做好云的鉴黄师,跟每个企业单个做这个事情或是人工去完成相比有巨大的好处。因为机器是24小时不知疲惫的,而且机器的成本只可能不断往下降,不会像人工成本一样上升。人工有很多不稳定的情况,人可能会流动,这个流动会带来审核标准的不稳定。但是机器在一个标准值上,它可以不断优化,它是稳定的,并且可以站在一个水平线上不断提高水平,所以相对人工来说有很多优势。对于其他人或单一的内容厂商,他自己来做这个事情,而不使用云服务,它做不了,因为人工智能需要大量的数据。厂商在创业之初,可能刚刚积累一些数据,这些数据不足以制作海量的模型。这是需要历史的积累,所以它需要有一个“我为人人,人人为我”的云服务的概念。其他的人工智能的服务也是同样的原理,都是需要大量的数据支持才能做得出来。
中国网:可见使用我们人工智能去进行鉴黄,不仅可以解放人的双眼,还能够节约人力成本,同时也具有非常高的稳定性。我们想问一下除了在鉴黄领域之外,这样的图像识别技术目前还在其他哪些领域有些实际的运用呢?
李明强:我们做的是图像识别云服务,图像识别云服务的概念就很广了。比如说人脸的识别,还比如说图像的搜索,我们现在也在尝试工业检测。在生产线上有三分之一的工人是用来做质量检测的,这个岗位也是需要大量的人力,跟互联网鉴黄师的作用有相似之处,都是最后一层质量把关,所以它也可以用图像识别来完成。只要这个动作是需要双眼来完成的,都需要使用到图像识别服务。
中国网:刚刚您也提到希望在未来能够建立一个图像识别的云平台,这个平台是基于大数据的积累。想请问一下您关于建立这样的云平台,对于公司将来的发展有什么样的规划?
李明强:就像KK,凯文凯利,作为写了《失控》,还有《必然》两本预言书的著名预言家,他提出的观点就是IQ服务会像水和电一样,会有一万个人工智能企业提供各种各样的人工智能服务。我希望我们提供这个服务也像水和电一样,专业的人做专业的事情,使用这样的服务,接入人工智能的服务。我们有很多接口,关于图像这块,我们尽量会做出很多现成的组件,对其他同行业,对于类比行业都是适用的。所以我们希望做好这样的组件,能够低成本提供给广大企业使用。我们希望做国内最大的图像识别云服务,让我们的服务像水和电一样,成为视频时代的基础服务提供商。
中国网:我们也希望这样美好的愿景能够早日实现,也再次感谢您今天做客我们的演播室。
李明强:谢谢!
中国网:非常感谢您的收看,我们下期节目再会!
(主持/责编:黄婉晴 摄像:刘哲 郜玉至 导播/后期:周姗姗)
栏目组联系方式:
访谈热线:
010-  010-
duomeiti@china.org.cn> 什么样的桌面软件好
热门文章热门标签
07月11日 |
07月11日 |
07月11日 |
07月11日 |
07月11日 |
07月11日 |
07月11日 |
07月11日 |主题信息(必填)
主题描述(最多限制在50个字符)
申请人信息(必填)
申请信息已提交审核,请注意查收邮件,我们会尽快给您反馈。
如有疑问,请联系
CSDN &《程序员》研发主编,投稿&纠错等事宜请致邮
你只管努力,剩下的交给时光!
如今的编程是一场程序员和上帝的竞赛,程序员要开发出更大更好、傻瓜都会用到软件。而上帝在努力创造出更大更傻的傻瓜。目前为止,上帝是赢的。个人网站:www.xttblog.com。个人QQ群:、
个人大数据技术博客:http://www.iteblog.com}

我要回帖

更多关于 人工智能 图像风格 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信