华为诺亚方舟实验室待遇是一个什么样的地方

点击联系发帖人 时间：2016-08-29 05:43

华为诺亚方舟实验室

帐号:密码:下次自动登录{url:/nForum/slist.json?uid=guest&root=list-section}{url:/nForum/nlist.json?uid=guest&root=list-section}
贴数:1&分页:发信人: jxfeb (), 信区: AI
标&&题: 【华为诺亚方舟实验室】博士招聘宣讲会+深度学习报告
发信站: 水木社区 (Wed May 18 15:02:36 2016), 站内 && 在工业界做大数据和人工智能研究是什么感受？是晨昏颠倒、废寝忘食？是揪发撞墙、目光迷离？还是带着迷之微笑轻松搞定一切？来了，看了，你才知道！
华为诺亚方舟实验室，低调但炫酷的研究，呆萌但睿智的同事，欢迎你带着渴(Tiao)望(Ci)交(Tu)流(Cao)的心，来看看我们真实的研究生活～ && 时间：日晚18：30-20：30
18：30-19：30 华为诺亚方舟实验室介绍
19：30-20：30 Recent advances of Deep Learning for NLP at Noah by Zhengdong Lu
地点：北京大学理科一号楼 1131教室 && 报名方式：“报名+姓名+学校”发送至唯一官方邮箱或微信：
了解更多：
来吧！先到先得，前10位砸简历、发照片过来的（看脸）还有神秘之礼包噢~&& 附件(552.1KB)&
-- && ※ 来源:·水木社区 ·[FROM: 205.177.226.*] && 文章数:1&分页:
抽奖到手软！将狂欢进行到底！　　证券时报记者胡志毅　　华为总裁任正非曾在内部讲话中提到，诺亚方舟实验室要面对信息洪流的冲击，解决信息收集、处理、挖掘和分析等方面的挑战，构筑华为技术优势，成为ICT领域的领先者。要超越护航，要有新思想、新理论产生，要为华为找到信息洪流中的诺亚方舟。如此，华为诺亚方舟实验室在外界看来都蒙着一层神秘的面纱。　　昨日，略显神秘的诺亚方舟实验室主任张宝峰，出现在了第十六届高交会中国高新技术分论坛，分享了诺亚方舟实验室对于大的研究和观点。　　“诺亚方舟实验室的目标是打造一个具有学习能力的数据平台。”张宝峰表示。基于此，迁移学习和终身学习是平台应该具备的两项能力。　　张宝峰打了个比方，数学好的人一般物理和化学也很好一样，迁移学习能力就是希望机器能够具有类似的学习能力。终身学习能力则是指机器具有永不停止获取知识的能力。而迁移学习和终身学习能力均建立在大数据挖掘的基础上。　　张宝峰认为，大数据是需要新处理模式才能具有更强决策力、洞察发现力和流程优化能力的信息资产。诺亚方舟实验室一直希望能够开发出这样的新处理模式。　　“然而，我们发现开发出的处理模式没有太强的普适性，往往改动几个参数或者环境，该模式就无法与数据适应。”张宝峰表示，企业对于海量数据进行分析成本过高，华为近95%工程单数据长期处于闲置状态。　　尽管如此，大数据挖掘也有着重要的意义。张宝峰介绍，在一次对工程单位客户需求的研究分析实验中，诺亚方舟实验室通过对数据挖掘作出分析，平均误差率已经降到了3%以下。而往常，类似的研究分析往往会交由行业专家来进行。　　不过，张宝峰认为，数据提供的商业价值应该要能覆盖数据挖掘的成本。大数据作为信息资产，商业价值的体现才能促进大数据挖掘模式的普及。　　资料显示，诺亚方舟实验室是华为设立在香港的实验室，成立于2012年，主要从事人工智能学习——数据挖掘研究，希望通过人工智能和数据挖掘技术来抓住大数据时代历史机遇。　　华为的诺亚方舟实验室能不能像《旧约》中的诺亚方舟一样，经过多年的探索和研究，找到新的通讯理论，带领人类走出甚至驾驭“信息洪水”，目前尚不得而知。　　不过，大数据挖掘的重要性已经成为当前企业界的共识。无论是华为、英特尔还是IBM都早已开始了在相关领域的研究。
责任编辑：dm
回复0条，有0人参与
以下网友评论只代表同花顺网友的个人观点，不代表同花顺金融服务网观点。
净额（亿）
同花顺财经官方微信号
手机同花顺财经
炒股必备&同花顺财经
同花顺爱基金
您有什么问题想要告诉我们？
留下您的联系方式，以便我们向您反馈结果
提交成功，感谢您的支持！华为诺亚方舟实验室首席科学家李航：从人机交互中学习
发表于 11:33|
摘要：在大会主会场，华为诺亚方舟实验室首席科学家李航带来了主题为《机器学习的新动向》的精彩演讲。他认为机器学习正在改变着我们的生活和工作，但反过来，机器学习也可以从人机交互中学习。
【CSDN现场报道】2012中国软件开发者大会（SDCC）于9月8-9日在国家会议中心召开，本次大会由CSDN、《程序员》杂志、ITEye合办。作为年度最具实战的技术盛会，大会云集了来自国内外一线互联网和企业级软件公司的实战专家，就高可用性系统架构、海量数据挖掘、开放平台服务与架构、智能推荐系统、异构计算等话题和参会者进行了深入分享与探讨。
在大会主会场，华为诺亚方舟实验室首席科学家李航带来了主题为《机器学习的新动向》的精彩演讲。他认为机器学习正在改变着我们的生活和工作，但反过来，机器学习也可以从人机交互中学习。
华为诺亚方舟实验室首席科学家李航
训练数据到底需要多少？
为什么机器学习需要大量数据，到底有多少数据才是足够的数据，我们再看一下机器学习新动向，怎样通过人机交互获得更多数据，这个包括日志数据挖掘、重包，还有最近比较热门的人机协同计算。最后我想介绍一下有了大量数据以后，怎样使用这些数据，构建一个非常智能化的系统，使得我们这个系统更加智能。
大家知道统计机器学习是基于数据的，最重要的一个环节就是收集、采集数据，高质量的大规模数据能帮助我们构建出一个非常智能化的系统。有一个非常朴素的问题，到底有多少数据才足以帮助我们去构建一个智能化的系统，这是一个非常重要的问题。在机器学习里面有很多研究，比如说在统计机器学习理论里面一个重要的研究课题就是所谓的样本复杂度，到底我要多少样本，要多少训练数据，才能很好地学一个模型。
我们需要非常多的高质量的数据来帮助我们去构建智能化的系统。这时候就给我们带来一个很大的挑战，我们到底怎样才能够采集到这么多高质量数据？机器学习里有一个新的趋势，就是通过人机的交互，我们希望交互过程当中采集大量高质量数据，这是机器学习领域里的一个非常值得大家关注的新的动向。
机器从人机交互中学习
我们希望通过人机交互，用各种巧妙的办法采集到数据，有日志数据挖掘、众包、人机协同计算等方法被提出，现在在研究领域另一热门研究话题，就是怎样能构建出更好的机制，有效地从用户那里采集到大量高质量机器学习的训练数据。
在互联网搜索引擎里边，搜索引擎一定会记录下所有日志，比如一个用户提交了查询，系统会返回一组URL，用户点击URL的过程被记录在搜索引擎里边作为日志数据。这个数据是非常有用的，对帮助提高搜索引擎相关排序是非常有帮助的，等于说我们每天有上亿用户使用搜索引擎，提交的查询也都是更大数量级的查询，不同用户提交不同查询，之后点击了不同URL，我们把这个收集起来可以从用户那里得到的就是到底用户需要从搜索引擎得到什么样的信息，这样大量的查询对搜索引擎质量和相关排序质量提高非常有关。这种所谓的数据挖掘在搜索引擎里面应用非常普遍，在其他不同应用里边大家也在尝试着采集各种不同日志数据，能够帮助提高相关应用。
一般用户在使用过程当中自己不会花更多的代价做什么事，他只是更多地使用应用，但是我们把用户使用过程很好地记录下来，把这些数据拿回来作为用户的反馈，这是一种隐式的反馈，用这种反馈数据帮助我们提高现在的应用，这是非常合理、很自然的想法。如果这个系统本身是基于机器学习的话，一般来说能够很好地利用日志数据帮助我们提高应用各方面的性能。当然用户行为数据往往是含噪音的，怎么去除噪音，提高日志数据的质量是我们需要考虑的问题。&
更多精彩内容，请关注，。
本文为CSDN原创，未经允许不得转载。如需转载请联系。
推荐阅读相关主题：
网友评论有（0）
CSDN官方微信
扫描二维码,向CSDN吐槽
微信号：CSDNnews
相关热门文章AIR 019 | 华为诺亚方舟实验室主任李航：我们在人工智能领域的愿景与实践 - 推酷
AIR 019 | 华为诺亚方舟实验室主任李航：我们在人工智能领域的愿景与实践
作为华为诺亚方舟实验室的主任，北京大学、南京大学的兼职教授，我们能够很轻易地发现，在李航身上兼具着一种学者的探索精神和华为公司特有的研发气质。在今天下午进行的GAIR大会“人工智能的商业场景”这一大会议程中，李航以华为诺亚方舟实验室提出的“智能信息助手”这一场景化智能手机愿景为切入口，为大家分享了世界500强之一，中国科技界的领军企业，华为公司在人工智能和深度学习领域的发展和思考。
首先，李航阐明了诺亚方舟实验室的概况。他说，实验室成立4年多以来，主要关注人工智能、机器学习、数据挖掘等前沿科技领域的研究。同时，也面对华为三大BG业务部门聚焦一些产品的开发，例如智能通讯网络，企业领域的大数据应用，消费者领域的智能手机语音助手等。
其次，他重点表示，诺亚方舟实验室在华为消费者领域的愿景就是，打造一个全智能化的智能移动助手终端，用户将通过自然语言的方式从终端中获取一切需要的信息和协助。
最后他以该愿景为目标，介绍了目前在诺亚方舟实验室研发的两款终端相关的产品，以及三个智能信息化检索技术。
第一款产品是华为手机上的App市场。他表示，面对3亿用户，每天3千万次检索，1亿下载总量的大数据挑战，诺亚方舟实验室一直在联合华为终端公司共同努力，为客户智能化地提供检索结果和推荐App。
第二款产品是华为“手机服务”。该产品是华为手机上的一个App，用户可以用自然语言的方式向它求助手机使用过程中遇到的各种问题，在每天10万次的求助问题中，有超过90%的用户都可以得到正确的回答。
其次是三个利用深度学习技术实现的智能化搜索。
第一个是用自然语言检索分类照片。该方式不使用人工或机器学习的形式预先为每个照片设置一个标签，然后通过标签来处理照片。而是采用深度学习模型的方式处理照片，利用照片承载的内容产生自然分类。
第二个是神经机器翻译。
第三个是神经响应机，即一个自动生成式系统，李航表示这是业界第一台公开发表的能够自动生成回复的智能应答机，而不是通过大数据搜索配对实现的。
据李航介绍，后面两款检索技术都是基于序列到序列的学习模型而实现，将待翻译语句和神经响应机中的提问视为序列1，将目标翻译结果和神经响应机中的问题回复视为序列2。所谓的序列到序列是指，在两个序列之间存在一种中间变量态，该中间变量通过加权和attention（关注机制）来进行最优目标匹配，同时能有效防止重复和遗漏现象，最终完成了业界最优的深度模型之一。其中第三款神经响应机可以输出76%的正常对话，和高达95%的正确语句，需要强调的一点：这些都是自动生成的。
最后李航再度总结说，诺亚方舟试验在进行人工智能研究和未来技术探索的同时，主要将关注终端产品的智能化研发。
以下是演讲实录：
大家好！下面我就介绍一下华为，特别是诺亚方舟实验室在人工智能方面做的研究和技术开发。重点放在智能手机这块的应用。
我先介绍一下我们在智能手机上面的愿景，介绍一下我们相关的产品和我们的研究，最后介绍一下我们的技术。
诺亚方舟实验室成立4年，杨强教授是我们实验室第一人主任，我们研究的方向主要是人工智能、机器学习，数据挖掘，更进一步来说我们现在围绕华为三个BG的产品做研究开发，大概来说我们有4个方向：
第一个是智能通讯网络，大家知道通讯设备是华为非常重要的产品，未来的通讯设备一定是基于数据挖掘的，所以我们在这方面做了很多的技术开发。另一方面是大数据，还有我们聚焦在华为的智能手机上，主要是在语义语音，推荐搜索这方面的技术，帮助我们的用户能够更好的使用手机。简单说一下我们未来的愿景。我们用智能信息数据来概括我们的愿景。未来的华为的智能手机首先通过语言能够很自然的跟用户做交流，能够去帮助用户克服语言障碍，能够帮助做翻译，能够理解用户做需求，给用户做推荐，能够帮助用户管理信息，同时能够很好的帮助用户得到外界的信息。下面介绍两个我们围绕华为手机做的产品，我们诺亚方舟实验室跟终端的部门有密切的合作，我们在一起开发几个重要的产品，比如说华为的应用市场，大家用华为手机的用户知道到华为的应用市场我们有应用的推荐和搜索，这个推荐和搜索的算法是我们华为诺亚方舟实验室和终端的产品线的同事们一起开发的，这里面的挑战就是一个大数据的挑战，这里面有3亿的注册用户，每天有3000万的用户访问我们这个市场，下载的用户每天有1亿，这里面怎么能够帮助用户很好很快的找到他们的应用，这个是比较挑战性的问题，大家知道搜索和推荐都是在大数据的环境下都是极具挑战性的，怎么样能够时时的更新模型，能够更好的满足用户的需求，现在用业界最新近的技术做推荐和搜索。
另外，我们做的大家有华为手机的话可以有看手机服务这个部分，我们有智能问答，回答怎么样更好的使用华为的手机，用自然语言的方式来问答，比如说怎么给手机做备份，我们可以找到答案，有的是我们的技术手册里面找到的答案，准确率能够达到90%，能够给用户提供更好的帮助，大家不用去网上去搜华为的使用了。下面我做几个演示，我们诺亚方舟实验室一方面在跟产品部门一起开发产品，另外一方面未来在做一些技术的研发，特别是深度学习这方面我们做了一些工作，我现在演示三个演示：第一个是图片搜索，假设你是一个手机用户，你在手机上可以用语音或者是拼音的方式输入你的问题，比如说在飞机上看到云彩的照片，现在这个场景是由2万张图片，可以用自然语言的方式搜这些图片，这些图片没有做任何的图象处理，比如说吃火锅的照片，或者是爬山的照片可以通过自然语言自动的找到这些照片，现在手机上有成千上万的照片，怎么样做好照片的管理，这个是非常有用的应用，我们现在在做这方面的技术开发。下一个是在做机器翻译，特别是用深度学习，大家叫做神经技术翻译，这块也开发了业界领先的技术，因为时间的关系我就不放了。这个演示是神经响应机，这个是基于深度学习做单轮的自然语言的对话，这个是我们在业界第一个开发出来的，生成式自对话系统，这个系统可以自动的去产生回答，并不是像传统的问答系统，我们有大量的数据，有44万的数据去建立这样一个系统，这个系统比谷歌其他的公司开发的产品，我们早发表，并且在ACL的顶级的会议上发表了这个论文。我介绍一下里面的内容，比如说你输入一句话，我们到诺亚方舟实验室来访问的话，我们可以给你看看时时的，前天我们华为的总裁来诺亚方舟实验室参观我们就给他展示这个，比如我想买一部三星的手机，这个系统会说还是支持一下国产的吧，比如说你说占中终于结束了，系统会说下一个是不是鹿角嘴，产生一些非常有意思你完全想象不到的回答。
我们下面看一下这个技术，我们在围绕终端这样的应用场景在做技术开发，这块列出来的是我们主要在做的技术研究，包括问答、推荐、语音识别、对话、翻译、图片、检索、深度学习，就是说我们在特别是深度学习这方面做了业界一系列比较领先的一些工作，这块介绍一些具有代表性的工作。第一个是MulimodalCNN，第一个是图片搜索的演示，你说一句话就找到相关的图片，我们现在有2万张图片，每张图片大概有3句的描述，比如说一个小孩在游泳照片，有15万对数据，我们就可以训练这样一个模型，大家知道卷神经网络是一个比较有代表性的网络，左边的是可以把这个图片抽取出来，这个CNN有多层，可以从图片里面抽取里面的轮廓和物体，另外一个是从文本里面抽取特征，直观的就是单词和词组的特征，你说这句话小孩的照片，这个小孩可能就会被抽取出来作为特征，在这个照片里面正好有一个小孩，这个小孩会作为一个物体抽取出来，通过大量的学习可以做到刚好看到的效果，这个可以看一下，我们的实验的结果，这个是英语的30K的数据，我们做了比较实验，我们比较了跟业界的其他部门的方法的结果，可以看到诺亚方舟实验室提出的刚才MulimodalCNN在检索方面可以达到最好的效果，有些模型不一定很公平，大家为了所谓的Exprimental上面，可以达到更好的水平，这个工作在去年的图象识别的大会上训读了我们的论文。
下一个介绍的工作，我们看一下机器翻译和对话里面我们用了序列到序列的学习，最早的模型是谷歌和蒙特利尔大学提出来的，我们对他进行了改进，用在对话和翻译上取得了非常好的效果。序列到序列的学习到底是什么样好的方法。大家问自然语言里面哪个深度学习的工具给我们带来最大的革命性的变化，让我来说的话就是序列到序列的学习，基本的想法是这样，用翻译来做例子，现在把中文的一句话，一只猫坐在垫子上“A &cat sit a &cushion”，序列对序列的模型，从左到右一个词一个词的去看我们的中文，把它转换成一个语义的表示，这个是一个向量，我们现在看到的HE、HT-E，HT，就是这个一只猫坐在一个垫子上得到的语义的表示，我们叫编码，这个翻译到目标语言，翻译成英语的话这个T-1，表示说英语产生这样的句子在每个位置上对应的语义表示是什么，我们翻译要做的就是要把这个原文，中文做一个编码，表示成中间的表示，再从中间的表示转换成另外的一个中间的表示，是一个解码，把它转换成英文的句子，中间的C的这一行就是所谓的叫注意力模型，注意力就是帮助我们去选择，当我产生英文的某一个单词，我要做翻译要一个一个的产生英文单词，我要有选择性的去决定，我现在在任何一个位置我要决定产生解码的表示的时候我是要选择中文的语言里面的哪个表示更好，这个C实际上做了一个平衡，我在每个位置上我要重新判断，我现在要产生一个英文的单词的时候对应的中文是哪个好，直观上来说是这样的解释，我们可以通过这样的模型，实际上是相当复杂的，通过这个模型你给我任何一个单词的序列我可以产生另外的序列，这个数据是中英文我可以产生翻译，这个模型的效果是非常好的。我们刚才演示的神经响应机实际上也是用的序列到序列学习的模型，这个时候我们有一点不同是中文到中文的句子，但是它不像翻译，翻译是在两句话不同的语言，但是语义是一样的几两句话才同一个语言他们形成同一轮的对话，我们最核心的想法就是用注意力的机制，但是我们有一个全球的机制，直观上解释这个C实际上表示我读完这句话整体的语义就是一个10数值的向量，每个位置上的编码得到的结果是得到每个位置上得到的语义是什么，这两者的语义结合起来就变成中间C的这一行的语义，再把它转换成要对应的话的语义的表示，最后再解码变成一句话，这个模型我们有400万的对应的数据的话就可以把这个模型对应得比较好，能够做这样转换。我们看到正确的句子大概有95%，大概有76%的回答是能够形成自然的对话，就是刚才我举的例子。我们现在可以把它用在机器翻译上，机器翻译我们用的机制就是我们说序列对序列是很强大了，但是我们可以把它做得更好，用传统的序列对序列的模型的话会把原文的东西漏掉，或者是翻译多次，我们这边有一个机制，翻译的时候我哪些东西翻译过了就不用翻了，哪些没有翻，同时这个机制可以把它变得更强，直观上说我要产生英文下面是一个实词和虚词的话是不一样的，就中文的话就好了，如果产生一个实词，cat，这样的话我就要看哪个词影响我，如果两个结合的话会产生很好的效果，这个礼拜ACL顶级会议上我们发表了一个论文，其中有一个就是解决漏译或者是过译的问题。
诺亚方舟实验室在手机方面做产品方面的开发，做图片检索等技术方面的研究，就到这里，谢谢大家！
已发表评论数()
请填写推刊名
描述不能大于100个字符!
权限设置：公开
仅自己可见
正文不准确
标题不准确
排版有问题
主题不准确
没有分页内容
图片无法显示
视频无法显示
与原文不一致|||||||||||
最新播报：
华为诺亚方舟实验室在做什么
证券时报记者胡志毅
华为总裁任正非曾在内部讲话中提到，诺亚方舟实验室要面对信息洪流的冲击，解决信息收集、处理、挖掘和分析等方面的挑战，构筑华为技术优势，成为ICT领域的领先者。要超越护航，要有新思想、新理论产生，要为华为找到信息洪流中的诺亚方舟。如此，华为诺亚方舟实验室在外界看来都蒙着一层神秘的面纱。
昨日，略显神秘的诺亚方舟实验室主任张宝峰，出现在了第十六届高交会中国高新技术分论坛，分享了诺亚方舟实验室对于大数据的研究和观点。
“诺亚方舟实验室的目标是打造一个具有学习能力的数据平台。”张宝峰表示。基于此，迁移学习和终身学习是平台应该具备的两项能力。
张宝峰打了个比方，数学好的人一般物理和化学也很好一样，迁移学习能力就是希望机器能够具有类似的学习能力。终身学习能力则是指机器具有永不停止获取知识的能力。而迁移学习和终身学习能力均建立在大数据挖掘的基础上。
张宝峰认为，大数据是需要新处理模式才能具有更强决策力、洞察发现力和流程优化能力的信息资产。诺亚方舟实验室一直希望能够开发出这样的新处理模式。
“然而，我们发现开发出的处理模式没有太强的普适性，往往改动几个参数或者环境，该模式就无法与数据适应。”张宝峰表示，企业对于海量数据进行分析成本过高，华为近95%工程单数据长期处于闲置状态。
尽管如此，大数据挖掘也有着重要的意义。张宝峰介绍，在一次对工程单位客户需求的研究分析实验中，诺亚方舟实验室通过对数据挖掘作出分析，平均误差率已经降到了3%以下。而往常，类似的研究分析往往会交由行业专家来进行。
不过，张宝峰认为，数据提供的商业价值应该要能覆盖数据挖掘的成本。大数据作为信息资产，商业价值的体现才能促进大数据挖掘模式的普及。
资料显示，诺亚方舟实验室是华为设立在香港的实验室，成立于2012年，主要从事人工智能学习——数据挖掘研究，希望通过人工智能和数据挖掘技术来抓住大数据时代历史机遇。
华为的诺亚方舟实验室能不能像《旧约》中的诺亚方舟一样，经过多年的探索和研究，找到新的通讯理论，带领人类走出甚至驾驭“信息洪水”，目前尚不得而知。
不过，大数据挖掘的重要性已经成为当前企业界的共识。无论是华为、英特尔还是IBM都早已开始了在相关领域的研究。
[责任编辑：
来源：新闻热搜榜}

久游无息网