有能qq怎么设置不接受语音音配合的吗

手动点击才能启动的语音接口,也配叫人工智能?手动点击才能启动的语音接口,也配叫人工智能?寰宇天下百家号科幻小说中经常描绘机器具备高度智慧,并能自然地与人类互动。但机器真的能完全自然地与人类互动吗?市面上虽然已有许多不错的语音接口,但要达到完美、无缝的语音接口控制,还有许多问题要解决……语音接口在2017年成为相当火红的话题,许多人甚至将2017年称为语音控制年。但只要接触过语音控制的用户,一定曾碰过令人头痛抓狂的时候;虽然语音有机会成为人机接口的最终选择,但现在还不是时候。在这篇文章中,我们将探讨语音控制的几个问题,以及有那些需要改进的功能。大厂采用自家平台目前,在语音接口领域中,最明显的首要问题就是封闭平台(walled garden)的问题——每家大厂都采用自己开发的封闭系统,想从语音接口上赚钱当然是一件棘手的事。相较于视觉媒体(visual media)——如网页浏览器、文字搜索引擎,要在语音接口上投放广告并不容易。当然,如亚马逊(Amazon)这一类的公司必须确认其语音服务是否能带来获利,因此,Alexa的重要功用之一当然就是帮助你在亚马逊网站上进行购物。但若跟其他厂商买东西时会发生甚么情况?显然地,各种语音助理分别在产品与服务中提供了封闭的系统,因而限制了用户的选择。一种可能的做法是让所有的设备与服务都能透过语音启动。之后只要透过编程,机器间就能透过语音互相沟通合作,举例来说,Alexa可以透过语音控制电视、录制用户喜爱的电视节目,而无关乎电视服务供应商是谁。这将有助于解决封闭平台的问题,并且让使用者了解机器间如何沟通。但是,另一方面,当家中的冰箱、电视、吸尘器、灯具或其他电子设备大声沟通时,有可能使环境变得嘈杂,就像动画电影《玩具总动员》(Toy Story)里面的玩具一样。截至目前为止,在这些情况可能实现之前,仍然有些问题要解决。在一个有关Alexa和Google语音助理之间「永无止境」的对话影片中,显示了可能发生的问题。虽然这是预先安排好的,但由于一些意外触发所导致的干扰与技术上的小问题仍然出现,像是先前在电视报道时,主播说了一句:“Alexa,帮我买一间娃娃屋。”你可以想象接下来会发生甚么事情——许多观众家中的Echo意外被触发甚至下订!虚拟语音助理能多聪明?接着谈到下一个议题——何谓人工智能(artificial intelligence;AI)。由于深度学习(deep learning)与其他人工智能领域的长足进步,现今许多设备支持的自动语音识别(ASR)已有一定水平。但这些虚拟助理(virtual assistant)到底能聪明到什么程度?我们又能指望他们些什么呢?在计算机科技领域,与人工智能相关且最广为人知的就是由艾伦·图灵(Alan Turing)所设计的图灵测试(Turing test)。为了通过测试,具备人工智能的机器在测试时必须与人类的反应几乎一样,电影《人造意识》(Ex Machina)就是一个很好的示范。电影中的人形机器人Ava成功地通过图灵测试,其成功的关键在于Ava能无限制地存取用户的信息,以及所有人类的兴趣、喜好与想法。电影中收集巨量资料的虚拟公司Blue Book让人联想到Google与Facebook。电影《人造意识》(Ex Machina)中的人形机器人Ava;Alexa还要多久才能成为像Ava这样的智慧机器人?先不管科幻小说的内容,很难说还要多久才能设计出这样智能化的机器。一方面,机器学习的发展神速,以较专家们预期更快的速度不断达到里程碑,例如AlphaGo打败韩国棋王李世石。但是许多一般的聊天机器人(chatbots)则没有这么聪明,他们会犯一般人不可能会做的错误,像是提供色情内容给孩童、不经意地说出种族歧视的字眼,甚至只是令人沮丧地健忘。由于这些情形,让我们觉得机器人要达到Ava等级的智能化似乎是遥不可及。手动点击才能启动hand-free接口?语音接口中最重要且最有用的功能之一是不必靠手来控制,这是它的优点之一,你可以在双手忙着做其他事情的同时,使用语音接口控制电子设备,例如开车时(“播放NPR”)、煮饭时(“设定8分钟的烹调时间”)、打字时(“要求提供‘许多’同义字”)、抱小孩时(“关灯”)、手拿日用品时(“开门”)等等。其概念是让你使用你的声音控制,而不必动手。但令人困惑的是,许多语音控制的设备在启动前必须先进行手动设定,例如以手点击或滑动之后电子设备才会启动语音控制。这样做的原因并不是什么秘密。“倾听”(listen)这个动作是主动状态,需要经过处理,因此会使用到电池,而在便携设备中,电池的容量有限。因此,为了减少耗电量,便携设备中会加入手动触发的设计。但想象一下,如果你有一个朋友或是同事,总是在做任何活动前都在睡觉,你要和他们说话前都要先戳他们一下,那就很不优了,对吧?语音控制的设备也是同样的情形,点击才能开启功能并不合理。要同时达到可携与不用手动控制的理想状况,就得有效地利用既有资源。情境处理上必须绝对有效率地处理特定功能,这就是为什么要有长时倾听(always-listening)的设计。有一些设备已经是永远开机的状态,所以要等到这些耗电的处理器达到低功耗且永远开机的状态,还需要一些时间。最近推出的Amazon Echo Tap就是最好的左证,它可以不需要用手操作。亚马逊透过在线软件更新(over-the-air;OTA)来提供这个功能,这也突显出在快速变化的市场中,提供具有弹性、可随时更新的解决方案有多重要。(他们在为产品命名时,显然没有想到要加入更新功能。)长时倾听(与免手动控制)的功能让语音接口变得更便利缺点是,要达到持续更新与长时倾听的功能,电池寿命会减少到只剩8小时。在以后的报道中,我们将讨论如何增加待机时间的技术,使电池使用寿命从8小时延长到3个月!机器真的能完全自然地与人类互动吗?现在市场上有许多不错的语音接口,但若要达到完美、无缝的语音接口控制,还有许多问题要解决。许多科幻小说中描绘机器具备高度智能,并能自然地与人类互动。未来,我们将进一步探索那些能让我们更接近这个奇妙境界的未来科技。本文由百家号作者上传并发布,百家号仅提供信息发布平台。文章仅代表作者个人观点,不代表百度立场。未经作者许可,不得转载。寰宇天下百家号最近更新:简介:搜集行业和品牌信息,分享各类有趣资讯作者最新文章相关文章只需要有一个电子语音导游机就可以给温州古道配智能“导游”
谈到电子语音导游机,市民可以利用App上的VR全景功能,随时随地了解古道实景。
温州网讯 语音导航、地图导览、VR实景……浙江智慧古道平台暨温州子系统9月15日开通,全市首批22条古道有了智能“导游”为你带路,今后市民可以通过手机下载“温州古道”App实行智能化的旅游体验,更可在网上领略我市各地古道自然与人文风光。
有人说电子语音导游机, 古道,是古代交通的主要通道,和我们先民生活水乳交融,密不可分。
如今,森林古道又成了广大市民领略自然、体验森林康养、健身休闲的好去处。
据温州市林业局局长王丽峰介绍,2013年,我市率全省之先完成了全市古道资源的普查,温州全市共有古道570条,计3016.9公里,其中重点古道128条,约835.6公里,并编印了《温州古道》丛书,完成了105条重点古道的整修建设规划编制工作,让古道重新走入老百姓的视线,古道也从原来的交通功能转化为森林康养及健身步道之新功能。
但是,因为地处偏远或深藏深山,想去找一条红枫古道却发现手机地图上没有标注,很难找到进口或出口,更不知道这些古道的前生及人文故事。
因此,今年,浙江省启动智慧古道平台建设,并把温州作为一个完整的子系统来开发建设,从7月份启动温州子系统建设以来,温州首批已有22条古道图文数据建设完毕,智慧古道将运用移动互联网、物联网、智能硬件等新技术,通过App平台为游客提供语音导航、地图导览、VR实景、林特产微商城等智能化导览及互动服务。
该平台建设方工作人员告诉记者,市民可以通过平台看到一条录入古道的地图,了解其起止点和分支岔道,还可以在游览古道的时候听到语音导览,或者通过手机的GPS定位实现地图导览,甚至可以通过平台的VR全景功能,在家观看古道实景。
与此同时,平台上还会集纳每条录入古道的历史、文化、风景等资源,以后游客的旅游攻略、游记也会通过网络录入到平台上,成为每条古道的个性化宣传,也为游客带来智能化的旅游体验,助力森林古道的保护和开发。
全市首批22条开通智慧古道平台名单 瓯海:
石岩屋古道、京山古道 鹿城:
东坑古道、石垟古道 龙湾:
瑶溪古道、长坑古道 乐清:
四十九盘岭古道、马家岭古道 瑞安:
瞿湖林源古道、圣井大路古道 泰顺:
畲乡古道、三滩岭红枫古道 平阳:
穹岭古道、苔泰古道 苍南:
藻溪挑矾古道、松山古道 永嘉:
太平岭古道、芙蓉岭古道、永乐古道 文成:
松龙岭古道、大会岭红枫古道 洞头:
长坑古道 来源:
温州商报 记者:
有关电子语音导游机,刘娜筱 本文转自:大家为什么很少用语音输入? - 知乎有问题,上知乎。知乎作为中文互联网最大的知识分享平台,以「知识连接一切」为愿景,致力于构建一个人人都可以便捷接入的知识分享网络,让人们便捷地与世界分享知识、经验和见解,发现更大的世界。261被浏览<strong class="NumberBoard-itemValue" title="6分享邀请回答15719 条评论分享收藏感谢收起3718 条评论分享收藏感谢收起关于智能语音交互的5点思考
本文是我在学习智能语音过程中的思考,希望从智能语音的人机交互层面给大家带来一些启发。
小时候很喜欢一部剧叫《恐龙战队》,里面有个角色叫“阿尔法”,是个每天忙来忙去的机器人,能传唤队员并和他们交流,令我很好奇。
今天,我们对于能对话的机器已经不那么新奇了,这得益于智能语音技术的发展和一些语音产品的出现。一度调戏Siri成为全民话题,这肯定不是Apple公司初衷。这暴露了它的不完善,也让大众离语音产品更近了。本文是我在学习智能语音过程中的思考,希望从智能语音的人机交互层面给大家带来一些启发。
语言是人类文明的重要成果,也是人类最重要的工具之一,它为保存和传递人类文明起到了不可或缺的作用。概括来说它的主要作用就4个字:传递信息。
“而我们所说的智能语音,学术界叫“自然语言处理”,是计算机科学领域与人工智能领域的一个研究方向,主要研究能实现人与计算机之间用自然语言进行有效传递信息的理论和方法。—引自百度 ”
“交互”一词全名是“人机交互”,是一门研究系统与用户之间交流、互动关系的学问。
智能语音交互严谨点说应该是自然语言交互(natura language interaction),为了方便理解我依然采用“智能语音交互”这个词。
计算机技术及人工智能领域发展迅速,对“自然语言处理”的研究也异常火热。
siri、微软小冰、google now、Echo、科大讯飞、京东叮咚、出门问问等智能语音类产品开始出现,虽然存在很大的不完善,但回望历史我们能发现智能语音技术一直是在进步的。
在了解智能语音的过程中,我产生了一些问题,围绕这些问题我对智能语音交互进行了一些思考,希望能给你带来一些启发。
1、智能语音能成为人类主流的人机交互方式吗?
这个问题在知乎引起了很大的争论,而我倾向于智能语音交互会成为人类主流的人机交互方式之一。
人类与世界万物的交互过程大概是这样的:通过眼睛去观察人、事、物、环境等,再辅以耳朵听、鼻子闻、舌头尝、嘴巴交流、肢体触碰,而后大脑产生记忆和思考并做出动作、表情、语言和生理反馈,这个过程是循环和组合的。
不同的环境和习惯会有不同,但基本是在这个范围。 这个过程中,前半部分主要是接收信息,后半部分主要负责交流互动,而语言和动作是最主要的交流互动方式。
人机交互角度看,用手操控是这个世界绝对的主流
我们每天使用的手机、电脑、相机、汽车,包括现在很火的AR、VR设备,基本上都要靠手去操控。(用手操控属于动作这个范畴)这跟人类的进化方式有很大关系,我们的祖先从学会制作工具开始,手就成为了人类接触万物的最主要工具。
尤其是机械的出现,只有人类灵巧的双手才能精准的操控完成任务。
可是人的手有几个缺陷:不够长,不够多,需要配合眼睛,这给我们的生活带来了很多不便。
举个例子:
当我们在开车时,眼睛和手被占用,再去操作手机、中控触屏等设备会非常不便,危险系数也会大大增加。
原本语言是人与人之间交流的工具,很难像双手一样直接与物体产生反应。 但是随着公认的第四次工业革命的到来,人工智能让我们有了更多可能,当机器能听懂我们的意思并很好的执行时,很多场景的人机交互方式将会被改变,更多适合的场景将会被挖掘出来,就像当年智能手机进入我们的生活。10年前,我们是无法想象通过手机做现在的大多数事情的。
所以我的浅见是:
智能语音技术会成为人类主流的人机交互方式之一。
成为之一,是因为除了语音外,原本的手的操作、体感操作、面部表情识别、注意力识别、甚至是情绪的波动,都可能在不同场景成为我们与机器的交互方式,未来这很可能是综合的交互体验。
2、 智能语音技术发展到什么阶段了?
智能语音分近场语音和远场语音。
“近场的定义是小于1个波长的范围内(或者波长量级)的电磁场。而远场是电磁波传播到远处之后的场(分布)。——引自百度”
近场语音主要是基于手机等设备,基本上是一些辅助的使用需求,Siri和微软小冰就是近场语音产品。远场语音也越来越受重视,亚马逊的Echo就是远场语音,很受欢迎,至少用户能在5米外的距离语音指示它播放音乐。
自然语言理解方面的研究已经60多年了,虽然还不完善,但令人欣喜的是类似Siri、Echo这样的产品不断涌现,而不再是虚无缥缈的概念。
简单了解下自然语音处理的技术过程:
当我们与机器进行语音交互时,机器需要通过声学处理我们的声音和周围环境,减少干扰和噪音。再通过语音识别技术将听到的声音翻译成文字,语义理解技术则会分析这些文字的意义,最后机器去执行用户的指令或者通过语音合成技术把要表达的内容合成语音。
在此过程,声学处理、语音识别、语义理解等属于自然语言理解,语音合成等是自然语言生成,这些都是非常核心的技术,还要配合人工智能、机器深度学习等等。
但是现阶段依然困难重重。
真实环境下,受噪音等影响机器仍然听不准自然语言。机器将听到的语音翻译成文字时,重音、口音模糊、语法模糊等又很影响成功率。人类语言太复杂,受到单词边界模糊、多义词、句法模糊、上下文理解等影响,语义理解又是一大障碍。
再举个例子:
如果一门课程上一年没开设,对于“这门课程去年有多少同学没通过”这样的问题,机器是回答“都没通过”还是“去年没开这门课”?同时机器还需要提前存储“去年没开这门课”的信息。
想想我们从小时候啥也不懂到现在懂得的知识和信息,这是难以想象的数据量!所以现阶段来看,在某垂直领域开发智能语音产品是相对现实的选择。
3、 智能语音交互与界面交互的异同点是什么?
研究智能语音与机器的交互,不得不说界面交互,这是使用者和设计者都非常熟悉的人机交互方式。从界面交互出发,其实有很多可思考的或借鉴的点。
界面交互是线性的,而语音交互是非线性的
界面交互是一种线性的交互方式,本质上是不同的页面通过不同的层级关系串联起来的。所以,我们在使用的时候会有一层层返回,tab导航切换,回到app首页和home键回到手机桌面的概念。
语音交互不适合这样做,我们人类在语言交流时,是一种非线性发散式的,我们会在聊某个话题时突然切换到另外一个不相关的话题上,这之间没有层级关系,更谈不上返回关系。
界面交互更多过程,语音交互直接指向结果
界面交互在设计的时候,是将很多“小任务”(按钮点击、模块选择、页面跳转等等)提供给用户,用户通过不同的组合选择,最终达成自己的目标。
但是在语音交互时,更多是直接表达,你会跟服务员说:请给我一杯咖啡。而不会说:请用杯子从咖啡壶里倒一杯咖啡给我。
界面交互可以没有目标,语音交互需要准确的目标
我们在使用电脑和手机上网时,有时候是漫无目的,但在语音交互产品上如果漫无目的的进行下去,会让人很烦躁,因为你得不停地说下去。
语音交互的私密性更强,没有界面交互覆盖的使用场景多
当我们在一个人多的场合可以毫无顾忌的使用手机和ipad,但若跟机器进行语音对话,就会令人很尴尬。再例如,在ATM机上取款时你会使用语音吗??
所以在一些使用语音交互效率高的场景,如何避免这样尴尬的情绪很重要。而另一些更私密的场景语音交互可能是个灾难。
4、智能语音交互适合哪些使用场景?
任何一款产品不管是什么样的交互方式,没有使用场景,满足不了用户需求,一定是无法成功的。智能语音类产品也不例外,并且从现阶段的技术上来看,垂直一些的使用场景更适合用智能语音交互。
汽车的车载智能语音系统,已经有很多商业产品了。是不是可以在挖掘出其他出行场景呢?比如骑车时?
儿童娱乐和教育也是适合语音交互切入的行业,也有很多公司在做。
智能语音类产品还可以应用于客服行业,可以极大的程度降低人员成本,也可以解决语音客服体验差效率低的问题。
人工客服和非智能语音客服场景的痛点
如果应用智能语音系统呢?理想的情况跟人工客服没有区别,但是全部由机器完成,想想看节省了多少人力成本。甚至线下的客服工作也可以替代。
4似智能语音助理这样的产品,帮用户处理一些短路径目的明确的任务需求。
还有办公领域、智能家居等等……
5、如何设计使用体验好的智能语音产品?
不管是界面产品还是语音产品,最终目的都是解决人们的问题。界面产品设计的部分标准和经验依然适用。
比如设计流程上,同样需要理解业务诉求、用户诉求,要进行用户调研、分析用户特征和观察用户行为,要挖掘使用场景中的问题和痛点,要梳理任务流程、设计信息架构和方案设计,并且要去验证和迭代。
而语音交互过程中还需要注意以下问题:
流程简单,路径明确,最大限度减少对话轮数。
语音交互应该避免不停的对话,太多轮对话用户难以记住,并且会很烦躁。
信息传达简洁明了,避免大量内容。
用户的短期记忆量有限,信息太多用户难以记住。
给予用户适当的引导,避免或及时纠正用户发散式思维导致的错误。
用户的语言表达是自由度非常高的,这会增加机器识别的难度,适当的引导让用户回到正确的道路。
系统状态反馈,及时有效。
语音交互中的系统状态反馈,要让用户及时了解当前状态,上下文关系,用户所处流程的位置。
任何时刻都是“首页”。
语音交互对用户来说是快捷方式,有需求会直接说,而不会像界面产品先要回到首页再去找相应应用。
加载过程要快。
在界面交互中页面加载3秒以内,配合状态反馈,用户是可以接受的。而语音交互用户会更不耐心等待,所以加载过程要快,就像人与人之间对话一样自然,才会令用户满意。
固定的、舒适的声音风格,令用户愉悦。
固定的音乐、铃声,给用户形成印象,让人一听见就知道是什么产品。例如微信、iphone铃声、新闻联播片头曲。动听、令人愉悦的声音、音乐、铃声很重要,是产品气质的表现。
与机器的语音交流如何像人类一样自然?
这是最后的疑问,我还没有答案。机器的语音交流,不像人类一样自然永远是最大问题,因为只有人与人之间交流才是最自然和舒适的。如何让机器学习和模仿人类,使它慢慢的向自然人“进化”?
以上仅是分析和思考,并未经过实践验证,只希望给大家带来启发。
本文由 @Wayne 原创发布于人人都是产品经理。未经许可,禁止转载。
题图来自PEXELS,基于CC0协议
责任编辑:
声明:该文观点仅代表作者本人,搜狐号系信息发布平台,搜狐仅提供信息存储空间服务。
今日搜狐热点语音配文字,秒懂不误事。云之家创新语音消息体验
稿源:科技讯
半夜打开微信,看见老板发来的一连串语音,此时我们的内心是崩溃的。纽昂斯通讯公司曾经对 1000 名年龄从 18 岁到 65 岁不等的智能手机用户进行了一项调查,有27%的受访者表示听语音消息是一种负担。更有甚者,有19%的用户会在收到语音消息时感到被干扰或者恼怒。对于信息发送者来说,微信语音有一定的便利性,但是对于信息接收者来说,它却是一个烦恼。原因通常是:第一,不方便。生活中总有很多不方便接听语音的时刻,比如工作、会议、聚餐、应酬、挤公交等等。第二,费时间。读 100 个字只需 9 秒,听 100 个字则至少需要几十秒。在同等信息量下,听语音所需时间远多于文字,效率很低。85%的用户认为文字信息会比语音信息更方便。第三,不能搜索保存。在微信里,你可能一边在和老板讨论,另一边在和朋友商量聚会。如果语音里有重要信息,也许还来不及把它记录下来,注意力就马上跳转到另一项事务了。当我们需要查找信息时,如果是文字,还可以搜索,而语音还要重新再听一遍,甚至是找不到了。那么,有没有方法可以优雅的发语音呢?云之家语音消息全新上线,在发送语音的同时能够配以文字显示,真正做到“让语音可见”。据云之家产品经理李杨晶介绍,云之家这种全新的语音消息可以让接受者减少压力,与此同时还支持语音消息的搜索、复制、转发、工作安排、合并收藏等操作,使工作生活沟通效率大幅提升。如果你正在为接收语音而困扰,推荐使用这款应用。云之家是国内领先的移动工作平台,持续创新消息的沟通体验,包括消息的已读未读、一键短信、电话提醒、指定回复等,此次也是国内第一个推出语音消息同步显示文字功能的App。云之家其他明星功能还包括组织架构通讯录、企业云盘、免费电话、连接企业ERP等,尤其是可以将工作行为转为员工和部门的活力值,从而凝聚信任,激活创造力。目前,云之家的知名用户包括海尔、万科、华大基因等 300 万企业团队。现在体验云之家全新语音消息,还可抽取【得到】 199 元专栏听书卡。活动链接:http://s.yzj.im/s/2GrgQ6k
有好的文章希望站长之家帮助分享推广,猛戳这里
本网页浏览已超过3分钟,点击关闭或灰色背景,即可回到网页}

我要回帖

更多关于 语音验证码怎么接受 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信