人脑想象的主要内容是符号中的图、符号就是一类还是一个脑细胞?

聪明与否, 主要不是体现在具体任务上, 而是体现在大脑学习如何学习,决策和思考- 或者说元认知和元学习能力上,这点要从元认知和元学习能力的本质 -神经网络的层次谈起:相比机器,人脑擅长快速的跨任务学习和泛化推理, 或者说叫做卓越的元学习能力。我们说人类站立在这个迅速变化的危险世界面前,快速适应新任务的元学习能力事关生死。 这种能力是目前的深度学习人工智能所完全不具备的。 元学习概念解析: 机器学习围绕一个具体的任务展开, 然而生物体及其一生, 学习的永远不只是一个任务。 与之相对应的叫做元学习, 元学习旨在掌握一种学习的能力, 使得智能体可以掌握很多任务。 这种伟大的能力建立的基础是什么呢?
深入大脑,我认为可以分为以下几方面认识元认知能力,同时它们也是聪明人和不聪明人的区别所在: 1, 可以灵活的切换认知模式, 选择如何选择, 决策如何决策。
2, 大量先天可以使用的inductive bias(先验,归纳偏置) , 使用贝叶斯推理框架后可以结合最新证据迅速匹配最新任务或环境的模型。相比AI单纯做梯度下降,这个方法要快速有效很多。
3, 强大的抽象/表征能力 。抽象之后,概念,以及概念与概念之间的结构关系能够支撑具体任务的学习
4, 强大的层级组合能力,迅速将已有的技能组合成新技能。
5, 因果 6, 意识 这些基础,也是不同人的聪明程度区别的根基。 我们一个个从AI和神经网络的视角来看看:1.
切换认知模式的能力不同 聪明的人往往更加理性, 理性的程度高低,实际体现了人切换认知模式的能力:Griffiths, Thomas L., et al. "Doing more with less: meta-reasoning and meta-learning in humans and machines."Current Opinion in Behavioral Sciences29 (2019): 24-30. “The term ‘meta-reasoning’ contains within it the solution to the problem of how to efficiently deploy computational resources: meta-reasoning is reasoning about reasoning, which means making intelligent decisions about how to think ” 人的元认知能力,被被称为一种能够根据所具有的计算资源来灵活选择认知系统的能力。 比如我们熟知的系统1和系统2,一个负责直觉有关的决策,一个负责更加理性更加逻辑的决策。 这种选择的本质是根据现有的认知资源来计算进一步计算需要的成本是否可以cover收益来看是否切换认知模式。 就好比当我们在危急时刻或者大脑已经十分疲惫,都倾向于用直觉思考,只有在认知有盈余的时候才会进入更深层的思考状态。这也可以让我们反思我们所经常犯的错误,也就是自己匆忙因为本能做的决定事后后悔。你会发现当你经常处于认知资源匮乏的状态,就会经常犯错误。 人的这种切换决策,学习等相关的认知模式的能力,是快速适应不同环境的一个基础。 我们可以如下的计算图表示这个计算过程,我们的大脑一边进行C0,C1,C2..一个序列的计算, 用以更新我们的认知B0, B1, B2, 另一方面,计算每个计算步骤的成本收益,当这个计算的成本大于收益,就停下来。 这就是所谓的有限理性,不要冥思苦想,对一个问题适可而止交给上帝。这种浅度或深度认知模式的切换是适应复杂多变环境的基础,让我们虽然可以创造最伟大的文明,但是在被老虎追击的时候不至于陷入过度思考,最终鲁棒性而不是最优化才是长时间不被淘汰的关键。 那么有没有无限理性呢?你也可以假定一个超级智商的Lucy可以做到的是建立一个无穷深度的计算图,站在一个制高点上,观测每个理性层次上的自己往下游戏会得到一个什么样的结局, 最终避开所有可能的坑,但是这样的人是不可能存在的,除非她真的获取了这个星球所有的计算资源,并且有无限的计算速度。
也就是说, 正常的人都是有限理性,而理性的深浅不同, 聪明的人由于先天具有更好的认知调控能力,比一般人理性的程度更深, 可以在认知空间里看着理性层次更浅的自己如何跌倒从而避免。 2. Inductive bias 不同 (先验假设,归纳偏置) 人们的头脑由于遗传和发育的关系,会形成不同的能力结构, 我们可以把它们看作对世界的先验不同,或者说先天结构和偏好固有不同。不同的天才均是具备了某方面比普通人更强的先验结构,即使这种结构是不同的, 比如莫扎特和爱因斯坦, 我们可以看看这些先验从何而来。我们来一个一个看这些点。与人工神经网络相比,生物神经网络一个显著的特征是自发活动非常频繁。这些自发活动表明,人脑在没有外界输入的时候, 也在自发的演绎着自己的“主旋律”。与其认为这些活动是一些无意义的发放, 更加多的生物实验基础指出的是, 这些活动反应了某种大脑的对世界或任务的”先验假设”,犹如一些认知的模板。 心理学家认为人脑中大部分的意识或想法都在意识之下 ,我们是看不到的, 或许也有一定道理 ,本质上,这些想法就如同不同先验组成的假设空间, 最终能够胜出进入到我们的决策区间的仅仅是极少的一部分。不同的先验可能来自于进化,也可能来自于早期学习。 不同种族的人有着深层相通的语法结构,或者类似的谚语,都反应了这些潜在于大脑内部的原始先验,不禁让人想到荣格的集体无意识。 这一点也在被机器学习界所认知: Meta-learning of Sequential Strategies Ortega, Pedro A., et al. "Meta-learning of sequential strategies."arXiv preprint arXiv:1905.03030(2019). 这篇文章从通用的序列建模的角度描述了不同的先验假设结合贝叶斯框架如何构成了序列学习的通用方法.。 首先,元学习的本质就是如何高效的从多个任务(环境)的混合数据里获取供不同任务使用的inductive bias。所有的元学习方法,都可以看做是如何从数据中获取这种最具一般性的先验假设(模板)。
一个序列预测问题某个先验下可能的答案,但是它们只代表所有可能中的一种常见的元学习方法Mamal, 从不同任务的混合数据中学习一个恰当的初始参数,可以看作是学习一个离每个具体任务都不远的先验当然, 以人类日常任务的多样性, 和环境的复杂多变,这些先验模板一定不是一成不变,甚至有可能互相矛盾。 我们经常纠结,且时时处于矛盾之中,就是反应了这个事实。 事实上,我们大脑处理不同的先验假设有两个基本的原则: A
Epicurus’ principle:在认知资源允许的情况下, 我们保持尽可能多的假设。减少某些假设意味着对应未知世界的风险增加。
B
Occam’s
principle: 当不同的假设均可解释一个事实, 那么我们尽可能给简单的假设赋予更多的权重。
这一条被称为阴谋论绞杀者。
在此基础上有了这些不同的假设,大脑执行的一个基本的工作是karl Fristion所说的预测编码,每时每刻,大脑都在尽可能的生成预测下一刻的输入变换(视觉,听觉,触觉),根据上面所说的,我们所做的预测不是凭空而来,而是根据大脑里的先验假设空间进行修正, 减少一些不符合事实的假设的概率, 而增加那些符合事实的假设,这个过程对于大脑就像水往低处流一样自然。在这种预测力的驱动下, 这个修正过程是快速的,准确的,我们会很快得到最贴合真实的模板或者其组合,远比重新学习新的世界模型要快的多。也就是说,我们看到的未来是过去所见的组合,阳光之下并无新事。这一点对于这个迅速变换且危险的世界比缓慢的梯度下降学习靠谱的多。
这篇文章指出一个可靠的具有类似智能的系统需要 : 1)能够在大量(来自不同任务或环境下的)序列数据的预测中习得一组先验假设。 2)可以在不同任务间快速的调整后验。
聪明的人本质具有更强的对某个领域预测编码的能力,除了具有先天或早期学习到的某个领域的强大先验, 更有极强的在这些领域的快速学习能力,这些都具有大脑先天的结构性基础。3. 强大的抽象/表征能力 。聪明的人往往具有更高的抽象能力。我们还是来看神经网络。 抽象之后, 概念,以及概念与概念之间的结构关系能够支撑具体任务的学习 。
世界是复杂的,大脑的神经元再多, 表达能力都有限。 那么,如何用有限的神经资源表达无线的假设? 抽象,就是必经之路。 经过一定量的抽象, 很多看似不同的事物就归结到一个东西上,所需要表达的假设就大大减少。
抽象可以看做分成两层, 一层是如何从具体感知中获得符号。符号对应某种不变性,比如一个人A的脸可以有不同的侧面, 不同的光影效果, 但是最终可以抽象成为一个符号-就是A。或者一个地点在不同的时间角度看场景都不一样,但是你走的多了,就理解那是一个地点而已。
这是当下的人工神经网络,尤其是CNN非常擅长做的事情。 符号和概念息息相通, 某种程度能从感知信息里抽取符号,就是具有概念学习的能力。
不同人脸侧面对应同一个人而另一层较少被提及的抽象就是对某种结构性知识的抽象,或者是说有了符号后,对符号之间的关系的抽象,结构的抽象。 比如说刚刚说的人脸, 如果有了不同人的脸,那么我们可能会把同一人种,性别放到一个区域,而不同人种,性别放在不同区域。 或者刚刚说的地点的抽象, 对于不同的地点, 我们可能会把近的能够直接到达的地点放在能够直接联通的区域, 远的不相通的地点放在较远区域。 仔细看你会发现对于人脸和地点, 我的描述是相似的,都是一种类似空间关系。 这种关系本身就是我说的另一类抽象, 对关系或者结构性知识的抽象, 在这个层次上,符号是什么本身已经不重要,重要的是符号和符号之间的关系。
概念和概念相互关联的结构性知识我们可以看做所有的关系都可以看做某种图(graph)来表达, 图里的节点可以对应可以替代的概念(一个占位符),而具体图里的每条边是什么,或者说距离如何定义,又可以用一个新的自由度表达,也就是我们常说的度量(metric), 我们日常生活中的欧式空间,无非是有关metric假设的一种形式。 graph和metric构成我们需要的多种多样的结构性知识,你可以想象出现过在你大脑中的结构都有哪些。 大脑中的典型负责这一类关系的脑区,是海马。 海马里的place cell如同一个不同地点(概念)相互连接的弦网而每个弦长又由更抽象的grid cell来定义。
抽象的符号或者关系是大脑中的先验模板存在的基本形式。 比如视觉回路的感受野是先天就确定的, 海马体的place cell也很早就形成。
有了这些表达关系和符号的抽象模板, 我们很容易在经历新的刺激,环境或者任务时候,直接套用已有的抽象,并且略作重新组合,理解新事物。这个理解的过程,可以同样看作两部,一个是生成新的符号(命名新的刺激),另一个就是用刚刚说的结构模板,来强行套用到新的符号上。比如一个毫无香水概念的人一天接触了一百种香奈儿香水,在知道了那些不同的名字后,那么她可能很容易用它熟悉的空间概念来套用到不同味道,给她一个“距离”关系,也就是我们常说的比喻的能力,如此几百个味道或许被分到香甜和辛辣两个维度,从而被大脑迅速掌握。
把符号和符号之间的结构性知识结合起来, 得到最终的任务表示。这里的结构性知识是空间网格。网格上可以放各种物体。对网格的认知方便对周围物体的预测。What Is a Cognitive Map?Organizing Knowledge for Flexible Behavior聪明的人本质上具有极为强大的这一类对世界的结构性知识, 也就是说,他们往往能够在某个任务上抽取到其最本质的结构, 然后迁移到非常遥远的领域,体现在一种触类旁通的能力, 和极高的幽默感。物理学家就是这个方面表现极为突出的一群人,犹如把宏观力学的空间概念拓展到微观。4.
这种关系或结构的抽象最重要的一个是 4, 强大的层级组合能力,迅速将已有的技能组合成新技能。 用迭代法则构建的层级结构是所有结构性知识里最重要的一种, 因为无论是对符号之间关系的表达, 还是对动作之间关系的表达, 还是状态的构成,树结构是最常见的一种结构。 从当下到未来,我们可以用一个状态的决策树表达。动作到动作, 我们可以用一个微观动作到宏观动作的技能树表达。
我们说,层级关系对应了从一些最基本的符号或概念,如何构建更复杂的符号或概念的一个最常用的方法。 或者说从已有的若干基本先验假设,构建新的无穷多假设的一种方法,能够多大程度利用迭代关系得到最高层级的知识,也决定了聪明人的思考深度。
更多层级关系的例子:
我们的语言就是层次结构最典型的体现勃艮第牛肉的制作过程为例看层级化的强化学习。每个动作由更基本的动作组成,又成为更复杂的动作的基础。技能的构成体现层级嵌套的树结构除了以上4点, 对于人类的元学习能力不能不提的还有两个核心点,一个是因果,一个是意识 5. 因果能力的区别聪明人的头脑更擅长抽取事物中的因果关系。刚刚提到的世界模型离不开当下状态和未来状态的关系, 我们不停的预测下一刻的世界变化,这是大脑的热力学第二定律。 这个预测系统大部分做的是统计预测,也就是分析不同事件之间的相关性。但是偶尔,它抓住了比这种相关性更深刻的关系--那就是因果。 太阳升起引起公鸡叫引起外面的广播体操喇叭响了而不是反过来,这种因果一旦被掌握,它就不太会局限于某个数据集和任务,而是掌握了可以跨越很多任务不同环境使用的规律。 假定你学会了用公鸡叫预测太阳升起,那么当你从乡村移动到城市这规律就不能用了。反过来,如果你学会的太阳升起到一系列动物和人的行为的因果关系, 这种泛化能力就大的多。 因此因果也成为最为热门的研究领域。
某种意义上,我们也可以把因果图看成刚刚讲的抽象符号关系里的一种。 6. 自我意识的深度 没有人真正了解意识,但是它无疑与人类最引以为傲的智能息息相关, 聪明人往往具有最高的自我意识水平。 表现在更强的对自身状态的挖掘能力,和对自我实现的更高追求。我们来看看意识对学习为何如此重要:这可能是所有人类强大元学习能力背后最深奥的一个,讨论起来可能看起来比较玄学,然而不讨论意识,或许我们永远无法真正把握人类超强泛华能力背后最重要的一环。 Bengio等对意识做了一定程度的研究,认为它可能代表了一种迅速的把不同脑区得到的不同抽象假设统一在一起,形成一种合并的大脑表征的能力(进入到当下意识中)。 或许当人有了意识,它就好比得到了一个产生好多重的无意识自我,并在其间切换的能力。 更多内容请参阅论文: Bengio, Yoshua. "The consciousness prior."arXiv preprint arXiv:1709.08568(2017).
相关阅读:
}
这是一篇足足有7000字的干货,看完它大约需要花费你15分钟的时间,这15分钟足以让你从一个对大脑功能一知半解的小白变成专家。本文出自公号 快乐学习匠,转载请注明作者和出处。话说500多年前,哥伦布带领着他的水手们发现了新大陆,这是人类以全新视角认识地球的里程碑。与探索地球相比,人类在对大脑的探索方面显然要滞后很多。在发现新大陆300多年后,人类才开始有了对大脑的科学研究。而直到50多年前,我们才以现代科学手段证明了大脑工作的基本方式。人脑无疑是整个宇宙中最复杂、最神秘的系统。有人曾经把人脑称作是整个宇宙最后被破解的黑匣子。幸运的是,今天的人们可以享受比前人多得多的大脑研究成果。这些研究成果中的一部分已经被广泛地运用在脑科学和神经科学领域,而另一部分则成为推进教育和学习手段的理论工具。博赞的思维导图正是在系统地研究了大脑的功能后开发出来的。从某种意义上讲,思维导图是对大脑的模仿,是对这台宇宙中最复杂的机器的致敬。可以说,思维导图的原理根源于大脑工作的原理。因此,想要透彻地掌握思维导图这门学习工具,就必须从了解大脑开始。 原理一:连接保证存在与人体的其他部位相比,大脑无疑是最忙碌的。从每天起床开始,我们的大脑便要开始繁忙的工作。首先,大脑会主动分析墙上时钟的指针位置,并由此判断出离上学还有多久,自己需要以多快的速度行动。在洗漱的过程中,大脑会不断摆脱困倦的侵扰,并盘算着接下来要做的事情。出门之后,大脑要帮助我们选择合适的交通工具。乘坐交通工具的过程中,大脑会以不完全受你操纵的方式对你的记忆和想象进行排列组合。如果有一个可以吸引你大脑注意的物品,这段无聊的旅途显然会好过许多。抵达学校之后,大脑会利用听觉系统帮助我们获取声音信息,还要用视觉系统帮助我们做笔记。为了把老师们传递的信息转化成为我们的长期记忆,大脑会进行一系列复杂的化学反应,背知识点、做题、考试是大脑工作的主旋律。这么多复杂的事情,大脑是如何应付的?这要从大脑最基本的组成单位——神经元说起。绝大多数生物组织都是以细胞作为基本单位的。大脑也不例外。大脑的基本单位是神经元,也有人把它们叫做脑细胞。你可以把大脑看作是一个由众多神经元拼装在一起的巨大机器。如果单纯从体积和重量来看,把大脑称之为巨大显然有些言过其实了。一个普通成年人的大脑重量大约是1.4公斤,和一台标准的笔记本电脑相仿(图3-1)。但是,如果你了解了它的结构和组成方式,你会充分同意我使用“巨大”这个词。图3-1
大脑外观图仅仅在大脑的表层,即我们通常所说的大脑皮层,就存在着上千亿个脑细胞。我们看到的、听到的、闻到的、触摸到的、想到的、感觉到的绝大部分信息都是在这里进行传递、汇集和加工的。这些脑细胞尽管小得可怜,却承担着仓库保管员和物流派送员的双重使命。一方面,它们把外部的刺激转化成内部的信息,并以化学方式把这些信息存储在细胞内部;另一方面,它们还对信息进行不断地传递,从而可以把分散在人脑中的众多信息拼装组合在一起,形成一个完整的、有意义的信息。脑细胞之间的相互连接和信息传递是大脑工作的基本方式。这也是大脑工作的原理之一:连接保证存在。脑细胞之所以能够进行信息传递,是因为它们拥有神奇的触手——树突和轴突。这两种触手一长一短,所以很好分辨。凭借着短短的树突,脑细胞可以接受由其他脑细胞传递过来的信息,而凭借着长长的轴突,脑细胞又会把信息传递给其他脑细胞(图3-2)。信息在脑细胞之间不断地传递,便形成了人类的感觉和想法。而整个大脑,就是由脑细胞相互连接而成的一张大网(图3-3)。图3-2
信息(神经冲动)在脑细胞间传递这就是我们的大脑。它的超级能力足以令世界上最昂贵、最庞大的超级计算机黯然失色。图3-3 脑细胞组成的网换句话说,我们头脑中的每个想法都对应大脑细胞间的一组连接。那么,脑细胞之间究竟能形成多少种连接呢?平均每个脑细胞大约要与15000个脑细胞相连接,而大脑皮层中的脑细胞大约是1000亿。这些脑细胞之间可能的连接数量实际上超过了整个银河系中原子的数量!如果一定要把这个数字写在纸上的话,这张纸的长度将足以把地球的赤道包裹上240圈!这就是我们的大脑。它的能力足以令世界上最昂贵、最庞大的超级计算机黯然失色。拥有如此惊人的能力,大脑自然可以完成其他任何计算工具都无法完成的功能。它不但拥有还原自然界信息的能力,还拥有对这些原始的信息进行抽象化处理的能力,进而形成大脑更容易使用的模型。人脑可以进行自由地想象和创造,并凭借这种功能创造出这个世界上并不存在的事物。这是我们今天的人类世界之所以区别自然界的根本原因。复杂的人脑还可以产生各种情绪,同样的事实在不同人的眼中可以形成完全不一样的印象。由情绪支配的人类可以做出许多匪夷所思的事情来。这大概是人和智能化机器最明显的区别。学习是帮助我们发掘大脑资源的活动。现在,你应该明白我为什么使用“巨大”这个词来称呼人脑了吧?无需嫉妒爱因斯坦,无需羡慕霍金,你我都拥有这个宇宙中最不可思议的武器——人脑。这是我们最引以为豪的硬件。除了极少数大脑存在器质性缺陷外,任何一个普通人的大脑都足以应付学习上的问题。在《卡尔·威特的教育》中,我们看到,作为父亲兼超级教师的老卡尔,硬是凭借着系统的后天训练,让大脑存在先天缺陷的小卡尔成为后来的神童。以脑子笨作为学习不好的理由显然是十分牵强的。人脑的能力虽然十分巨大,但能够完全利用这些能力的人几乎没有。到目前为止,还没有人能100%地发挥出大脑的潜能。这部分地与我们人类有限的寿命相关。如果我们的寿命是无限的,也许我们有机会发挥全部的大脑潜能。但从目前人类的平均寿命来看,这是一个可望而不可及的梦想。即便是被我们誉为世界上最聪明的人——爱因斯坦,也只利用了其大脑潜能的7%。而绝大多数普通人终其一生只利用了其大脑潜能的1%。至少90%的大脑潜能在没有来得及被发掘之前就随同我们进入了坟墓,这个事实既让我们感到惋惜,又让我们兴奋。惋惜的是,我们注定无法100%地发挥自己的大脑潜能;但另一方面,我们又会因为自己的大脑潜能永远挖掘不尽而兴奋不已。从这个意义上说,把学习看作是消耗大脑资源的活动是错误的。学习是帮助我们发掘大脑资源的活动。任何学习都无法消耗掉我们大脑的全部潜能。没有任何人的大脑潜力会因为过度学习而被挖尽。那些动辄给孩子扣上“潜力已尽”帽子的家长和老师,应该好好读一读这段话。也许正是他们无心的评价束缚了孩子们的大脑潜能。事实上,对于脑细胞来说,与其他脑细胞发生连接,正是保证它们存在的最重要的条件。与其他脑细胞相互连接,确保自己处在大脑的网络之中,是脑细胞存在的意义。一旦脑细胞脱离了“组织”,不再与其他脑细胞连接,它也就失去了存在的意义,并在用尽废退的生物原则下逐渐归于凋亡。这也是我们的第一条大脑工作原理——“连接保证存在”的含义。以脑子笨作为学习不好的理由显然是十分牵强的。多多动脑,多多思考,不仅可以提高我们的学习成绩,对我们的大脑本身也是有无限好处的。这个世界上没有愚笨的大脑,只有尚未被开发的大脑。这个世界上没有笨学生,只有不懂得科学使用大脑的学生。 原理二:刺激激发动力请想象你正在翻开今天的报纸,你看到头版里有这样两则新闻。第一则新闻的标题是“美国总统正式访问欧洲”,其篇幅占据了近一半的版面。第二则新闻的标题是“科学家终于发现火星人存在的证据”,其篇幅只有前者的四分之一。请问,你先读哪则新闻?我敢和你赌一块钱,你一定会先看关于火星人的新闻。为什么会这样呢?火星人存在的证据是否比美国总统的出访更重要,我们暂且不论。不过我们可以确定地认为,火星人存在的证据对于我们的大脑来说,的确是远比美国总统出访更刺激、更有诱惑力的。大脑只关注那些能够刺激到它的信息,而刺激不到的信息,则会被忽略。这便是大脑工作的第二个原理。认识到这一点,对于学习者来说是非常重要的。常在教室里坐板凳听课的人都有这样的体会:那些听起来有意思的课,要远比听上去枯燥乏味的课给人的印象更深。同样的知识点,如果可以用有趣的、别具一格的方式呈现,就容易被人记住,而如果呈现这些知识点的方式平淡无奇,则很容易被人遗忘。而大多数时间里,学生的大脑恰恰是在缺少刺激的情况下辛苦工作的。这也是学习为什么总是让一些人困倦和疲惫的原因。与单纯的文字相比,图画无疑更容易刺激大脑。大脑是一架无比精密、无比高效的机器,但是它不会无缘无故地工作,催促它工作的主要动力就是来自外在和内在的各种刺激。如果你希望把提高成绩的胜券稳操手中,就不能指望着别人来帮你提供刺激。你自己才应该是提供刺激的那个人。一旦掌握了刺激大脑的科学方法,你就掌握了驱使大脑高速运转的秘诀。什么样的信息才能有效刺激大脑呢?单纯就文字信息而言,有氧信息要比无氧信息更容易刺激大脑。具体来说:l 简单的信息要比复杂的信息更容易刺激大脑,因为它们更容易理解;l 有趣的信息要比枯燥的信息更容易刺激大脑,因为它们能唤醒大脑中的兴奋点;l 实用的信息比看不出明显价值的信息更容易刺激大脑,因为它们可以激活大脑工作的目标。所以,如果我们面对的是复杂、枯燥、无明显价值的文字信息(包括语言信息),就很有必要把它们变成简单、有趣、实用的有氧信息。从而让沉睡的大脑得到足够的刺激,让静止的脑细胞运动起来。与单纯的文字相比,图画无疑更容易刺激大脑。一图胜过千言万语。如果在文字和图画之间选择,绝大多数人都会选择先看图画。因此,对于注意力极不稳定的少儿来说,他们阅读的大部分读物都是图文并茂的。其实成年人也一样。与枯燥烦琐的文件相比,更为形象的PPT和图表会更有吸引力一些。至于媒体,更是把这个原理发挥到极致。对于报纸来说,如果头版不使用图片,那简直是无法想象的。与图片相比,情绪的刺激无疑更强烈,也更持久。如果你正在看漫画的时候,有人给了你一巴掌,无论你之前如何投入地看漫画,还是会感受到强烈的情绪冲动。而且这种情绪冲动会在你心中持续很久。你也许会忘记历史人物的准确名称,但绝对不会忘记自己暗恋女孩的名字,你也许会忘记历史事件的具体细节,但绝对不会忘记让你最兴奋的生日礼物是什么……情绪的刺激总是会给人以很深刻的印象。人,归根到底是由情绪支配的动物。出于生存的本能,人类对于情绪的刺激格外敏感。对天敌的恐惧情绪和对母亲的依赖情绪是人类生息繁衍的根本动力。一旦经过强烈的情绪刺激,大脑便会把短时记忆变成长期记忆。过去的老私塾里,先生常常对背不下书的孩子打手板。这种体罚早已被现代教育废除。但是,从心理学的角度看,由于害怕打板子而引发的情绪刺激,会帮孩子们把课文记得更牢固。这也是过去的私塾教育质量如此之高的原因之一吧? 原理三:左右逢源19世纪60年代,年过半百的巴黎鞋匠Lebrogne到外科医生Broca那里去接受检查。这位可怜的老鞋匠无法用语言进行正常表达,这在作为外科医生的Broca看来并没有什么可奇怪的。但令人百思不得其解的是,老鞋匠的发声系统没有任何问题。他不但可以说一些极为简单的词,甚至还可以熟练地哼唱一些小曲,但他就是无法说话。Broca医生怀疑病人的大脑理解能力有问题。但事实证明,病人完全可以理解来自他人的情绪。可既然如此,为什么病人不能正常说话呢?谜底在老鞋匠Lebrogne死后才逐渐被揭开。Broca医生发现,老鞋匠的大脑左侧有一处损伤。此后的几年里,他发现了数个相同的病例。这说明,人的语言功能与左侧的大脑密切相关。Broca最终得出了一个惊人的结论:人的语言功能是由左脑来支配的!这是人类对大脑左右分工研究的开始。100年后,美国神经心理学家斯佩里进行了一项更为大胆的实验:他把连接病人左右大脑的胼胝体切开——这意味着病人的左右脑将独立工作。随后的实验过程就连斯佩里都觉得不可思议。被切断左右大脑连接的病人表现得就像是一个人格分裂患者,更确切地说,是行为分裂患者。他们很可能用左手伤害自己的妻子,而右手却在死死地抓住左手,试图阻止这种伤害。这种情形一般只会在电影中出现,但是现在却被斯佩里的试验变成了现实。还有些病人穿衣服的时候,一只手在向上拽着衣服,而另一只手却在把衣服向下拽。表面上看,这些病人的身躯似乎是被两个大脑同时支配。事实上也差不多。当斯佩里向病人的左右两眼分别独立呈现不同图像,并让病人用左手画出自己看到的符号时,病人只画出了左眼看到的图像,而右眼看到的则完全被忽略了。之所以会产生如此不可思议的现象,是由于左眼与左手都要受右脑的支配。相反,当斯佩里要求病人用右手指出自己刚才画的是哪幅图像时,病人却指向了右眼看到的图像。这是因为右眼和右手都要受到左脑的支配。生活中的大部分时间,我们的左脑和右脑都会相安无事。它们像一对亲密的兄弟一样密切地配合着。但如果想要让它们相互干扰,甚至是打架,也并非不可能。这并不需要切断我们左右脑之间的胼胝体,你只需和我玩一个小游戏,就可以看到最不可思议的现象。图3-4 读颜色(彩色图样请见彩插26)在看图3-4之前,请认真阅读下面的游戏规则:请从左至右,从上至下读出这些字的颜色。请注意,要你读出的不是这些字的读音,而是它们的颜色!如果你确认你已经了解了规则,请立刻开始这个游戏,说得越快越好。最好把你的家人也找来,让他们也参与到这个游戏中。你们可以比赛,看谁说得更快且没有失误。当你或你的家人发现你读错时,请停下来。看看你是从哪个字开始出错的?这个游戏我曾经和上千人玩过。他们中的大多数人都没有办法通过第二行,有些人甚至在念第一行字的颜色时就出错了。为什么会这样?如果你已经了解了大脑分工理论,便不会对这种现象感到丝毫奇怪。这些文字的读音是由左脑来负责处理的;而这些文字的颜色则是由右脑来负责处理的。当你说出这些字的读音时,你的发声器官要通过左脑的支配才能起作用。但问题是,辨别这些字的颜色需要通过右脑的工作才能完成。当你有足够多的时间从容思考的时候,尚且可以让左脑和右脑分别在两个信息通道上协同工作;可当你需要迅速给出答案的时候,左脑和右脑便会争抢通道。如果右脑占上风,你便会说对,可如果左脑占上风,你便会出错,你说出的将不是那个字的颜色,而是那个字的读音。左脑和右脑的区别不仅仅是读音和颜色。现在心理学家们已经基本研究清楚了大脑左右两个半球的分工。其中,左脑负责的主要是语言、文字、逻辑顺序、数字、分析性的信息。而右脑负责的,则是画面、色彩、音乐、感情、想象、综合性的信息。如下表所示。左脑功能右脑功能语言文字
逻辑
顺序
数字
分析画面色彩
感情
音乐
想象
综合仔细看看这个列表,我们会发现,左脑和右脑在我们的生活中扮演着极不平衡的角色。我们对左脑的使用无疑要远远超过右脑。对于学生来说,其接触到的信息大都是语言文字、公式符号、逻辑推理等。这些信息的处理无疑都要使用到左脑,而右脑则在大部分时间里被闲置着。下次,当你忙于做高强度的习题训练时,请摸一摸你的脑袋。你会发现大脑左侧的温度要略高于大脑右侧的温度。这是由于左脑的持续工作造成的。了解这些对于我们有什么意义呢?答案很简单:当别人用一只手做事情,而你却可以用两只手做事时,你觉得谁的效率会比较高呢?历史上,几乎所有聪明绝顶的伟人都是左右脑并用的人。达芬奇是世界上最伟大的艺术家,他的《蒙娜丽莎》闻名世界,但你不要忘记,他同时也是伟大的建筑工程师、生物学家和发明家。即便他压根不会画画,也完全可以依靠其他领域的成就被人们永远记住。在达芬奇遗留的画稿中,我们能清晰地看到底稿上精确的比例划分和数据计算。达芬奇的精美画作不仅是画出来,也是算出来的,他创造的艺术品是左脑和右脑完美合作的结晶。爱因斯坦被我们誉为世界上最聪明的人。爱因斯坦死后,其大脑还被众多国家的科研机构提取切片,并被长期研究。连小孩子都知道爱因斯坦是一位伟大的物理学家,却很少有人知道他也是一位伟大的小提琴手。通常在经历了繁忙的研究工作后,爱因斯坦都会拉一会儿小提琴。而且,当爱因斯坦还是个孩子的时候,他就充分展示了其充满想象力的一面。据他本人讲,他曾不只一次幻想过沿着手电筒的光柱爬到天上去。这个童年时期的想象最终为我们带来了全新的物理学理论——相对论。无论是拉小提琴,还是做白日梦,都是右脑负责的领域。离开了右脑的强大支持,爱因斯坦也就不是我们看到的爱因斯坦了。与左脑相比,右脑的能力要强大得多。这一点非常容易证明。比如我们和陌生人见了面,互相介绍了名字,并简单地寒暄了一会。几天后,当我们再次看到这个人时,很可能会遭遇这样的尴尬:我们清晰认得他的长相,甚至记得在哪里见过他,可我们就是想不出他的名字。记名字显然是左脑的工作。而记住人的长相则是右脑的任务。右脑对图像的记忆能力是左脑无法相提并论的。右脑不仅仅擅长记忆,它更擅长创造。无数发明家都是在常规方法无法达成目的后,在右脑的帮助下创造性地解决了问题。阿基米德为了解决王冠真假问题焦头烂额,最终却是在洗澡的时候发现了解决问题的办法。瓦特并没有多少正规学校的经历,却在水壶的启示下发明了蒸汽机。化学家凯库勒在研究苯分子的结构时,曾试过各种办法,都没有结果。后来,他在梦中看见苯分子的各部分像蛇一样游动,最终蛇头咬住了蛇尾,形成了环形结构。醒来后,他根据梦中获得启示揭开了苯分子结构之谜。这些发明创造都不是严谨的逻辑分析的直接产物,它们之所以能够存在,主要是依靠右脑的作用。对于学生来说,记住知识只是提高成绩的基础,能够灵活地、创造性地利用知识才是提高成绩的关键。而无论记忆知识,还是运用知识,都需要右脑的积极参与。想要了解更多大脑的秘密,可以前往在下的公号
快乐学习匠
,我们不见不散。}
聪明与否, 主要不是体现在具体任务上, 而是体现在大脑学习如何学习,决策和思考- 或者说元认知和元学习能力上,这点要从元认知和元学习能力的本质 -神经网络的层次谈起:相比机器,人脑擅长快速的跨任务学习和泛化推理, 或者说叫做卓越的元学习能力。我们说人类站立在这个迅速变化的危险世界面前,快速适应新任务的元学习能力事关生死。 这种能力是目前的深度学习人工智能所完全不具备的。 元学习概念解析: 机器学习围绕一个具体的任务展开, 然而生物体及其一生, 学习的永远不只是一个任务。 与之相对应的叫做元学习, 元学习旨在掌握一种学习的能力, 使得智能体可以掌握很多任务。 这种伟大的能力建立的基础是什么呢?
深入大脑,我认为可以分为以下几方面认识元认知能力,同时它们也是聪明人和不聪明人的区别所在: 1, 可以灵活的切换认知模式, 选择如何选择, 决策如何决策。
2, 大量先天可以使用的inductive bias(先验,归纳偏置) , 使用贝叶斯推理框架后可以结合最新证据迅速匹配最新任务或环境的模型。相比AI单纯做梯度下降,这个方法要快速有效很多。
3, 强大的抽象/表征能力 。抽象之后,概念,以及概念与概念之间的结构关系能够支撑具体任务的学习
4, 强大的层级组合能力,迅速将已有的技能组合成新技能。
5, 因果 6, 意识 这些基础,也是不同人的聪明程度区别的根基。 我们一个个从AI和神经网络的视角来看看:1.
切换认知模式的能力不同 聪明的人往往更加理性, 理性的程度高低,实际体现了人切换认知模式的能力:Griffiths, Thomas L., et al. "Doing more with less: meta-reasoning and meta-learning in humans and machines."Current Opinion in Behavioral Sciences29 (2019): 24-30. “The term ‘meta-reasoning’ contains within it the solution to the problem of how to efficiently deploy computational resources: meta-reasoning is reasoning about reasoning, which means making intelligent decisions about how to think ” 人的元认知能力,被被称为一种能够根据所具有的计算资源来灵活选择认知系统的能力。 比如我们熟知的系统1和系统2,一个负责直觉有关的决策,一个负责更加理性更加逻辑的决策。 这种选择的本质是根据现有的认知资源来计算进一步计算需要的成本是否可以cover收益来看是否切换认知模式。 就好比当我们在危急时刻或者大脑已经十分疲惫,都倾向于用直觉思考,只有在认知有盈余的时候才会进入更深层的思考状态。这也可以让我们反思我们所经常犯的错误,也就是自己匆忙因为本能做的决定事后后悔。你会发现当你经常处于认知资源匮乏的状态,就会经常犯错误。 人的这种切换决策,学习等相关的认知模式的能力,是快速适应不同环境的一个基础。 我们可以如下的计算图表示这个计算过程,我们的大脑一边进行C0,C1,C2..一个序列的计算, 用以更新我们的认知B0, B1, B2, 另一方面,计算每个计算步骤的成本收益,当这个计算的成本大于收益,就停下来。 这就是所谓的有限理性,不要冥思苦想,对一个问题适可而止交给上帝。这种浅度或深度认知模式的切换是适应复杂多变环境的基础,让我们虽然可以创造最伟大的文明,但是在被老虎追击的时候不至于陷入过度思考,最终鲁棒性而不是最优化才是长时间不被淘汰的关键。 那么有没有无限理性呢?你也可以假定一个超级智商的Lucy可以做到的是建立一个无穷深度的计算图,站在一个制高点上,观测每个理性层次上的自己往下游戏会得到一个什么样的结局, 最终避开所有可能的坑,但是这样的人是不可能存在的,除非她真的获取了这个星球所有的计算资源,并且有无限的计算速度。
也就是说, 正常的人都是有限理性,而理性的深浅不同, 聪明的人由于先天具有更好的认知调控能力,比一般人理性的程度更深, 可以在认知空间里看着理性层次更浅的自己如何跌倒从而避免。 2. Inductive bias 不同 (先验假设,归纳偏置) 人们的头脑由于遗传和发育的关系,会形成不同的能力结构, 我们可以把它们看作对世界的先验不同,或者说先天结构和偏好固有不同。不同的天才均是具备了某方面比普通人更强的先验结构,即使这种结构是不同的, 比如莫扎特和爱因斯坦, 我们可以看看这些先验从何而来。我们来一个一个看这些点。与人工神经网络相比,生物神经网络一个显著的特征是自发活动非常频繁。这些自发活动表明,人脑在没有外界输入的时候, 也在自发的演绎着自己的“主旋律”。与其认为这些活动是一些无意义的发放, 更加多的生物实验基础指出的是, 这些活动反应了某种大脑的对世界或任务的”先验假设”,犹如一些认知的模板。 心理学家认为人脑中大部分的意识或想法都在意识之下 ,我们是看不到的, 或许也有一定道理 ,本质上,这些想法就如同不同先验组成的假设空间, 最终能够胜出进入到我们的决策区间的仅仅是极少的一部分。不同的先验可能来自于进化,也可能来自于早期学习。 不同种族的人有着深层相通的语法结构,或者类似的谚语,都反应了这些潜在于大脑内部的原始先验,不禁让人想到荣格的集体无意识。 这一点也在被机器学习界所认知: Meta-learning of Sequential Strategies Ortega, Pedro A., et al. "Meta-learning of sequential strategies."arXiv preprint arXiv:1905.03030(2019). 这篇文章从通用的序列建模的角度描述了不同的先验假设结合贝叶斯框架如何构成了序列学习的通用方法.。 首先,元学习的本质就是如何高效的从多个任务(环境)的混合数据里获取供不同任务使用的inductive bias。所有的元学习方法,都可以看做是如何从数据中获取这种最具一般性的先验假设(模板)。
一个序列预测问题某个先验下可能的答案,但是它们只代表所有可能中的一种常见的元学习方法Mamal, 从不同任务的混合数据中学习一个恰当的初始参数,可以看作是学习一个离每个具体任务都不远的先验当然, 以人类日常任务的多样性, 和环境的复杂多变,这些先验模板一定不是一成不变,甚至有可能互相矛盾。 我们经常纠结,且时时处于矛盾之中,就是反应了这个事实。 事实上,我们大脑处理不同的先验假设有两个基本的原则: A
Epicurus’ principle:在认知资源允许的情况下, 我们保持尽可能多的假设。减少某些假设意味着对应未知世界的风险增加。
B
Occam’s
principle: 当不同的假设均可解释一个事实, 那么我们尽可能给简单的假设赋予更多的权重。
这一条被称为阴谋论绞杀者。
在此基础上有了这些不同的假设,大脑执行的一个基本的工作是karl Fristion所说的预测编码,每时每刻,大脑都在尽可能的生成预测下一刻的输入变换(视觉,听觉,触觉),根据上面所说的,我们所做的预测不是凭空而来,而是根据大脑里的先验假设空间进行修正, 减少一些不符合事实的假设的概率, 而增加那些符合事实的假设,这个过程对于大脑就像水往低处流一样自然。在这种预测力的驱动下, 这个修正过程是快速的,准确的,我们会很快得到最贴合真实的模板或者其组合,远比重新学习新的世界模型要快的多。也就是说,我们看到的未来是过去所见的组合,阳光之下并无新事。这一点对于这个迅速变换且危险的世界比缓慢的梯度下降学习靠谱的多。
这篇文章指出一个可靠的具有类似智能的系统需要 : 1)能够在大量(来自不同任务或环境下的)序列数据的预测中习得一组先验假设。 2)可以在不同任务间快速的调整后验。
聪明的人本质具有更强的对某个领域预测编码的能力,除了具有先天或早期学习到的某个领域的强大先验, 更有极强的在这些领域的快速学习能力,这些都具有大脑先天的结构性基础。3. 强大的抽象/表征能力 。聪明的人往往具有更高的抽象能力。我们还是来看神经网络。 抽象之后, 概念,以及概念与概念之间的结构关系能够支撑具体任务的学习 。
世界是复杂的,大脑的神经元再多, 表达能力都有限。 那么,如何用有限的神经资源表达无线的假设? 抽象,就是必经之路。 经过一定量的抽象, 很多看似不同的事物就归结到一个东西上,所需要表达的假设就大大减少。
抽象可以看做分成两层, 一层是如何从具体感知中获得符号。符号对应某种不变性,比如一个人A的脸可以有不同的侧面, 不同的光影效果, 但是最终可以抽象成为一个符号-就是A。或者一个地点在不同的时间角度看场景都不一样,但是你走的多了,就理解那是一个地点而已。
这是当下的人工神经网络,尤其是CNN非常擅长做的事情。 符号和概念息息相通, 某种程度能从感知信息里抽取符号,就是具有概念学习的能力。
不同人脸侧面对应同一个人而另一层较少被提及的抽象就是对某种结构性知识的抽象,或者是说有了符号后,对符号之间的关系的抽象,结构的抽象。 比如说刚刚说的人脸, 如果有了不同人的脸,那么我们可能会把同一人种,性别放到一个区域,而不同人种,性别放在不同区域。 或者刚刚说的地点的抽象, 对于不同的地点, 我们可能会把近的能够直接到达的地点放在能够直接联通的区域, 远的不相通的地点放在较远区域。 仔细看你会发现对于人脸和地点, 我的描述是相似的,都是一种类似空间关系。 这种关系本身就是我说的另一类抽象, 对关系或者结构性知识的抽象, 在这个层次上,符号是什么本身已经不重要,重要的是符号和符号之间的关系。
概念和概念相互关联的结构性知识我们可以看做所有的关系都可以看做某种图(graph)来表达, 图里的节点可以对应可以替代的概念(一个占位符),而具体图里的每条边是什么,或者说距离如何定义,又可以用一个新的自由度表达,也就是我们常说的度量(metric), 我们日常生活中的欧式空间,无非是有关metric假设的一种形式。 graph和metric构成我们需要的多种多样的结构性知识,你可以想象出现过在你大脑中的结构都有哪些。 大脑中的典型负责这一类关系的脑区,是海马。 海马里的place cell如同一个不同地点(概念)相互连接的弦网而每个弦长又由更抽象的grid cell来定义。
抽象的符号或者关系是大脑中的先验模板存在的基本形式。 比如视觉回路的感受野是先天就确定的, 海马体的place cell也很早就形成。
有了这些表达关系和符号的抽象模板, 我们很容易在经历新的刺激,环境或者任务时候,直接套用已有的抽象,并且略作重新组合,理解新事物。这个理解的过程,可以同样看作两部,一个是生成新的符号(命名新的刺激),另一个就是用刚刚说的结构模板,来强行套用到新的符号上。比如一个毫无香水概念的人一天接触了一百种香奈儿香水,在知道了那些不同的名字后,那么她可能很容易用它熟悉的空间概念来套用到不同味道,给她一个“距离”关系,也就是我们常说的比喻的能力,如此几百个味道或许被分到香甜和辛辣两个维度,从而被大脑迅速掌握。
把符号和符号之间的结构性知识结合起来, 得到最终的任务表示。这里的结构性知识是空间网格。网格上可以放各种物体。对网格的认知方便对周围物体的预测。What Is a Cognitive Map?Organizing Knowledge for Flexible Behavior聪明的人本质上具有极为强大的这一类对世界的结构性知识, 也就是说,他们往往能够在某个任务上抽取到其最本质的结构, 然后迁移到非常遥远的领域,体现在一种触类旁通的能力, 和极高的幽默感。物理学家就是这个方面表现极为突出的一群人,犹如把宏观力学的空间概念拓展到微观。4.
这种关系或结构的抽象最重要的一个是 4, 强大的层级组合能力,迅速将已有的技能组合成新技能。 用迭代法则构建的层级结构是所有结构性知识里最重要的一种, 因为无论是对符号之间关系的表达, 还是对动作之间关系的表达, 还是状态的构成,树结构是最常见的一种结构。 从当下到未来,我们可以用一个状态的决策树表达。动作到动作, 我们可以用一个微观动作到宏观动作的技能树表达。
我们说,层级关系对应了从一些最基本的符号或概念,如何构建更复杂的符号或概念的一个最常用的方法。 或者说从已有的若干基本先验假设,构建新的无穷多假设的一种方法,能够多大程度利用迭代关系得到最高层级的知识,也决定了聪明人的思考深度。
更多层级关系的例子:
我们的语言就是层次结构最典型的体现勃艮第牛肉的制作过程为例看层级化的强化学习。每个动作由更基本的动作组成,又成为更复杂的动作的基础。技能的构成体现层级嵌套的树结构除了以上4点, 对于人类的元学习能力不能不提的还有两个核心点,一个是因果,一个是意识 5. 因果能力的区别聪明人的头脑更擅长抽取事物中的因果关系。刚刚提到的世界模型离不开当下状态和未来状态的关系, 我们不停的预测下一刻的世界变化,这是大脑的热力学第二定律。 这个预测系统大部分做的是统计预测,也就是分析不同事件之间的相关性。但是偶尔,它抓住了比这种相关性更深刻的关系--那就是因果。 太阳升起引起公鸡叫引起外面的广播体操喇叭响了而不是反过来,这种因果一旦被掌握,它就不太会局限于某个数据集和任务,而是掌握了可以跨越很多任务不同环境使用的规律。 假定你学会了用公鸡叫预测太阳升起,那么当你从乡村移动到城市这规律就不能用了。反过来,如果你学会的太阳升起到一系列动物和人的行为的因果关系, 这种泛化能力就大的多。 因此因果也成为最为热门的研究领域。
某种意义上,我们也可以把因果图看成刚刚讲的抽象符号关系里的一种。 6. 自我意识的深度 没有人真正了解意识,但是它无疑与人类最引以为傲的智能息息相关, 聪明人往往具有最高的自我意识水平。 表现在更强的对自身状态的挖掘能力,和对自我实现的更高追求。我们来看看意识对学习为何如此重要:这可能是所有人类强大元学习能力背后最深奥的一个,讨论起来可能看起来比较玄学,然而不讨论意识,或许我们永远无法真正把握人类超强泛华能力背后最重要的一环。 Bengio等对意识做了一定程度的研究,认为它可能代表了一种迅速的把不同脑区得到的不同抽象假设统一在一起,形成一种合并的大脑表征的能力(进入到当下意识中)。 或许当人有了意识,它就好比得到了一个产生好多重的无意识自我,并在其间切换的能力。 更多内容请参阅论文: Bengio, Yoshua. "The consciousness prior."arXiv preprint arXiv:1709.08568(2017).
相关阅读:
}

我要回帖

更多关于 想象的主要内容是符号 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信