超难的高中数学题

授权转载自:新智元(ID:AI_era)丨原文来源:arXiv丨编辑:金磊、元子、张乾

做数学题一直令多数人头疼不已的事情。近期,DeepMind团队最新研究了利用AI来解数学题,但结果令人大跌眼镜——水平不及高中生。

数学可能是大多数人在求学过程中最头疼的一门科目。近日,DeepMind团队便对“AI做数学题”进行了研究,结果大跌眼镜:“万能的AI”在面对数学问题也是不知所措!

人类解题能力超群的关键在于,人类并非主要通过经验和证据,而是通过推断、学习,以及利用定理、公理和符号操纵规则

DeepMind团队便对神经架构和类似系统的评估(以及最终的设计)提出了新的挑战,开发了一个数学问题的任务处理套件,涉及以自由形式文本输入/输出格式的系列问题和答案。

不过,在研究过程中,DeepMind发现,AI非常擅长做的数学题都是比较偏简单的,例如:查找数字中的位值、四舍五入小数/整数等。但是在诸如素数检测、因式分解以及多项式操作等方面,性能结果存在显著的差异。

AI做数学的能力不及高中生水平?

深层模型远未达到人类所表现出的稳健性和灵活性,由于自身能力的限制,深度学习无法超越所经历的环境去生成新的东西,并且面对存在对抗性构建的输入时极其脆弱。

与神经模型相比,人类智能擅长的一个领域是关于物体和实体的离散组合推理,即“代数泛化”,这个领域也体现了神经模型和人类智之间的差异。

人类在这个领域内的概括能力是复杂的、多方面的。先来看这个数学题:

人类解决这道数学题时候,用到的各种认知技能有:

将字符解析为数字,算术运算符,变量(一起形成函数)和单词(确定问题)等实体

计划(例如,以正确的顺序识别功能以进行撰写)

使用子算法进行函数合成(加法,乘法)

利用工作记忆来存储中间值(例如合成h(f(x)))

通常应用已获得的规则,转换,过程和公理知识

DeepMind在这篇论文中引入了一个由许多不同类型的数学问题组成的数据集,对于模型来说,优于缺乏上述人类能力,在处理跨系列的问题类型(包括我们在下面详述的泛化)的时候难度更大,更难获得良好的表现。

该领域对于一般的神经结构的分析是重要的。除了提供广泛的问题外,还有其他几个优点:

符号在不同的问题类型中是相同的,是的数据集更容易得到扩展的;

在一种问题类型上学习的规则和方法通常适用于其他地方。例如数字的加法在任何地方都遵循相同的规则,并且在其他问题中作为“子程序”出现,具体体现在乘法中,以及具体且更抽闲的体现在多项式中;

具有转移知识能力的模型将在数据集上获得更好的表现(知识迁移可能是解决更难问题的必要条件)。

数学本身也是一个有趣的领域,虽然解决该数据集中大多数中学数学问题的模型本身不具备应用程序,但它们可能会导致更强大的模型,这些模型可以解决有趣且实质性的新数学问题。

或者更一般地说,寻求验证以捕获算法/系统推理为目标的新架构的实验经常从这个领域中得出,这并非巧合。因此,在为这些模型提供大规模的训练和评估框架时,希望为继续研究超越数学的机器推理提供坚实的基础。

请看以下数学问题集示例:

问题:从qqqkkklkqkkk中选择了三个字母而没有替换。给出序列qql的概率

研究人员发布1个序列到序列的数据集,包括许多不同类型的数学问题(见图1),用于测量数学推理,同时提供生成代码和预生成的问题。

数据集附带两组测试:插值测试,一个针对训练集中出现的每种类型的问题;外推测试,测量沿着各种难度轴的概括超出训练期间的概括。将外推测试作为模型是否采用允许它们进行代数泛化的能力的额外度量。

本文利用一个实验评估来研究最先进的神经架构的代数能力,实验表明它们在某些类型的问题上表现良好,但肯定不是全部,而且只有适度的数量一般化。我们对他们如何学习回答数学问题及其失败模式提供了一些见解。

由于该数据集背后的构建过程,有大量现有模型可以进行调整、专门构建或定制,以解决提出的问题,特别是在符号求解器或计算机代数系统的帮助下。

随着问题和答案的复杂性或语言多样性的增长,撇开传统符号方法可能的脆弱性或可扩展性的限制,我们对评估通用模型更感兴趣,而非已经内置数学知识的模型。

使这些模型(总是神经架构)从翻译到通过图像字幕解析无处不在的原因,是这些函数逼近器缺乏偏差,因为它们的设计中编码的域特定知识相对较少(或没有)。

虽然有一些神经网络驱动的方法可以直接访问数学运算(例如加法或乘法,或更复杂的数学模板,这无疑是我们在本文中提出的任务中具有竞争力,我们将局限于一般的序列处理架构,这些架构用于其他非数学任务,以便为将来的比较提供最一般的基准。

论文研究了两种(广泛的)模型,这些模型已经证明了它们在序列到序列问题上的最新技术:循环神经架构,以及最近引入的Attention/Transfomer结构。 我们还尝试使用可微分神经计算机,这是一种具有“外部存储器”的复现模型(其大小与网络中的参数数量无关)。 

理论上,这可能非常适合解决数学问题,因为它可以存储中间值以供以后使用。然而,却无法从中获得不错的表现,即使对于内存插槽的数量和大小的超参数扫描等,在训练一天后才能达到10%的验证性能,而大多数模型在不到一个小时内就能获得这一点。

图2:注意力LSTM和Transformer体系结构都包含一个解析问题的编码器和一个解码器,它将正确的答案右移1个映射到每个位置的答案中的下一个字符(因此允许自回归预测):

(a)注意LSTM将问题编码为一系列(关键,值)位置,然后由解码器进行处理

(b)变压器有几个阶段的自我注意和输入注意

LSTM 是一个强大的序列到序列模型构建模块,它在许多领域都达到了最先进的结果,尽管它很简单,但仍然是循环神经网络的一个核心构建模块。本文测试了两个标准的循环结构。

第一个(也是最简单)模型,称作“Simple LSTM”是直接将问题提交到LSTM,一次输入一个字符(采用1-hot编码);

第二个模型称作“Attentionnal LSTM”,是引入具有注意力结构的编码器/解码器。

在这两种体系结构中,还使用了一个简单的更改来提高性能。所描述的模型必须在解析问题之后直接输出答案。

近期,一种称为关系递归神经网络或关系内存核(relational memory core,RMC)的递归体系结构被开发出来作为LSTM的替代品。这个重复单元有多个记忆槽,它们通过注意力相互作用。

Transformer模型是一个实现机器翻译的最先进结果的序列到序列模型。图2b对其做了简要的描述。该模型由编码器和解码器组成,前者将问题(表示为向量序列)转换为另一个相同长度的序列,后者将编码的问题和答案转换为答案预测。

与序列到序列模型中常见的方法一样,这些模型使用贪婪解码器(每一步输出多数类)自回归地预测答案。通过Adam优化器最小化正确字符的对数概率之和,学习率为6×10-4,β1= 0.9,β2= 0.995,ε= 10-9。 使用批量大小为1024的8个NVIDIA P100 GPU进行500k批次分割,绝对梯度值限幅为0.1。

图3显示了不同结构的平均插值和外推(extrapolation)性能。

图3  模型精度(正确答案的概率)在各个模块之间取平均值。RMC是关系递归神经网络模型。

使用具有多个内存插槽的RMC不会提高性能;也许RMC很难学会使用插槽来操纵数学实体。对于给定数量的隐含单元,RMC的数据效率更高,但训练速度更慢(因为它们有更多的参数),LSTMs具有更好的渐近性能。

Attentional LSTM和Simple LSTM具有相似的性能。有人可能会怀疑Attentional LSTM什么也不做,但事实并非如此,因为与解析LSTM大小相同的Simple LSTM模型获得的性能要差得多。我们推测,注意力模型并没有学习算法解析问题,因此每一步改变注意力焦点的能力并不重要。

对于Attentional LSTM模型,可以观察到,将“思考”步骤的数量从0增加到16,可以提高性能。

Transformer在几乎所有模块上的性能与递归模型相同,或者明显优于递归模型。这两种体系结构具有相当数量的参数。人们可能会预先期望LSTM执行得更好,因为它的顺序体系结构可能更类似于人类执行的顺序推理步骤。然而,实验表明,这两种网络都没有做太多的“算法推理”,并且Transformer相对于LSTM架构具有各种优势,例如:

使用相同数量的参数进行更多计算;

有一个内部连续的“记忆”。

对神经网络来说最简单的数学问题

最简单的问题类型是查找数字中的位值,以及四舍五入小数和整数,所有模型在这些方面都获得了近乎完美的分数。涉及比较的问题也往往相当容易,因为这类任务是相当感性的(例如比较长度或单个数字)。

对神经网络来说最困难的数学问题

也许并不奇怪,一些最难的模块包含了更多的数字理论问题,这些问题对人类来说也很难,比如检测素数和因式分解。

Transformer模型在“加或减几个数字”模块和“乘数或除数”模块的性能为90%或更高。然而,在混合算术模块上,性能下降到大约50%。我们推测这些模块之间的区别在于前者可以在相对线性/浅/平行的方式(因此解决方法通过梯度下降相对容易发现),而没有用括号评估混合算术表达式的快捷方式,其中需要计算中间值。

这证明模型没有学习任何代数/算法操作值,而是学习相对简单的技巧来获得许多模块的良好答案。对于其他需要中间值计算的模块,如多项式求值和一般组合,也是如此。

Transformer和递归模型之间的一个显着差异是多项式操作。Transformer在多项式展开、收集项、加法、组合、微分和提取命名系数方面做得明显更好。从理论上说,Transformer的并行顺序特性更擅长于处理多项式,其中几个系数必须同时保存在内存中,以便相互作用。

}

高中数学解题技巧(精选11篇)

  一般说来,对于题目的熟悉程度,取决于对题目自身结构的认识和理解。从结构上来分析,任何一道解答题,都包含条件和结论(或问题)两个方面。下面是小编分享给大家的高中数学解题技巧的资料,希望大家喜欢!

  高中数学解题技巧 篇1

  (一)、充分联想回忆基本知识和题型:

  按照波利亚的观点,在解决问题之前,我们应充分联想和回忆与原有问题相同或相似的知识点和题型,充分利用相似问题中的方式、方法和结论,从而解决现有的问题。

  (二)、全方位、多角度分析题意:

  对于同一道数学题,常常可以不同的侧面、不同的角度去认识。因此,根据自己的知识和经验,适时调整分析问题的视角,有助于更好地把握题意,找到自己熟悉的解题方向。

  (三)恰当构造辅助元素:

  数学中,同一素材的题目,常常可以有不同的表现形式;条件与结论(或问题)之间,也存在着多种联系方式。因此,恰当构造辅助元素,有助于改变题目的形式,沟通条件与结论(或条件与问题)的内在联系,把陌生题转化为熟悉题。

  数学解题中,构造的辅助元素是多种多样的,常见的有构造图形(点、线、面、体),构造算法,构造多项式,构造方程(组),构造坐标系,构造数列,构造行列式,构造等价性命题,构造反例,构造数学模型等等。

  高中数学解题技巧 篇2

  所谓简单化策略,就是当我们面临的是一道结构复杂、难以入手的题目时,要设法把转化为一道或几道比较简单、易于解答的新题,以便通过对新题的考察,启迪解题思路,以简驭繁,解出原题。

  简单化是熟悉化的补充和发挥。一般说来,我们对于简单问题往往比较熟悉或容易熟悉。

  因此,在实际解题时,这两种策略常常是结合在一起进行的,只是着眼点有所不同而已。

  解题中,实施简单化策略的途径是多方面的,常用的有: 寻求中间环节,分类考察讨论,简化已知条件,恰当分解结论等。

  1、寻求中间环节,挖掘隐含条件:

  在些结构复杂的综合题,就其生成背景而论,大多是由若干比较简单的基本题,经过适当组合抽去中间环节而构成的。

  因此,从题目的因果关系入手,寻求可能的中间环节和隐含条件,把原题分解成一组相互联系的系列题,是实现复杂问题简单化的一条重要途径。

  2、分类考察讨论:

  在些数学题,解题的复杂性,主要在于它的条件、结论(或问题)包含多种不易识别的可能情形。对于这类问题,选择恰当的分类标准,把原题分解成一组并列的简单题,有助于实现复杂问题简单化。

  3、简单化已知条件:

  有些数学题,条件比较抽象、复杂,不太容易入手。这时,不妨简化题中某些已知条件,甚至暂时撇开不顾,先考虑一个简化问题。这样简单化了的问题,对于解答原题,常常能起到穿针引线的作用。

  4、恰当分解结论:

  有些问题,解题的主要困难,来自结论的抽象概括,难以直接和条件联系起来,这时,不妨猜想一下,能否把结论分解为几个比较简单的部分,以便各个击破,解出原题。

  高中数学解题技巧 篇3

  1:调理大脑思绪,提前进入数学情境

  考前要摒弃杂念,排除干扰思绪,使大脑处于“空白”状态,创设数学情境,进而酝酿数学思维,提前进入“角色”,通过清点用具、暗示重要知识和方法、提醒常见解题误区和自己易出现的错误等,进行针对性的自我安慰,从而减轻压力,轻装上阵,稳定情绪、增强信心,使思维单一化、数学化、以平稳自信、积极主动的心态准备应考。

  2:沉着应战,确保旗开得胜,以利振奋精神

  良好的开端是成功的一半,从考试的心理角度来说,这确实是很有道理的,拿到试题后,不要急于求成、立即下手解题,而应通览一遍整套试题,摸透题情,然后稳操一两个易题熟题,让自己产生“旗开得胜”的快意,从而有一个良好的开端,以振奋精神,鼓舞信心,很快进入最佳思维状态,即发挥心理学所谓的“门坎效应”,之后做一题得一题,不断产生正激励,稳拿中低,见机攀高。

  3:“内紧外松”,集中注意,消除焦虑怯场

  集中注意力是考试成功的保证,一定的神经亢奋和紧张,能加速神经联系,有益于积极思维,要使注意力高度集中,思维异常积极,这叫内紧,但紧张程度过重,则会走向反面,形成怯场,产生焦虑,抑制思维,所以又要清醒愉快,放得开,这叫外松。

  4:一“慢”一“快”,相得益彰

  有些考生只知道考场上一味地要快,结果题意未清,条件未全,便急于解答,岂不知欲速则不达,结果是思维受阻或进入死胡同,导致失败。应该说,审题要慢,解答要快。审题是整个解题过程的“基础工程”,题目本身是“怎样解题”的信息源,必须充分搞清题意,综合所有条件,提炼全部线索,形成整体认识,为形成解题思路提供全面可靠的依据。而思路一旦形成,则可尽量快速完成。

  5:“六先六后”,因人因卷制宜

  在通览全卷,将简单题顺手完成的情况下,情绪趋于稳定,情境趋于单一,大脑趋于亢奋,思维趋于积极,之后便是发挥临场解题能力的黄金季节了,这时,考生可依自己的解题习惯和基本功,结合整套试题结构,选择执行“六先六后”的战术原则。

  就是先做简单题,再做综合题,应根据自己的实际,果断跳过啃不动的题目,从易到难,也要注意认真对待每一道题,力求有效,不能走马观花,有难就退,伤害解题情绪。

  通览全卷,可以得到许多有利的积极因素,也会看到一些不利之处,对后者,不要惊慌失措,应想到试题偏难对所有考生也难,通过这种暗示,确保情绪稳定,对全卷整体把握之后,就可实施先熟后生的方法,即先做那些内容掌握比较到家、题型结构比较熟悉、解题思路比较清晰的题目。这样,在拿下熟题的同时,可以使思维流畅、超常发挥,达到拿下中高档题目的目的。

  先做同科同类型的题目,思考比较集中,知识和方法的沟通比较容易,有利于提高单位时间的效益。高考题一般要求较快地进行“兴奋灶”的转移,而“先同后异”,可以避免“兴奋灶”过急、过频的跳跃,从而减轻大脑负担,保持有效精力,

  小题一般是信息量少、运算量小,易于把握,不要轻易放过,应争取在大题之前尽快解决,从而为解决大题赢得时间,创造一个宽松的心理基矗

  近年的高考数学解答题多呈现为多问渐难式的“梯度题”,解答时不必一气审到底,应走一步解决一步,而前面问题的解决又为后面问题准备了思维基础和解题条件,所以要步步为营,由点到面6.先高后低。即在考试的后半段时间,要注重时间效益,如估计两题都会做,则先做高分题;估计两题都不易,则先就高分题实施“分段得分”,以增加在时间不足前提下的得分。

  6:确保运算准确,立足一次成功

  数学高考题的容量在120分钟时间内完成大小26个题,时间很紧张,不允许做大量细致的解后检验,所以要尽量准确运算(关键步骤,力求准确,宁慢勿快),立足一次成功。解题速度是建立在解题准确度基础上,更何况数学题的中间数据常常不但从“数量”上,而且从“性质”上影响着后继各步的解答。所以,在以快为上的前提下,要稳扎稳打,层层有据,步步准确,不能为追求速度而丢掉准确度,甚至丢掉重要的得分步骤,假如速度与准确不可兼得的说,就只好舍快求对了,因为解答不对,再快也无意义。

  7:讲求规范书写,力争既对又全

  考试的又一个特点是以卷面为唯一依据。这就要求不但会而且要对、对且全,全而规范。会而不对,令人惋惜;对而不全,得分不高;表述不规范、字迹不工整又是造成高考数学试卷非智力因素失分的一大方面。因为字迹潦草,会使阅卷老师的第一印象不良,进而使阅卷老师认为考生学习不认真、基本功不过硬、“感情分” 也就相应低了,此所谓心理学上的“光环效应”。“书写要工整,卷面能得分”讲的也正是这个道理。

  8:面对难题,讲究方法,争取得分

  会做的题目当然要力求做对、做全、得满分,而更多的问题是对不能全面完成的题目如何分段得分。下面有两种常用方法。

  对一个疑难问题,确实啃不动时,一个明智的解题方法是:将它划分为一个个子问题或一系列的步骤,先解决问题的一部分,即能解决到什么程度就解决到什么程度,能演算几步就写几步,每进行一步就可得到这一步的分数。如从最初的把文字语言译成符号语言,把条件和目标译成数学表达式,设应用题的未知数,设轨迹题的动点坐标,依题意正确画出图形等,都能得分。还有象完成数学归纳法的第一步,分类讨论,反证法的简单情形等,都能得分。而且可望在上述处理中,从感性到理性,从特殊到一般,从局部到整体,产生顿悟,形成思路,获得解题成功。

  解题过程卡在一中间环节上时,可以承认中间结论,往下推,看能否得到正确结论,如得不出,说明此途径不对,立即否得到正确结论,如得不出,说明此途径不对,立即改变方向,寻找它途;如能得到预期结论,就再回头集中力量攻克这一过渡环节。若因时间限制,中间结论来不及得到证实,就只好跳过这一步,写出后继各步,一直做到底;另外,若题目有两问,第一问做不上,可以第一问为“已知”,完成第二问,这都叫跳步解答。也许后来由于解题的正迁移对中间步骤想起来了,或在时间允许的情况下,经努力而攻下了中间难点,可在相应题尾补上。

  9:以退求进,立足特殊

  发散一般对于一个较一般的问题,若一时不能取得一般思路,可以采取化一般为特殊(如用特殊法解选择题),化抽象为具体,化整体为局部,化参量为常量,化较弱条件为较强条件,等等。总之,退到一个你能够解决的程度上,通过对“特殊”的思考与解决,启发思维,达到对“一般”的解决。

  10:应用性问题思路:面点线

  解决应用性问题,首先要全面调查题意,迅速接受概念,此为“面”;透过冗长叙述,抓住重点词句,提出重点数据,此为“点”;综合联系,提炼关系,依靠数学方法,建立数学模型,此为“线”,如此将应用性问题转化为纯数学问题。当然,求解过程和结果都不能离开实际背景。

  高中数学解题技巧 篇4

  1、解决绝对值问题

  主要包括化简、求值、方程、不等式、函数等题,基本思路是:把含绝对值的问题转化为不含绝对值的问题。

  ①分类讨论法:根据绝对值符号中的数或式子的正、零、负分情况去掉绝对值。

  ②零点分段讨论法:适用于含一个字母的多个绝对值的情况。

  ③两边平方法:适用于两边非负的方程或不等式。

  ④几何意义法:适用于有明显几何意义的情况。

  根据项数选择方法和按照一般步骤是顺利进行因式分解的重要技巧。因式分解的一般步骤是:

  提取公因式;选择用公式;十字相乘法;分组分解法;拆项添项法;

  3、配方法。利用完全平方公式把一个式子或部分化为完全平方式就是配方法,它是数学中的重要方法和技巧。配方法的主要根据有:

  4、换元法。解某些复杂的特型方程要用到“换元法”。换元法解方程的一般步骤是:设元→换元→解元→还元

  5、待定系数法。待定系数法是在已知对象形式的条件下求对象的一种方法。适用于求点的坐标、函数解析式、曲线方程等重要问题的解决。其解题步骤是:①设②列③解④写

  6、复杂代数等式。复杂代数等式型条件的使用技巧:左边化零,右边变形。

  ①因式分解型:(-----)(----)=0两种情况为或型

  7、数学中两个最伟大的解题思路

  (1)求值的思路列欲求值字母的方程或方程组

  (2)求取值范围的思路列欲求范围字母的不等式或不等式组

  8、化简二次根式。基本思路是:把√m化成完全平方式。即:

  (3)适当变形法(和积代入法)

  注意:当求值的代数式是字母的“对称式”时,通常可以化为字母“和与积”的形式,从而用“和积代入法”求值。

  11、解含参方程。方程中除过未知数以外,含有的其它字母叫参数,这种方程叫含参方程。解含参方程一般要用‘分类讨论法’,其原则是:

  (1)按照类型求解

  (2)根据需要讨论

  (3)分类写出结论

  12、恒相等成立的有用条件

  13、恒不等成立的条件。由一元二次不等式解集为R的有关结论容易得到下列恒不等成立的条件:

  14、平移规律。图像的平移规律是研究复杂函数的重要方法。平移规律是:

  15、图像法。讨论函数性质的重要方法是图像法――看图像、得性质。定义域图像在X轴上对应的部分;值域图像在Y轴上对应的部分;单调性从左向右看,连续上升的一段在X轴上对应的区间是增区间;从左向右看,连续下降的一段在X轴上对应的区间是减区间。最值图像点处有值,图像最低点处有最小值;奇偶性关于Y轴对称是偶函数,关于原点对称是奇函数

  16、函数、方程、不等式间的重要关系

}

我要回帖

更多关于 最难高考数学压轴题 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信