机器学习到底在量化金融里哪些方面有应用

点击上方蓝色字体关注。您还可以搜索公众号“D1net”选择关注D1net旗下的各领域(包括云计算,智慧城市,数据中心,大数据,视频会议,视频监控,服务器,存储,虚拟化,软件等)的子公众号。=======问:机器学习(非传统统计方法如回归)到底在量化金融里哪些方面有应用?机器学习和统计很难隔离,这里排除传统统计方法是想知道现代机器学习方法在量化金融的应用,如有困难请忽略此要求。Weicong Liu答:尝试回答一下这个问题,也算是对自己阅读的一些论文的总结,顺带谈下一点自己的思考。前一阵子被吐槽说中英夹杂,也不是为了装逼,因为其实翻译过来,意思反而有了偏差。如果你去搜索早期的神经网络、SVM的相关论文,会发现不少是做股票预测的。原因很简单,因为似乎我们可以天然地把股票投资的问题看成一个分类问题或者回归问题。回归的角度,我们可以根据之前的历史数据,预测下一个时间点的股价;分类的角度,我们可以根据历史数据,预测下一个时间点股价的正负。看起机器学习的方法可以完美适用了。不过这个结论显然是错的,因为如果真的完美适用,那么机器学习的大牛们怕是已经赚发了以致无心学术。那么,问题在哪里?我个人的观点,大家没有太多关注机器学习算法能够work的assumption。以分类问题为例,分类算法能够work的assumption是在同一类下,样本数据应该是i.i.d.的。而股票价格数据特点就是,股票return的correlation极低,noise多,而且不stationary。如果明白了这两点,我们再回过头去看这类文章的思路,就发现了问题。绝大部分文章在提取特征方面基本没下什么功夫,就靠股票的return的信息来构成pattern。这样,因为股票return的不稳定、高噪声、低相关性,使得最终做成的pattern没法满足在同一类的情况下i.i.d的条件,因此,这类方法的失败也是必然的。如果你仔细观察,会发现这类文章喜欢使用IBM啊MSFT啊这样的股票做实验,为什么?因为这种顶级公司股票的价格比较稳定,噪声少,相关性强。不过,近年来已经有一些研究者开始从别的角度思考问题。传统的机器学习方法使用的基本是是股票的日线图和月线图。实际的股票交易大部分是使用limit order book的,一些能够得到数据的研究者,开始思考将机器学习的方法应用于limit order book层次的数据上,典型的论文就是今年新晋的ACM fellow,Michael Kearns在ICML06上发表的Reinforcement learning for optimized trade execution 不同于之前的论文,这篇文章试图为历史数据的每一个时间点构建state,这样可以将增强学习的框架应用其中。这提供了与以前截然不同的思路,不过也并没有从assumption的层面证实文章的方法确实是适应limit order book数据性质的。在种种的失败之后,开始有一些learning领域的研究者认识到,如果想在股票投资的问题上成功,似乎不能够独立于股票数据固有的性质。于是开始有一些方法,试图利用股票数据既有的性质,来设计online learning的算法。典型的是之前NTU计算机系的PhD, Bin Li在ICML,IJCAI的一系列paper。他的核心其实就是抓住了股票的mean reversion的性质。简单的理解,mean reversion认为股票有它自己的隐含价值,股价在这个值附近波动。他的这一系列paper,其实就是在怎么找这个’mean’方面有些许变化。在时间点t,最开始他认为这个mean就是t-1的股价,后来他又认为这个mean是过去一个窗口时间上的均值。这些paper的思路、算法都很简单容易理解,但是包含的思想是前人不曾有过的,就是利用股票数据的性质设计算法,而不是硬将数据往既有的机器学习算法里套。他现在已经凭借这些paper在武大金融系当上了副教授。一家基金公司,通常会同时运行好多种strategy进行投资。这就产生了另外一个问题,应该如何给这些strategy动态地分配权值?机器学习领域有很多类似的问题,比如我要做一个分类问题,我有好多个分类器,如何ensemble它们使得它们的表现比较好?关于多种strategy的权值问题,Das在KDD11的paper,Meta optimization and its application to portfolio selection中有详细的讨论。这类方法被称为Meta-Learning Algorithm。现如今的股票交易已经比几十年前要复杂的多,催生了很多新的交易场所和交易类型。这也给机器学习的专家们很多的机会。典型的例子是Michael Kearns在UAI09年发表的Censored exploration and the dark pool problem。这篇文章是描述暗池交易的,我在另一个回答里也提到过。向某个暗池提交v股的交易量,如果实际成交量小于v,我们知道其容量;而如果实际交易量就是v,则只能知道其实际容量是大于v的。假使在某时刻,我们需要在K个暗池中交易V手股票,我们就需要根据历史数据推断哪些暗池的容量大,在这些暗池里我们就多投入。如果暗池的容量都stochastic的,是不是就是另外一个更复杂的故事了?事实上已经有很多后续的工作来讲述这个故事,不过不是learning界,而来自主流的FE界和OR界。那么learning界最为红火的deep learning在这个问题上是否有所斩获?前一阵子看新闻说,已经有几个人利用deep learning的技术开了家对冲基金公司,赚了很多钱。那么deep learning问题在交易上的作用可能体现在哪里?我自己没事儿也YY过这个问题,我觉得可能是在统计套利方面。最简单的统计套利方法是看股价的correlation,比如A和B两只股票价差一向稳定在10块钱,某天价差突然跌倒5块钱,统计套利就假设,这个价差会恢复到10块钱,那么我们就可以就此设计交易策略。如果股价价差真的恢复了,那么就可以实现套利。但是显然,这样的关系可能不是那么明显地存在于股票的价格中,可能存在于return中或者variance中,甚至更高复杂度的统计量中。deep learning提供了将原数据投影到另一个特征空间中的方法,而且是高度非线性的。那么,原数据中没有体现出来的correlation,会不会在这种高度非线性的投影空间中体现出来呢?如果有体现,是不是能够设计交易策略实现套利呢?这是我自己的一点点思考。(来源:量化与对冲)D1Net大数据商业智能BI(D1Net03) 
 文章为作者独立观点,不代表大不六文章网立场
的最新文章
点击上方蓝色字体关注。您还可以搜索公众号“D1net”选择关注D1net旗下的各领域(云计算,数据中心,大数点击上方蓝色字体关注。您还可以搜索公众号“D1net”选择关注D1net旗下的各领域(云计算,数据中心,大数点击上方蓝色字体关注。您还可以搜索公众号“D1net”选择关注D1net旗下的各领域(云计算,数据中心,大数点击上方蓝色字体关注。您还可以搜索公众号“D1net”选择关注D1net旗下的各领域(云计算,数据中心,大数点击上方蓝色字体关注。您还可以搜索公众号“D1net”选择关注D1net旗下的各领域(云计算,数据中心,大数点击上方蓝色字体关注。您还可以搜索公众号“D1net”选择关注D1net旗下的各领域(云计算,数据中心,大数点击上方蓝色字体关注。您还可以搜索公众号“D1net”选择关注D1net旗下的各领域(云计算,数据中心,大数点击上方蓝色字体关注。您还可以搜索公众号“D1net”选择关注D1net旗下的各领域(云计算,数据中心,大数点击上方蓝色字体关注。您还可以搜索公众号“D1net”选择关注D1net旗下的各领域(云计算,数据中心,大数点击上方蓝色字体关注。您还可以搜索公众号“D1net”选择关注D1net旗下的各领域(云计算,数据中心,大数点击上方蓝色字体关注。您还可以搜索公众号“D1net”选择关注D1net旗下的各领域(云计算,数据中心,大数点击上方蓝色字体关注。您还可以搜索公众号“D1net”选择关注D1net旗下的各领域(云计算,数据中心,大数点击上方蓝色字体关注。您还可以搜索公众号“D1net”选择关注D1net旗下的各领域(云计算,数据中心,大数点击上方蓝色字体关注。您还可以搜索公众号“D1net”选择关注D1net旗下的各领域(云计算,数据中心,大数一、开源成为技术创新主要模式经过多年来的高速发展,大数据相关的数据采集、存储、分析、可视化等多个基础性技术领“十三五”期间,京津冀三地要共同建设大数据综合试验区。记者从《北京市“十三五”时期软件和信息服务业发展规划》8月11日,IBM Watson将使用开放源代码R扩展,目的是给数据科学家提供更多认知计算。ColumbuHadoop管理正在成为大数据用户和供应商首先考虑的分部署处理框架,它在企业的业务运营中中扮演着越来越重要角点击上方蓝色字体关注。您还可以搜索公众号“D1net”选择关注D1net旗下的各领域(云计算,数据中心,大数点击上方蓝色字体关注。您还可以搜索公众号“D1net”选择关注D1net旗下的各领域(云计算,数据中心,大数大数据作为当前产业升级的主要推动力,近些年的重要性已经在逐年上升,国外市场同样如此,大数据技术和战略已经上升点击上方蓝色字体关注。您还可以搜索公众号“D1net”选择关注D1net旗下的各领域(云计算,数据中心,大数点击上方蓝色字体关注。您还可以搜索公众号“D1net”选择关注D1net旗下的各领域(云计算,数据中心,大数点击上方蓝色字体关注。您还可以搜索公众号“D1net”选择关注D1net旗下的各领域(云计算,数据中心,大数如《大数据时代》作者迈尔舍恩伯格所说:“大数据正在改变我们的生活以及理解世界的方式,成为新发明和新服务的源泉数据可视化可以将分析数据转化为可操作的业务信息。但行业专家提醒,这需要让事情变得容易理解和记忆。数据可视化软点击上方蓝色字体关注。您还可以搜索公众号“D1net”选择关注D1net旗下的各领域(云计算,数据中心,大数点击上方蓝色字体关注。您还可以搜索公众号“D1net”选择关注D1net旗下的各领域(云计算,数据中心,大数据《印度教徒报》6月1日报道,中国西南部新建了一块工业园区,这里是印度国家信息技术研究所(简称NIIT)中国点击上方蓝色字体关注。您还可以搜索公众号“D1net”选择关注D1net旗下的各领域(云计算,数据中心,大数点击上方蓝色字体关注。您还可以搜索公众号“D1net”选择关注D1net旗下的各领域(云计算,数据中心,大数6月6日上午消息,大数据反欺诈公司Maxent行邑科技今日宣布已于年初完成数千万元A轮融资,投资方为祥峰资本。日前,在行业媒体安排的问答环节中,杰弗里·里特人们对大数据情报的追求将会驱使信息治理专业人士超越GRC的管控进行了探讨。大数据并只是大企业的使用专利。各种规模的企业可以利用大数据集和先进分析的能力,以获得推动未来的商业机会所需的洞察力。点击上方蓝色字体关注。您还可以搜索公众号“D1net”选择关注D1net旗下的各领域(云计算,数据中心,大数点击上方蓝色字体关注。您还可以搜索公众号“D1net”选择关注D1net旗下的各领域(云计算,数据中心,大数随着各行各业的迅速发展,大数据铺天盖地而来。通过简单的观察人们很难从浩如烟海的数据中发现潜在的规律、挖掘数据企业产生和收集的数据量日渐增长,随之而来的是对这些数据进行集成需求的增长,可以帮助IT团队简化并管理这一流程的数据集成软件应运而生。虽然构成Hadoop生态系统堆栈均为开源技术,但是为使用商业Hadoop平台而支付一定的订阅费用还是大有裨益通过应用工业大数据,广东制造业企业实现了商业模式转型近日,《广东省促进大数据发展行动计划(在过去的半个世纪中,数据管理已经成为大部分IT商业价值的助产师。在大约二十年前的日,当NiD1Net03企业网D1Net-国内最精准专业的企业IT媒体。涵盖:云计算;智慧城市;数据中心;大数据;物联网;BYOD;企业移动应用;服务器;存储;虚拟化;安全;企业应用软件;UC协作;视频会议;视频监控;呼叫中心;运营商企业业务;IT咨询;渠道等。热门文章最新文章D1Net03企业网D1Net-国内最精准专业的企业IT媒体。涵盖:云计算;智慧城市;数据中心;大数据;物联网;BYOD;企业移动应用;服务器;存储;虚拟化;安全;企业应用软件;UC协作;视频会议;视频监控;呼叫中心;运营商企业业务;IT咨询;渠道等。机器学习在量化投资中的应用:从技术分析谈起 - 推酷
机器学习在量化投资中的应用:从技术分析谈起
作者:Weicong Liu
前言:最近特别忙,写毕业论文,找工作,忙得不亦乐乎。硕士两年来做的一些工作,导师没有让我往毕业论文里面写,我感觉到,这两年的一些经验以及所思所想,可能没有办法写成正式的文章了,特别可惜。所以我决定开一个知乎专栏,把自己的一些思考拿出来与大家分享。我从来没有将机器学习应用在量化投资的实战经验(其实我神马实战经验也没有。。),但是读过相当数量的相关论文。很多论文,如许多网友所喷,“这玩意儿根本不work”。说实话,我也知道这些论文不work。但是“不work”并不代表“没用”。一篇文章里,能有一个闪光的思想,对真实投资有一些借鉴价值,我觉得这篇文章就是“有用”的。而所谓的“不work”,是指把这篇文章的方法应用于真实投资,没法赚钱。这是废话,能赚钱,我发出来给你看?我始终认为,看出一篇文章“不work”,并不需要什么水平,而能从这篇“不work”的文章中,找到有用的信息的人,才是真大神。所以我希望大家能以一个欣赏的眼光去看待这个专栏里的文章(好吧,其实我只是想少挨点儿喷。。)。我将把我在这个问题 机器学习(非传统统计方法如回归)到底在量化金融里哪些方面有应用? – Weicong Liu 的回答下的回答 ,一条条拓展出来,细致地写。水平有限,错误难免。废话到此为止,希望我能把这个专栏坚持下去:)
在这篇文章里,我想讲的,是那些将技术分析和机器学习算法相结合的论文。首先,我会简要介绍一个最常用的技术分析方法:双移动平均线法。然后,我将简要介绍一下相关的论文。本文的重头戏是,我想跟大家一起,发现这些方法的问题,逐步把这些方法变成一个“看起来还蛮像样”的投资策略。我首先声明,这个方法是否work我也不知道,因为我没有细致地尝试。我想展示的,是一个思考问题的思路。
1 移动平均线法
下图展示了一个双移动平均线的例子。
双移动平均线的用法是:
(1)用两个长度不同的窗口,计算价格数据的移动平均值;
(2)当短的移动平均值穿过长移动平均值时,一个买入信号就诞生了。随着时间的推移,当短的移动平均值小于长的移动平均值时,就产生了一个卖出信号。
这个方法是如此的简单方便,很多散户都会或多或少地使用该方法。学术界对这个方法亦有很大的兴趣。文献[1]首先从假设检验的角度,去验证这个方法在实际数据上的盈利能力。而后有很多论文利用这篇文章中提供的方法,在不同的数据集上验证。他们的结果都表明,长期来看,如果不考虑交易费的话,这个方法貌似还有一点点的盈利能力,但是如果一点考虑交易费,这个能力就基本为0了。
2 移动平均与机器学习算法
那么,这样一个简单的移动平均的方法,是怎么被应用在机器学习算法中,进行投资的呢?千万不要小看研究人员的脑洞(不过这似乎也不需要太大的脑洞)。
让我们随手从机器学习的武器库里面挑个武器吧。恩,就神经网络好了,这玩意儿最近很火。要很深吗?咱们先用个浅的玩玩吧。我们需要给自己设定一个目标,这个目标是,我希望通过历史数据值,预测第二天的股价涨跌。有了这个目标,我们干脆把神经网络当成一个分类器用。在每一天t,我都基于历史数据,建立一个输入向量x_t。看,机会来了,我们可以把移动平均线产生的信号,当成这个特征向量的某个维度。如果移动平均线让我们在某天持有该股票,那么我们可以把这个维度设为1;而在其他的天数,我们则把它设为0。
除了移动平均线,股票的技术分析手段中还有好多可以产生类似信号的东西,比如MACD,RSI之类。所以,我们可以利用这些信号,把它们安放在不同的维度,构成我们输入向量x_t。标签y_t就容易了,如果t+1天收益率为正,则设为1,否则为0。至此,一个二分类问题的训练集构建,就搞定了。
这个方法看起来很简单,也确实没啥难想的。相关的文献不少,可以看参考文献[2, 3, 4]。在那个年代,这些文章都取得了相当的引用量。
3 问题与改进
显然,这样的方法是存在问题的。而且看起来图样图森破,甚至有点儿naive。在这一节,我们将一步一步,把这个方法变的“看起来还蛮像样”。
3.1 趋势的表示
使用技术分析手段的人,被认为是趋势跟随型的投资者(可能有误。。)。这些论文里面也声称,他们希望通过神经网络来预测趋势。但是,趋势就是明天股票收益的正负吗?让我们来看个例子。下图是我截取的苹果公司从日,到日的股价。这是一个非常明显的上升趋势。但是,在这个趋势中,日收益率为正的比率是多大?答案是只有55%。所以你看,把第二天股票收益率的正负当成趋势的表征,并不靠谱。
那么,能不能换一个靠谱一点儿的方式来表达趋势?也就是表达y_t?当然可以。一个简单的方法是,我们可以把计算t+1,t+2,…,t+N,这些天收益的平均值,观察其正负,构建新的y_t(正则1,否则置0)。当然,N是一个可以由你设置的量。
3.2 更进一步
经过上一步的改进,这个方法好像似乎有点儿像样了。我们来理一下思路。我们是怎么来解决这个问题的呢?步骤如下:(1)大喊一声“我要做趋势投资者”,(2)找到那些声称表征趋势的技术指标,构成输入向量x_t,(3)为这些向量配备一个表征趋势正负的y_t,(4)扔进一个神经网络训练,(5)利用训练好的神经网络预测。
还是有点儿naive,我们甚至都没用到神马金融上的概念。在3.1节的结尾,我们说要用t+1,t+2,…,t+N,这些天的收益的平均值,观其正负,来构建y_t。这似乎比较靠谱了。但是细细一想,假如这些天收益的平均值为0.02,但是标准差达到了0.04,我们这么做似乎有点儿慌。而如果这些天的收益平均值是0.01,但是标准差只有0.005,似乎这么做还是靠谱的。这就提醒我们,作为一个趋势投资者,在动荡里,我们如浮萍一般无依(当然,动荡则是另外一些交易者发家致富的机会)。我们构建y_t的时候,不能只去想收益的平均值,还要考虑它的波动。
有了这个概念,我们就可以重新思考下y_t的设定。我们将t+1,t+2,…,t+N这些天收益的平均值记为r_t,而标准差记为sigma_t。我们考虑这样一个量r_t – lambda * sigma_t的正负。这里,lambda是一个事先设定的常量,它有一个比较好的金融角度的意义:它体现了投资者对风险的厌恶程度。Lambda越大,厌恶性越强。
当然,你可能觉得这个波动率估计的太不准了。不是有个拿诺奖的工作,(G)ARCH,用来估算波动率的嘛。你也许也可以用它替代sigma_t。
3.3 再进一步
到此为止,我知道,你肯定还不满足。现在这个方法看起来还是有点儿naive,一个分类问题,有啥了不起?好吧,那我们跳出分类问题的框框吧。
我们已经有了x_t,也知道,对于每一天,我们有两种选择,即持有这只股票还是不持有(在我们之前的讨论里,并不允许做空,所以只有这两种)。让我们给x_t换个名字,叫它“状态”(state),而把两种投资的选择,叫做动作(action)。你大概已经看出来了,我在往增强学习的框架里面靠。既然是增强学习,那么我们还得定义一个回报(reward),恩,这是现成的嘛,r_t – lambda * sigma_t。
于是,我们就这样慢慢YY出了一个基于增强学习的量化投资方法。很巧,以前已经有人做过很类似的工作了,请参看[5]。
在这篇文章里,我们从前人看似naive的方法,一步一步地推进,搞出了一个“看起来还蛮像样”的投资策略。这个方法直接去用,估计是要失败的。如果你够细致,会发现我一直在做y_t的文章。也许y_t的文章已经做得差不多了,但是x_t怎么办?就用那些技术指标?或许,只有那些真正在实践中成功运用了机器学习方法的人,才拥有好的x_t吧。
[1] Brock, William, Josef Lakonishok, and Blake LeBaron. “Simple technical trading rules and the stochastic properties of stock returns.” Journal of finance (1992): .
[2] Gencay, Ramazan. “Non-linear prediction of security returns with moving average rules.” Journal of Forecasting 15.3 (1996): 165-174.
[3] Franses, Philip Hans, and Kasper van Griensven. “Forecasting exchange rates using neural networks for technical trading rules.” Studies in Nonlinear Dynamics & Econometrics 2.4 (1998).
[4] Shambora, William E., and Rosemary Rossiter. “Are there exploitable inefficiencies in the futures market for oil?.” Energy Economics 29.1 (2007): 18-27.
[5] Li, Jian, and Laiwan Chan. “Reward Adjustment Reinforcement Learning for Risk-averse Asset Allocation.” Neural Networks, 2006. IJCNN’06. International Joint Conference on. IEEE, 2006.
已发表评论数()
请填写推刊名
描述不能大于100个字符!
权限设置: 公开
仅自己可见
正文不准确
标题不准确
排版有问题
主题不准确
没有分页内容
图片无法显示
视频无法显示
与原文不一致机器学习在量化投资中的应用研究_百度百科
机器学习在量化投资中的应用研究
《在中的应用研究书名》是国内少有的研究机器学习在量化投资中应用的专著。主要运用多层感知器神经网络、广义自回归、与支持向量机对证券时间序列进行回归分析。特别是在支持向量机框架下构造了小波、流形小波与样条小波三种核函数,并在此基础上建立了股指收益与波动预测两类新的量化投资模型。与经典高斯核相比,具备多分辨分析特性的新模型能较好地捕捉曲线性状,各预测指标在模拟数据与真实数据上均占优,表明其具有良好的适用性与有效性。[1]
机器学习在量化投资中的应用研究图书信息
量化投资与对冲基金丛书
机器学习在量化投资中的应用研究(国内少有的研究机器学习在量化投资中应用的专著。)
ISBN 978-7-121-24494-0
2014年11月出版
定价:59.00元
机器学习在量化投资中的应用研究编辑推荐
本书是国内少有的研究机器学习在量化投资中应用的专著。主要运用多层感知器神经网络、广义自回归神经网络、模糊神经网络与支持向量机对证券时间序列进行回归分析。特别是在支持向量机框架下构造了小波、流形小波与样条小波三种核函数,并在此基础上建立了股指收益与波动预测两类新的量化投资模型。本书可供计算机、信息管理与金融类专业高年级本科生与研究生使用,也可供从事机器学习技术与应用研究的科研人员、金融市场数据分析人员以及机器学习软件开发人员参考。
机器学习在量化投资中的应用研究内容提要
《机器学习在量化投资中的应用研究书名》是国内少有的研究机器学习在量化投资中应用的专著。主要运用多层感知器神经网络、广义自回归神经网络、模糊神经网络与支持向量机对证券时间序列进行回归分析。特别是在支持向量机框架下构造了小波、流形小波与样条小波三种核函数,并在此基础上建立了股指收益与波动预测两类新的量化投资模型。与经典高斯核相比,具备多分辨分析特性的新模型能较好地捕捉曲线性状,各预测指标在模拟数据与真实数据上均占优,表明其具有良好的适用性与有效性。
机器学习在量化投资中的应用研究目录
第1章 绪论 1
1.1 背景与意义 1
1.2 国内外研究现状 3
1.2.1 金融时间序列方法 3
1.2.2 机器学习方法 6
1.2.3 小波与流形方法 10
1.3 本书主要内容与逻辑结构 15
1.3.1 内容安排 15
1.3.2 逻辑结构 17
第2章 统计学习与机器学习 19
2.1 计算学习理论 19
2.1.1 学习问题表述 19
2.1.2 统计学习理论 21
2.1.3 可能近似正确学习模型 22
2.2 神经网络模型 23
2.2.1 多层感知器神经网络模型 23
2.2.2 广义回归神经网络模型 26
2.3 支持向量机理论 28
2.3.1 线性支持向量分类机 29
2.3.2 非线性支持向量分类机 31
2.3.3 支持向量回归机 33
2.4 本章小结 34
第3章 基于模糊神经网络的股票预测模型分析 35
3.1 引言 35
3.2 模糊神经网络模型研究 36
3.2.1 模糊逻辑推理系统结构 36
3.2.2 模糊神经网络分类器 37
3.2.3 模糊神经网络回归机 38
3.3 基于模糊神经网络的股票预测 40
3.3.1 模糊神经网络设计 40
3.3.2 实验结果与分析 42
3.4 本章小结 43
第4章 基于高斯核支持向量机的股票预测模型分析 44
4.1 引言 44
4.2 核函数研究 45
4.2.1 核的构造条件 45
4.2.2 核的构造原则 46
4.2.3 核的主要类型 49
4.3 基于高斯核支持向量机的股票预测 52
4.3.1 数据处理与性能指标 52
4.3.2 实验结果与分析 53
4.4 本章小结 57
第5章 基于小波支持向量机的股票收益模型分析 58
5.1 引言 58
5.2 股票收益的理论研究 59
5.2.1 有效市场假说与布朗运动模型 59
5.2.2 分形市场假说与分数布朗运动模型 61
5.2.3 Hurst指数与重标极差分析 62
5.2.4 混沌动力学模型与Lyapunov指数 64
5.3 基于小波支持向量机的收益模型 65
5.3.1 小波变换与多分辨分析 66
5.3.2 小波核构造与证明 68
5.3.3 实验结果与分析 70
5.4 本章小结 77
第6章 基于小波支持向量机的波动模型分析 79
6.1 引言 79
6.2 波动率模型研究 79
6.2.1 ARCH模型 80
6.2.2 GARCH模型 81
6.2.3 随机波动SV模型 82
6.3 基于小波支持向量机的GARCH模型 84
6.3.1 仿真实验 84
6.3.2 真实数据集实验 86
6.4 本章小结 95
第7章 基于流形小波核的收益序列分析 96
7.1 引言 96
7.2 微分几何基本理论 96
7.3 核函数的几何解释 100
7.4 构造融合先验知识的流形小波核 101
7.5 实验结果与分析 102
7.6 本章小结 107
第8章 基于样条小波核的波动序列分析 108
8.1 引言 108
8.2 样条小波模型研究 108
8.3 样条空间与函数 110
8.3.1 样条函数空间 110
8.3.2 B样条函数定义与性质 112
8.4 样条小波核构造与证明 113
8.5 实验结果与分析 115
8.6 本章小结 119
第9章 结论与展望 120
9.1 本书主要贡献 120
9.2 后续研究展望 122
附录A 微积分 124
A.1 基本定义 124
A.2 梯度和Hesse矩阵 126
A.3 方向导数 126
A.4 Taylor展开式 128
A.5 分离定理 129
附录B Hilbert空间 131
B.1 向量空间 131
B.2 内积空间 134
B.3 Hilbert空间 136
B.4 算子、特征值和特征向量 138
附录C 专题研究期间学术论文与科研项目 140
参考文献 144
机器学习在量化投资中的应用研究前言
诺贝尔经济学奖得主罗伯特·默顿(Robert Merton)认为现代金融理论由资金的时间价值、资产定价与风险管理三大支柱构成,其核心问题就是如何在不确定的环境下对资源进行跨期的最优配置。基于这一理解,斯坦利·R·普利斯卡从整个数理金融领域归纳出了随机过程与随机控制两类基本模型。显然,前者是后者的前提与基础。因而,作为离散随机过程的金融时间序列必然是金融模型研究的基石与关键。同时,鉴于股指收益序列与波动率序列在投资组合和风险规避中的重要作用,本书拟围绕其展开研究。
与传统统计学相比,统计学习理论(Statistical Learning Theory,SLT)是一种专门研究小样本情况下机器学习规律的新型理论。该理论针对小样本统计问题建立了一套全新的理论体系,其统计推理规则不仅考虑了对渐近性能的要求,而且追求在现有有限信息的条件下得到最优结果。因此,本书拟基于统计学习理论,以机器学习为工具,进行股指收益序列与波动率序列的建模研究。
本书讨论了模糊神经网络在股价预测中的应用。模糊神经网络克服模糊规则产生对专家的依赖性及模糊集的非自适应性,隶属函数的自适应和模糊规则的自组织通过神经网络的自学习和竞争获得。通过一个股价预测实例验证了该方法的有效性。接着,本书将支持向量回归机这一新型神经网络应用于收益序列预测的回归分析,力求在克服数据过拟合现象的基础上寻找问题的全局最优解。通过交叉验证选择学习参数。实验表明基于二次规划与核函数理论的高斯核函数支持向量回归机能准确捕捉动态股票收益序列的波形特征,其预测性能与多层感知器以及广义回归神经网络进行比较,具有较为明显的优势。
基于小波理论,本书提出了小波核的一种新型构造方法。用高维母小波函数直接生成小波框架,通过缩放与平移产生平方可积空间中的一个完备基,从而构造出满足Mercer条件的小波核函数。该核在理论上具有任意逼近平方可积空间中目标函数的优点。实验表明与高斯等核函数相比具有多分辨率特性的小波核确实能较好地逼近目标函数。
基于流形理论,本书提出了一种新的流形小波核。该核借鉴了Amari 提出的依据数据流形几何特征修改核函数进而增进分类性能的思想方法,通过缩减超平面附近的黎曼距离处理回归问题。该核具有融入支持向量数据依赖知识的优点。实验表明流形小波核能比高斯等核函数更好地捕捉曲线性状。
基于样条理论,本书提出了一种新的样条小波核。用一维样条母小波通过平移与缩放产生一维样条小波核函数,接着依据乘法原理,生成高维样条小波核函数。该核具有函数形式简单与支集小等优点。实验表明样条小波核解析波动特征的能力比高斯等核函数要强。
针对金融时间序列自身的高噪声、动态与混沌等特性,本书提出了新型小波支持向量机-股价动力学模型。该模型具有所需样本小、泛化性能好、全局最优与高容噪性等优点。与高斯等核函数相比,其多分辨特性使得该模型各主要预测性能指标在模拟数据与真实股指数据实验中占优,因而能较好地分析股指收益。
针对波动率序列高峰、厚尾与长效依赖等特性,本书提出了新型小波支持向量机-广义自回归条件异方差模型。该模型同样具有所需样本小、泛化性能好、全局最优与高容噪性等优点。借助采用多尺度分析核的小波支持向量机能有效捕捉波动率的聚集特性,从而对股指波动进行较为准确的预测。通过模拟实验与真实股指数据分析,该模型在波动率分析中的适用性与有效性获得了证实。
本书可供计算机、信息管理与金融类专业高年级本科生与研究生使用,也可供从事机器学习技术与应用研究的科研人员、金融市场数据分析人员以及机器学习软件开发人员参考。
.豆瓣读书[引用日期]
汤凌冰.机器学习在量化投资中的应用研究:电子工业出版社,2014年
企业信用信息}

我要回帖

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信