美国基金用什么模型预测股票预测模型价格

基于AR模型的Kalman滤波在股票价格预测中的应用--《统计与决策》2013年06期
基于AR模型的Kalman滤波在股票价格预测中的应用
【摘要】:文章在分析AR(n)模型和Kalman滤波模型具有的预测功能的基础上,将二者结合起来而提出一种基于AR模型的卡尔曼滤波模型。该模型用1至n阶的AR模型组合建立新的多维状态空间模型,再应用Kal man滤波方法预测股票价格。通过对股票价格预测的具体实验表明,提出的新模型克服了单一方法使用的缺点,具有较高的预测精度。
【作者单位】:
【关键词】:
【基金】:
【分类号】:F224;F830.91【正文快照】:
0引言由于股票市场相当复杂,且易受金融政策、政治形势等商业和非商业因素影响,经过多年研究人们提出了许多股票市场预测方法。常见的有神经网络预测法、经济计量法、灰色模型预测法、时间序列分析法[1]等。仅使用一种方法往往具有片面性[2],因此运用多种方法进行组合,利用多
欢迎:、、)
支持CAJ、PDF文件格式,仅支持PDF格式
【参考文献】
中国期刊全文数据库
许长龙;蔡世民;周佩玲;;[J];计算机工程;2009年10期
唐春艳,彭继兵,邓永辉;[J];计算机仿真;2005年09期
李春兴;白建东;;[J];青岛理工大学学报;2008年02期
陆付民;;[J];数学的实践与认识;2007年19期
中国硕士学位论文全文数据库
陈阳;[D];哈尔滨工程大学;2007年
【共引文献】
中国期刊全文数据库
许燕;张国生;;[J];北京印刷学院学报;2010年06期
雷开洪;游庆山;;[J];制造业自动化;2010年05期
赵新秀;王解先;;[J];全球定位系统;2009年05期
赵文举;马孝义;李军利;张建兴;;[J];数学的实践与认识;2008年18期
边俊民;;[J];时代金融;2010年08期
中国硕士学位论文全文数据库
陈政;[D];暨南大学;2011年
蔡国成;[D];杭州电子科技大学;2009年
范雯;[D];西安科技大学;2011年
黄巧玲;[D];华侨大学;2007年
郭静雯;[D];广州大学;2007年
邵航;[D];暨南大学;2008年
袁捷;[D];西南交通大学;2009年
邹润芳;[D];上海交通大学;2009年
赵利锋;[D];广州大学;2009年
孙宇轩;[D];北京交通大学;2010年
【二级参考文献】
中国期刊全文数据库
吴定洪;[J];大坝观测与土工测试;1995年03期
常松,何建敏;[J];东南大学学报(自然科学版);2001年05期
李春生;[J];纺织高校基础科学学报;2003年01期
郭原,郭文扬;[J];干旱环境监测;1994年03期
丁雪梅,伦立军,高为;[J];哈尔滨商业大学学报(自然科学版);2003年06期
王光强;周佩玲;;[J];计算机工程;2006年01期
苏占东,游福成,杨炳儒;[J];计算机应用;2004年10期
林先澄,李凡;[J];计算机与数字工程;2003年05期
梁夏;[J];计算机应用研究;1999年01期
张丕一;;[J];青岛理工大学学报;2006年05期
中国硕士学位论文全文数据库
丁咏梅;[D];华中科技大学;2005年
【相似文献】
中国期刊全文数据库
王宏勇;马丽;;[J];统计与决策;2009年16期
廉新宇;吴立锋;;[J];商场现代化;2006年29期
阎长俊;[J];沈阳建筑工程学院学报;1997年04期
韩文蕾,王万诚;[J];计算机应用与软件;2005年11期
吕谋,赵洪宾,李红卫,王常明;[J];系统工程理论与实践;1998年08期
盛梅,邹云;[J];南京理工大学学报(自然科学版);2004年02期
张喆;曹旭;马少仙;;[J];甘肃联合大学学报(自然科学版);2011年03期
李民,邹捷中,李俊平,梁建武;[J];长沙铁道学院学报;2000年01期
邵丽娜;;[J];农村经济与科技;2007年12期
曹韫建;[J];中国管理科学;1998年01期
中国重要会议论文全文数据库
梁循;陈华;杨健;曾月卿;;[A];第八届中国管理科学学术年会论文集[C];2006年
芮秀;;[A];1998中国控制与决策学术年会论文集[C];1998年
赵艳桃;崔梅萍;;[A];2004中国控制与决策学术年会论文集[C];2004年
万玉成;;[A];第四届中国不确定系统年会论文集[C];2006年
朱宁;徐标;李建军;;[A];第八届中国青年运筹信息管理学者大会论文集[C];2006年
应保胜;容芷君;;[A];2005年十二省区市机械工程学会学术年会论文集(湖北专集)[C];2005年
许海平;傅国华;;[A];热带作物产业带建设规划研讨会——天然橡胶产业发展论文集[C];2006年
吕剑;荐利荣;;[A];第16届全国灰色系统学术会议论文集[C];2008年
金成晓;王均恒;;[A];第五届国有经济论坛“海峡两岸企业改革与重组”学术研讨会论文集[C];2005年
高齐圣;潘德惠;;[A];发展的信息技术对管理的挑战——99’管理科学学术会议专辑(上)[C];1999年
中国重要报纸全文数据库
海通期货研究所;[N];期货日报;2009年
中国博士学位论文全文数据库
李嵩松;[D];哈尔滨工业大学;2011年
武征;[D];吉林大学;2008年
管卫华;[D];南京师范大学;2005年
万玉成;[D];东南大学;2004年
马玖军;[D];哈尔滨工程大学;2006年
李湘梅;[D];华中科技大学;2007年
付剑茹;[D];华中科技大学;2009年
赵娟;[D];四川大学;2002年
唐建伟;[D];复旦大学;2004年
侯迎春;[D];对外经济贸易大学;2007年
中国硕士学位论文全文数据库
舒俊;[D];华中科技大学;2005年
王铁媛;[D];内蒙古工业大学;2005年
王浩;[D];西南交通大学;2005年
段新玉;[D];暨南大学;2005年
刘伟;[D];中国地质大学(北京);2006年
贾非;[D];吉林大学;2006年
廖为鲲;[D];江苏大学;2006年
张兰萍;[D];暨南大学;2006年
密长林;[D];天津大学;2006年
国琳;[D];天津大学;2006年
&快捷付款方式
&订购知网充值卡
400-819-9993
《中国学术期刊(光盘版)》电子杂志社有限公司
同方知网数字出版技术股份有限公司
地址:北京清华大学 84-48信箱 知识超市公司
出版物经营许可证 新出发京批字第直0595号
订购热线:400-819-82499
服务热线:010--
在线咨询:
传真:010-
京公网安备75号常用的对冲套利策略_百度文库
两大类热门资源免费畅读
续费一年阅读会员,立省24元!
常用的对冲套利策略
上传于||文档简介
&&对​冲​基​金
阅读已结束,如果下载本文需要使用0下载券
想免费下载更多文档?
下载文档到电脑,查找使用更方便
还剩3页未读,继续阅读
你可能喜欢Twitter 能否预测股市?
| 科学人 | 果壳网 科技有意思
Twitter 能否预测股市?
本文作者:Lithium42
今年5月,世界首家基于社交媒体的对冲基金 Derwent Capital Markets 在屡次跳票后终于上线。它会即时关注 Twitter 中的公众情绪指导投资。正如基金创始人保罗o郝汀(Paul Hawtin)表示:“长期以来,投资者已经广泛地认可金融市场由恐惧和贪婪驱使,但我们从未拥有一种技术或数据来量化人们的情感。”一直为金融市场非理性举动所困惑的投资者,终于有了一扇可以了解心灵世界的窗户——那便是 Twitter 每天浩如烟海的推文[1]。
小试牛刀,成果斐然
尽管针对公众情绪的调查耗时耗力,仍有一些研究另辟蹊径,揭示出情绪与股市关联中的冰山一角。对39个国家的调查表明,当在如世界杯、欧洲杯的国际球赛中输球时,当地的股价指数会受到显著的负面影响[2]。天气变化也会波及股市。给一点阳光,股票收益率便会和人们的心情一样灿烂[3]。
美国印第安纳大学的约翰o博伦(Johan Bollen)等人[4],则将目光投向了新兴的社交网络 Twitter。这个反映公众情绪的绝佳晴雨表,在预测电影票房、选举结果等方面,都有不俗的表现。研究者采用了两种情绪追踪工具。一种是开源工具OpinionFinder,能将推文二分为正面和负面情绪;另一种则是研究者在临床上使用的情绪状态量表(POMS)基础上,新开发出的情绪测试工具GPOMS。它能将公众的情绪分为冷静、警惕、确信、活力、友善和幸福这六个类别。
为了验证两个工具的准确性,研究者将公众情绪和社会事件对比,结果十分吻合。例如,在总统大选日(日)期间,Twitter 在大选日前一天开始紧张,在大选日当天变得冷静、活力、友善、幸福,总体情绪在大选日后又回归平常。在感恩节(11月28日)当天,整个 Twitter 洋溢着浓浓的幸福味道,过后又恢复正常。
而最令人激动的是,将“冷静”情绪指数后移3天,竟然和道琼斯工业平均指数惊人一致。其他情绪则没有这样的效果。另外,研究者还测试了一个称为SOFNN的股市预测模型。当仅输入股市数据时,模型已经有73.3%的准确率;加入“冷静”的情感信息后,准确率更升至86.7%。
但是,Twitter 情绪指标,仍然不可能预测出会冲击金融市场的突发事件。例如,在号,美国联邦储备委员会突然启动一项银行纾困计划,令道琼斯指数反弹,而3天前的Twitter冷静指数自然毫无征兆。而且,研究者自己也意识到,Twitter 用户与股市投资者并不完全重合,这样的样本代表性有待商榷。
公众情绪中的冷静指数(红线)后移3天和道琼斯工业指数(蓝线)能够很好的匹配。这种一致性在灰色区域尤其显著,而在白色区域不尽如人意。
深入挖掘,仍有收获
博伦的研究,也启发着更多研究者对于社交网络进一步地探讨。麻省理工学院的张雪(音译)等人[6],根据情绪词将推文标定为正面或负面情绪。结果发现,无论是如“希望”的正面情绪,或是“害怕”、“担心”的负面情绪,其占总推文数的比例,都预示着道琼斯指数、标准普尔500指数、纳斯达克指数的下跌。研究者据此认为,只要是情绪的突然爆发,无论希望或担忧,都反映出人们对于市场的不确定性,因此能预测股市之后的走向。
慕尼黑工业大学的两位学者对 Twitter 进行了更为细致的分析[5]。他们筛选出提到标准普尔100指数中的公司的推文(比如 $AAPL 代表苹果公司),分为 “买入”、“持有”或“卖出”三类,并算出每支股票的看涨程度。结果同样鼓舞人心。例如,推文的总数和交易量,看涨程度和标准普尔100指数之间,都有密切相关。更具操作意义的是,如果投资者采取“买入”看涨程度最高的3支股票,“卖出”最低3支的策略,半年便有高达15%的收益。
美国佩斯大学的博士生亚瑟o奥康纳(Arthur O’Connor)[7],则采用了另外一种思路。他追踪了星巴克、可口可乐和耐克三家公司在社交媒体上的受欢迎程度,同时比较它们的股价。他发现,Facebook上的粉丝数、Twitter 上的听众数和 Youtude 上的观看人数,都和股价密切相关。品牌的受欢迎程度,还能预测股价在10天、30天之后的上涨情况。
品牌在社交媒体上的受欢迎程度,能够预测它们在股市中的表现。图片来自
这样前瞻性的尝试,自然会招来反对的声音。特许财务分析师(CFA)协会创新与新兴媒体主管莱恩o科斯塔(Len Costa)虽然态度温和,但仍不赞成 Twitter 情绪指数的滥用:“对于严肃的专业投资者来说,在作出投资决定时,没有什么可以替代合理的审慎、独立的专业判断和由适当的研究与调查支持的基础。”[8]
美国圣母大学的研究者则对情绪分析的基础提出质疑。他们发现在语义分析中广泛使用的哈佛心理社会学词典中,近3/4被归为“负面”的词汇,在金融领域中并无情感判断[9]。例如vice(邪恶)、tire(疲劳)、crude(粗鲁的),可能仅仅是vice-president(副总裁)、tire(轮胎)和crude oil(原油)。
然而,这一切反对声音,似乎都无法阻止投资者对于新兴的社交网络倾注更多的热情(希望他们对果壳网也如此)。一份八月份的报道显示,利用 Twitter 的对冲基金 Derwent Capital Markets 在首月的交易中确实盈利了。它以1.85%的收益率,让平均数只有0.76%的其他对冲基金相形见绌[10]。
这是最好的时代。在5亿用户的 Facebook,2亿用户的 Twitter 构筑的社交网络帝国中,似乎一切皆有可能,每天都让人期待。这是最坏的时代。谣言共真相一色,吹捧与贬低齐飞。我们每一个人都身处于社交网络之中,当你正在阅读果壳网这篇文章时尤其如此,而我们却不知道它最终会将我们引向何方。
(hedge fund)】是指由金融期货(financial futures)和金融期权(financial option)等金融衍生工具(financial derivatives)与金融组织结合后,高风险投机为手段而以盈利为目的的金融基金
】原本为金融用语,指因为支票帐户内没有钱,银行无法兑现支票,遂把此空头支票寄还给支票持有人的行为。“跳票”之后,开此空头支票的人只会受到罚款。现在也指无法在原定发售日推出的产品都可说是跳了票,有“延期发行”的意思。现在跳票通俗说就是本来公布了某天要做什么,但是一直没有做。
】标准普尔指数是美国最大的证券研究机构即标准o普尔公司编制的股票价格指数。是继道o琼斯之后美国第二大股票价格指数。标普100指数是由标准普尔公司在标普500当中最强的100只成份股编写而成。
[2] Edmans A, Garca D, Norli ?. (2007). Sports Sentiment and Stock Returns. Journal of Finance 62, .
[3] Hirshleifer D, Shumway T. (2003). Good Day Sunshine: Stock Returns and the Weather. Journal of Finance 58, .[4]Bollen J, Mao HN, Zeng XJ. (2010). Journal of Computational Science. 2(1), 1-8.
[4] Bollen J, Mao HN, and Zeng XJ. (2010). Twitter mood predicts the stock market, Arxiv working paper, Indiana University.
[5] Sprenger, Timm O. and Welpe, Isabell M. (2010). Tweets and Trades: The Information Content of Stock Microblogs.
[6] Zhang X, Fuehres H, and Gloor P. (2010). Predicting stock market indicators through Twitter – “I hope it is not as bad as
I fear”. In COIN Collaborative Innovations Networks Conference, 1-8.
[9] Tim Loughran, Bill Mcdonald. (2011). When is a Liability not a Liability Textual Analysis, Dictionaries, and 10-Ks. The Journal of Finance. 66(1), 35–65.
你可能感兴趣
哈哈!终于占了个沙发~~~
心理学硕士,科幻控,翻译控
赞最后一句话~感兴趣微博能做出类似的结果么?个人觉得应该更难吧,微博的信息种类太繁杂了,比twitter的纯文字难分析多啦
有机化学博士,法学学士
呃,那是因为老外没有职业水军和五毛,否则和股评家合作,刷高一支股票后大家一起逃跑,套住的还是散户。
赞!因为我一直相信人们的投资行为基于非理性行为。这个模型我觉得可以对该理论进行验证。
想起了《失落的秘符》里面说的 思想足够多足够强大就可以影响物质世界的话
果壳网心事鉴定组编辑,科学松鼠会成员
不,微博分析最大的困难在于,它永远沉浸在一派喜庆祥和的气氛之中引用nopanic的回应:赞最后一句话~感兴趣微博能做出类似的结果么?个人觉得应该更难吧,微博的信息种类太繁杂了,比twitter的纯文字难分析多啦
想起来&π&里面的蓝纸可以有新的研究模型了==u
哪位大侠推荐个好用的翻墙软件?自由门慢了点儿。。。。
谢谢~~~
引用0.618的回应:不,微博分析最大的困难在于,它永远沉浸在一派喜庆祥和的气氛之中突然就正解了
软件工程硕士
引用0.618的回应:不,微博分析最大的困难在于,它永远沉浸在一派喜庆祥和的气氛之中这个有点偏颇,看看创刊号的《好运Money+》杂志,上面说了用Twitter预测故事的事情,编辑也在新浪微博测试了:“随机选择一只股票,如双汇发展(000895),以双汇为关键词进行搜索,发现自6月27日起后5天,显示结果分别为732条、789条、673条、4255条和2128条,6月30日反馈的有效数据最多。有意思的是。在6月30日的后一天,双汇发展上涨4.71%,是最近15天以来的最大涨幅。这就是说,和上述研究得到的结论类似,微博数量增多与股价上涨有正向关系,而股价高点正是出现在微博数量最多的第二天。”不过记者也在文章说了这样的话:“事实上,记者所做的随机抽样法还不足以说明问题。对于这项研究成果能否搬到中国来用 ,国内几家著名的网络公司都没有给出正面回应”。[1] 《好运Money+》杂志创刊号
对于相对理性的欧美市场还有预测的可能,A股就算了吧
索罗斯的反身性理论(Reflexivity)揭示了这种方法的缺点!不过,如果这种方法管用的话,散户赚些小钱应该可以吧!
最多才能预测情绪与股市的关系,还有其他因素呢,按这么算,他的现在最大预测成功可能性才4%,所以几乎没什么用。感觉只是因为人们的渴求,所以才将这些强行联系到一起了,哈哈。
的话:呃,那是因为老外没有职业水军和五毛,否则和股评家合作,刷高一支股票后大家一起逃跑,套住的还是散户。一只股票可能能炒,大盘的话就难了吧,可以做股指期货的啊,Twitter那篇文章也是做的道琼斯指数~
的话:最多才能预测情绪与股市的关系,还有其他因素呢,按这么算,他的现在最大预测成功可能性才4%,所以几乎没什么用。感觉只是因为人们的渴求,所以才将这些强行联系到一起了,哈哈。文章里面不是说他做实验的时候模型的准确率就已经86.7%了吗~~肯定是有盈利的,要不然也不可能成立对冲基金的啊。关键是,我把这篇paper读完之后发现,当年他写的源代码还有dataset说是可以下载的,现在居然被删除了。。。是因为技术细节要保密吗?
安装投行做机器学习的规则,一般能赚钱的算法都不会公开发表到paper上。。。
感觉twitter用来炒股这个功能没什么用吧。我想应该twitter官方不会为用户推出这个功能,这么大的公司不可能做出这么荒唐的事情。所以感觉twitter炒股虚有屠龙之技实际用处不大!顺便介绍一下关注一下我的推特日志。
引用 的话:哈哈!终于占了个沙发~~~朋友,想获得万3佣金的股票账户吗?安信证券网上开户随时办,方便快捷还优惠,我的服务我做主,基础服务至万三。中秋期间,安信证券特推出网络开户优惠活动,万3佣金优惠请联系电话,或加QQ:进行预约。
引用 的话:Woa!朋友,想获得万3佣金的股票账户吗?安信证券网上开户随时办,方便快捷还优惠,我的服务我做主,基础服务至万三。中秋期间,安信证券特推出网络开户优惠活动,万3佣金优惠请联系电话,或加QQ:进行预约。
股市是一种策略的博弈,没有一种策略能一直赢,这种技术最多只能在一段时间内有效。
显示所有评论
(C)2016果壳网&&&&&京ICP备号-2&&&&&您所在位置: &
&nbsp&&nbsp&nbsp&&nbsp
关于Jensen模型的股票型开放式基金绩效评估.pdf50页
本文档一共被下载:
次 ,您可全文免费在线阅读后下载本文档。
文档加载中...广告还剩秒
需要金币:200 &&
你可能关注的文档:
··········
··········
A Thesis Submitted in Partial Fulfillment of Requirements for the Degree of Master of Management
The Evaluation of Chinese stock Open-end Funds Based on Jensen Model Candidate :Huang Hao Major :Enterprise Management Supervisor :Associate Prof. Wang Shicai Huazhong University of Science and Technology Wuhan 430074, P.R.China April, 2008 独创性声明 本人声明所呈交的学位论文是我个人在导师指导下进行的研究工作及取得的研
究成果。尽我所知,除文中已经标明引用的内容外,本论文不包含任何其他个人或
集体已经发表或撰写过的研究成果。对本文的研究做出贡献的个人和集体,均已在
文中以明确方式标明。本人完全意识到,本声明的法律结果由本人承担。 学位论文作者签名: 日期: 学位论文版权使用授权书 本学位论文作者完全了解学校有关保留、使用学位论文的规定,即:学校有权
保留并向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅。
本人授权华中科技大学可以将本学位论文的全部或部分内容编入有关数据库进行检
索,可以采用影印、缩印或扫描等复制手段保存和汇编本学位论文。 保密□ ,在_____年解密后适用本授权书。 本论文属于 不保密 (请在以上方框内打“√”) 学位论文作者签名: 指导教师签名:
日期: 日期: 华 中 科 技 大 学 硕 士 学 位 论 文 摘 要 随着中国金融市场的发展,投资者需要有金融工具把大量分散的资金集中起来。
随着投资者承受风险的意识和能力的增强,以及对较高的收益水平的追求,证券投
资基金应运而生。证券投资基金在西方国家己有一百多年的发展历史,在其运作过
程中积累的丰富经验以及系统、科学的理论研究方法都是值得我们借鉴的。随着我
国资本市场的快
正在加载中,请稍后...后使用快捷导航没有帐号?
如何用大数据炒股
查看: 20823|
评论: 0|来自: 财新网
摘要: 头图:正如百发100的市场情绪因子来自百度,南方- 新浪 I100和I300指数基金的市场情绪因子全部来自新浪平台。图为日,南方-新浪大数据100指数、大数据300指数在深交所举行敲钟仪式。我们如今生活在一个数 ...
头图:正如百发100的市场情绪因子来自百度,南方- 新浪 I100和I300指数基金的市场情绪因子全部来自新浪平台。图为日,南方-新浪大数据100指数、大数据300指数在深交所举行敲钟仪式。我们如今生活在一个数据爆炸的世界里。百度每天响应超过60亿次的搜索请求,日处理数据超过100PB,相当于6000多座中国国家图书馆的书籍信息量总和。新浪微博每天都会发布上亿条微博。在荒无人烟的郊外,暗藏着无数大公司的信息存储中心,24小时夜以继日地运转着。克托·迈尔-舍恩伯格在《大数据时代》一书中认为,大数据的核心就是预测,即只要数据丰富到一定程度,就可预测事情发生的可能性。例如,“从一个人乱穿马路时行进的轨迹和速度来看他能及时穿过马路的可能性”,或者通过一个人穿过马路的速度,预测车子何时应该减速从而让他及时穿过马路。那么,如果把这种预测能力应用在股票投资上,又会如何?目前,美国已经有许多对冲基金采用大数据技术进行投资,并且收获甚丰。中国的中证广发百度百发100指数基金(下称百发100),上线四个多月以来已上涨68%。和传统量化投资类似,大数据投资也是依靠模型,但模型里的数据变量几何倍地增加了,在原有的金融结构化数据基础上,增加了社交言论、地理信息、卫星监测等非结构化数据,并且将这些非结构化数据进行量化,从而让模型可以吸收。由于大数据模型对成本要求极高,业内人士认为,大数据将成为共享平台化的服务,数据和技术相当于食材和锅,基金经理和分析师可以通过平台制作自己的策略。量化非结构数据不要小看大数据的本领,正是这项刚刚兴起的技术已经创造了无数“未卜先知”的奇迹。2014年,百度用大数据技术预测命中了全国18卷中12卷高考作文题目,被网友称为“神预测”。百度公司人士表示,在这个大数据池中,包含互联网积累的用户数据、历年的命题数据以及教育机构对出题方向作出的判断。在2014年巴西世界杯比赛中,Google亦通过大数据技术成功预测了16强和8强名单。从当年英格兰报社的信鸽、费城股票交易所的信号灯到报纸电话,再到如今的互联网、云计算、大数据,前沿技术迅速在投资领域落地。在股票策略中,大数据日益崭露头角。做股票投资策略,需要的大数据可以分为结构化数据和非结构化数据。结构化数据,简单说就是“一堆数字”,通常包括传统量化分析中常用的CPI、PMI、市值、交易量等专业信息;非结构化数据就是社交文字、地理位置、用户行为等“还没有进行量化的信息”。量化非结构化就是用深度模型替代简单线性模型的过程,其中所涉及的技术包括自然语言处理、语音识别、图像识别等。金融大数据平台-通联数据CEO王政表示,通联数据采用的非结构化数据可以分为三类:第一类和人相关,包括社交言论、消费、去过的地点等;第二类与物相关,如通过正在行驶的船只和货车判断物联网情况;第三类则是卫星监测的环境信息,包括汽车流、港口装载量、新的建筑开工等情况。卫星监测信息在美国已被投入使用,2014年Google斥资5亿美元收购了卫星公司Skybox,从而可以获得实施卫星监测信息。结构化和非结构化数据也常常相互转化。“结构化和非结构化数据可以形象理解成把所有数据装在一个篮子里,根据应用策略不同相互转化。例如,在搜索频率调查中,用户搜索就是结构化数据;在金融策略分析中,用户搜索就是非结构化数据。”百度公司人士表示。华尔街拿着丰厚薪水的分析师们还不知道,自己的雇主已经将大量资本投向了取代自己的机器。日,高盛向Kensho公司投资1500万美元,以支持该公司的大数据平台建设。该平台很像iPhone里的Siri,可以快速整合海量数据进行分析,并且回答投资者提出的各种金融问题,例如“下月有飓风,将对美国建材板块造成什么影响?”在Kensho处理的信息中,有80%是“非结构化”数据,例如政策文件、自然事件、地理环境、科技创新等。这类信息通常是电脑和模型难以消化的。因此,Kensho的CEO Daniel Nadler认为,华尔街过去是基于20%的信息做出100%的决策。既然说到高盛,顺便提一下,这家华尔街老牌投行如今对大数据可谓青睐有加。除了Kensho,高盛还和Fortress信贷集团在两年前投资了8000万美元给小额融资平台On Deck Capital。这家公司的核心竞争力也是大数据,它利用大数据对中小企业进行分析,从而选出值得投资的企业并以很快的速度为之提供短期贷款。捕捉市场情绪上述诸多非结构化数据,归根结底是为了获得一个信息:市场情绪。在采访中,2013年诺贝尔经济学奖得主罗伯特•席勒的观点被无数采访对象引述。可以说,大数据策略投资的创业者们无一不是席勒的信奉者。席勒于上世纪80年代设计的投资模型至今仍被业内称道。在他的模型中,主要参考三个变量:投资项目计划的现金流、公司资本的估算成本、股票市场对投资的反应(市场情绪)。他认为,市场本身带有主观判断因素,投资者情绪会影响投资行为,而投资行为直接影响资产价格。然而,在大数据技术诞生之前,市场情绪始终无法进行量化。回顾人类股票投资发展史,其实就是将影响股价的因子不断量化的过程。上世纪70年代以前,股票投资是一种定性的分析,没有数据应用,而是一门主观的艺术。随着电脑的普及,很多人开始研究驱动股价变化的规律,把传统基本面研究方法用模型代替,市盈率、市净率的概念诞生,量化投资由此兴起。量化投资技术的兴起也带动了一批华尔街大鳄的诞生。例如,巴克莱全球投资者(BGI)在上世纪70年代就以其超越同行的电脑模型成为全球最大的基金管理公司;进入80年代,另一家基金公司文艺复兴(Renaissance)年均回报率在扣除管理费和投资收益分成等费用后仍高达34%,堪称当时最佳的对冲基金,之后十多年该基金资产亦十分稳定。“从主观判断到量化投资,是从艺术转为科学的过程。”王政表示,上世纪70年代以前一个基本面研究员只能关注20只到50只股票,覆盖面很有限。有了量化模型就可以覆盖所有股票,这就是一个大的飞跃。此外,随着计算机处理能力的发展,信息的用量也有一个飞跃变化。过去看三个指标就够了,现在看的指标越来越多,做出的预测越来越准确。随着21世纪的到来,量化投资又遇到了新的瓶颈,就是同质化竞争。各家机构的量化模型越来越趋同,导致投资结果同涨同跌。“能否在看到报表数据之前,用更大的数据寻找规律?”这是大数据策略创业者们试图解决的问题。于是,量化投资的多米诺骨牌终于触碰到了席勒理论的第三层变量——市场情绪。计算机通过分析新闻、研究报告、社交信息、搜索行为等,借助自然语言处理方法,提取有用的信息;而借助机器学习智能分析,过去量化投资只能覆盖几十个策略,大数据投资则可以覆盖成千上万个策略。基于互联网搜索数据和社交行为的经济预测研究,已逐渐成为一个新的学术热点,并在经济、社会以及健康等领域的研究中取得了一定成果。在资本市场应用上,研究发现搜索数据可有效预测未来股市活跃度(以交易量指标衡量)及股价走势的变化。海外就有学术研究指出,公司的名称或者相关关键词的搜索量,与该公司的股票交易量正相关。德国科学家Tobias Preis就进行了如此研究:Tobias利用谷歌搜索引擎和谷歌趋势(Google Trends),以美国标普500指数的500只股票为其样本,以2004年至2010年为观察区间,发现谷歌趋势数据的公司名称搜索量和对应股票的交易量,在每周一次的时间尺度上有高度关联性。也就是说,当某个公司名称在谷歌的搜索量活动增加时,无论股票的价格是上涨或者下跌,股票成交量与搜索量增加;反之亦然,搜索量下降,股票成交量下降。以标普500指数的样本股为基础,依据上述策略构建的模拟投资组合在六年的时间内获得了高达329%的累计收益。在美国市场上,还有多家私募对冲基金利用Twitter和Facebook的社交数据作为反映投资者情绪和市场趋势的因子,构建对冲投资策略。利用互联网大数据进行投资策略和工具的开发已经成为世界金融投资领域的新热点。保罗·霍丁管理的对冲基金Derwent成立于2011年5月,注册在开曼群岛,初始规模约为4000万美元, 2013年投资收益高达23.77%。该基金的投资标的包括流动性较好的股票及股票指数产品。通联数据董事长肖风在《投资革命》中写道,Derwent的投资策略是通过实时跟踪Twitter用户的情绪,以此感知市场参与者的“贪婪与恐惧”,从而判断市场涨跌来获利。在Derwent的网页上可以看到这样一句话:“用实时的社交媒体解码暗藏的交易机会。”保罗·霍丁在基金宣传册中表示:“多年以来,投资者已经普遍接受一种观点,即恐惧和贪婪是金融市场的驱动力。但是以前人们没有技术或数据来对人类情感进行量化。这是第四维。Derwent就是要通过即时关注Twitter中的公众情绪,指导投资。”另一家位于美国加州的对冲基金MarketPsych与汤普森·路透合作提供了分布在119个国家不低于18864项独立指数,比如每分钟更新的心情状态(包括乐观、忧郁、快乐、害怕、生气,甚至还包括创新、诉讼及冲突情况等),而这些指数都是通过分析Twitter的数据文本,作为股市投资的信号。此类基金还在不断涌现。金融危机后,几个台湾年轻人在波士顿组建了一家名为FlyBerry的对冲基金,口号是“Modeling the World(把世界建模)”。它的投资理念全部依托大数据技术,通过监测市场舆论和行为,对投资做出秒速判断。关于社交媒体信息的量化应用,在股票投资之外的领域也很常见:Twitter自己也十分注重信息的开发挖掘,它与DataSift和Gnip两家公司达成了一项出售数据访问权限的协议,销售人们的想法、情绪和沟通数据,从而作为顾客的反馈意见汇总后对商业营销活动的效果进行判断。从事类似工作的公司还有DMetics,它通过对人们的购物行为进行分析,寻找影响消费者最终选择的细微原因。回到股票世界,利用社交媒体信息做投资的公司还有StockTwits。打开这家网站,首先映入眼帘的宣传语是“看看投资者和交易员此刻正如何讨论你的股票”。正如其名,这家网站相当于“股票界的Twitter”,主要面向分析师、媒体和投资者。它通过机器和人工相结合的手段,将关于股票和市场的信息整理为140字以内的短消息供用户参考。此外,StockTwits还整合了社交功能,并作为插件可以嵌入Twitter、Facebook和LinkedIn等主要社交平台,让人们可以轻易分享投资信息。另一家公司Market Prophit也很有趣。这家网站的宣传语是“从社交媒体噪音中提炼市场信号”。和StockTwits相比,Market Prophit更加注重大数据的应用。它采用了先进的语义分析法,可以将Twitter里的金融对话量化为“-1(极度看空)”到“1(极度看多)”之间的投资建议。网站还根据语义量化,每天公布前十名和后十名的股票热度榜单。网站还设计了“热度地图”功能,根据投资者情绪和意见,按照不同板块,将板块内的个股按照颜色深浅进行标注,谁涨谁跌一目了然。中国原创大数据指数尽管大数据策略投资在美国貌似炙手可热,但事实上,其应用尚仅限于中小型对冲基金和创业平台公司。大数据策略投资第一次被大规模应用,应归于中国的百发100。百度金融中心相关负责人表示,与欧美等成熟资本市场主要由理性机构投资者构成相比,东亚尤其是中国的股票类证券投资市场仍以散户为主,因此市场受投资者情绪和宏观政策性因素影响很大。而个人投资者行为可以更多地反映在互联网用户行为大数据上,从而为有效地预测市场情绪和趋势提供了可能。这也就是中国国内公募基金在应用互联网大数据投资方面比海外市场并不落后、甚至领先的原因。百发100指数由百度、中证指数公司、广发基金联合研发推出,于日正式对市场发布,实盘运行以来一路上涨,涨幅超过60%。跟踪该指数的指数基金规模上限为30亿份,日正式获批,10月20日发行时一度创下26小时疯卖18亿份的“神话”。外界都知道百发100是依托大数据的指数基金,但其背后的细节鲜为人知。百发100数据层面的分析分为两个层面,即数据工厂的数据归集和数据处理系统的数据分析。其中数据工厂负责大数据的收集分析,例如将来源于互联网的非结构化数据进行指标化、产品化等数据量化过程;数据处理系统,可以在数据工厂递交的大数据中寻找相互统计关联,提取有效信息,最终应用于策略投资。“其实百发100是在传统量化投资技术上融合了基于互联网大数据的市场走势和投资情绪判断。”业内人士概括道。和传统量化投资类似,百发100对样本股的甄选要考虑财务因子、基本面因子和动量因子,包括净资产收益率(ROE)、资产收益率(ROA)、每股收益增长率(EPS)、流动负债比率、企业价值倍数(EV/EBITDA)、净利润同比增长率、股权集中度、自由流通市值以及最近一个月的个股价格收益率和波动率等。此外,市场走势和投资情绪是在传统量化策略基础上的创新产物,也是百发100的核心竞争力。接近百度的人士称,市场情绪因子对百发100基金起决定性作用。百度金融中心相关负责人是罗伯特•席勒观点的支持者。他认为,投资者行为和情绪对资产价格、市场走势有着巨大的影响。因此“通过互联网用户行为大数据反映的投资市场情绪、宏观经济预期和走势,成为百发100指数模型引入大数据因子的重点”。传统量化投资主要着眼点在于对专业化金融市场基本面和交易数据的应用。但在百度金融中心相关业务负责人看来,无论是来源于专业金融市场的结构化数据,还是来源于互联网的非结构化数据,都是可以利用的数据资源。因此,前文所述的市场情绪数据,包括来源于互联网的用户行为、搜索量、市场舆情、宏观基本面预期等等,都被百度“变废为宝”,从而通过互联网找到投资者参与特征,选出投资者关注度较高的股票。“与同期沪深300指数的表现相较,百发100更能在股票市场振荡时期、行业轮动剧烈时期、基本面不明朗时期抓住市场热点、了解投资者情绪、抗击投资波动风险。”百度金融中心相关负责人表示。百发100选取的100只样本股更换频率是一个月,调整时间为每月第三周的周五。业内人士指出,百发100指数的月收益率与中证100、沪深300、中证500的相关性依次提升,说明其投资风格偏向中小盘。但事实并非如此。从样本股的构成来说,以某一期样本股为例,样本股总市值6700亿元,占A股市值4.7%。样本股的构成上,中小板21只,创业板4只,其余75只样本股均为大盘股。由此可见,百发100还是偏向大盘为主、反映主流市场走势。样本股每个月的改变比例都不同,最极端的时候曾经有60%进行了换仓。用大数据预测热点变化,市场热点往往更迭很快;但同时也要考虑交易成本。两方面考虑,百度最后测算认为一个月换一次仓位为最佳。样本股对百发100而言是核心机密——据说“全世界只有基金经理和指数编制机构负责人两个人知道”——都是由机器决定后,基金经理分配给不同的交易员建仓买入。基金经理也没有改变样本股的权利。展望未来,百度金融中心相关负责人踌躇满志,“百发100指数及基金的推出,只是我们的开端和尝试,未来将形成多样化、系列投资产品。”除了百发100,目前市场上打着大数据旗帜的基金还有2014年9月推出的南方-新浪I100和I300指数基金。南方-新浪I100和I300是由南方基金、新浪财经和深圳证券信息公司三方联合编制的。和百发100类似,也是按照财务因子和市场情绪因子进行模型打分,按照分值将前100和前300名股票构成样本股。推出至今,这两个指数基金分别上涨了10%左右。正如百发100的市场情绪因子来自百度,南方-新浪I100和I300的市场情绪因子全部来自新浪平台。其中包括用户在新浪财经对行情的访问热度、对股票的搜索热度;用户在新浪财经对股票相关新闻的浏览热度;股票相关微博的多空分析数据等。此外,阿里巴巴旗下的天弘基金也有意在大数据策略上做文章。据了解,天弘基金将和阿里巴巴合作,推出大数据基金产品,最早将于2015年初问世。天弘基金机构产品部总经理刘燕曾对媒体表示,“在传统的调研上,大数据将贡献于基础资产的研究,而以往过度依赖线下研究报告。大数据将视野拓展至了线上的数据分析,给基金经理选股带来新的逻辑。”在BAT三巨头中,腾讯其实是最早推出指数基金的。腾讯与中证指数公司、济安金信公司合作开发的“中证腾安价值100指数”早在2013年5月就发布了,号称是国内第一家由互联网媒体与专业机构编制发布的A股指数。不过,业内人士表示,有关指数并没有真正应用大数据技术。虽然腾讯旗下的微信是目前最热的社交平台,蕴藏了大量的社交数据,但腾讯未来怎么开发,目前还并不清晰。大数据投资平台化中欧商学院副教授陈威如在其《平台战略》一书中提到,21世纪将成为一道分水岭,人类商业行为将全面普及平台模式,大数据金融也不例外。然而,由于大数据模型对成本要求极高,就好比不可能每家公司都搭建自己的云计算系统一样,让每家机构自己建设大数据模型,从数据来源和处理技术方面看都是不现实的。业内人士认为,大数据未来必将成为平台化的服务。目前,阿里、百度等企业都表示下一步方向是平台化。蚂蚁金服所致力搭建的平台,一方面包括招财宝一类的金融产品平台,另一方面包括云计算、大数据服务平台。蚂蚁金服人士说,“我们很清楚自己的优势不是金融,而是包括电商、云计算、大数据等技术。蚂蚁金服希望用这些技术搭建一个基础平台,把这些能力开放出去,供金融机构使用。”百度亦是如此。接近百度的人士称,未来是否向平台化发展,目前还在讨论中,但可以确定的是,“百度不是金融机构,目的不是发产品,百发100的意义在于打造影响力,而非经济效益。”当BAT还在摸索前行时,已有嗅觉灵敏者抢占了先机,那就是通联数据。通联数据股份公司(DataYes)由曾任博时基金副董事长肖风带队创建、万向集团投资成立,总部位于上海,公司愿景是“让投资更容易,用金融服务云平台提升投资管理效率和投研能力”。该平台7月上线公测,目前已拥有130多家机构客户,逾万名个人投资者。通联数据目前有四个主要平台,分别是通联智能投资研究平台、通联金融大数据服务平台、通联多资产投资管理平台和金融移动办公平台。通联智能投资研究平台包括雅典娜-智能事件研究、策略研究、智能研报三款产品,可以对基于自然语言的智能事件进行策略分析,实时跟踪市场热点,捕捉市场情绪。可以说,和百发100类似,其核心技术在于将互联网非结构化数据的量化使用。通联金融大数据服务平台更侧重于专业金融数据的分析整理。它可以提供公司基本面数据、国内外主要证券、期货交易所的行情数据、公司公告数据、公关经济、行业动态的结构化数据、金融新闻和舆情的非结构化数据等。假如将上述两个平台比作“收割机”,通联多资产投资管理平台就是“厨房”。在这个“厨房”里,可以进行全球跨资产的投资组合管理方案、订单管理方案、资产证券化定价分析方案等。通联数据可以按照主题热点或者自定义关键字进行分析,构建知识图谱,将相关的新闻和股票提取做成简洁的分析框架。例如用户对特斯拉感兴趣,就可以通过主题热点看到和特斯拉相关的公司,并判断这个概念是否值得投资。“过去这个搜集过程要花费几天时间,现在只需要几分钟就可以完成。”王政表示。“通联数据就好比一家餐馆,我们把所有原料搜集来、清洗好、准备好,同时准备了一个锅,也就是大数据存储平台。研究员和基金经理像厨师一样,用原料、工具去‘烹制’自己的策略。”王政形容道。大数据在平台上扮演的角色,就是寻找关联关系。人类总是习惯首先构建因果关系,继而去倒推和佐证。机器学习则不然,它可以在海量数据中查获超越人类想象的关联关系。正如维克托`迈尔-舍恩伯格在《大数据时代》中所提到的,社会需要放弃它对因果关系的渴求,而仅需关注相互关系。例如,美国超市沃尔玛通过大数据分析,发现飓风用品和蛋挞摆在一起可以提高销量,并由此创造了颇大的经济效益。如果没有大数据技术,谁能将这毫无关联的两件商品联系在一起?通联数据通过机器学习,也能找到传统量化策略无法发现的市场联系。其中包括各家公司之间的资本关系、产品关系、竞争关系、上下游关系,也包括人与人之间的关系,例如管理团队和其他公司有没有关联,是否牵扯合作等。未来量化研究员是否将成为一个被淘汰的职业?目前研究员的主要工作就是收集整理数据,变成投资决策,而之后这个工作将更多由机器完成。“当初医疗科技发展时,人们也认为医生会被淘汰,但其实并不会。同理,研究员也会一直存在,但他们会更注重深入分析和调研,初级的数据搜集可以交给机器完成。”王政表示。但当未来大数据平台并广泛应用后,是否会迅速挤压套利空间?这也是一个问题。
刚表态过的朋友 ()
上一篇:下一篇:}

我要回帖

更多关于 股票预测数学模型 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信