请问智投圈马科维茨投资组合理论数据是真的吗?

智投圈app是一个创新的社交投资平台,软件大小20.8Mb,版本5.0.3,由上海涵赟网络公司开发运营。&平台特点,用户可在多个经纪商或不同身份之间灵活切换,实现无障碍跨平台跟操作。极大程度改善传统跟单信号延迟的行业痛点,让智能化交易衍生出更多可能,多元化社交打破交易的孤立状态,让用户随时随地轻松沟通。&核心优势,全新实盘高手体系;同步跟单系统;实时信号系统;智投圈上海板块。
文章来源:中国网& 用数据解读摩羯智投
用数据解读摩羯智投
,将介绍如何使用IT技术,处理金融大数据。在互联网混迹多年,已经熟练掌握一些IT技术。单纯地在互联网做开发,总觉得使劲的方式不对。要想靠技术养活自己,就要把技术变现。通过“跨界”可以寻找新的机会,创造技术的壁垒。
金融是离钱最近的市场,也是变现的好渠道!今天就开始踏上“用IT技术玩金融”之旅!
关于作者:
张丹(Conan), 程序员R,Nodejs,Java
weibo:@Conan_Z
转载请注明出处:
进入2016年,伴随世界经济危机的到来,中国互联网创业,也在经历长时间的寒冬,有不少的公司都因资金链断裂,停止了运营。与寒冬反差很大的是,AI技术却火了起来,受到资本的追捧。智能投顾作为金融领域的AI热点,一直在持续升温。
到2016年底,招商银行发布了一个名为“摩羯智投”的应用,一下子吸引了众多人的眼球,打开了银行进军智能投顾领域的大门。本文将用数据来解读“摩羯智投”的到底是怎么玩的。
摩羯智投介绍
数据建模分析
1. 摩羯智投介绍
摩羯智投,是招商银行在日发布的一款手机端应用,嵌入在招商银行的APP中,加入了FinTech理念,把金融和人工智能进行了结合。
按招商银行发布的文章中介绍,摩羯智投是运用机器学习算法,构建的以公募基金为基础的、全球资产配置的“智能基金组合配置服务”。在客户进行投资期限和风险收益选择后,摩羯智投会根据客户自主选择的“目标—收益”要求、构建基金组合,由客户进行决策、“一键购买”并享受后续服务。
摩羯智投并非一个单一的产品,而是一套资产配置服务流程,它包含了目标风险确定、组合构建、一键购买、风险预警、调仓提示、一键优化、售后服务报告等,涉及基金投资的售前、售中、售后全流程服务环节。比如,摩羯智投会实时进行全球市场扫描,根据最新市场状况,去计算最优组合比例,如果客户所持组合偏离最优状态,摩羯智投将为客户提供动态的基金组合调整建议,在客户认可后,即可自主进行一键优化。
摩羯智投的开机画面。
看完招商银行官方的介绍,接下来我们从数据进行分析,看看“摩羯智投”到底有多智能。
2. 数据收集
要做数据分析,我们就要以数据来思考。我的思路,要先收集数据,把应用所有的输入项和输出项的数据进行整理,然后我们通过统计的方法和金融知识来找到数据之间的关系。
注:由于应用中没有明确的字段定义,下面字段我按照字面意思进行解读。
数据输入项只有2个字段,包括
大致投资期限:从投资开始到投资结束的期限。
风险承受能力:承担多大的风险,以及风险带来的损失。
数据输出项,字段就比较多,包括
模拟历史年化收益(%):对历史数据回测,所获得的年化收益率。
模拟历史年化波动率(%):对历史数据回测,所获得的年化波动率。
模拟历史收益(元):在投资10000元,并持有一年,所获得的收益金额。
95%的概率下亏损(元):在95%概率下最大亏损金额。
固定收益(%):固定收益类基金的配置比例。
现金及货币(%):现金货币类基金的配置比例。
股票类(%):股票类基金的配置比例。
另类及其他(%):另类投资的类基金的配置比例。
投资组合收益率曲线:按比例构成的组合,生成的收益率曲线。
投资组合配置详情:4类资产对应的具体基金品种和配置比例
对应到“摩羯智投”的操作界面上,我标出了输入数据和输出数据的提取点。
根据界面来收集到的数据,整理为CSV格式,便于之后的分析。数据收集,我分别存储到了3个CSV文件中。
a.csv:用于收集第1-2个界面的数据,用户直接输入和输出数据,包括:大致投资期限(term),风险承受能力(rick),模拟历史年化收益(ret),模拟历史年化波动率(vol),模拟历史收益(gains),亏损(loss),固定收益(fixed),现金及货币(cash),股票类(stock),另类及其他(alter)
b.csv:用于收集所有标的基金所对应的市场数据,从wind中采集,包括:基金名称(name),基金代码(code),基金成立时间(create),基金类型(type),净值(first2014),净值(first2015),净值(first2016),净值(last)
c.csv:用于收集第3个界面的数据,每个组合的标的基金的配置比例,包括:大致投资期限(term),风险承受能力(rick),基金类型(type),基金代码(code),配置比例(weight)
a.csv的数据样例前10条,如下:
b.csv的数据样例前10条,如下:
c.csv的数据样例前20条,如下:
这里还需要特别说明的事,由于应用的数据,可能会动态的发生变化,我是采集的日的“摩羯智投”应用中的数据。
多说一句,数据花点时间谁都可以在应用中拿到,虽然我已经整理了数据,但请大家不要太随意地张嘴要数据和代码,毕竟写一篇文章非常辛苦。如果你想直接用我的数据和代码,请扫文章下面二维码,请作者喝杯咖啡吧。 :_D
3. 数据建模分析
收集好了数据,接下来就可以进行数据分析了。当然,分析的角度有很多种,可以从金融、统计、数据挖掘等专业方向,也可以计算一些简单的指标,最大值,最小值,平均值等等。我思考的出发点,主要在金融和统计上面,如果存在片面性,还请大家给予指正。
下面将从6个知识点,对“摩羯智投”进行分析。
3.1 分析一:只有2个输入项。
由于只有2个输入项,大致投资期限和风险承受能力。大致投资期限有3个选项,风险承受能力有10个选项,那么实际的组合个数就是3*10=30个。对于只有30个组合来说,并不能完全实现个性化,当有31个用户使用产品时,就会有2个人购买的组合是是重复的。
3.2 分析二:只有17只标的基金
我们对30个组合进行配置尝试后,发现详细持仓方案中,只有17只基金,配置比例不同而矣。标的过少,可能导致风险不能足够的分散化,遇到极端行情会导致大的回撤。17只基金分别是
> paste(dfb$name,"(",dfb$code,")",sep="")
[1] "工银纯债B(OF000403)"
"易增强回报B(OF110018)"
"建信稳定增利C(OF530008)"
[4] "工银天颐B(OF485014)"
"南方量化成长(OF001421)"
"中欧潜力价值(OF001810)"
[7] "大成500(OF096001)"
"黄金接连C类(OF000217)"
"亚洲美元债C(OF002401)"
[10] "大摩收益C(OF233013)"
"博时信用债C(OF050111)"
"兴权可转债(OF340001)"
[13] "创金多因子(OF002210)"
"招商现金增值A(OF217004)" "富国中小盘(OF100061)"
[16] "工银瑞信全球(OF486002)"
"南方成份(OF202005)"
3.3 分析三:相关性分析
直接利用a.csv的数据集,查看输入项和输出项的相关性,发现相关关系。
通过R语言程序实现
# 加载数据
> dfa names(dfa) pairs(df)
把数据变成可视化来显示,对于我们理解数据非常有帮助。
term列,和其他列的散点图,完全呈现离散的分布,说明term列与其他列并没有相关性的关系。
risk列,除了和alter列没有线性关系,和其他列呈现明显的线性关系。
我们把上面相关性图,再加上一些元素,如相关系数、拟合曲线、分布图等,重新画出相关性图,如下所示。
这样就清晰了多了。
risk列,与模拟历史年化收益(ret),模拟历史年化波动率(vol),拟历史收益(gains),呈现极度正相关,输出项的数字完全受risk值影响。
risk列,与固定收益(fixed)和现金及货币(cash),极度负相关;与股票类(stock),极度正相关;另类及其他(alter),负相关。这种情况,与资产的风险收益属性是匹配。
vol列,与亏损(loss),是100%线性相关。
ret列,与拟历史收益(gains),是100%线性相关,这里可以获得公司:gains = 10000 * ret 。
3.4 分析四:线性回归
通过相关性的检查,我们可以发现risk与很多列都是极度相关的。
那么我们可以用线性回归的方法,把risk与有相关性的列的参数估计出来。如果不太了解,一元线性回归的可以参考文章,。
由于vol和loss是100%线性相关,以vol为x,loss为y,构建一元线性回归方程。
# 回归方程
> lv summary(lv)
lm(formula = loss ~ vol, data = dfa)
Residuals:
-36.119 -31.491
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) -447.514
<2e-16 ***
<2e-16 ***
Signif. codes:
0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 34.2 on 28 degrees of freedom
Multiple R-squared:
0.9963, Adjusted R-squared:
F-statistic:
7629 on 1 and 28 DF,
p-value: < 2.2e-16
进行线性回归的统计检查:T检查,F检查都非常显著,同时R-squared为0.9963,具有极度相关性。
# 画出散点图和拟合曲线
> plot(loss~vol,data=dfa)
> abline(lv)
从图中看到,拟合效果非常好,可以整理出公式:loss = -447.514 + 149.109*vol。
另外,由于risk决定vol,再让我们算一下risk和loss的关系,以risk为x,loss为y,构建一元线性回归方程。
# 构建一元线性回归方程
> lm(loss~risk,data=dfa)
lm(formula = loss ~ risk, data = dfa)
Coefficients:
(Intercept)
# 详细指标
> summary(lr)
lm(formula = loss ~ risk, data = dfa)
Residuals:
-219.88 -136.93
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept)
-6.021 1.73e-06 ***
15.426 3.23e-15 ***
Signif. codes:
0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 183.5 on 28 degrees of freedom
Multiple R-squared:
0.8947, Adjusted R-squared:
F-statistic:
238 on 1 and 28 DF,
p-value: 3.232e-15
T检查和F检查,非常显著;R-squared 也比较高。
下面进行残差检查,发现30号点,是偏离比较大,可能是离群值。
我们把30号点去掉,再做显著性检查和残差分析。
> dfa2 lr2 summary(lr2)
lm(formula = loss ~ risk, data = dfa2)
Residuals:
-203.00 -100.98
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept)
-6.389 7.64e-07 ***
16.431 1.39e-15 ***
Signif. codes:
0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 155.3 on 27 degrees of freedom
Multiple R-squared:
0.9091, Adjusted R-squared:
F-statistic:
270 on 1 and 27 DF,
p-value: 1.391e-15
在去掉30号点后,R-squared为0.9091,比之前的0.8947,有所提升。
从残差图中,我们看到没有明显的离群值点,所以去掉30号点,是符合统计提升标准的。
3.5 分析五:关于30号点的金融思考
从数据中,我们发现30号点的最大亏损已经超过了收益,也就是说你可能承担了过大了风险,但是没有获得风险所给你带来的收益。
按照资本资产定价模型的理解,我们投资组合的收益来自2部分,无风险收益和风险收益。无风险收益可以用现金或货币类的基金获得,风险收益主要来自股票基金,债券基金,另类投资最基金。直观上理解,风险收益比至少是1:1,即损失100元时,要获得100元风险补偿。对于私募业务来说,投资人可能会要求更高,比如 风险:收益=1:2。
从另外一个角度分析,上面我所说的风险收益比并没有涉及到概率的部分,我猜95%是通过VaR值来做的概率计算。
3.6 分析六:通过标的基金计算收益率
在“摩羯智投”的应用中,我们可以获得各个基金的配置比例,基金净值的数据又可以在公开市场中获得,所以对于预期收益率,我们也可以自己计算一下,看看是不是与“摩羯智投”提供的结果是一致的。
接下来,就利用到上文介绍的数据集,b.csv和c.csv。
# 加载数据
> dfb names(dfb) dfb$ret2014 dfb$ret2015 dfb$ret2016 dfb$ret2014[c(which(is.na(dfb$ret2014)),which(is.infinite(dfb$ret2014)))] dfb$ret2015[c(which(is.na(dfb$ret2015)),which(is.infinite(dfb$ret2015)))] dfb$ret2016[c(which(is.na(dfb$ret2016)),which(is.infinite(dfb$ret2016)))] head(dfb)
type first2014 first2015 first2016
工银纯债B OF40516 fixed
易增强回报B OF80319 fixed
建信稳定增利C OF80625 fixed
工银天颐B OF10810 fixed
南方量化成长 OF50629 stock
中欧潜力价值 OF50930 stock
由于基金中,招商现金增值A(OF217004)为现金类基金,所以收益率需要直接取年化收益,而不是按上面的计算方法。
#现金类,收益率从wind查年化收益率,进行赋值
dfb[which(dfb$code=='OF217004'),]$ret2
dfb[which(dfb$code=='OF217004'),]$ret
dfb[which(dfb$code=='OF217004'),]$ret7
再加载c.csv基金的详细配置方案。
> dfc names(dfc) head(dfc)
code weight
1 fixed OF000403
1 fixed OF110018
1 fixed OF530008
1 fixed OF233013
1 fixed OF050111
1 fixed OF485014
把数据变型,以type列转置为横表,去掉code列,以weight值进行填充,得到新数据集为r1。
> head(r1)
我们生成plan1的配置方案,当term=1,risk=1时。
# 只保留term=1,risk=1时数据
> plan1 plan1m plan1m$ret2014w plan1m$ret2015w plan1m$ret2016w plan1m
code term risk
type weight
0.05 0.... -0.
0.20 0....
0.05 0....
0.05 0....
0.05 0....
0.14 0....
0.20 0....
0.10 0....
0.05 0....
10 OF530008
0.11 0....
把数据进行合并,分别计算plan1方案的收益率,和plan1方案不同资产的收益率贡献。
# plan1方案的收益率
> plan1r plan1r
1 0...1621068
#计算3年的累积收益率曲线
> plan1r$cumret plan1r
1 0....2983493
# plan1方案不同资产的收益率贡献
> plan1rm plan1rm
1 alter 0. -0..
1 fixed 0.
1 stock 0.
用我计算的结果,分别对比“摩羯智投”中,近1年和近3年的收益率曲线。
近1年对应plan1r$ret%,近3年对应plan1r$cumret=0..83%。我发现计算结果存在差异,从最终结果的数字上来看差异并不大。但对于近3年的收益率曲线的走势来看,差异还是非常明显的。“摩羯智投”给出的近3年收益率曲线是,均匀平稳上升的,而我算出来的,3年数据2014年涨了16%,2015年涨了9%,2016年涨了3%,逐年收益率在递减。所以不应该呈现均匀平稳上升的形状。
究其原因,再来看plan1的组合数据,发现股票基金只有配了一只中欧潜力价值(OF001810),而这只基金在日才成立,所以并不能构建出该基金在的年度收益率组合。以此来判断,这个组合势必存在着中间调仓的过程,而“摩羯智投”的收益率曲线,并没有展示出调仓过程的数据,所以收益率曲线是不透明的,不能够直接做为用户购买决策的依据。
接下来,我们把30种组合的收益率,都计算出来。再与“摩羯智投”给出的收益率进行比较。
上图中,ret列为“摩羯智投”界面上采集的数据;ret2016,ret2015,ret2014分别为我们根据基金的公开市场的数据,计算出来的百分比结果;mean为ret2016,ret2015,ret2014算数平均数。从数据上看,ret列和mean列,有部分值接近。我们再做一次相关性分析。
这样解读结果就容易多了,ret与2016年的收益率是线性相关的,而mean与2014年的收益率是线性相关的,我猜2014底的“股债双牛”使均值发生了偏离。所以,ret和mean没有关系,“摩羯智投”对于收益率的预期,对于近1年的组合收益可能有更大的权重分配。
所以对于“摩羯智投”给出预期收益和净值曲线,我们并不能通过已知的数据计算出来,这些可能就涉及到它背景的算法,我们就无从知晓了。
以上从数据的角度给对“摩羯智投”进行了分析,首先摩羯构建的组合是线性组合,符合风险收益为基础资本资产定价模型(CAPM)。但由于组合数量有限,基金标的有限,算法不够透明、无法利用已知数据重现结果,缺少客户持续跟踪等部分,所以我把“摩羯智投”理解为是基于金融专业性架构,结合快速上线为目标的试水。可以实现对散户的简单、高效的财富管理体验,部分解放理财经理的压力。但对于专业的投资经理来说,这还仅仅是个玩具,还有相当大的提升空间。
本文只是人个出于兴趣,对“摩羯智投”应用的从数据角度的分析,不代表任何公司或其他第三方机构的立场。由于所获得数据有限,以及个人知识能力有限,如有片面的理解,还指大家指正。
转载请注明出处:
This entry was posted in
Designed by智能理财时代来了 你敢约吗?
第1页:智能理财时代来了,它有哪些优缺点?你敢约吗?
第2页:互联网金融新战场
第3页:产品单一、同质化严重
第4页:风险测评缺失、不专业
第5页:打破“建议”走向“实操”
  本月,一则《腾讯开始采用机器人写稿,记者们是否已哭晕?》的报道,火爆微信朋友圈。这篇机器人编撰的稿件题为《8月CPI同比上涨2.0%
创12个月新高》,整篇文章行文流畅,数据翔实,更让人惊异的是:机器人Dreamwriter写这篇报道只花了一分钟时间。
  其实,随着网络的普及,“信息化”、“智能化”、“数字化”等技术正在改变着人类所赖以生存的社会环境。在理财领域,以大数据和互联网技术为主的机器人理财顾问,也在逐渐改变投资者的理财方式。
  据机构预测,目前“机器人理财顾问”管理的理财产品,在今年估计能达到500亿至600亿美元,但只占到美国19万亿美元理财市场的一小部分。而目前,瑞银、美国银行和摩根士丹利等华尔街老牌银行已经注意到了机器人投资顾问的存在。  智能理财时代来了,它有哪些优缺点?你敢约吗?
  智能理财,又称机器人理财和自动化理财。在移动互联网时代,有些资产配置属性的智能理财,成为互联网金融发展的新方向。它最早缘于美国华尔街,是一种在线财富管理服务,为用户提供自动化的、以计算机算法为基础的证券投资组合管理服务。它综合了大数据分析、较低的资金门槛、便捷的用户体验等若干优点。蚂蚁聚宝、京东智投以及形形色色的互联网金融平台都开始投入到智能理财的大军中。  虽然各家平台的创新让投资者的投资更加便捷,但在业内人士看来,这类线上的理财方式也存在风险测评不完善、产品种类单一、同质化严重等问题。看来,真正的智能理财离投资者还有很远。
(责任编辑:HZ002)
理财精品推荐
特色栏目:
精品栏目:
每日要闻推荐
社区精华推荐
精彩焦点图鉴
  【免责声明】本文仅代表作者本人观点,与和讯网无关。和讯网站对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。}

我要回帖

更多关于 主动投资组合管理 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信