求教R语言处理高频数据的处理

苹果/安卓/wp
积分 22, 距离下一级还需 2 积分
道具: 彩虹炫, 涂鸦板, 雷达卡, 热点灯, 金钱卡
购买后可立即获得
权限: 隐身
道具: 金钱卡, 彩虹炫, 雷达卡, 热点灯, 涂鸦板
开心签到天数: 8 天连续签到: 1 天[LV.3]偶尔看看II
求问大神如何用R软件处理高频数据,建立已实现波动率模型?
这些模型包括但不限于HAR-RV,HAR-RV-J,HAR-RV-CJ。
我知道有一个软件包叫High frequency,但是找不着。。
非常感谢!
支持楼主:、
购买后,论坛将把您花费的资金全部奖励给楼主,以表示您对TA发好贴的支持
载入中......
用小写,中间没空格,包的名字叫highfrequency
用小写,中间没空格,包的名字叫highfrequency
<font color="#3383260 发表于
用小写,中间没空格,包的名字叫highfrequency谢谢哦。请问这个包需要在哪里下载呢?
直接在R的界面用install.packages命令下就好了,或者去r-project搜,然后手工安装
<font color="#3383260 发表于
直接在R的界面用install.packages命令下就好了,或者去r-project搜,然后手工安装非常感谢~~
<font color="#3383260 发表于
直接在R的界面用install.packages命令下就好了,或者去r-project搜,然后手工安装安装完highfrequency这个包,不知道里头有哪里函数功能,求助
<font color="#fdlijuan 发表于
安装完highfrequency这个包,不知道里头有哪里函数功能,求助 help(package='highfrequency')
楼主是不是在用HAR类模型构建波动率呢?求指教,求指教求指教
&nbsp&nbsp|
&nbsp&nbsp|
&nbsp&nbsp|
&nbsp&nbsp|
&nbsp&nbsp|
&nbsp&nbsp|
如有投资本站或合作意向,请联系(010-);
邮箱:service@pinggu.org
投诉或不良信息处理:(010-)
论坛法律顾问:王进律师用R进行文本挖掘与分析:分词、画词云
要分析文本内容,最常见的分析方法是提取文本中的词语,并统计频率。频率能反映词语在文本中的重要性,一般越重要的词语,在文本中出现的次数就会越多。词语提取后,还可以做成词云,让词语的频率属性可视化,更加直观清晰。比如下图:
这是根据总理2014年的政府工作报告制作的可视化词云,分词和词云的制作都是用R,词频的统计用了其他软件。这个图能很直观看到,工作报告的重心是"发展",这是大方向,围绕发展的关键要素有经济建设、改革、农村、城镇等要素。不过这张图中的词语还需要进行优化,因为有些术语或词组可能被拆分成了更小的词语,没有展示出来,为了演示,我就没再花更多时间去优化词库,主要是讲讲分析的方法。
下面是分析方法:
首先,要获得要分析的内容,做成txt文本文件。这个很简单,把要分析的内容粘贴到记事本,保存为txt文件就可以了。
其次,用R进行分词。这里要分几点来讲:
要用R进行分词,需要安装并装载两个library,一个是Rwordseg,另一个是rJava。rJava的作用是提供java的库,供Rwordseg调用。安装后,调用语句如下:
library(rJava)
library(Rwordseg)
说说Rwordseg,这是一个R环境下的中文分词工具,引用了Ansj包,Ansj是一个开源的java中文分词工具,基于中科院的ictclas中文分词算法,采用隐马尔科夫模型(HMM)。Rwordseg牛逼的地方三点,一是分词准确,二是分词速度超快,三是可以导入自定义词库,有意思的是还可以导入搜狗输入法的细胞词库(sqel格式),想想细胞词库有多庞大吧,这个真是太厉害了。
分词的语法。很简单,一个函数就搞定了,看下面:
segmentCN("待分析文件的完整路径",returnType="tm")
注意:R中的路径用"\\"分割文件夹。参数returnType表示返回的分词格式是按空格间隔的格式。执行完成后,会自动在相同目录生成一个"待分析文件名.
.segment.txt"的文本文件,打开可以看到是酱紫:
然后,要统计词频。到了这里,每个单词出现的频率是多少,需要统计出来。这个词频统计,我在R中找了一阵,没有找到合适的工具来统计,有人说lm可以统计,试了试不行。于是乎用了其他的软件。这方面的软件不少,大家可以找找,总之,统计出来是酱紫的:
最后,就是画成词云。R有工具可以画词云,当然互联网上有不少网站可以在线制作词云,做得也很漂亮,有兴趣可以去找找,我这里只谈R中的方法:
安装并装载画词云的工具包wordcloud:
library(wordcloud)
读取已经统计好词频的文件:
mydata&-read.table("已统计好词频的文本文件的完整路径",head=TRUE)
设置一个颜色系:
mycolors &- brewer.pal(8,"Dark2")
wordcloud(mydata$词汇,mydata$词频,random.order=FALSE,random.color=FALSE,colors=mycolors,family="myFont3")
然后就可以看到最上面的那个图了。
补充说明:
1、安装rJava:需要先在电脑上下载安装JDK,即java devolop
kit,然后再通过R从CRAN上选择安装rJava,否则,即使安装了rJava也用不了。前提是JDK必须先安装好;
2、安装Rwordseg,这个包不在CRAN上,所以不能在R中直接选择在线安装,需要用下面两种方式来安装,输入:
install.packages("Rwordseg", repos =
"http://R-Forge.R-project.org")
&#9313;(如果上面不能安装,则用下面的)
install.packages("Rwordseg", repos =
"http://R-Forge.R-project.org", type = "source")
已投稿到:
以上网友发言只代表其个人观点,不代表新浪网的观点或立场。EXCEL、R语言、Python、spss、SQL等数据分析工具特点对比
数据分析的工具千万种,综合起来万变不离其宗。无非是数据获取、数据管理、数据分析、数据处理、数据展示等几个方面。而被提到频率最高的又非excel、R、Python、spss、SQl等。那么,这些工具本身到底有什么特点呢,应该如何合理的使用来解决数据分析的各种问题?
招聘技能要求
一般非大量数据分析的人员可以满足大部分需求
财务、金融、产品经理等一般数据量处理需求&
较高,作为普通技能
兼容性强,语言程序化也强,在编程语言方面需要投入的精力比Python要大,但适用面也较广
数据分析基本皆可用
三个高频工具技能要求之一
life is too
short,I use Python
以语言简单,注重数据分析的高效著称,尤其是在文本处理等数据结构化方面有很好优势
数据分析基本皆可用
三个高频工具技能要求之一
数据库处理和分析的必备技能,属于数据库方面的基本工具
数据分析基本皆可用,侧重数据库方面
三个高频工具技能要求之一
统计分析功能强大,侧重于统计分析类模型
建模能力已经不局限于统计了,在预测、机器学习方面也有很多包
analytical
网页分析的主要手段
想去互联网做的不能不懂
互联网数据分析高频工具
金融大数据分析
金融风控建模较多
金融投资数据建模常用工具之一
&总的来说,不同工具各有擅场,最关键的当然还在于业务的掌握,数学方法的掌握:主要有统计学和机器学习等核心方法。但磨刀不误砍柴工,把基本工具掌握熟练了百利无一弊。而当你要做大数据和云计算时,又要用到hadoop等工具了。
&而且,工具不是万能的,业务和数据建模方法才是万法之源。不要被工具迷花了眼哦!
已投稿到:
以上网友发言只代表其个人观点,不代表新浪网的观点或立场。&>&【R代码】如何用R获取沪深股票高频数据和股指数据
【R代码】如何用R获取沪深股票高频数据和股指数据
上传大小:349KB
R语言获取沪深股票信息和股指数据,学习R语言的好资料
综合评分:3(9位用户评分)
下载个数:
{%username%}回复{%com_username%}{%time%}\
/*点击出现回复框*/
$(".respond_btn").on("click", function (e) {
$(this).parents(".rightLi").children(".respond_box").show();
e.stopPropagation();
$(".cancel_res").on("click", function (e) {
$(this).parents(".res_b").siblings(".res_area").val("");
$(this).parents(".respond_box").hide();
e.stopPropagation();
/*删除评论*/
$(".del_comment_c").on("click", function (e) {
var id = $(e.target).attr("id");
$.getJSON('/index.php/comment/do_invalid/' + id,
function (data) {
if (data.succ == 1) {
$(e.target).parents(".conLi").remove();
alert(data.msg);
$(".res_btn").click(function (e) {
var parentWrap = $(this).parents(".respond_box"),
q = parentWrap.find(".form1").serializeArray(),
resStr = $.trim(parentWrap.find(".res_area_r").val());
console.log(q);
//var res_area_r = $.trim($(".res_area_r").val());
if (resStr == '') {
$(".res_text").css({color: "red"});
$.post("/index.php/comment/do_comment_reply/", q,
function (data) {
if (data.succ == 1) {
var $target,
evt = e || window.
$target = $(evt.target || evt.srcElement);
var $dd = $target.parents('dd');
var $wrapReply = $dd.find('.respond_box');
console.log($wrapReply);
//var mess = $(".res_area_r").val();
var mess = resS
var str = str.replace(/{%header%}/g, data.header)
.replace(/{%href%}/g, 'http://' + window.location.host + '/user/' + data.username)
.replace(/{%username%}/g, data.username)
.replace(/{%com_username%}/g, data.com_username)
.replace(/{%time%}/g, data.time)
.replace(/{%id%}/g, data.id)
.replace(/{%mess%}/g, mess);
$dd.after(str);
$(".respond_box").hide();
$(".res_area_r").val("");
$(".res_area").val("");
$wrapReply.hide();
alert(data.msg);
}, "json");
/*删除回复*/
$(".rightLi").on("click", '.del_comment_r', function (e) {
var id = $(e.target).attr("id");
$.getJSON('/index.php/comment/do_comment_del/' + id,
function (data) {
if (data.succ == 1) {
$(e.target).parent().parent().parent().parent().parent().remove();
$(e.target).parents('.res_list').remove()
alert(data.msg);
//填充回复
function KeyP(v) {
var parentWrap = $(v).parents(".respond_box");
parentWrap.find(".res_area_r").val($.trim(parentWrap.find(".res_area").val()));
评论共有4条
代码写得精简,之前看过matlab的代码,可以参考不同的语言的做法。
没什么用。
是个广告内容,推广平台的
综合评分:
积分/C币:3
VIP会员动态
CSDN下载频道资源及相关规则调整公告V11.10
下载频道用户反馈专区
下载频道积分规则调整V1710.18
spring mvc+mybatis+mysql+maven+bootstrap 整合实现增删查改简单实例.zip
资源所需积分/C币
当前拥有积分
当前拥有C币
输入下载码
为了良好体验,不建议使用迅雷下载
【R代码】如何用R获取沪深股票高频数据和股指数据
会员到期时间:
剩余下载个数:
剩余积分:0
为了良好体验,不建议使用迅雷下载
积分不足!
资源所需积分/C币
当前拥有积分
您可以选择
程序员的必选
绿色安全资源
资源所需积分/C币
当前拥有积分
当前拥有C币
(仅够下载10个资源)
为了良好体验,不建议使用迅雷下载
资源所需积分/C币
当前拥有积分
当前拥有C币
为了良好体验,不建议使用迅雷下载
资源所需积分/C币
当前拥有积分
当前拥有C币
您的积分不足,将扣除 10 C币
为了良好体验,不建议使用迅雷下载
你当前的下载分为234。
你还不是VIP会员
开通VIP会员权限,免积分下载
你下载资源过于频繁,请输入验证码
您因违反CSDN下载频道规则而被锁定帐户,如有疑问,请联络:!
若举报审核通过,可返还被扣除的积分
被举报人:
liu7788414
举报的资源分:
请选择类型
资源无法下载
资源无法使用
标题与实际内容不符
含有危害国家安全内容
含有反动色情等内容
含广告内容
版权问题,侵犯个人或公司的版权
*详细原因:
【R代码】如何用R获取沪深股票高频数据和股指数据苹果/安卓/wp
积分 367, 距离下一级还需 83 积分
权限: 自定义头衔, 签名中使用图片
道具: 彩虹炫, 涂鸦板, 雷达卡, 热点灯, 金钱卡, 显身卡, 匿名卡下一级可获得
道具: 抢沙发
购买后可立即获得
权限: 隐身
道具: 金钱卡, 彩虹炫, 雷达卡, 热点灯, 涂鸦板
开心签到天数: 18 天连续签到: 2 天[LV.4]偶尔看看III
在处理高频数据的时候,想使用R的时间序列对象,但是好像时间都是以天为单位的。可不可以精确到十万分之一秒??
比如说像这样:
时间& && && && && && && && && && && && && &数据
载入中......
楼主解决了吗?求指教~
&nbsp&nbsp|
&nbsp&nbsp|
&nbsp&nbsp|
&nbsp&nbsp|
&nbsp&nbsp|
&nbsp&nbsp|
如有投资本站或合作意向,请联系(010-);
邮箱:service@pinggu.org
投诉或不良信息处理:(010-)
论坛法律顾问:王进律师}

我要回帖

更多关于 数据处理与统计教案 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信