信雅达数码科技咋样, 精准营销精准事业部总监 ,数据挖掘的,工作氛围,职业成长,

工具类服务
编辑部专用服务
作者专用服务
数据挖掘中的分类研究与应用
数据挖掘中的一个重要研究课题是如何对数据集进行分类.分类是根据己知训练数据的特征和分类结果,为每一个类找到一个合理的描述或模型,然后再用这些分类的描述或模型来对未知的新的数据进行分类;目标是构造一个分类器,现在已经有许多分类方法和技术用于构造分类模型.  
贝叶斯分类方法和决策树分类方法因为有扎实的数学统计理论基础以及综合先验信息和数据样本信息的能力,使得它们理所当然地其成为数据挖掘的研究热点.基于概率理论中贝叶斯公式的贝叶斯分类器一直受到很大重视.贝式分类法是根据贝氏定理为基础,用以计算未知类别的数据其属于各分类类别的机率.本文对朴素贝叶斯方法NaiveBayes和树状贝叶斯网络方法TAN的理论和实现方法进行了详细讨论.  
在相当长的时间里,决策树也是非常流行的人工智能技术.随着数据挖掘技术的兴起,决策树作为一个构建决策系统的强有力的技术在数据挖掘和数据分析过程中起着非常重要作用.数据挖掘中应用决策树主要是对所研究的事物进行分类、预测以及数据的预处理等.决策树方法中,ID3 具有基础性地位,对于学习和理解决策树方法有着良好作用.ID3不能处理数值型数据,而其改进算法C4.5 可以处理数据值型数据,所以比ID3 具有更为广泛的适用空间.决策树的分类结果能以直观的树状结构表达,可以从中得到一些有用的分类规则.  
数据预处理可以提高数据质量,从而提高分类质量.属性选择是对数据预处理的一种重要方法.属性选择是根据某些指标选择一个优化属性子集的过程.一个优化的子集可以是属性数目最小的子集,也可以是具有最佳预测正确率的子集.一种好的属性选择算法可以对数据集进行降噪和降维,对分类的正确率有着较大影响.其中属性选择方法CfsSubweEval和ConsistencySubsetEval是常用的两种方法.对于文中涉及的四种分类算法,CfsSubweEval的效果总体好于ConsistencySubsetEval的效果.  
集成学习是一种新的机器学习方式,它使用多个学习器来解决同一个问题,能够显著地提高学习系统的泛化能力.集成学习算法对分类正确率有着较大影响.本文对Bagging和AdaBoost 这两种集成学习法进行了研究,并得出AdaBoost的效果总体要好于Bagging的结论.  
文中采用数据挖掘平台weka对上述算法进行了实验和比较.  
数据挖掘已经成为一个非常活跃的研究领域,它的技术在医学领域得到广泛应用,并形成了医学数据挖掘这一重要研究分支.文中的最后用朴素贝叶斯NaiveBayes和决策树C4.5 方法对一个医学数据集进行了实际应用并得出相关的结果.
学科专业:
授予学位:
学位授予单位:
导师姓名:
学位年度:
在线出版日期:
本文读者也读过
相关检索词
万方数据知识服务平台--国家科技支撑计划资助项目(编号:2006BAH03B01)(C)北京万方数据股份有限公司
万方数据电子出版社工具类服务
编辑部专用服务
作者专用服务
基于数据挖掘的个性化推荐系统的研究与设计
在这个信息技术不断爆发的时代里,新产品和新技术不断的涌现在人们的视野中。网络购物更是从鲜有人知到目前成为大众购物的优先选择,不同年龄的人群都被其便捷和经济实惠的优点所吸引。由此产生了电子商务领域的海量数据,其中既有显示的数据,如用户的购买信息、商品评价信息;也有隐示的数据,如用户浏览一个页面的次数、用户在浏览某个商品所花费的时间等。用户在面对这些海量数据时,往往会产生迷茫,不知道如何选择。商家也急切的希望从这些海量数据中找到潜在的规律,希望利用这些规律创造更大的经济利益。个性化推荐系统已经被很多大型的电子商务网站所应用,它可以帮助用户在浩瀚的商品信息海洋中找到自己感兴趣的物品,这既可以提高商品的购买率,也增加了用户的粘性。个性化推荐技术的一个重要表现形式就是智能化的服务推荐系统,其在电子商务领域已经有着不可替代的作用。  
目前,许多著名的电子商务网站都在其服务平台中加入了推荐引擎,如亚马逊、淘宝、京东商城等。为了得到更为准确的推荐结果,许多学者和研究者提出了各种各样的推荐技术,如贝叶斯分析、主成分分析、数据挖掘技术的应用等,都各有所长。随着应用的不断推广以及数据爆炸似的增长,目前需要解决的问题就是过于稀疏的数据矩阵和系统的冷启动,这些都严重的影响了推荐质量。通过推荐引擎的应用与发展,人们发现混合的推荐引擎的模型相比较于单一技术的模型有着更好的推荐质量。  
本研究通过对基于协同过滤的推荐系统的研究,提出了应用主成分分析的方法对过于稀疏的用户-项目矩阵进行降维处理,将Fuzzy Art神经网络算法用于数据的聚类,以提高聚类的效果和推荐的质量。还考虑了将聚类结果用KdTree的结构进行存储,提高了邻居用户的搜索速度和相似度。本研究提出的推荐模型相比于传统的推荐算法不仅在推荐准确度上有了很大的提高,并且也缓解了数据过于稀疏的问题。
学科专业:
授予学位:
学位授予单位:
导师姓名:
学位年度:
在线出版日期:
本文读者也读过
相关检索词
万方数据知识服务平台--国家科技支撑计划资助项目(编号:2006BAH03B01)(C)北京万方数据股份有限公司
万方数据电子出版社工具类服务
编辑部专用服务
作者专用服务
数据挖掘在电子阅读精准营销中的应用
随着移动互联网技术和智能终端的创新和发展,人们的阅读方式发生了重大变化即由传统的阅读方式转变为阅读电子读物。电子书也因其众多的优点受到了广大读者的欢迎。为了更好的满足读者的需求,越来越多的付费阅读平台层出不穷。本文则是通过利用付费平台收集到的读者行为数据,然后利用数据挖掘技术中的K-NN分类来创建分类模型,将其用于付费用户的预测,以达到精准营销的目的。
作者单位:
北京信息科技大学 北京 100101
年,卷(期):
机标分类号:
在线出版日期:
本文读者也读过
相关检索词
万方数据知识服务平台--国家科技支撑计划资助项目(编号:2006BAH03B01)(C)北京万方数据股份有限公司
万方数据电子出版社招聘信息-应届毕业生网
【←前10页&[1]&后10页→】 1 页&&共 10799 条信息 当前显示第 1 - 10799 条 每页 20000 条信息 共 1 页}

我要回帖

更多关于 徐工挖掘机械事业部 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信