citespace不识别数据数据预处理和不预处理有什么区别

点击联系发帖人 时间：2017-10-31 05:48

citespace数据转换

　　【摘要】本文通过分析Web of Science与知网的将近7000条数据，探讨电子商务领域的研究热点和发展趋势。" />
免费阅读期刊
论文发表、论文指导
周一至周五
9：00&22：00
基于Citespace的电子商务研究热点与研究趋势分析
　　【摘要】本文通过分析Web of Science与知网的将近7000条数据，探讨电子商务领域的研究热点和发展趋势。使用Citespace软件，通过对施引文献进行词共现分析、作者合作分析以及对被引文献进行共被引分析，从而将电子商务的研究文献进行知识结构的可视化分析，借此来分析研究电子商务领域的研究热点及研究趋势。中国论文网 /2/view-7645989.htm　　【关键词】电子商务研究热点研究趋势　　1.引言　　电子商务的发展具有明显的时期特点，国内外的诸多学者，从研究主题的不同角度，针对电子商务发展的各种要素和发展特征进行了大量研究。去的大多数文献资料的研究反面多是较为分散的，不具有整体的结构性，对于新的发展主题很难把握研究的主题和前沿，也不便为后续的研究提供借鉴和帮助。可见，传统文献统计分析方法已经很难分析出电子商务学科内部的的结构化特征。　　通过以知识单元为分析基础的知识计量学和科学知识图谱，从海量的文献数据和知识中，找到电子商务发展的关键性文献和知识前沿，是一种有效获取知识、发现知识和探索知识前沿的新领域与新手段[1]。本次论文将使用Citespace软件，通过对施引文献进行词共现分析、作者合作分析以及对被引文献进行共被引分析，从而将电子商务的研究文献进行知识结构的可视化分析，借此来分析研究电子商务领域的研究主题及研究趋势。　　2.研究方法　　为了分析电子商务相关研究文献的知识结构和研究前沿，利用工具Citespace，对文献信息记录――作者、参考文献、关键词以及作者机构，进行了针对施引文献词的共现分析、作者合作分析以及针对被引文献的共被引分析，通过对施引文献的合作图谱和共现图谱，以及针对被引文献的共引图谱，为未来电子商务领域的研究提供参考依据。通过国内外的横向对比，有助于我们明确我国电子商务发展水平与国际的差异。随着电子商务越来越全面的全球化发展，科学知识的交叉、融合、纵深的快速发展，新型研究领域和主题不断涌现，进行中外研究文献的对比，能有助于我们把握整体的发展结构，为未来的现实发展和文献研究提供帮助。　　Citespace是在Java的基础上开发的一个用来对信息进行可视化分析的软件，用它，可以知道一个研究领域的重要的文献、经典的文献、发展的前沿和热点等。本文通过将大量的电子商务的文献数据转换成可视化图谱，显示出科学知识的发展进程与结构关系，将知识单元或知识群之间网络、结构、互动、交叉、演化或衍生等诸多隐含的复杂关系通过图谱直观地展现出来[2]。　　3.数据获取　　首先选择 Web of Science TM核心合集，时间为年，检索为 e-commerce主题 AND e-commerce标题 OR e-business主题 OR electronic e-commerce 主题 OR mobile electronic commerce 主题 OR cross-border e-commerce主题 OR mobile e-commerce 主题，在以确保搜索到文献最后聚类时的结果不过于单一，以便能更好的体现研究的主题。最终的结果是 4268 条文献记录。中文数据的获取是选取的中国知网的 CNKI 数据库，最终搜索到 3621 条结果。　　4.处理分析　　1）格式化处理　　通过EndNote文献管理软件的统计功能，将对从WoS数据库和CNKI数据库中的数据结果进行一些简单的统计分析，将本次搜集的中外文献数据导入软件中，通过其功能Tool内的Subject Bibliography，根据选择的关键词、出版商、作者、年份等，可以得出相应的统计结果。　　2）Citespace处理分析　　本文使用的Citespace软件，一般默认选择times slicing为 1，即研究的图谱的时间间隔是一年，selection Criteria 中 Top N per slice的N，代表以一年为时间片段中被引频次最高的 N个作者标识都会在图中显示。为了加快数据生成知识图谱的时间，Citespace会对数据进行预处理，将数据导入到软件，进行数据格式转换之后，就可进行高效便捷的分析。　　5.结果分析　　3.1 研究热点分析　　聚类研究，通过CiteSpace的自动聚类功能将网络分成一系列不重合的子群，可以探究该研究领域热点话题，研究热点即指在一定时间内，数量相对较多且具有内在联系的一组文献所共同讨论的话题[26]。在对数据进行聚类处理时，CiteSpace 软件默认将文献记录中的共被引文献聚类，并从施引文献中提取词集用于子群标识。选择node types 的cited reference，在 selection Criteria 中 Top N per slice选择为 50，代表以一年为时间片段中被引频次最高的 50个被引文献都会在图中显示，生成文献共引网络图谱，然后进行聚类（选取的clusters），通常选择来自于题目的标签词提取，算法用对数似然率算法，研究
年间的研究热点话题，最终得到图 1 所示的聚类图。　　聚类生成的上述表1，共有四个知识子群，分别为#0 adoption、#1 trust、#2 performance和#3 markets，四个子群的silhouette 值都在 0.5 以上，silhouette 值越高说明其同质性越高，聚类效果越好。平均发表年限是该子群主题引用的文献出版时期的平均值。其中，最大的#0 子群，它的研究范围集中在消费者方面，共被引频次最高的两篇文章分别是 Perceived usefulness perceived ease of use and user acceptance of information technology （Davis FD，1989）以及 User acceptance of computer technology： a comparison of two（Davis FD，1989），这两篇文章是关于介绍网购用户的对网络技术的接受问题的，该子群对主题消费者的研究多是引用了这些文章；其次是#1 子群，它主要涉及到了消费者对网购的信任度问题的研究，主要讲的是消费者对网购的信任度对其行为的影响；子群#2的silhouette值仅为0.585，说明子群同质性不高； #3 关注市场研究问题，被引频次最高的文章是 Frictionless commerce？a comparison of internet and conventional retailers（Brynjolfsson E 2000），主要讲的是互联网经营方式与传统方式的比较。
　　3.2 发展趋势分析　　为了保证研究结论的更准确性，在上述研究结论的基础上，将继续进行研究热点的探索，将
年的数据分成 2个区间，即，，分别识别出这2个区间内的研究热点，从而得出电子商务的研究热点。利用Citespace分别绘制2个区间内的时间线视图，如图 2所示。　　在上图中，第一行的横线是时间轴，节点之间的弧形连线的颜色由蓝到红表示年，右边的红色文字是子群的标签词。上图中有很多具有紫色外圈的节点，这些节点都是关键节点，节点的中间中心性大于0.1，它们是连接其它子群的桥梁。年如图 2（A）中，根据弧线颜色可以看出，#4 信任度的研究开始的较早，而#0消费者研究则是从 2011年开始的，其中#1 研究热点群中，关键的被引文献为 Gefen D， 2003， MIS QUART， V27， P51和 Mcknight DH， 2002， INFORM SYST RES， V13， P334，说明了研究话题以信息系统方面的知识为转折点，开始关注信息化方面的管理。年如图 2（B）所示，关于消费者的研究一直是研究的热点，#0 的信任度研究，关键的被引文献为Gefen D， 2003， MIS QUART， V27， P51，David Gefen是全球信息系统研究专家，其在信托研究上有着很大的代表性。综上，电子商务的研究热点是对于消费者的分析、信息技术方面的管理信息系统的研究。　　结束语　　本文利用Citespace软件对来自于WOS和CNKI两个数据库的中外文献进行了可视化的网络图谱分析，通过合著网络、共引网络、聚类分析和关键词分析，得出：1）在对电子商务的研究子领域中，即消费者、互联网和信息系统三大研究人的，外文文献对用户和网络技术方面的研究更多，相比起来，中文文献则更加侧重于对电子商务对不同领域的发展应用的研究以及消费者的研究，缺少对互联网技术方面的深入研究；2）消费者的分析、信息技术方面的管理信息系统方面的研究是近10年的研究热点和发展趋势。　　【参考文献】　　[1] 梁永霞.引文分析学知识图谱.大连：大连理工大学出版社，2012.1. 　　[2] 陈悦，陈超美，胡志刚，王贤文等.引文空间分析原理与应用Citespace实用指南.北京：科学出版社，2014.9. 　　[3] 万湘容.基于CitespaceII的电子商务研究的知识图谱分析[J].情报图书工作网刊，）：21-24. 　　[4] 赵丹群.2012.基于Citespace的科学知识图谱绘制若干问题探讨[J].情报理论与实践，35（10）：56-58. 　　[5] 聂林海. 我国电子商务发展的特点和趋势[J].中国流通经济，2014（6）：97-101. 　　本文系浙江省自然科学基金项目LY14G030022的研究成果。
转载请注明来源。原文地址：
【xzbu】郑重声明：本网站资源、信息来源于网络，完全免费共享，仅供学习和研究使用，版权和著作权归原作者所有，如有不愿意被转载的情况，请通知我们删除已转载的信息。
xzbu发布此信息目的在于传播更多信息，与本网站立场无关。xzbu不保证该信息（包括但不限于文字、数据及图表）准确性、真实性、完整性等。后使用快捷导航没有帐号？
查看: 3179|回复: 0
“CiteSpace 科技文本挖掘及知识发现” 培训班
“CiteSpace 科技文本挖掘及知识发现” 培训班日-10日在首都经济贸易大学（西校区）举办一次CiteSpace培训，地铁10号线首经站下，D口出。校内培训地点提供台式电脑，具体培训地址在收到回执后会通知学员。主要面向CiteSpace初级及中级用户（主要为在校硕士、博士以及博士后）。可以专门针对高级用户的一些问题进行解答。
报到时间：日 9：00—17：00（星期五）
培训时间：日-1月10日两天（星期六、星期日）报名日期：从即日起至 2015年12月20日报名人数限制30-50人，先到先得....（这里不保证以后还会有样的优惠和机会）
报名象征性统一收费1000元/人（同一单位多于两位学员的，其中一位学员享受半价），主要用于支付场地费、资料费、人员劳务费、晚宴费用、上网费用、茶水等.....并由承办公司统一开具发票。报名方式为填好报名回执发邮件到：
联系人：马老师&&188 （可加微信）单位名称
参会名单姓名性别职称电话/手机专业
关注微信公众号：CiteSpace知识图谱& &扫一扫即可加入“CiteSpace知识图谱”这里会不定期的增加CiteSpace的已有研究成果、点评、最新功能教程及其本次讲座的PPT。
月份和陈超美教授合著完成了《CiteSpace：科技文本挖掘及可视化》,在培训中会作为主要参考资料进行讲解。（本次培训也是获取本书的最早渠道）
培训涉及的要内容如下：主讲人，李杰&&详细介绍/u/jerrycueb 2016年1月9日
原理和方法学习时间培训内容9:00-9:50CiteSpace应用总述CiteSpace应用需要注意的问题（对已经发表的论文的整个分析和评价）Citespace操作问题的解答路径（在哪里能够找到学习CiteSpace问题解答）10:00-10:50CiteSpace分析数据的采集（配合有每个数据库的检索技巧）CNKI数据的采集（如何下载满足CiteSpace可分析的数据）CSSCI数据的采集（数据特征及下载和分析的注意事项）WoS数据的采集Derwent专利数据的采集各个数据库使用Citespace分析时要注意哪些问题？11:00:-11:30讨论11:30-13:50午餐和休息14:00-14:50CiteSpace安装及界面功能Citespace下载、安装和问题解答Citespace功能区及使用介绍（主要核心功能及实践表现）CiteSpace参数区及使用介绍（参数含义及其设置方法）Citespace可视化界面功能介绍（美化你的可视化图形攻略，各种视图及其功能）Citespace可视化界面的网络节点信息查询（节点信息及其编辑的窗口）特别地，本部分涉及了参数的设置方法和出现问题后的应对方案15:00-15:50CiteSpace对数据的预处理CNKI数据的转换（把CNKI数据转换成CiteSpace能够处理的数据）CSSCI数据的转换（把CSSCI数据转换成CiteSpace能够处理的数据）Derwent专利数据的转换（把专利数据转换成CiteSpace能够处理的数据）
Web of Science数据的除重（详细步骤及其作用）WoS数据的过滤（数据的进一步提炼）16:00-16:15讨论16:30-18:00
晚宴2016年1月10日
实践及练习9:00-9:50Citespace文献共被引和耦合分析文献共被引和耦合的原理CiteSpace中文献耦合和共被引的分析实践（原理及其实践分析）10:00-10:50CiteSpace科研合作网络的分析作者的合作分析（+Google Earth的合作网络可视化）机构的合作分析国家或地区的合作分析11:00:-11:30学员问答及讨论11:30-13:50午餐和休息14:00-14:50CiteSpace主题和领域的共现分析认识词频和共词分析CiteSpace中关键词的共现分析CiteSpace中主题词的共现分析(解决大家常见的不能提取术语的问题及如何有效的提取术语)科学领域的共现分析典型CiteSpace问题思考及解答策略15:00-15:50CiteSpace高级功能（网络叠加，期刊双图叠加，Netdraw的配合使用）
16:00-16:15培训总结
致谢：感谢CiteSpace软件开发者，大连理工大学长江学者讲座教授-陈超美对培训的鼓励和大力支持。感谢首都经济贸易大学相关老师、同学的鼓励和协助。感谢国内知识图谱的开拓者-大连理工大学刘则渊教授及其团队的大力支持以及在培训策划中给予的帮助和建议。感谢承接本次培训讲座的相关单位。
问题1，能否网络同步授课？&&
答：抱歉目前技术水平，特别是网络条件还不具备。以后可以考虑以慕课的形式开展。问题2：我是学经济学、理工科、医学的,学它有价值吗？答：该软件是通用的科技文本挖掘软件，就技术而言可以应用到任何领域。关于CiteSpace应用的论文有数十篇已经发表于SCI或SSCI期刊，国内的《统计研究》、《经济学动态》、《情报学报》、《经济地理》、《科学学研究》、《统计与决策》、《中医杂志》等等核心及其C刊....问题3，我已经报名了，但是在参加培训前个人需要哪些准备呢？
答：专门的工作人员会安排你学习的相关问题，及发送相关需要你二次返回的信息。另外，还建议先预习一下CiteSpace，参考资料为/blog-067.html
图1：国际恐怖主义研究的文献共被引聚类
图2：《经济研究》杂志的文献共被引网络
图3：国际火灾科学研究的作者合作网络，基于J FIRE SCI数据。
图4：大数据研究的期刊双图叠加分析
其他科学知识图谱可视化结果参见：
国际安全科学机构的合作网络
国际安全科学机构的全球地理分布
国内安全科学在做什么（共词网络）？
国际安全科学研究的知识供给
国内安全科学学者的合作网络（部分）
国际安全科学期刊的共被引网络
Powered by
Copyright &472被浏览11,588分享邀请回答pip install airflow
这里有个坑，因为airflow涉及到很多数据处理的包，所以会安装pandas和numpy（这个Data Scientist应该都很熟悉）但是国内pip install 安装非常慢，用douban的源也有一些小的问题。我的解决方案是，直接先用豆瓣的源安装numpy 和 pandas，然后再安装airflow，自动化部署的时候可以在requirements.txt 里调整顺序就行了如何运行摘自官方网站# airflow needs a home, ~/airflow is the default,
# but you can lay foundation somewhere else if you prefer
# (optional)
export AIRFLOW_HOME=~/airflow
# install from pypi using pip
pip install airflow
# initialize the database
airflow initdb
# start the web server, default port is 8080
airflow webserver -p 8080
然后你就可以上web ui查看所有的dags，来监控你的进程。如何导入dag一般第一次运行之后，airflow会在默认文件夹下生成airflow文件夹，然后你只要在里面新建一个文件dag就可以了。我这边部署在阿里云上的文件tree大概是这个样子的。以下是我自己写的我们公司prettyyes里需要每天处理log的其中一个小的dag：from airflow import DAG
from airflow.operators import BashOperator
from datetime import datetime, timedelta
import ConfigParser
config = ConfigParser.ConfigParser()
config.read('/etc/conf.ini')
WORK_DIR = config.get('dir_conf', 'work_dir')
OUTPUT_DIR = config.get('dir_conf', 'log_output')
PYTHON_ENV = config.get('dir_conf', 'python_env')
default_args = {
'owner': 'airflow',
'depends_on_past': False,
'start_date': datetime.today() - timedelta(days=1),
'retries': 2,
'retry_delay': timedelta(minutes=15),
dag = DAG('daily_process', default_args=default_args, schedule_interval=timedelta(days=1))
templated_command = "echo 'single' | {python_env}/python {work_dir}/mr/LogMR.py"\
.format(python_env=PYTHON_ENV, work_dir=WORK_DIR) + " --start_date {{ ds }}"
task = BashOperator(
task_id='process_log',
bash_command=templated_command,
写好之后，只要将这个dag放入之前建立好的dag文件夹，然后运行：python &dag_file&
来确保没有语法错误。在测试里你可以看到我的schedule_interval=timedelta(days=1)
这样我们的数据处理的任务就相当于每天跑一次。更重要的是，airflow还提供处理bash处理的接口外还有hadoop的很多接口。可以为以后连接hadoop系统提供便利。很多具体的功能可以看官方文档。其中的一个小的bugairflow 1.6.1有一个网站的小的bug，安装成功后，点击dag里的log会出现以下页面：这个只要将airflow/www/utils.py
文件替换成最新的airflow github上的utils.py文件就行，具体的问题在这个：[fixes datetime issue when persisting logs]()使用supervisord进行deamonairflow本身没有deamon模式，所以直接用supervisord就ok了，我们只要写4行代码。[program:airflow_web]
command=/home/kimi/env/athena/bin/airflow webserver -p 8080
[program:airflow_scheduler]
command=/home/kimi/env/athena/bin/airflow scheduler
我觉得airflow特别适合小的团队，他的功能强大，而且真的部署方便。和hadoop，mrjob又可以无缝连接，对我们的业务有很大的提升。[Prettyyes 不以貌取人最肤浅]()528 条评论分享收藏感谢收起113 条评论分享收藏感谢收起citespace数据预处理和不预处理有什么区别_百度知道
citespace数据预处理和不预处理有什么区别
我有更好的答案
CNKI上下载的结果里是不包含参考文献的，试过很多格式的都不行，共引文献是分析不来的，知道我是这样。转化后得到许多文档是正常的吧，我也没找到更好的处理办法，我觉得至多可以处理关键词什么的信息
采纳率：85%
来自团队：
为您推荐：
其他类似问题
换一换
回答问题，赢新手礼包
个人、企业类
违法有害信息,请在下方选择后提交
色情、暴力
我们会通过消息、邮箱等方式尽快将举报结果通知您。科学地图和9种代表性软件
图｜信管院
科学地图和9种代表性软件
& 1.科学地图化的流程：数据源―&数据预处理―&规范化―&地图化―&分析方法地图化：涉及降维，聚类，寻找backbone，地图挖掘技术和社会网络分析技术也可以应用。分析方法：可以使用各种指标，比如图密度和中心度。可以使用jaccard's index来测度聚簇之间的重叠；如果每个文档被分配到一个簇中，那么可以计算每个簇的质量度量和数量度量。Burst detection&是一种阶段性的分析方法，它是在指定时间点内寻找具有聚集度高的特征，，在Kleinberg(2003)中，这个算法被描述过。Geospatial&分析（Batty 2003.；leydesdorff&person 2010；small&Garfield 1985）旨在解决某地发生某件事，并对临界区域产生如何的影响；该类分析需要地理信息的支撑。可视化：目前的展现方式有heliocentric maps,geometrical models&和主题网络。另一种地图方法是用距离衡量两个节点之间关系的强弱程度，关系强的距离近。为了显示被探测的聚簇在连续时段内的演化路径，有不同的方法：cluster string(Small 2006),rolling clustering,alluvial diagrams,themeRiver visualization,thematic areas&2.九种代表性软件，用科学地图来分析科学领域。Bibexcel,citespace,CopalRed, In-spire,Leydesdorff's software,network workbench tool,sci^2 tool,vantagePoint,Vosviewer&Bibexcel可以从ISI wos，scopus，procite export format&中读取数据，Bibexcel上可以允许对文本数据进行不同的预处理方法。Bibexcel可以使用三种方法对数据进行规范化，Salton's Cosine,Jaccard's index,Vladutz和Cook测量。Bibexcel可视化做的不好，但是它可以将数据输出到PAJEK,UCINET,或者SPSS去做。&CitespaceII：主要目的是在知识领域对科技动向分析进行展现，它可以读取不同格式的文献计量资源，比如WOS,PUBMED,arXiv,SAO/NASA宇航数据系统，也可以读取大数据比如NSF Awards和Derwent Innovations Index专利数据。网络或图可以在不同时间段内进行构建，以分析要学习领域的演化。矩阵可以使用salton's cosine dice或者Jaccard's index进行标准化。Citespace允许使用光谱聚类和应用爆发探测。另外citespace有三种可视化模式，聚类视图，时间线和时间区域&ColPalRed:商业软件，使用共词分析来分析科学文档中的关键字。它收集包含在数据库中的知识，并将其转化为新的知识。ColPalRed可以进行三种数据分析：结构分析，战略分析和动态分析结构分析：在主题网络中展现知识，在主题网络中，包括词语和它们之间的关系战略分析：通过两个标准在全局主题网络中为每个主题网络放置在相对的位置上：中心度和密度动态分析:分析主题网络随时间的演变，它可以鉴别出主题的通路、分歧、出现和消失ColPalRed使用战略图、主题和主题网络对结果进行可视化，每个主题有一个标签，该标签的名称是相关主题网络中最中心的节点（词汇）的名称。此外，每个主题在战略图中，用球表示，球的大小和其中包含的文档数成正比。同样主题网络中的关键词也可以表示为一个球，球的大小和关键字的频率成正比。&IN-SPIRE使用地形图使用户发现文档之间的关系和相似文档集。该工具使用统计词汇模式基于上下文来描述文档。IN-SPIRE可以读取非格式化文档（ASCII码）和HTML/XML等格式化文档，和MS-EXCEL和CSV，可以指定列，软件根据指定列来判断文档之间的相似性。IN-SPIRE不从指定列中抽取文献计量网络，它使用自己的文本引擎来通过一列或者几列来计算文档之间的相似度，换句话说，它使用向量空间模型，每个文档使用一个向量进行表示。尽管IN-SPIRE可是使用任意列来构建地图，但是如果选择若干词汇作为列，文本引擎会工作的更好，文本引擎需要大数据量来正确探测文档之间的相似度。在相似度计算完成之后，IN-SPIRE运行一个叫做快速分割聚类的算法，在聚类的最后，若干主题（文档的集合）生成，每个主题的名字是最频繁出现在文档中的关键词（使用if.idf）。IN-SPIRE提供两种不同的可视化技术，Galaxies(模仿星空中的星星)和ThemeScape（在星际可视化中文档的分布基础上进行构建），将主题看成沉积层，它们一起构建起自然地貌，其山峰高度表示在该领域的主题强度，山峰的外延对应星际可视化中主题的明亮程度IN-SPIRE提供了一系列的工具，来帮助分析者来发现学习文档中的知识。时间片允许我们发现某个主题如何增长和萎缩的，在星际变化中主题是如何融合的Facet允许我们发现计算主题之间的关系，以及用户定义组之间的关系相互关系工具可以允许我们发现组之间的相互关系。&Leydesdorff's software免费的命令行软件，可以允许共词、共作者、作者文献计量耦合、期刊文献计量耦合、作者共引等文献计量分析方法。结果可以通过外部软件比如pajek,ucinet,network bench tool sci^2展现出来，更多的是，可以分析国际和学院合作，城市级别的合作，对合作网络的可视化可以通过google map和&外部软件来进行。不同的矩阵被用salton cosine进行规范化。该套程序不允许对数据进行预处理，因此，如果要进行时间维度的分析，需要用到外部软件来对不同时间段的数据进行划分。Network workbench ToolNWB提供特殊的算法来处理出版数据，来构建和分析文献计量网络与地图，该工具也可以读取&ISI WOS ,SCOPUS,BIBTEX,ENDNOTE export format,NFS,和其他CSV格式的数据，NWB允许数据预处理，不同类型网络的构建，对构建网络的图分析，最后它们的可视化，此外，该工具允许进行阶段性分析。数据的预处理包括去重，按时间段划分，探测同义词，并对其进行整合；NWB可以建设不同的网络：文档共引，共作者，共词，文献计量耦合，此外，可以通过直接连接来构建网络，例如，可以创建作者―文档网络，或者直接引用网络。有几个算法可以用来对网络进行地图化，和图分析，更进一步，工具可以进行爆发探测，来鉴别项目使用频度的增加。对产生图的可视化是通过不同的插件来进行的（如&GUESS,）&Sci^2 tool其最重要的作用是，提供几种方法来处理文献计量数据，为后续分析做准备。和NWB一样，可以读取&ISI WOS ,SCOPUS,BIBTEX,ENDNOTE export format,NFS,和其他CSV格式的数据，Sci^2 tool包括DrL&展现算法。地图化步骤中可以使用社区探测和backbone鉴别，可以执行爆发探测Vantage point它是文本挖掘软件，用来从专利和文化数据库的检索结果中发现知识，它允许用户分析大量的结构文本，来发现模式和关系，快速确定谁&什么哪里&什么时间。Vantage point的图接口有三个部分，worksapce,标题视图和细节窗口&VOSViewer:专门用来构建和对文献计量地图可视化，在对图形展现方面有所侧重，所以可以通过放大功能来表现大地图，特定标签算法，密度表达方式也得到了应用，VOSViewer不能从文献计量数据中抽取共现矩阵，如果要这样做，需要外部过程，同样，不能对数据进行预处理。为了展现地图上的元素，VOSViewer地图技术（van eck,waltman 2010）使用相似性度量从共现矩阵中创建了相似矩阵，VOS地图技术创建一个二维地图，元素之间的距离反应其相似性。尽管VOSViewer实现了VOS地图技术，这个程序可以使用其他技术来观察地图。VOSViewer允许我们进行使用VOS聚类技术进行社区探测，这个技术和基于颗粒的聚类技术有关，一旦地图建立起来，VOSViewer允许通过下列四个视图进行检查：1.标签视图：使用一个圆圈和标签来代表一个元素，圆圈大小代表重要性的高低。有一个智能程序，我们可以根据地图放大的程度展现最重要的标签。拥有相同颜色的圈圈属于同一个聚类，2.密度视图：地图上每一点会根据该店项目的密度来填充颜色，密度依赖于周围区域的项目和这些项目的权值。VOSViewer根据（van eck&waltman）提供的等式（GAUSSIAN KERNEL公示）来计算每一点的密度，密度被转化为一个颜色表3.聚类密度视图：只有每个项目之前被分配到一个聚类中，这个视图才可以使用，该视图和密度视图大致一样，区别是项目密度对每个聚类的项目分别进行展现。4.分散视图：这是一个简单视图，用小圆圈代表项目，没有展现标签。11管工赵月华供稿转自：.cn/s/blog_4c9dc2a10100ul2n.html
你是第&&0&&位访客}

久游无息网