如何处理antconc 3.2.4下载生成的单词表

AntConc_图文_百度文库
两大类热门资源免费畅读
续费一年阅读会员,立省24元!
评价文档:
上传于||文档简介
&&a​n​t​c​o​n​c​使​用​方​法
大小:553.50KB
登录百度文库,专享文档复制特权,财富值每天免费拿!
你可能喜欢 上传我的文档
 下载
 收藏
该文档贡献者很忙,什么也没留下。
 下载此文档
正在努力加载中...
AntConc的详细使用说明
下载积分:800
内容提示:AntConc的详细使用说明
文档格式:DOC|
浏览次数:28|
上传日期: 01:28:34|
文档星级:
该用户还上传了这些文档
AntConc的详细使用说明
官方公共微信【图文】antconc使用_百度文库
两大类热门资源免费畅读
续费一年阅读会员,立省24元!
评价文档:
antconc使用
上传于||文档简介
&&汉​语​言​专​业​必​备
大小:155.00KB
登录百度文库,专享文档复制特权,财富值每天免费拿!
你可能喜欢免费绿色软件AntConc在外语教学和研究中的应用-牛bb文章网
免费绿色软件AntConc在外语教学和研究中的应用
所属栏目: &
摘 要: 语料库免费绿色工具软件AntConc,由日本学者Laurence Anthony开发,具有词语检索、生成词表和主题词三大功能。本文介绍了AntConc3.2.1的三项主要功能;以语料库语言学界的权威软件Wordsmith4.0为参照软件,以SPSS11.5为统计工具,验证了其主要功能的可信度;并概要举例说明了和三大功能相关的基于语料库和语料库驱动的外语教学与研究。关键词: AntConc;语料库;绿色软件中图分类号:H319.3文献标识码:A编号:09)01-语料库语言学从60、70年代发展至今,逐步成为一门成熟的学科。该学科的迅速发展从很大程度上归功于计算机技术的进步和支持。许多工具软件,如Claws,Pos-tagger,WordSmith,Mconcord等的开发对语料库语言学的发展起着至关重要的作用。WordSmith是语料库语言学的一个主要有力工具,在当今的语料库语言学领域是公认的权威软件,它由英国利物浦大学开发,牛津大学出版社出版。WordSmith功能强大,但它是商业软件。本文推荐使用的AntConc是由日本学者Laurence Anthony开发的绿色免费软件,其版本在不断更新。只要登录到http://www.antlab.sci.waseda.ac.jp下载后即可直接使用。AntConc具有界面简洁和操作方便的优点,并基本实现了WordSmith的所有功能。该软件的使用有助于语料库语言学研究队伍的壮大。本文通过重点介绍AntConc3.2.1的三大功能,即词语检索、生成词表和主题词功能,和WordSmith的基本功能进行对比,用统计软件SPSS11.5统计分析,验证了AntConc的可信度,并概要说明了围绕其三项主要功能而开展的基于语料库和语料库驱动的外语教学研究,由此说明了计算机辅助研究方法在外语研究和教学中的重要性。1 AntConc3.2.1软件的主要功能1.1 词语检索功能从庞大的语料中检索提取某个词语或短语的所有词条,是AntConc的基本功能。AntConc的检索分为基本检索和高级检索。基本检索功能可以实现对固定词和词组的检索。检索结果可以根据sort功能排序,并可以保存为text文件。AntConc的高级检索功能可以对搜索条件进行设定(context),例如,查找take和look的搭配,可以设定搜索词为take,搭配词(context word)为look,跨距(span)可以设定从右一(R1)到右五(R5),就能检索到take a look, take on a peaceful look, take on a new look等搭配。高级检索还可以实现基于文件的检索。要实现基于文件的检索,研究者要先行编写一个text文件,把要检索的内容写入文件。这样可以一次性地对一组词实现批量检索。为了验证AntConc检索结果的可信度,笔者使用AntConc对一组介词(38个)在语料库Brown中进行了检索,其结果和语料库语言学界公认的权威软件Wordsmith4.0的检索结果进行对比,统计计算得到二者相关值为1.00,这表明两个软件的检索结果在0.01的水平上达到了显著相关。进而可以论断AntConc的检索结果可以信赖。两个软件在Brown语料库中检索到38个介词的频次对比(采用log对数值),如图1┧示。AntConc的检索功能可以实现对母语文本和学习者文本中有关语言现象的频率统计。揭示母语语言现象及语言的发展规律;对照母语文本和学习者文本,发现其异同,了解外语学习者中间语的发展特点及发展规律。例如:英语中有很多近义词,要研究比较其用法的区别,可以基于母语语料库,对它们进行检索、词频统计、人工分析后得出结论。以true 和real一组近义词为例,用AntConc检索Brown语料库,分别得到含有real的索引行256条,含有true的索引行231条。从它们在句中充当的语法成分、语意韵、非词语化使用状况三方面进行分析。表1~3显示了real和true在语料库Brown中的语法成分、语义韵和非词语化的使用状况。研究结果表明real 和true在句中充当的语法成分存在着差别:Real在句中更多时候做定语,true在句中更多时候做表语。两者搭配词的语义韵也存在显著差异:real既可以和褒义、中性词语搭配使用,也可以和贬义词语搭配使用,其语义韵表现为中性;true语义韵也表现为中性,但是它一般和褒义、中性意义的词语搭配使用,很少与贬义词语搭配使用。在非词语化使用的程度上,形容词real和true 之间也存在显著差异: real 的非词语化现象明显,true的非词语化现象不明显(注:此研究数据为笔者2007年的相关研究的数据。)。1.2 生成词表功能(Wordlist)根据某个语料库,统计生成词汇的词频表是AntConc又一大主要功能。生成词表功能对教学大纲的制定、课本内容的编排起着举足轻重的作用。它还为对比不同语料库,不同文本即不同的语言群体的词汇使用状况提供可靠的语料依据。AntConc生成词表的功能不但可以生成单独的词汇列表(wordlist),还可以生成词块(cluster)列表。AntConc的词块生成功能在cluster功能卡下操作。值得注意的是,由于计算机只是机械地切分统计词块的频率,所以对于计算机生成的词块表,一定要进行后期的意义分析,把生成词块表中没有意义的词块去除。为了验证AntConc词表生成功能的可靠性,把AntConc基于语料库Brown生成的词表和WordSmith的词表进行了对比,两个词表前1000个中有959个重叠词(注:此研究数据使用武汉大学沈阳老师提供的软件ROST计算得出,特此感谢。)。把959个重叠词在Brown中出现的频次进行统计计算,两者相关值为0.977,结果表明两者在0.01的水平上呈现显著相关。因此可以得到结论:AntConc生成的词表可以信赖。基于Brown生成的两个词表的重叠词的频次对比(采用log对数值)如图2所示。生成词表用于大纲设计、课本编排的研究有很多:Ljung(1991)对比了瑞典EFL高级中学课本内容和Cobuild语料库的检索结果,发现在课本中出现频率最高的前1000个词中有20%未出现在Cobuild语料库频率最高的前1000个词中。 Kennedy(1998)也观察到了课本和语料库的内容不一致现象。他发现表示量词时,很多课本多用“all”和“every”,而书面语语料库和口语语料库都表明更地道的表达方法是用词汇形式来达到量化的目的,如:使用entirely,completely,whole,throughout等副词(摘自Sincliair,2004:41)。此类研究的基础是基于语料库所生成的词表。词块的研究也受到越来越多的语言学家的关注(Sinclair,1991;Lewis,00;Nation,2001;Willis,1990;Nattinger,1992;Cook,1997等)(见杨,2005)。词块的研究表明母语讲话者的语言中存在大量大于单个词的词块,学习者的中间语也同样存在着大量词块。语料库驱动的词块研究范式由Sinclair(1991)首创,Altenberg(1998)基于母语口语语料库LLC(London Lund Corpus)对母语口语词块的特点研究被视为该范式下词块学研究的里程碑(卫乃兴,2007)。卫乃兴(2007)基于COLSEC描述了中国学习者英语口语的词块特征并发现,学习者用于表达命题内容的复现词块多于本族语者, 而用于实施语用功能的复现词块则严重少于本族语者甚至完全缺失, 由此影响到学习者话语的交互性、合作性、礼貌性与适切性等语用品质。濮建忠(2003)基于CLEC对中国英语学习者的书面语的词块特点有详细的研究和分析,研究结果表明母语者前20个最常用的三词词块无一出现在学习者最常用的20个三词词块中;母语者的词块绝大多数似与语篇的内容无多大关系,而学习者的词块绝大多数与语篇内容直接相关。词块研究中对词块的检索、统计功能,AntConc都能够实现,这为词块研究提供了可靠的技术支持。ィㄔ作者:王春艳)为了验证AntConc生成词块功能的可信度,笔者对濮建忠(2005)的词块研究结果用AntConc进行重新统计,结果非常一致:基于母语语料库Brown,AntConc生成的三词词块和濮建忠(2005)使用Wordsmith生成的三词词块的前20个最常用词块保持完全一致。基于中国英语学习者语料库CLEC(非英语专业学生作文部分),AntConc生成的三词词块列表最常用的前20个词块中含有濮建忠(2005)使用Wordsmith生成的三词词块列表前20中的16个,未包括的四个词块也相继出现在词块列表的第22、23、24和35位(如表4所示)。用AntConc生成的词块列表和濮建忠(2005)的研究结果一致:母语者前20个最常用的三词词块无一出现在学习者最常用的20个三词词块中。由此可以认为AntConc具有可靠的词块生成功能。1.3 主题词功能(keyword list)通过比较两个不同大小的语料库,可以得到主题词,也就是所研究的语料库中频率超常的词语。计算主题词需要两个语料库。一是观察语料库(observed corpus);一是参照语料库(reference corpus)。一般来说,参照语料库要比观察语料库大。基本词表统计能够提供一个语料库文本的词语频率和分布信息,却难以说明词语在语境中的用法和词语之间的关系;主题词统计能提供语篇层面词语的分布与文本主题的关系以及词语之间的关系(李文中,2005)。根据主题词网络分析,能够发现主题词触发学生有关现实世界的认知结构,学生通过选择词语实现语义表达。学生的心理词汇围绕某个主题概念形成独特的语义场,在语义场中,词语与词语之间具有复杂的语义关系和联想关系,这些相互关联的词语在运用中通过在句子层面的词语搭配和类联结以及在语篇层面的词语联系体现出来。学生的作文成功与否,取决于他们能否构建围绕主题、联想以及词语搭配关系的词语网络(李文中,2005)。AntConc的主题词功能可以在keyword list功能卡下操作。AntConc的主题词功能既可以生成正主题词(positive keywords)列表,也可以生成负主题词(negative keywords)列表。如图3所示,以母语语料库Brown为参照语料库,观察60位同学以Education为题的同题作文(注:60篇作文为2007年外研社暑期语料库和语言研究培训班提供数据,感谢李文中、梁茂成、许家金等老师的帮助和支持。)主题词状况。在AntConc的主题词功能下,计算出60篇作文的主题词。如表3所示:结果显示的第一行是根据主题词的主题性log likelihood值由高到低的排序。第二行是60篇作文中关键词出现的绝对频率。第三行是主题性log likelihood值。第四行是主题词列表。根据得到的主题词表,可以画出主题词网络图,并进行主题词分析(李文中,2005)。从education为题的60篇作文的主题词表,可以看出该主题的行为者为I,we, you,us等表明学生认为教育是关系你我大家的问题。表达行为的词有get,keep,receive,master等表达学生渴望通过教育得到知识、掌握知识的愿望。表示具体动作的动词有study,learn,read,catch,等,说明学生认为要通过教育,通过学习、阅读的方式,获得知识。方位词有school,university,society等,学生把教育和学校、大学联系在一起,他们认为受教育的程度和在社会的发展以及毕业后步入社会的生存状况息息相关。主题词的联想词有lifelong,important,secure,future,useful,knowledge等,所有这些都能折射出学生对教育的积极肯定态度。为了验证AntConc的生成主题词表功能的可信度,同样对AntConc的主题词生成功能和WordSmith4.0的主题词功能进行了对比。以母语语料库Brown为参照语料库,分析60位同学以education为题的同题作文的主题词状况。对于AntConc和WordSmith4.0各自生成的正主题词词表的前170个词进行了对比,其重叠词有154个。154个重叠词的频次在0.01水平上的相关值为0.999;154个重叠词的主题性值(log likelihood值)在0.01水平上的相关值为0.998。这表明AntConc的主题词生成功能可以信赖。2 AntConc3.2.1软件的其他功能AntConc除了具有上述三大主要功能以外,还可以提供检索词的上下文背景,检索词在文本中出现的位置图,计算搭配词的搭配力等功能。对于语法标注过的文本,AntConc还可以通过正则表达式实现对一定语法单位的检索,这对词法、句法的研究是非常有力、可靠的支持。3 小结本文举例概述了AntConc的主要功能及相关研究,通过对比AntConc和WordSmith的词语检索、生成词表和主题词三大基本功能,我们可以得到如下结论:免费绿色软件AntConc3.2.1功能齐全,值得信赖。它为基于语料库和语料库驱动的外语教学与研究有着巨大的支持,对日益广大的外语研究者提供了免费的帮助,这里还要非常感谢日本学者Laurence Anthony的开拓和奉献精神。2007年外研社组织的语料库和语言研究暑期研讨班也重点介绍了AntConc的操作用法。希望AntConc的功能越来越完善,更多的学者能够掌握这个有用的工具,开展自己的外语教学和研究,为我们的外语研究和教学发展做贡献。□参考文献[1] Anthony, L. AntConc: Design and Development of a Freeware Corpus Analysis Toolkit for the Technical Writing Classroom[C]. 2005 IEEE International Professional Communication Conference Proceedings,2005.[2] Biber, D., Conrad, S. and Reppen, R. Corpus Linguistics[M]. Foreign Language Teaching and Research Press, Cambridge University Press,2000.[3] Lyons J. Language and Linguistics[M]. Cambridge University Press, Cambridge. M,1981.[4] Kennedy, G. An Introduction to Corpus Linguistics[M]. Foreign Language Teaching and Research Press,2000.[5] Sinclair, J. How to use corpora in Language Teaching[M]. John Benjamins Publishing Company,2004.[6] Sinclair, J. Trust the text[M]. Routledge London,2004.[7] Thomas, J. Using Corpora for Language Research[M]. Foreign Language Teaching and Research Press,2001.[8] 王立非,梁茂成.Wordsmith方法在外语教学中的应用[J].外语电化教学,2007.6.[9] 卫乃兴.词语搭配的界定与研究体系[M].上海:上海交通大学出版社,2002.[10] 卫乃兴,李文中,濮建忠.语料库应用研究[C].上海:上海外语教育出版社,2005.[11] 杨惠中,桂诗春,杨达复.基于CLEC语料库的中国学习者英语分析[C].上海:上海外语教育出版社,2005.[12] 杨惠中.语料库语言学导论[M].上海:上海外语教育出版社,2004.Applications of AntConc in Foreign Language Teaching and ResearchWANG Chun-yan(Foreign Language Institute, Shanghai Jiaotong University, Shanghai 200240, China)Abstract: AntConc is a free and green tool developed by the Japanese scholar Laurence Anthony. AntConc featured by three main functions of concordance, wordlist and keywords now is extensively applied in the field of corpus linguistics. This paper introduces the three main functions of AntConc 3.2.1 and confirms its reliability in reference to the authority software Wordsmith 4.0. during which the statistics software SPSS 11.5 is employed. Some corpus-based and corpus-driven studies related to its three main functions in foreign language teaching and researching are also exemplified in this paper.Key words: AntC C Green Software欢迎您转载分享:
更多精彩: 上传我的文档
 下载
 收藏
所有文档均可在线免费浏览,需要的朋友请看好是否是自己需要的文档。所有资料来源于网络,仅供大家参考学习,版权归原作者。若有侵权,敬请及时告知,本人会及时删除侵权文档,竭诚全力为您服务!!!
 下载此文档
正在努力加载中...
AntConc的详细使用说明
下载积分:1324
内容提示:AntConc的详细使用说明,antconc,的,详细,使用说明
文档格式:DOC|
浏览次数:14|
上传日期: 02:07:14|
文档星级:
该用户还上传了这些文档
AntConc的详细使用说明
官方公共微信}

我要回帖

更多关于 antconc 3.2.4下载 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信