CiteSeerX—免费获取计算机类外文科技文献的搜索利器
(辽宁省科学技术情报研究所,辽宁 沈阳 110016)
摘要:CiteSeerx是CiteSeer的换代产品,是免费检索计算机英文科技文献的权威网站,文章介绍了CiteSeerx的系统功能、操作规则及检索方法,并给出了检索示例,以供业内人员参考。
关键词:CiteSeerx;搜索引擎;检索技巧;检索示例
中图分类号:G254.0 文献标识码:A 文章编号:1007—6921(2009)21—0131—02
“工欲善其事,必先利其器”。在计算机技术日新月异发展的今天,及时、全面、准确地掌握国际计算机科学领域的发展脉络、最新动向和研究成果,引领学术前沿,无疑是每一位计算机科技工作者的最大愿望。为此,笔者将向大家推介一个可免费获得国外计算机科学论文全文的权威检索网站——CiteSeerX,希望对读者有所帮助。
1 CiteSeerX简介
CiteSeerX是CiteSeer的换代产品。1997年,CiteSeer引文搜索引擎由美国普林斯顿大学NEC研究院研制开发。CiteSeer引文搜索引擎是利用自动引文标引系统(ACI)建立的第一个学术论文数字图书馆。
在此后投入运行的10年间,研发人员不断对CiteSeer运行中暴露的问题和用户的反馈建议进行分析,并由NationalScienceFoundation和MicrosoftResearch资助,为该搜索引擎重新设计了系统结构和数据模型(即CiteSeerX),于2007年投入运行。
CiteSeerX采用机器自动识别技术搜集网上以Postscrip和PDF文件格式存在的学术论文,然后依照引文索引方法标引和链接每一篇文章。CiteSeerX的宗旨就在于有效地组织网上文献,多角度促进学术文献的传播与反馈。至今,CiteSeerX存储的文献全文达138万多篇,引文2674万多条,内容主要涉及计算机和信息科学领域,主题包括智能代理、人工智能、硬件、软件工程、数据压缩、人机交互、操作系统、数据库、信息检索、网络技术、机器学习等。CiteSeerX与CiteSeer一样,也公开在网上提供完全免费的服务,实现全天24h实时更新。CiteSeerX的常用功能包括:①检索相关学术文献,浏览并下载PS或PDF格式的论文全文;②查看某一具体文献的“引用”与“被引”信息,同时还能获得文献、作者与出版单位最新的引用排行;③查看某一文献的相关文献,并应用特殊算法计算文献相关度;④图表显示某一主题文献(或某一作者、机构所发表文献)的时间分布。可依此推测学科热点和发展趋势,避免重复劳动。
2 CiteSeerX检索方法
2.1 检索界面
启动IE浏览器,在地址栏输入http://citeSeerx.ist.psu.edu/cis,然后回车,即可打开CiteSeerX检索界面。
CiteSeerX的检索界面简洁清晰,默认为文献检索界面。如果要搜索某一特定作者的学术论文,选择“Authours”标签进入作者检索界面。若选择“IncludeCitations”可选项,则搜索范围不但包括CiteSeerX的学术文献全文数据库,还包括数据库中每篇论文的参考文献。因此未选择“IncludeCitations”项的检出结果均能下载全文,而选择“IncludeCitations”项的检出结果不一定有全文。
CiteSeerX的检索首页只有一个检索框,默认为对篇名、作者、摘要、文本内容进行检索。CiteSeerX还支持高级检索,点击“AdvancedSearch”进入高级检索界面,可以看到CiteSeerX支持以下检索字段的“并”运算:篇名、作者、作者单位、期刊或会议录名称、出版年、文摘、关键词、文本内容以及用户为论文定义的标签(Tag)。当然也可以在首页的单一检索框自行构造组合检索式,如Author:(jkleinberg)ANDvenue:(journaloftheacm)。
2.2 检索规则及技巧
CiteSeerX作为获取计算机专业领域学术论文的高效搜索引擎,其查询遵循以下操作规则:
2.2.1 CiteSeerX支持布尔逻辑运算。逻辑组合查询的语法有逻辑(and)或(or)、无逻辑非(not)。逻辑算符不区分大小写。如:要查找Kleinberg或bollacker的论文则在检索框中录入“Kleinbergorbollacker”。需要注意的是:逻辑或只在检索首页的单一检索框适用,高级检索界面的各组合检索框之间为逻辑与关系。
2.2.2 CiteSeerX支持邻近词运算匹配,邻近距离默认为一个单词。多个关键词之间有空格的作为词组或邻近词运算匹配。如输入“Virtualcomputer”,可检出包含“Virtualcomputer”或“Computervirtual”的文献。
2.2.3 CiteSeerX不支持词组的精确匹配,这样处理对查出同一作者姓名的不同拼写有利。例如J.R.Quinlan和Quinlan,J.R.的拼法,若用精确匹配只能检出一个,若用亲近匹配则两个都能检出;再如,要检索“JonKleinberg”的文章,如果检索词为全名“JonKleinberg”,则不能得到所有该作者的论文,只有那些名字“Jon”未经缩写的作者的文章能够被检出。在作者检索中,只用姓或者名字缩写加姓进行检索,会得到比较好的效果。例如用检索词“J.Kleinberg”,CiteSeerX的作者索引将扩展该检索式得到“JonKleinberg”和“JonMKleinberg”的文章。
2.2.4 CiteSeerX查询时,词干法有效,而通配符语法是无效的。如录入关键词“Programme”,可检出“Programme”、“Programming”、“Programmed”和“Programms”文献。
2.2.5 CiteSeerX支持位置算符,书写格式为w/n,n=词间相连数值。如输入virtualw/3computer,表示2个词中间允许出现3个或3个以内的单词或符号。
2.2.6 利用CiteSeerX查询时,遵循检索词大小写无差别原则,如输入检索词“bollacker”、“Bollacker”,或“bolLackEr”,将返回同样的检索结果。
2.2.7 在CiteSeerX中检索完整字句,需用双引号,如“3Dcomputervision”。
2.2.8 若输入检索式后,CiteSeerX搜索结果为零,无论何种原因,系统会自动给出检索建议和几种新检索式的链接供检索者选择。
2.2.9 在高级检索界面还可以对检索范围和检索结果排序规则做出规定。比如可对文献发表时间、文献引文的最小数目等做出限定,这样发表时间超出范围或引文数少于规定数目的文章将不被检出。排序规则包括被引次数、相关性和标引日期。
3 检索示例
例如,查询近两年来国外发表的有关计算机视觉(ComputerVision)方面的科技文献。为提高查准率可将检索关键词“Computervision”限制在摘要(Abstract)字段,并将出版时间范围限制在2007to2009。具体操作如下:
若采用普通检索,可在CiteSeerX主页检索界面Documents检索框中直接键入Abstract:(computervision)ANDyear:(2007TO2009),再点击Search按钮。
若采用高级检索,可在CiteSeerX主页检索界面直接点击“AdvancedSeach”标签,进入高级检索界面,然后分别在Abstract和PublicationYear:RangeFrom()to()检索框中输入“computervision”及2007和2009,再点击“Search”按钮。
获得查询结果后,可根据需要点击选中文献标题链接,进入论文概况界面,再点击“View/Download”即可浏览或下载全文。
4 结束语
CiteSeerX被誉为是全球最大的科学文献免费全文索引搜索引擎。笔者曾就某一计算机学科方面的检索课题做过对比研究,根据用户的具体查新要求,在Inspec和EiCompendex文摘型数据库查到12篇相关适用文摘,多为会议文献。为获取全文,笔者利用CiteSeerX反检,结果查到其中的11篇,并均成功下载到全文。可见,CiteSeerX的确称得上是广大科研人员和图书情报工作者免费获取计算机科学文献的搜索利器,值得推介和收藏!
[参考文献]
[1]宋歌.引文搜索引擎CiteSeerx设计原理及检索[J].中国索引,2008,(3).)]
[2]马旭东.超级搜索引擎为科学研究助力[J].国外科技动态,2001,(11).
版权声明:
1.十号范文网的资料来自互联网以及用户的投稿,用于非商业性学习目的免费阅览。
2.《CiteSeerX—免费获取计算机类外文科技文献的搜索利器》一文的著作权归原作者所有,仅供学习参考,转载或引用时请保留版权信息。
3.如果本网所转载内容不慎侵犯了您的权益,请联系我们,我们将会及时删除。
本栏目阅读排行
栏目最新
- 1在农民收入调查工作动员培训会上讲话
- 22024年领导干部政治素质自评材料(完整)
- 3公司党委党建工作总结报告【完整版】
- 42024年主题教育党建调研开展情况总结
- 52024年度区妇联关于党建工作述职报告(完整)
- 6关于加强企业人才队伍建设调研与思考(完整文档)
- 72024县党员干部抓基层党建工作述职报告
- 8第二批主题教育研讨发言:时刻“以民为本”,听“实言实语”,办实事好事
- 92024关于党员干部法治信仰情况调研报告(2024年)
- 10局网络安全工作责任制落实自查报告(全文)
- 11XX国企分管领导关于党建设引领企业高质量发展研讨发言(范文推荐)
- 122024年第二批主题教育专题读书班研讨发言提纲(6)【完整版】