基于硕博士论文的网络免费学术资源引文分析与研究
教育学、文学、历史学、理学、工学、管理学。本研究最终确定了15所高校作为研究对象。其中985工程高校4所,211工程高校5所,一般普通高校6所。在选取不同高校的同一学科时,尽量选取同一学科下的不同专业,以便能涵盖更多的专业。
1.2 统计内容和工具
选取15所高校从2005年到2011年的硕博士论文作为数据来源,对论文的数量、引文数量、网络引文的数量、网络引文的类型、网络引文的语种、含网络引文的可访问性和文件类型进行统计分析。含网络引文的论文数用Wa表示,论文总数用a表示,引文总数用C表示,网络引文数用W表示。
篇均网络引文率一网络引文数/论文总数=W/a;
篇均参考文献量=引文总数/论文总数=C/a;
网络引文占引文总量的百分率一网络引文数/引文总数*100%=W/C*100%;
含网络引文的论文数占论文总数的百分率一含网络引文数/论文总数*100%=Wa/a*100%。
采用spss统计分析工具对数据进行统计分析。
1.3 数据搜集方法
主要利用中国博士学位论文全文数据库、中国优秀硕士论文全文数据库、万方中国学位论文全文数据库和各高校的硕博士论文库。
2 统计结果分析
2.1 总体情况
学科分布和高校分布如表1:
选取的硕博士论文共3807篇,其中硕士论文2856篇,博士论文951篇。引文总数286841篇,篇均参考文献量为75.34,篇均参考文献数量高于平均值的学科为历史学、工学、理学、哲学、文学。含网络引文的论文数为1313篇,网络引文数为11641篇,篇均网络引文率为8.9,网络引文占引文总数的百分比为4%,含网络引文的论文数占论文总数的百分率为34.5%,其中法学的篇均网络引文率高于平均值,见表2。
2.2 统计分析
2.2.1 按照不同学科分析
采用非参数统计中的Kruskal-Wallis检验,可以对各个学科的网络引文数是否存在显著性差异进行检验,结果显示,卡方统计量=563.58,p值<0.001,因此在0.05的显著性水平下,拒绝原假设,认为不同学科间网络引文数具有显著差异。
为了解具体是哪些学科的网络引文数与其他学科有显著差异,采用未假定方差齐性的多重比较法分析,并做出各学科引用网络文献均值图,结果如表3、图1所示。
确定显著性水平为0.05,则p值<0.05表明拒绝原假设,即学科之间存在显著性差异。根据表2结果以及图1中各学科引用网络文献均值情况,得到结论如下:
①法学硕博士论文网络引文数显著高于其他8个学科;
②教育学硕博士论文网络引文数显著高于哲学、文学、历史学、理学、工学和管理学;
③理学硕博士论文网络引文数显著少于除经济学以外的7个学科;
④哲学、文学、历史学、工学、管理学的硕博士论文的网络引文数没有显著差异。
2.2.2 按照不同学历分析
将所得数据按照不同学历(博士、硕士)整理,利用整理得到的数据,采用t检验方法对博士论文和硕士论文两个总体的均值是否具有显著性差异进行检验。得到结果见表4:
方差齐性的Levene检验结果显示,在显著性水平为0.05前提下,p值=0.231>0.05,故不能拒绝原假设,即认为不同学历引用网络文献数的方差相等。因此,均值的t检验以假设方差相等得出的结论为准。
对均值的t检验显示,p值为0.001,小于显著性水平0.05,故拒绝原假设,即认为不同学历的学位论文引用网络文献数据有显著差异。分别计算博士、硕士论文网络引文数的均值,得到每篇博士论文平均引用网络文献10.05篇,而每篇硕士论文平均引用网络文献8.37篇,即博士论文中网络引文数显著高于硕士论文。
2.2.3 按照不同学校分析
将搜集数据按照985工程、211工程高校以及普通高校分类,利用整理得到的数据,采用方差分析的方法对不同学校类别的均值是否具有显著性差异进行检验。方差齐性检验p-value=0.845>0.05,故在0.05的显著性水平下不能拒绝原假设,即认为不同学校类别引用网络文献的方差相等。假定方差相等的前提下,方差分析结果见表5:
从方差分析表5可看到,检验p-value=0.009,小于显著性水平0.05,拒绝原假设,即认为985工程高校、211工程高校和普通高校三者的硕博士论文的网络引文数存在显著性差异。
使用多重比较的方法在三者之间进行两两相互比较;在假定方差相等情况下,LSD多重比较结果如表6所示:
根据多重比较结果显示,p-valued0.05时,说明学校之间网络引文数存在显著差异,即可知985工程高校和211工程高校之间存在显著性差异——985工程高校网络引文数显著高于211工程高校。
2.2.4 根据网络文献来源类型分析
本研究将网络文献来源分为政府信息源、综合网站学术信息源、开放获取信息源、学术机构信息源、科研信息源、教育信息源、古籍信息源、港台地区学术信息源、新闻报刊信息源、个人文献信息源、参考工具信息源、图书馆信息源(特藏和导航)、学科信息源。将搜集的网络文献数据按照来源网站进行整理分析,得到各种网络文献来源的均值图,见图2。
从图2可见,来自学术机构信息源、政府信息源、新闻报刊信息源以及学科信息源的最多,均值分别是50.42、45.16、39.96、31.75。最少的是来自其他信息源(包括开放获取信息源和古籍信息源),平均值为0.82。对数据进行非参数统计中的Kruskal-Wallis检验,进一步检验不同来源的网络文献数是否具有显著差异。结果显示,卡方统计量等于191.681,p值小于0.001,因此在0.05的显著性水平下,拒绝原假设,认为不同网站来源的网络文献数量具有显著差异。
为了解具体是哪些网站的引用数量与其他网站有显著差异,采用未假定方差齐性的多重比较法分析,结果如表7所示(由于比较类别比较多,故仅将差异显著的情况列出)。
多重比较结果显示:
①其他信息源、科研信息源的网络文献量均显著低于政府信息源、综合网站信息源、新闻报刊信息源、学科信息源、个人文献信息源、图书馆信息源;
②政府信息源、综合网站信息源、新闻报刊信息源、学科信息源的网络引文数量都显著高于港台地区学术信息源;
③个人文献信息源的网络引文数量显著低于新闻报刊信息源、学科信息源;
④学术机构信息源、教育信息源、参考工具信息源的网络引文数量与其他所有信息源没有显著差异。
2.2.5 根据语种分析
将搜集到的网络引文按照语种进行整理,分布情况见图3。
从均值来看,汉语和英语的引文数量远远高于其他语种。故将汉语、英语与其他语种分开比较:即(1)比较汉语、英语之间是否存在显著差异;(2)比较俄语、日语、法语、德语、韩语之间有无显著差异。
(1)比较汉语、英语之间是否存在显著差异。
对汉语、英语两总体的方差同质性进行检验,检验显示没有证据表明方差不相等,故使用单因素方差分析法对均值进行检验,结果见表8。
结果表明,p值等于0.299>0.05,即在0.05的显著性水平下,不能拒绝原假设,即认为汉语和英语的网络文献引用数量没有显著差异。这可能是因为随着国际学术交流增多,学生的英语水平和能力提高,很多学生在参考文献时,都比较关注国外先进文献,故使用英语文献的数量也增加,甚至提高至与国内文献的地位相同。
(2)比较俄语、日语、法语、德语、韩语之间有无显著差异。
考虑到这几类语种的样本数量比较少,有的甚至不足5(韩语的样本量仅为4),故直接采用非参数统计中的Kruskal-Wallis检验进行差异性检验,p值为0.185,大于显著性水平0.05,故不能拒绝原假设,即没有证据表明俄、日、法、德、韩这五类语种之间的网络文献数量存在显著差异。
2.2.6 根据年份分类的网络文献分析
将网络文献数量按照年份整理,并做出每年的网络文献均值折线图(图4)。
2008年的网络文献均值达到最大值,为107.41篇;2005年的网络文献均值最小,仅为40.88篇。对各年网络引文数量进行方差同质性检验,Levene检验p值为0.181,不能拒绝方差相等的原假设,故采用单因素方差分析进行深入分析。
表9是按年份分类进行的方差分析结果,p值等于0.53,大于显著性水平0.05,故不能拒绝原假设,即没有证据显示各年份的网络文献数量具有显著性差异。
2.2.7 网络引文的可访问状态
笔者对所有网络引文的URL逐一进行了访问,6094条网络引文的URLs可以访问,占网络引文总数的52.3%。5547条网络引文的URLs无法访问(包括该页面不存在、禁止访问、页面错误、该页面无法打开、服务器错误),占网络引文总数的47.7%。
2.2.8 网络引文的文件格式类型
笔者根据引文中所涉及到的文件格式,将文件格式分为以下几种类型:HTML(包括JSP、ASP、PHP)、DOC、PDF、XLS、PPT。各种文件格式类型的分布见表10。
3 结论与不足
从总体统计可看出,篇均网络引文率为8.9%,网络引文占引文总数的4%,含网络引文的论文数占论文总数的34.5%。部分学科,例如法学、管理学、教育学、经济学这四个学科,含网络引文的论文数占论文总数的百分比分别为74.2%、37.9%、36.2%、35.1%。从这些数据可看出,虽然目前网络文献占引文总数的比例仍然很小,但是已经达到了一定规模,说明在学术研究中,硕博士已经意识到了网络免费资源的学术性和新颖性,开始逐渐认同和使用这些资源来从事学习和研究。
按照学科分析的结果,法学网络引文数显著高于其他8个学科,教育学显著高于除经济学之外的其他6个学科,而理学则显著低于除经济学之外的其他学科。而其他6个学科之间并无显著差异。
按照学历分析的结果,博士论文篇均网络引文数高于硕士论文,说明博士在查找、吸收和利用网络文献方面好于硕士,同时也说明这些免费网络文献的学术性在增强,得到越来越多的学者的接受。
按照学校分析的结果,可知985工程高校和211工程高校之间存在显著性差异——985工程高校网络引文数显著高于211工程高校。而985工程高校、211工程高校和普通高校之间并没有显著差异。说明在使用网络免费资源方面,普通高校的硕博士生和985工程、211工程高校在使用的意识和实际利用方面差别不大。
从网络免费文献的类型来看,均值排在前五位的分别为学术机构信息源、政府信息源、新闻报刊信息源、学科信息源、综合网站学术信息源。再综合多重比较的结果,可以看出硕博士比较信赖的网络免费资源主要集中在政府信息源、综合网站信息源、新闻报刊信息源、学科信息源,而利用比较少的信息源为科研信息源、其他信息源。
从网络免费文献的语种分析来看,目前主要集中在中文和英文文献,中文和英文的引用数量没有显著差别,反映出硕博士对中外文文献的吸收能力基本持平,也说明他们的研究基本上能借鉴国内外的前沿的研究趋势。而其他语种的数量微乎其微。
从网络文献的年代分析来看,没有结论显示越接近目前的年份,硕博士论文对网络文献的需求越大。姚蓉、廖永霞对1999—2006年间评选出的776篇全国优秀博士学位论文的引文分析中得出网络资源的引用呈逐年增长的趋势E105,本文并未得出该结论,可能是因为数据的年代分布不均匀所致。
从网络引文的可访问状态分析来看,52.3%的网络引文可访问,而47.7%的网络引文无法访问,无法访问的原因包括该页面不存在、禁止访问、页面错误、该页面无法打开、服务器错误。从本研究来看,网络引文的稳定性较差,接近一半的网络引文不能访问,这为研究者参考网络引文带来了障碍,在未来我们应该考虑建立相应的网络引文保存和数字对象的识别系统(DOI),来不断地定位和交换这些数字资源。
从网络引文的文件格式类型来看,目前使用最普遍的文件类型是HTML格式,包括JSP、ASP、PHP等这些动态的网页格式,其次是PDF格式的文件为大家所广泛使用,再其次是DOC文件格式,而PPT和XLS格式的文件使用相对很少。
本研究力图尽可能多地反映不同学科不同专业的网络文献引用情况,但是在实际搜集数据的过程中,存在学校、专业、学科的分布不均匀,不具有典型代表性的缺憾,尤其是年代分布因为搜集数据来源的限制,导致年代分布有些不均匀,这些都是在今后的研究中有待改善的方面。
网络免费学术文献已经成为学者治学的重要的参考来源,随着网络学术文献的质量和学术性的不断提升,加之获取方便和免费的优势,已经得到越来越多的学者的接受和认可,图书馆应该重视这些免费网络学术资源的建设,尤其在进行学科服务的过程中,针对网络免费学术资源使用率高的学科,按照使用频率高的网络免费文献类型搜集资源进行学科导航服务,让图书馆的数据库资源和网络的免费资源成为学者治学的左膀右臂。
版权声明:
1.十号范文网的资料来自互联网以及用户的投稿,用于非商业性学习目的免费阅览。
2.《基于硕博士论文的网络免费学术资源引文分析与研究》一文的著作权归原作者所有,仅供学习参考,转载或引用时请保留版权信息。
3.如果本网所转载内容不慎侵犯了您的权益,请联系我们,我们将会及时删除。
本栏目阅读排行
栏目最新
- 1在农民收入调查工作动员培训会上讲话
- 22024年领导干部政治素质自评材料(完整)
- 3公司党委党建工作总结报告【完整版】
- 42024年主题教育党建调研开展情况总结
- 52024年度区妇联关于党建工作述职报告(完整)
- 6关于加强企业人才队伍建设调研与思考(完整文档)
- 72024县党员干部抓基层党建工作述职报告
- 8第二批主题教育研讨发言:时刻“以民为本”,听“实言实语”,办实事好事
- 92024关于党员干部法治信仰情况调研报告(2024年)
- 10局网络安全工作责任制落实自查报告(全文)
- 11XX国企分管领导关于党建设引领企业高质量发展研讨发言(范文推荐)
- 122024年第二批主题教育专题读书班研讨发言提纲(6)【完整版】