图书馆如何控制外包商书目数据质量
(长江师范学院 图书馆,重庆 涪陵 408100)
摘 耀: 运用图书馆学、文献分类学等学科原理,通过调查法、文献资料法、综合分析法等方 法,结合自己多年从事文献编目的实践经验,对外包商书目数据的常见错误、错误产生的原 因作了详尽的分析,并提出解决书目数据质量控制的对策。
关键词:图书馆;编目工作;业务外包;书目数据;质量控制
中图分类号:G258.6 文献标识码:A 文章编 号:1007—6921(2008)13—0150—02
长期以来,采编部作为传统图书馆的技术部门,承担着图书馆的资源搜集、采访、编目、整 理和加工的过程。工作内容既有技术含量高的分类、编目工作,又有盖馆藏章、贴条形码、 粘磁条的简单重复劳动。普遍存在着采编任务繁重、图书积压待编和新书与读者见面周期长 等现象,于是纷纷将本馆的编目业务承包给书商。这样既节约了时间,又节约了人力资源。 实施编目外包后,从编目业务外包的主体方面看,弥补了人力资源的不足、专业技术人员不 够的困难,大大缩短新书在采编部的停留时间和上架的时间。但由于外包商书目数据质量问 题和编目人员自身问题等方面的因素,造成了书目质量的不准确。而书目数据的质量直接关 系到馆藏的收集、组织管理以及为用户提供服务的效果。现代图书馆无论是图书外借,还是 检索咨询等业务都是以书目数据库为基础,没有高质量的书目数据库就无法有效实现图书馆 的各项服务。因此,如何对书目数据质量进行有效控制,是图书馆编目业务的工作重中之重 。
1 外包商书目数据常见错误
有许多外包商在书目数据建设中,往往重视“2~8”字段著录信息块的分类编目,忽视了记 录头标区、“0”标识块和“1”代码信息块的编目。但这些信息块恰好是今后资源共享时计 算机识别的内容,如这些信息块著录不准确。今后在资源共享时将是一堆垃圾数据。而“2 ~8”字段信息块著录不准确,将造成藏书的困难和在流通时造成一定的借阅障碍。
1.1 记录头标区的常见错误
头标区为一条记录的头,是整个记录的整体特征,主要是为计算机提供记录处理所需,又间 接地用于标识书目文献实体本身,因此显得尤为重要。初次建库,一般记录状态为“n”,即 为新记录,那么第8字符位即层次等级取“0”;当编有层次记录的记录时,低层次记录的记 录状态应填“o”,表示编有高层的记录,第8字符位即层次等级取“2”。外包商在记录头 标区的常见错误是新记录“n”和已有较高层次记录“o”相混淆,特别是对某种有较高记录 层次的书籍没有及时将“n”替换成“o”,从而造成记录特征不明确。
1.2 “0XX”标识的常见错误
1.2.1 “0”标识记录标识是记录或编目文献的标识号。而“005”是记录版本的日期或时 间 、日期的标识字段,在CNMARC编目系统中,敲入回车键就由计算机自动生成,是记录最近一 次对记录进行处理作业的日期和时间,以便计算机系统能判定所处理的记录的版本比以前处 理的记录版本较新、较老还是相同,也为用户文献查重提供了可比性。对于“005”字段与 “100”和“801”字段的日期或时间,有必要做出解释,因为它们之间是相关字段,它们在 每一条记录中会同时出现,记录着各自的日期或时间,代表着各自的含义。外包商为了节省 时间,往往将记录的日期做成了工作单,其结果是众多的书目数据处理日期都是相同的时间 ,不能与“100”和“801”字段的时期吻合。
1.2.2 在著录随书光盘时,外包商常常将光盘上的“ISBN”国际标准音像编码字段代码中 的 内容著录在“010”字段代码中的“$a”里,从而造成一条记录有图书和光盘两个“010”字 段代码。而读者在检索数据时,喜欢用图书中的“ISBN”字段来检索所需的图书,读者在检 索图书的“ISBN”时不能显示出该书目的信息。正确著录方法的方法应将随书赠送的光盘的 “ISBN”著录在“016”字段代码里。这样读者在检索该书的ISBN才不会产生冲突。还有“0 10”字段代码中,定价“$d”字段经常出现“元”、“¥”、“RMB”和“CNY”等符号,没 有一个统一的货币标识。我们以人民币为例,正确的著录方法是在人民币单价前加上“CNY ”。另在著录套书时,外包商有将单价分别著录的,有将单价合计著录的。正确的著录方法 应将图书的套价合计,然后在后面注明“套价”字样。
1.3 “1XX”编码信息块的常见错误
1.3.1 字符集是“100”字段子字段“$a”的必备数据元素,长期以来,不同编目机构在用 CN MARC编制普通中文图书的书目数据时,对“26~29”字符位的代码标识始终存在分歧和混乱 。时而用“0120”,时而用“0121”。还在著录出版时间类型、出版年“1”和出版年“2 ”中的顺序搞错,出版年“1”和出版年“2”都有固定搭配比如。专著出版物。基本上是一 次或一年内出全。其出版日期类型为“d”。出版年1为出版物现在重印的出版时间,出版年 “2”为第一次出版时间“####’,此时的出版日期类型为“e”,否则电脑就不能在“210” 字段自动生成的“$d”和“$h”字段正确出版日期。题名文种代码主要分歧是“ea”和“eb ”混淆不请。
1.3.2 “101”字段中的常见错误:“101”字段为作品语种标识.它包含作品实体的整体、 部分和题名的语种代码,以及该作品为译作时,其原作的语言标识。如果正文语种有两种或 两种以上的语种,当作品正文为两种以上语种时,不能重复著录“$a”子字段。例:《汉语 成语英译词典》,正文为英汉对照,正确的著录方式为:1010# $a chi$a eng,外包商著录中 常出现的错误是只著录$a chi,而不著录$a eng,不能正确反应出作品的语种。
1.3.3 “105”字段中的常见错误:在著录图表代码时常常是将图表代码“a”、肖像代码 “c”和图版代码“f”相混淆;对内容特征代码中的书目“a”和目录“b” 相混淆;著录 文学体裁代码一项时未能准确地从代码“a一h”中选择一位表示作品的文学体裁,有的干脆 不著录,直接用“y”(非文学作品)替代。
1.4 “2XX”字段的常见错误
1.4.1 “200”字段的常见错误:对文献出现有正题名、其他题名和并列题名的,往往只著 录正题名,而忽略了其他题名,特别是并列题名的著录;著录丛书时,误将丛书名著录成书 名,正确的是将丛书名著录到“225”字段“$a”中,丛书中的文献正题名应分别著录在“2 00”字段的“$a”里,这样读者才能准确运用出正题名检索该记录的信息。
1.4.2 “210”字段常见错误:在著录出版发行项时,只注重文献的当前出版日期,忽略了 重复印刷日期,或者是印刷日期与重复印刷日期未能与“100”字段中的“出版日期1”和“ 出版日期2”相对应。
1.4.3 “215”字段常见错误:在著录载体形态项时,对套书文献的页码有的是分别著录, 中 间用“,”区别开来;有的则是将套书页码相加。对于套书,若价格著录为套价,正确的著 录方法是在“215”字段中著录为 “$a*册(*页)”;对记录的尺寸有的用“cm”,有的用 “开”。正确的著录方法应为“cm”;还有将图表代码“a”、肖像代码“c”和图版代码“ f”相混淆,著录的信息不能与相关字段“105”吻合。
1.5 “6XX”字段的常见错误
1.5.1 文献主题标引错误:有些外包商常常是将主题标引著录成了关键词的标引;将个人 名 称主题、团体名称主题、家庭名称主题、题名主题、地名主题等统统著录成“606”字段中 的学科主题上;还有地区复分和年代复分标引不规范;文献主题标引不能与“200”字段和 “690”字段相对应。
1.5.2 “690”字段的常见错误:一些外包商对一些边缘学科、交叉学科的文献未能做出准 确 判断,导致文献分类错误;对新兴学科的文献无所适从,也不能正确分类;该细分的文献未 细分,统统归在了上位类;同一种类的文献分在不同的类别,导致相同文献的书籍在书架上 不能放在同一处,增加了读者检索的难度,同时也是文献馆藏的一大障碍。另外对复分、仿 分和打“0”占位的理解也时常出现偏差。
2 目数据质量问题产生的原因
2.1 外包商方面的因素
由于书商经营图书的目的在于经济效益和经济利益最大化,不会花大力气去理会图书编目数 据的质量问题。而现在的书商基本上都是民营企业,他们的管理都是量化管理,属下的编目 人员的薪金是跟他们每天所编图书的数量直接挂钩的,难免不出现只求数量不顾质量的问题 ,加之书商招聘的编目人员素质良莠不齐,对文献编目的理解和认识也不一样,从而造成书 目质量出现问题。
2.2 图书馆编目人员方面的因素
一些图书馆有的编目人员只经过简单培训后就从事书目数据的套录工作,不懂得文献著录的 方法和基本规则,不能对边缘学科和交叉学科的图书进行准确判断和分类。另在套录数据源 时过多依赖外包商的书目数据,照搬书商提供的书目数据,从而造成书目数据的不准确。还 有因时间紧,任务重,有些编目人员只追求数量而忽略了书目数据的质量,也造成书目数据 不准确。
3 书目数据质量控制的对策
3.1 规范书目数据
随着计算机不断普及,读者利用计算机检索查询文献资料将更加广泛和深入,这就要求编目 人员应严格地按照《中国图书馆图书分类法》(第四版)、《中国文献编目规则》以及《中 国机读目录格式》的标准进行分类编目,并严格按机读目录格式制作书目数据,及时修正原 有书商书目数据中的错误。另外还应根据本馆藏书的特色以及交叉学科和新兴学科的特点, 制定编目工作细则,使编目人员有据可依,使读者进行文献检索时有规律可循。
3.2 完善的著录细则
为进一步提高编目质量,在套录书商数据源时,精简冗长和繁琐的字段,制定出适合自 己图书馆里的套录工作单,对著录必备字段和著录细则都有严格的要求。除对字段的要求外 .还应制定一套完善的著录细则,如对检索点的著录、书名的排列顺序、正副题名的判定、 书名中的字母、数字符号、标点全角与半角的使用。译著责任者字段的规范著录、多卷书采 用集中还是分散著录方式等,都有统一的规定。这样使编目员在工作中有章可循,确保同一 种书在数据库中的准确性和惟一性,有效杜绝异书同号、同书异号情况的发生。
3.3 建立严格的审定程序
对待每一条套录的数据都要进行严格的审查、校对。建立健全监督、检查、奖惩机制, 惩罚分明,努力提高编目员的工作积极性。加强层层校对制度,制定出严格有效的检查和纠 正错误的质量控制方案,严把多层校对关,以确保高质量的数据套录到中心数据库。
3.4 提高编目人员的业务素质
编目工作是图书馆的基础工作,从图书进馆到上架流通、阅览,每个环节都与编目工作息息 相关,所以编目人员的职业道德素质的高低将直接关系到编目数据的质量,影响到图书馆功 能的发挥。所以编目人员除了应具备基木的图书馆学、目录学、分类学等专业知识外,还要 具备计算机编目知识、网络编目技术以及外语等知识和其他能力。一方面,对编目人员进行 短期培训,也就是针对某一种新技缩、新理论、新方法进行培训。尤其要注重单项培训,如 计算机知识、网络知识、信息检索知识以及外语培训等,这是编目人员掌握最新技术、技能 快捷的有效方法之一。另一方面,在职攻读学位,图书馆的领导要允许有能力的编目人员, 根据个人实际情况,选择适当的专业,以恰当的方式和时机接受继续教育,进行深造学习。 此外,还要加强业务研究和学术交流活动,利用各种机会让编目人员听取专家、学者的报告 会、专题学术讲座、经验交流会,取长补短、开阔视野,把握学科发展的最新动态。
4 结束语
总之,书目数据的质量是书目数据库建设的生命线,也是图书馆各项业务工作的基础。 无论是图书馆领导还是一般的编目人员,都从思想上认识数据准确的重要性,不能以牺牲数 据质量为代价,换取图书加工的数量。
建设高质量的书目数据库,不仅要从硬件上加以控制 ,而且更重要的是人员、系统的选择,但最关键的是对于系统的理解、对规则的理解,和规 范的控制,才能建设高质量的书目数据库。
[参考文献]
[1] 中国图书馆分类法编委会.中国图书馆分类法(第四版)[M].北京:北京图 书馆出版社,1999.
[2] 熊光莹.计算机编目技术手册[M].北京:北京图书馆出版社,1999.
[3] 北京图书馆《中国机读目录格式使用手册》编委会.中国机读目录格式使用手 册[M].北京:华艺出版社,1995.
[4] 李育嫦.当前文献主题标引存在的问题与解决方法[J].图书情报知识,2002 ,(5):70-72.
[5] 禹良琴.关于记录头标区及人工赋值字符位问题的探讨[J].农业图书情报学 刊,2005,(11):146-148.
[6] 严红,等.关于书目数据质量控制问题的探讨[J].情报杂志,2004,(1): 120-121.
[7] 张玉娥,等. 高校图书馆书目数据库建设质量控制问题探析[J].晋图学刊, 2001,(3):29-30,40.
版权声明:
1.十号范文网的资料来自互联网以及用户的投稿,用于非商业性学习目的免费阅览。
2.《图书馆如何控制外包商书目数据质量》一文的著作权归原作者所有,仅供学习参考,转载或引用时请保留版权信息。
3.如果本网所转载内容不慎侵犯了您的权益,请联系我们,我们将会及时删除。
本栏目阅读排行
栏目最新
- 1在农民收入调查工作动员培训会上讲话
- 22024年领导干部政治素质自评材料(完整)
- 3公司党委党建工作总结报告【完整版】
- 42024年主题教育党建调研开展情况总结
- 52024年度区妇联关于党建工作述职报告(完整)
- 6关于加强企业人才队伍建设调研与思考(完整文档)
- 72024县党员干部抓基层党建工作述职报告
- 8第二批主题教育研讨发言:时刻“以民为本”,听“实言实语”,办实事好事
- 92024关于党员干部法治信仰情况调研报告(2024年)
- 10局网络安全工作责任制落实自查报告(全文)
- 11XX国企分管领导关于党建设引领企业高质量发展研讨发言(范文推荐)
- 122024年第二批主题教育专题读书班研讨发言提纲(6)【完整版】