当前位置: 首页 > 党团工作 >

Tag在图像资源管理中的作用

发布时间:2022-03-09 15:08:17 | 来源:网友投稿

——以Flickr为例

(1.中山大学;2.广东省立中山图书馆,广东 广州 510110)

摘要:文章总结了传统图像检索方法存在的诸多不足,分析了以Tag技术为蓝本的Flickr网站获得广泛好评的原因,在此基础上探讨了Tag在图像资源管理中的优势。

关键词:Tag;Flickr;图像资源;资源描述

中图分类号:TP391.41    文献标识码:A    文章编号:1007—6921(2009)21—0145—03

 

20世纪90年代以来,随着因特网和多媒体技术的发展和普及,图像资源逐渐成为一种日趋重要的信息资源,图像成为描述和存储信息的重要载体。图像资源以几何级数量增长,如何管理这些图像才能使用户在面对浩瀚的数字图像资源时,不会感到束手无策,不会产生“迷航现象”,成为发挥图像资源重要作用过程中的绊脚石。如果不对它们进行有效的管理,图像资源的重要作用就要被湮没。而常用及传统的图像标引检索技术已不能满足Web2.0时代人们个性化的信息需求,以Flickr网站为代表的一批互联网站所采用的Tag技术带来了转机。
1 常用图像检索技术遭遇瓶颈

常用的图像检索技术主要有两种:基于文本的检索技术和基于内容的检索技术。
1.1 基于文本的检索技术

该方式始于20世纪70年代,其一般处理方式是人工对图像进行关键词或文本标题描述,必要时再辅加一些附加信息,然后将图像的存贮路径和图像相关的关键词或文本标题建立相应关系[1]。

尽管基于文本的检索比较容易实现,而且它对技术、硬件等的要求也比较低,但由于图像本身存在难于准确描述的特性,以及人工标引行为的存在,导致其检索效率效果往往不尽人意。
1.1.1 图像资源本身内容信息的模糊性和不确定性。利用语言传达信息时,基于交流双方对语言含义的统一认识,交流过程是明确的,确定的。甲大脑中的信息经过转化成为语言信息,通过交流对话传递给乙,乙经过大脑处理获得的信息与信息源信息(甲大脑发出的信息)基本相同。但图像信息的传达不是通过文字,而是通过视觉。

图像信息的传达有赖于人们“看”到的内容。但人们对于“看到”的视觉信息并没有统一的认识,这使得图像信息转化为语义信息的过程存在模糊性和不确定性。图像资源内容具有丰富性和复杂性的特点:①图像丰富的内容信息不能被完全揭示(Besser,1990);②图像常被挖掘其原创者未曾预料的价值(Besser,1990);③对于不同个体,图像具有不同的信息含义(ChenandRasmussen,1999;Enser,2000);④从具体到抽象,图像具有数个不同的意义层(Enser,2000;Jorgensenetal.,2001;Layne,1994)[2]。
1.1.2 人工标引行为存在。现阶段的计算机视觉技术和人工智能技术都无法自动对图像进行标引,必须依赖于人工标引行为。因而标引人员主观理解的差异将导致检索过程中的失配错误。①对图像应被标引的属性没有统一的认识(ChenandRasmussen,1999);②恰当的确定标引深度存在着困难(Enser,2000);③标引人员主观性明显和标引过程缺少连贯性(Rasmussen,1997);④用户使用语言与标引所用受控词表的匹配程度不尽如人意(Gordon,2001;Hastings,1999;Jorgensen,1998;Roberts,2001);⑤用户和标引人员对同一对象的认知存在着差异(Heidorn,1999)。⑥图像资源的剧增,也使得人工对每幅图像进行关键字的概括和注释变得几乎不可能[3]。
1.2 基于内容的检索技术

该方式出现在20世纪90年代,它是一种综合集成技术,通过分析图像的内容,提取其颜色、形状、纹理,以及对象空间关系等信息,建立特征索引,并存储在特征库中。它用于检索的是反应图像内容并与图像存储在一起的各种量化特征[3]。

特征(即内容)的提取是基于内容的图像检索的基础,就广义而言,特征既可包括文本型的(如关键字、注解等),也可包括视觉特征(如颜色、纹理、形状等),然而,从一般的图像中自动提取出关键字目前尚无可能达到[4],从现有的理论研究及基于内容的图像检索系统或软件等应用情况来看,基于内容的图像检索都集中于底层视觉特征的研究[5]。但是试验结果往往证明,由于用于检索的图像的纹理、颜色、形状等特征大多是图像的全局特征,在有些场合下这些特征及其组合并不能很好的描述图像内容,尤其在描述建筑物等刚性物体时,纹理、颜色、形状无法描述其结构特征而使检索的效率下降,因此,仅仅依赖颜色、纹理和形状等底层视觉特征并不能很好地表达图像的语义。并且计算机自动提取的图像特征和人理解的语义间存在很大的差距,使得基于内容的图像检索存在着较大的误检率。此外,这种方法只能针对那些对图像信息有一定专业认识的用户,如何把一般用户的检索需求条件化仍是待解决的问题之一。
2 Flickr网站的图像标引与检索方法

Flickr是全球最好的在线图片管理和分享网站[6],它为用户提供最方便快捷的图片管理方式——利用Tag来描述,揭示,组织用户上传到系统中的图片。
2.1 图像标引与揭示

在Flickr网站,用户可以通过网页、软件或者Email等方式上传照片,采用著者添加Tag进行图片标引的方式。用户在上传完毕一张或一批图片后,可以任意选择自己喜欢的词语作为这张或这批图片的Tag,不受原有分类体系的限制,甚至不受图片原有内容的限制。上述操作完成后,系统将显示标引结果。对每一张被标引的图片,系统会从是否有其他用户保存过相同名称的图片、相关Tag列表、发布时间、被访问次数、被推荐数量以及访问权限等角度进行揭示,而且所有以数值描述的指标所使用的数据都是动态的。
2.2 图像检索

Flickr的图像检索主要是通过对标签的检索来实现的。标签具有聚合的特征,在每一个标签下面,都汇聚了众多图片,用户键入某一标签后,系统会自动返回所有使用该标签标引的图片。Flickr最引以为自豪的就是它所提供的标签云图功能,在其标签云图页面上提供150个Tag的显示结果,Flickr将其分为两类,一类是查询24h之内被频繁使用的热门标签,另一类是一直以来都受关注的热门标签。标签云图的功能是将一个用户或一群用户的所有标签集中显示,这批标签除了按字序排列外,还根据被使用的次数,以不同大小和颜色的字体区别。一般而言,被使用次数越多的标签,字体越大,颜色也就越醒目。因此,最受欢迎的Tag和最具影响力的Tag会脱颖而出,有助于用户更快更准确的了解热门图片和热点问题。除此之外,Flickr还有用户评论功能,用户可以根据发布者授权公开的程度对图片发表评论。如允许向家庭成员公开的照片,发布者的家庭成员便可以根据授权对该图片发表评论,系统将在每一图片的描述结果页面中显示评论内容。

Flickr网站经常被视为应用民俗分类法的典型代表,它所采用的著者添加Tag进行图片管理的方式,挑战长久以来采用严格分类体系进行信息组织的传统,极大的激发了公众进行个性化信息组织的热情。根据Alexa的统计,Flickr的流量目前已超过成立伊始的10倍,作为互联网上最大的图片管理网站,flicker的成功之处主要有:①Flickr网站图片资源丰富,使得任何一种特定检索要求都有可能实现。②Flickr网站提供的相关Tag列表功能,群组功能等,满足了无既定检索目的的用户单纯追求视觉乐趣的需求。③相比较传统受控词表跟不上社会发展的困难,Flickr能更灵活更迅速的吸收社会新近出的新词新语。④用户添加Tag进行图片管理的方式,避免繁琐的分类体系带来的认知障碍,满足用户个性化信息管理的趋势。⑤群体认知的趋同性,不仅促使与该事物有关的元数据更迅速地向其靠拢,而且更透彻的揭露事物本质。
3 Tag在图像资源管理中的作用

尽管Tag在形式上看来与传统资源描述方法中的关键词等元数据颇为相似,但其实存在着本质的不同,Tag是用户为方便自己再次使用资源而建,是一种利己的信息组织行为;而传统元数据则是由资源的组织者所建,是为他人共享使用资源而建[7]。因此,Web2.0时代,Tag极大的满足了公众个性化的信息需求,特别是它在图像资源管理中的独特优势,更使得以它为技术蓝本的Flickr网站获得巨大成功。
3.1 Tag很好地解决了多媒体技术迅猛发展的今天,如何标引揭示数量如此巨大的图像资源的难题

基于图像资源在描述和存储信息上的重要作用,各种数字图片,数字图片数据库如雨后春笋般涌现,充斥着整个网络。但是对于图像资源的标引与揭示一直不能达到相应发展规模和发展速度的要求,浏览与检索已成为困难,更不用谈利用了。Tag技术则很好的分解了这个难题,它将标引揭示的压力转嫁到每个用户身上。用户在产生图像资源的同时,还兼有标引与揭示该图像的责任。图像资源自其产生,便拥有相应的“身份证明”,从而避免了未经标引的垃圾图片进入网络空间。
3.2 Tag处于同一个平面上,不存在上下级之间的层级关系,不进一步表达分类的概念,因而描述图片的若干个Tag之间的关联关系就会得到很好地揭示

例如,在描述梵高的名画“向日葵”时,用户可能添加“后印象派”、“向日葵”等标签,如此一来,后印象派和向日葵之间就存在着联系了,而这是目前的计算机所无法完成的。这种关联性的揭示,为用户提供了一种新的检索模式。当我们把经常一起出现的分类关联起来,就可以产生一种相关性聚合,将这种聚合应用到用户的检索中去,就可能为用户提供更恰当的结果[8]
3.3 Tag技术可以更好地揭示图像资源的语义信息,这一优势是建立在群体用户标签行为之上的

由于人类认知模式和认知过程的存在差别,不同的人对同一事物的观察会存在不同的认识和理解,标注的结果可能会存在很大的差异。但也正是基于这样的原因,用户在为某一类图片添加的标签总是能从不同角度揭示这类图片的,久而久之,与该类图片相关的所有元数据都被挖掘出来,这比权威机构按照传统信息组织方法所给出的标引揭示结果更具实用价值和社会意义。
3.4 Tag所具有的聚合特征,支持偶然性的图片发现,有助于图片检索

用户在很多情况下并不能准确描述自己所需要的图像资源,他们只是想获得一种与其感情、感觉相契合的图片,只是一种模糊的需求,可能只会用一二个词语来形容这种心理需求。而Tag能够将所有使用该词语进行标引的图片全部集中起来,它提供了一种“类”的浏览方式,支持用户在浏览过程中发现符合自己需要的图像资源。这种“类”的浏览方式并不是用户漫无目的、毫无头绪的寻找过程,而是用户在Tag提供的互相关联的图片之间的浏览,因而其命中率显然更高一些。
4 结束语

Tag在图像资源管理中的应用刚刚起步,尚处于初步发展阶段。尽管Flickr获得了广泛的关注和好评,但这并不意味着将Tag技术应用于图像资源管理的实践已完全成熟。由于Tag与生俱来的随意性、时效性、平面性和分散性[9]的特点,使其图片资源管理中仍然存在一系列的问题。例如,用户过于个性化的标签行为、Tag的语义模糊歧义等等,这些因素必将影响标签的服务效率,同时产生的垃圾标签将严重扰乱整个系统的稳定性。Tag所倡导的完全自由的信息组织行为无疑具有巨大的吸引力,但同时,这种自由性所带来的标签行为的随心所欲和毫无组织也会成为其致命弱点。在图片资源的描述与组织中,Tag不能取代传统的元数据已成为各界的共识,因此,如何借鉴传统的信息组织规范方法,对标签进行规范,以便更好的组织信息,就是应对未来的课题[8]。
[参考文献]
[1]韩毅,沈怡.图像数据的存贮和检索技术述评[J].情报杂志,2003,(1):46~48.
[2]KrystynaK.Matusiak.Towardsuser-centeredindexingindigitalimagecollections[J].OCLCSystems&Services,2006,22(4):283~298.
[3]范自柱.基于内容的图像检索技术综述[J].华东交通大学学报,2005,22(5):147~150.
[4]庄越挺,潘云鹤.基于内容的图像检索综述[J].模式识别与人工智能,1999,(2):170~177.
[5]汪丹.基于内容的图像标引与检索创新[J].现代情报,2005,(4):59~62.
[6]Flickr官方网站[EB/OL].[2009-04-20].http://flickr.am.
[7]常唯.标签在数字学术资源内容揭示中的作用研究[J].图书馆杂志,2007,(1):46~52.
[8]图书馆2.0工作室.图书馆2.0:升级你的服务.北京:北京图书馆出版社,2008.169~171.

推荐访问:资源管理 图像 作用 Tag

本文标题:Tag在图像资源管理中的作用
链接地址:http://www.ylwt22.com/dangtuangongzuo/2022/0309/102092.html

版权声明:
1.十号范文网的资料来自互联网以及用户的投稿,用于非商业性学习目的免费阅览。
2.《Tag在图像资源管理中的作用》一文的著作权归原作者所有,仅供学习参考,转载或引用时请保留版权信息。
3.如果本网所转载内容不慎侵犯了您的权益,请联系我们,我们将会及时删除。

十号范文网 |
Copyright © 2018-2024 十号范文网 Inc. All Rights Reserved.十号范文网 版权所有
本站部分资源和信息来源于互联网,如有侵犯您的权益,请尽快联系我们进行处理,谢谢!备案号:粤ICP备18086540号