主办单位:广东时代传媒有限公司

投稿邮箱:fzggzzs@163.com

你的位置: 首页 » 论文鉴赏 » 数字图书馆信息检索可视化体系

发展改革理论与实践封面

主管单位:南方出版传媒股份有限公司

主办单位:广东时代传媒有限公司

出版周期:半月刊

编辑出版:发展改革理论与实践杂志社

国内刊号:CN 44-1729/F

国际刊号:ISSN 1003-6709

邮发代号:46-123

开本:16开

语种:中文

投稿邮箱: fzggzzs@163.com

《发展改革理论与实践》
投稿邮箱:fzggzzs@163.com
论文鉴赏

数字图书馆信息检索可视化体系


发布时间:2019-10-20 阅读数:553

摘 要 可视化技术利用计算机图像处理技术、数字技术、网络通信技术等把没有空间模型的信息数据转换成视觉形式,将其应用于数字图书馆信息检索可以使其信息服务更加人性化、智能化,可极大提高检索效率,获得满意的检索效果。本文论述了数字图书馆信息检索可视化的必要性,构建了数字图书馆检索可视化系统的体系结构。

关键词 数字图书馆 信息检索可视化

中图分类号:G250 文献标识码:A

1数字图书馆信息检索可视化的必要性

首先,数字图书馆的信息资源不仅包括各种多媒体信息,还包括各种经过处理的网络信息资源,馆藏信息资源内容的多样性、广泛性和深入性远甚于多载体文献形式的传统图书馆。传统图书馆文献信息是按照一定的分类编目法进行组织分类编目并建立相应的类目标引体系,而数字图书馆信息资源是数字化信息,是以指针、元数据和数据的方式进行组织存贮。因此,数字图书馆信息资源组织方式和检索操作的复杂性远远超过传统图书馆。其次,数字图书馆作为大众化的信息服务中心,其服务对象具有广泛性和多样性的特点。面对信息资源的多媒体性以及信息存贮的数字化,数字图书馆要为用户提供优质服务就应提供更为简便化、人性化、自动化的人机交互检索系统,为用户获取所需信息提供有效捷径。

2数字图书馆信息检索可视化系统的体系结构

可视化检索系统主要包括特征索引库模块、用户检索模块以及结果可视化模块,如图1所示。在传统的基于关键词标引匹配检索方法中一般是通过对多媒体信息的物理特征进行著录标引,并将其转换成相应的文本格式,建立索引库,然后按照文献检索一样,将用户提问的关键词与索引库数据进行匹配。由于图像、音频、视频等包含的信息量很庞大,物理特征描述往往不能揭示这些数字信息的内容,用户也难以用文字合理地表述对其所需,导致信息检索不能满足用户的信息需求。目前,基于内容的多媒体检索技术较好地克服了这一缺点并成为数字图书馆多媒体信息检索的热点技术,本系统就以这种检索技术为基础,构建各功能模块:

建立数字化信息资源特征索引库是数字图书馆信息检索的基础。特征索引库模块的功能主要是对各种多媒体数字化信息资源按照选定的特征抽取方法,生成相应的特征数据库建立索引数据库。对数字化多媒体信息资源进行特征提取,是指选择按照一定的算法从原始数字化资源库中分析出可以表示数字化文本、图像、音频、视频等各种信息资源本质内容的数据信息,并为这些信息数据建立相应的特征库。在该模块中为了加快检索速度,系统模块将这些数据按照抽取的方法分类存放到数据库中,同时把各种媒体的特征数据和具体的媒体信息关联起来。因为多媒体信息具有多种属性,为了有效揭示信息内容,系统会从多个不同角度描述信息资源,所以特征索引库的数据是多维的数据。用户检索模块是用户进行查询和浏览数据的接口,该模块的主要功能是将用户的检索提问输入检索系统为可视化信息检索提供数据接口,将用户提供的查询需求与索引库数据进行匹配检索。结果可视化模块的功能是通过可视化算法求出匹配成功数据的可视化结构模式,结合图符库将检索结果以视图形式显示给用户。由于基于内容特征的信息检索是一种相似度检索,需要在检索过程中不断与系统交互,评价系统查询结果,并重新匹配调整查询提问,逐步求精获取有效信息的方法,所以系统设置利用相关反馈技术来收集用户对检索结果的反馈信息。

此外,信息检索可视化需要把信息资源的特征数据信息描述为n维向量,然后选择合适的检索模型将向量在n维空间中显示出来,因此选择可视化检索模型时要考虑所选模型是否能够以向量的形式描述信息资源和查询。布尔逻辑模型、向量空间模型和概率模型是常用的三大检索模型。布尔逻辑模型(Boolean Model)是一种基于关键词的信息检索模型,通过将用户的检索提问与特征数据的标志进行严格字符匹配比较来检索信息。它的改进模型包括模糊集合模型和擴展布尔模型。模糊检索模型较好地克服了严格匹配导致查全率下降的不足,但它并没有对检索结果进行向量化处理;扩展布尔模型是对提问与特征数据进行布尔检索后,再将检索结果按照向量检索模型处理,所以它符合可视化检索要求。向量空间模型(Vector Space Model,VSM)是把每一条特征数据以及每个检索提问用向量表示,然后将检索中的特征数据与提问的匹配处理过程转化为向量空间中特征数据向量与提问向量的相似度计算问题,所以向量空间模型及其改进模型都可以成为可视化检索模型。概率模型是基于概率排序原理,根据特征数据信息与提问的相关概率来排序输入检索结果的方法。因此,扩展布尔模型以及向量空间模型及其改进模型都可以成为可视化检索模型的选择。

3结束语

可视化技术的研究和利用给数字图书馆环境下的信息资源操作管理带来了根本性的变革。通过对可视化技术的研究和利用,数字图书馆把计算机技术、数字技术、多媒体技术结合起来,将那些通常难以设想和接近的环境和信息,以动态直观的方式表现出来,为读者提供更加有效的服务。

作者简介:罗慧丽(1986.8-)女,汉族,福建省建瓯市人,本科 ,闽北职业技术学院,助理馆员,研究方向:图书馆服务。

参考文献

[1] 曾民族.知识技术及其应用[M].北京:科学技术文献出版社,2006:431.

[2] 张学福.信息检索可视化基本问题研究[J].中国图书馆学报(双月刊),2006(03):37.


编辑整理:发展改革理论与实践杂志社官方网站