当前位置:文档下载 > 所有分类 > 数据整合的利器——数据仓库
免费下载此文档

数据整合的利器——数据仓库

数据仓库

‰;牵别

2()09年6月

情报杂志

JoI琅NAL

oFINTELLIGENCE

Vd.28june2009

数据整合的利器

刘学风

数据仓库

(天津科技大学图书馆天津300222)

摘要阐明了数字资源整合的必要性和层次模型,分析了利用数据仓库进行数据整合的可行性。介绍了数据仓库的关键技术数据抽取、转换和加戢,最后利用Q鬣le数据仓库构建器和实验数据进行数据仓库的构建试验。关键词数字资源整合数据仓库数据整合中图分类号G250

文献标识码A

文章编号:1002—1965(2009)0107—03

术和较常见的中间件技术外,数据仓库技术是解决数据整合

1背景

随着以计算机技术为代表的信息技术的迅速发展,图书馆数字信息资源的建设成绩斐然,作为一个专门搜集整理保存并传播信息的机构,图书馆拥有非常丰富的数字化信息资源,这些数字资源既包括图书、期刊、报纸、标准、专利产品等全文数据库;又包括如文摘、题录和书目数据的数据库和相关系统。

从计算机应用系统的角度来看,这些数字资源系统的硬件平台、数据库管理软件、数据库元数据、用户端应用程序都不尽相同,因而具有分布异构性。从用户的角度来看,各个数字资源系统中数字资源内容交叉重复,影响用户对信息的选择与获取;数字资源间的知识关联程度低,知识结构体系遭破坏等。

然而用户希望在统一的检索环境和检索界面下,以最小的时间和精力实现“一站式”的文献检索、浏览和使用。图书馆也希望其用户的信息需求得到充分满足,并更好地体现其“以人为本”的服务理念,提高数字资源的利用率。因此,元论是用户方面还是图书馆方面都迫切地需要解决由于。信息爆炸”和“信息污染”给信息利用带来的不便。数字资源整合在这种情况下应运而生。

问题的重要技术。利用中间件整合异构数据库并不需要改变原始数据的存储和管理方式,中间件位于异构数据库系统(数据层)和应用程序(应用层)之间,向下协调各数据库系统,向上位访问整合数据的应用提供统一的数据模式和数据访问的通用接口。各数据库仍完成各自的任务,中间件主要为异构数据源的高层次的检索来服务。这种数据整合的思路是,通过模式翻译器将局部数据库模式以某种公共数据模型为基础映射成局部集成模式,然后通过模式集成器将各个局部集成模式按需要采用全局数据模型来定义,最终成为全局概念模式。

应用整合数据整合系统软件的整合

网络整合

图l数字资源整合层次图

3利用数据仓库进行数字资源整合的可行性

数据仓库创始人W.H.Inrn∞于1991年在<酗ldirlg

髓ta

the

2数字资源整合的层次模型

从计算机信息系统集成的角度来看,根据数字资源的分布异构性,数字资源整合从低级到高级可以分为四个层次:网络整合、系统软件整合、数据整合和应用整合u一2J,如图1所示。

网络和系统软件的整合是基础,目前各数字资源系统基本上都运行在集成的网络和系统软件基础上,而数据整合和应用整合是数字资源系统能否有效整合的关键。数据整合

Wareh溅》将“数据仓库”(跳aWarel砑l∞,Dlw)定义为

。一个用以更好地支持企业或组织的决策分析处理的、面向主题的、集成的、非易失的且随时间变化的数据集合”【3J。元数据是数据仓库的核心。多个数据源的异构数据向数据仓库集成时,多个数据源的局部数据模式映射到数据仓库的全局数据模式,并对各个数据源数据进行抽取、转换和清洗、装载等处理来为数据仓库应用程序使用。

虽然最早数据仓库的提出是用于企业的联机分析系统和决策支持系统,但分析数据仓库的基本特征,如集成性、稳定性和随时间不断变化的特点,对于数字资源系统数据层的整合来说,数据仓库可以将各个异构数字资源系统数据库中

就是采用合适的技术手段将数字资源系统中的异构数据按

一定的规则组织在一起,方便用户的有效访问。除数据库技

收稿日期:2009一03一07

作者简介:刘学风,男,1977年生,硕士。

万方数据

第1页

免费下载Word文档免费下载:数据整合的利器——数据仓库

(下载1-3页,共3页)

我要评论

返回顶部