数据仓库技术在公司管理中的应用
(呼伦贝尔学院 计算机科学与技术学院,内蒙古 呼伦贝尔 021008)
摘 要:文章介绍了数据仓库的定义及特征、数据仓库的 体系结构、数据仓库在公司管理中的应用。
关键词:数据仓库;公司管理;数据集合
中图分类号:TP311.13 文献标识码:A 文章编号: 1007—6921(2009)24—0110—01
随着计算机科学技术的发展,越来越多的公司逐渐建立了各种各样的应用子系统,如销售系 统、库存系统、财务系统、人事系统,经营分析系统,决策支持系统等等。它们能够较好地 满足公司OLTP (Online Transaction Processing,联机事务处理)的应用需求。但是,当 前绝大多数公司内数据的真正状况是分散而非集成的,数据不一致问题、外部数据和非结构 化数据问题都难以解决。
市场竞争的日益激烈,公司需要利用现有的数据,进行分析和推理,为公司的决策提供依据 。当这种分析处理只涉及到很少的数据库表时是可行的。当数据量迅速地增长而且查询要求 不断复杂化时,这种建立在OLTP基础上的DSS(Decision Support System,决策支持系统) 就不能很好地满足决策的需求。另外从大量的历史数据中获取信息,要求系统保存大量的历 史数据。如果系统在进行事务处理时还要进行复杂的分析处理,这样对于频繁操作处理的数 据库系统而言,将会不堪重负。因此,需要重新组织数据,使其使于进行复杂分析。为适应 这一需求,应运而生的就是数据仓库技术。
1 数据仓库的定义及特征
1.1 数据仓库的发展
数据仓库,简称DW(Data Warehouse),其概念起源于20世纪80年代中期,在90年代 ,数据仓库技术已 经成为一大热点。遍及世界的公司都在试图利用多年来存储在他们计算机内的信息。数据仓 库的概念是经过被誉为“数据仓库之父” W.H.Inmon加以定义与发展的。
1.2 数据仓库的定义
数据仓库概念创始人W.H.Inmon在《建立数据仓库》一书中对数据仓库的定义是:数据仓 库 就是面向主题的、集成的、不可更新的(稳定性)、随时间不断变化(不同时间)的数据集 合,用以支持经营管理中的决策制定过程、数据仓库中的数据面向主题,与传统数据库面向 应用相对应。
1.3 数据仓库的特征
①面向主题数据仓库是一个面向主题的、集成的、非易失的且随时间变化的数据集合, 用来支持管理人员的决策。②数据集成性数据在进入数据仓库前,必须经过数据加工和 集成。首先要统一原始数据中的矛盾之处,还要将原始数据结构做一个从面向应用到面向主 题的大转变。③数据的稳定性操作型数据正规地是一次访问和处理一个记录。可以对操 作型环境中的 数据进行更新。但数据仓库中的数据呈现出非常不同的特性。数据仓库的数据通常是一起载 入与访问的,但在数据仓库环境中并不进行一般意义上的数据更新。④数据随时间变化。数据仓库中的数据随时间的不断变化,主要表现在以下3个方面:会 随时间变化不断增加新的数据内容,会随时间变化不断删去旧的数据内容,数据仓库中包含 大量的综合数据,这些综合数据很多跟时间有关,会随着时间的变化不断地进行重新综合。
2 数据仓库的体系结构
由于数据仓库偏重于工程性的特点,因而在技术上可以根据它的工作过程分为:
2.1 数据的抽取
数据的抽取是数据进入仓库的入口。由于数据仓库是一个独立的数据环境,它需要通过抽取 过程将数据从联机事务处理系统、外部数据源、脱机的数据存储介质中导入数据仓库。数据 抽取在技术上主要涉及互连、复制、增量、转换、调度和监控等几个方面。在数据抽取方面 ,未来的技术发展将集中在系统功能集成化方面,以适应数据仓库本身或数据源的变化,使 系统更便于管理和维护。数据仓库的数据并不要求与联机事务处理系统保持实时的同步,因 此数据抽取可以定时进行,但多个抽取操作执行的时间、相互的顺序、成败对数据仓库中信 息的有效性则至关重要。
2.2 存储和管理
数据仓库的组织管理方式决定了它有别于传统数据库的特性,也决定了其对外部数据表现形 式。数据仓库管理所涉及的数据量比传统事务处理大得多,且随时间的推移而累积。在数据 仓库的数据存储和管理中需要解决的是如何管理大量的数据、如何并行处理大量的数据、如 何优化查询等。目前,许多数据库厂家提供的技术解决方案是扩展关系型数据库的功能,将 普通关系数据库改造成适合担当数据仓库的服务器。
2.3 数据的表现
在数据表现方面,数理统计的算法和功能已经普遍集成到联机分析产品之中,同时又与Inte rnet/Web技术紧密结合,推出适用于Intranet、终端免维护的数据仓库访问前端。在这个方 面,按行业应用特征细化的数据仓库用户前端软件将成为产品作为数据仓库解决方案的一部 分。数据仓库实现过程的方法论将更加普及,将成为数据库设计的一个明确分支,成为管理 信息系统设计的重要组成部分。
3 数据仓库技术在公司管理中的应用
3.1 数据仓库的设计
数据仓库的设计不能照搬传统的生命周期法,而采用类似于快速原型法的开发方法。快 速建立起系统原型,提交用户试用,然后根据用户的反馈,对需求不断进行调整,使系统原 型逐渐完善。开发数据仓库的指导思想应是边建、边用、边修改、边扩充。
公司数据仓库的设计大体可以分为以下6个步骤:①概念模型设计,完成的工作是界定系统边界,确定主要的主题域及其内容。②技术准备工作,这一阶段工作包括技术评估,技术环境准备,并提出技术评估报告, 软硬件配置方案,系统总体设计方案。③逻辑模型设计,主要工作是分析主题域,确定粒度层次划分及数据分割策略,关系模 式的定义等。其成果是对每个当前要装载的主题的逻辑实现进行定义,并将相关内容记录在 数据仓库的元数据中。④物理模型设计,主要是确定数据的存储结构,确定索引策略,及数据存放位置和存储 分配。⑤数据仓库生成,所做的工作是接口编程,数据装入。⑥数据仓库运行与维护,即建立DSS应用,使用数据仓库,进一步理解需求的基础上,调 整和完善系统,维护数据仓库。
3.2 财务决策支持
典型的财务决策问题有:投资决策、筹资决策、成本决策、销售决策等。
财务决策支持系统需要的信息是通过日常业务数据所体现的整体趋势,或随时间变化而表现 出来的变化趋势,必须对业务数据进行分类、析取、归纳、加工等处理才能得到这些信息。 对数据信息的这些要求决定了财务决策支持系统的数据库有别于普通的业务数据库,因此, 必须为公司建立数据仓库以适应决策支持系统的要求。财务决策支持系统具有三个功能:决 策、管理和核算。核算,即会计功能。在会计层,它完成会计原始数据的收集、记帐、算帐 和报帐的业务处理后输出会计信息,同时将会计基础信息传输到管理层。管理,即管理信息 功能。在管理层,进行会计基础信息的分析,并将分析结果输出的同时,再送给决策层。决 策,即根据会计分析信息和其他管理信息进行预测、判断和决策,然后将决策方案下达到管 理层。在管理层进行指标分解,编制财务计划,再下达到核算层,并对核算层的执行过程进 行控制。
3.3 管理决策支持
在公司管理决策支持系统的构架方案中,OLTP应用系统中的数据库,可分为不同的类型 ,它是DSS的数据来源。大量不同事务的、可靠的、历史性的数据是建立DW的基础。OLTP从D W中的可集成数据出发,构建面向分析的多维数据模型,自动地发现数据中的潜在模式,并 以这些模式为基础自动做出预测。数据挖掘中挖掘的知识可以直接用于指导OLAP的分析处理 ,而OLAP分析得出的新知识又可以补充到系统的知识库中。传统的DSS往往独立地设计并实 现,将数据库、模型库和知识库,缺乏内在的统一性。而数据仓库、联机分析和数据挖掘组 成的新的DSS,将三库有力地结合在一个多维的数据库中,利用多维分析工具,通过可视化 工具将分析结果呈现给用户。
4 结束语
综上所述,数据仓库为解决目前数据分析中遇到的问题指明了方向,为信息分析提供了良好 的平台,基于数据仓库的联机分析处理实现了在全局数据的基础上,实时、动态地按照分析 人员意愿展开信息分析的功能。因此,数据仓库技术在国内企业及金融业将有良好的应用前 景。
[参考文献]
[1] 陈京民数据仓库原理、设计与应用[M]北京:水利水电出版社,2004,( 4).
[2] 王彦龙企业级数据仓库(ed4w)原理、设计与实践[M]北京:电子工业出 版社,2006,(1).
[3] 苏新宁数据仓库和数据挖掘技术[M]北京:清华大学出版社,2006,(4) .
[4] 荫蒙数据仓库-(原书第4版) [M]北京:机械工业出版社,2006.
版权声明:
1.十号范文网的资料来自互联网以及用户的投稿,用于非商业性学习目的免费阅览。
2.《数据仓库技术在公司管理中的应用》一文的著作权归原作者所有,仅供学习参考,转载或引用时请保留版权信息。
3.如果本网所转载内容不慎侵犯了您的权益,请联系我们,我们将会及时删除。
本栏目阅读排行
栏目最新
- 1在农民收入调查工作动员培训会上讲话
- 22024年领导干部政治素质自评材料(完整)
- 3公司党委党建工作总结报告【完整版】
- 42024年主题教育党建调研开展情况总结
- 52024年度区妇联关于党建工作述职报告(完整)
- 6关于加强企业人才队伍建设调研与思考(完整文档)
- 72024县党员干部抓基层党建工作述职报告
- 8第二批主题教育研讨发言:时刻“以民为本”,听“实言实语”,办实事好事
- 92024关于党员干部法治信仰情况调研报告(2024年)
- 10局网络安全工作责任制落实自查报告(全文)
- 11XX国企分管领导关于党建设引领企业高质量发展研讨发言(范文推荐)
- 122024年第二批主题教育专题读书班研讨发言提纲(6)【完整版】