新闻资讯
记录首创点滴进步 见证远行
我们一直紧跟时代前沿,聚焦行业实时动态,发布公司最新资讯,欢迎您的关注

12.06日音讯,解读数据仓库的主要元素

日期:2013-12-06发布:首创网络浏览:630次

    12.06日音讯,解读数据仓库的主要元素。了解数据仓库或数据市场的组成元素必不可少的一部分就是建立新的词汇表,与数据仓库相关的词汇可能并不是那么直观易懂,然而一旦你拿到手,所有问题便都迎刃而解。其实,数据仓库主要是由两种表构成的,即事实表和维度表

    本文关键字:12.06日,音讯,解读,数据,仓库,的,主要,元素,

  

  12.06日音讯,解读数据仓库的主要元素。了解数据仓库或数据市场的组成元素必不可少的一部分就是建立新的词汇表,与数据仓库相关的词汇可能并不是那么直观易懂,然而一旦你拿到手,所有问题便都迎刃而解。其实,数据仓库主要是由两种表构成的,即事实表和维度表。

  通常情况下,事实表包含一些业务事实数据,例如销售额、销售数量、客户数量以及指向维度表的外键。所谓外键,指的是关系型表中的一个字段,该字段与另一个表中的主键列相匹配。外键在多个表之间提供一种间接引用级别,使你可以对其进行交叉引用。外键的一个重要作用是维护数据库中的引用完整性(数据完整性)。维度表包含与事实表中特定特性相关的详细信息,例如产品的详细信息、客户特性、存储信息等。在图1-3中,Product维度表包含ProductSKU和ProductName特性。接下来的几节将对事实表和维度表进行更为详细的介绍。

  1.事实表

  最终目标是从数据提取至关重要的业务信息,为了实现这一目标,需要在一开始就按照能够便于在将来进行数值操作的方式来组织数据结构。将数据嵌入某些经过规范化处理的数据库永远也不会这样做!业务数据(通常称为详细信息数据或事实数据)存储在一种非规范化的表中,我们称之为事实表。不要被“事实”这个术语所困扰,它的字面意思就是我们常说的事实。在企业中,所谓的事实其实就是诸如销售的产品数量以及针对售出产品收到的货款金额等内容。此外,还可以通过另外一种方式来描述这种类型的数据,即将其称为度量值。将数据称为度量值还是详细信息数据并不重要,重要的是,这种类型的数据通常都是数值型的(当然,也可能是字符串类型),并且对应的值很可能会发生聚合(在层次结构基础上对数据进行预先计算好的汇总,这样会对以后的查询性能起到明显的改善作用)。事实表中通常会包含与表1-1中类似的列:

  2.维度表

  通常情况下,事实表保存的是量化数据,例如显示每次销售售出的产品数量以及针对售出的产品向客户收取的款项金额的交易数据。为了基于诸如时间等内容提供对更高级别汇总数据的引用,可以添加一个补充表,通过联接功能(将一个表链接到另一个表的方式)提供到这些更高级别数据的链接。对于时间,事实表可能只会显示售出特定数量的啤酒时的日期,若要进行月度、季度或年度业务分析,时间维度是必不可少的。表1-2显示的是一个啤酒产品维度表至少应该包含的信息。在该表中,ProductID是主键。前面显示的事实表中的ProductID是联接到该表中的ProductID的外键:

  为便于说明,假定有一个针对时间的维度表,其中时间包含月度值、季度值和年度值。每个值都必须具有一个唯一键,这些唯一键值称为主键。与此同时,返回到前面所说的事实表,该表中包含一列键,其对应的键值映射到维度表中的主键。事实表中的这些键称为外键。到现在为止,如果你能够认识到维度表连接到事实表,而这种连接性使你可以扩展保存在事实表中的低级别事实的效用,就已经足够了。

  多维数据库是基于事实表和维度表创建的,用于形成称为维度和多维数据集的对象。绝大多数情况下,维度对象是基于维度表创建的。维度对象的部分示例包括时间、地理位置以及员工,通常还可能包含有关这些对象的其他信息,用户可以利用这些信息对事实数据进行分析。多维数据集指的是包含事实数据以及维度的对象,可以通过按维度对数据进行切片来执行数据分析。例如,可以查看2011年度华盛顿州的销售信息。其中,每个信息片都是一个维度。

  3.维度

  为了弄清楚多维数据集(在业务分析中居于核心地位,将在下一节中进行讨论)的概念,必须首先了解维度的性质。我们说OLAP基于多维数据库,这一点从字面上便可以看出来。在执行业务分析时需要观察这种维度之间的关系,例如时间、销售额、产品、客户、员工、地理位置以及账户。绝大多数情况下,维度由若干个层次结构组成。层次结构属于逻辑实体,业务用户可能需要通过这种逻辑实体来分析事实数据。每个层次结构可能会包含一个或多个级别。以地理位置维度为例,该维度中的一个层次结构可能包含以下级别:Country、State、County和City。

  对于美国来说,像地理位置维度中的层次结构可以提供一个完全均衡的层次结构。所谓完全均衡的层次结构,指的是城市所对应的所有叶子(端点)节点与顶级节点的距离应该是相等的。

  相对于顶级节点,维度中的某些层次结构可能具有非均衡的叶子节点分布。这种层次结构称为非均衡层次结构。组织结构图就是一个明显的非均衡层次结构的示例。从主管到员工的结构链具有不同的深度,也就是说,各个叶子节点与顶级节点的距离不尽相同。例如,总经理下面可能具有若干部门经理以及一名管理助理。部门经理下面可能具有其他一些直属下级,例如一名开发经理和一名测试经理,而管理助理可能没有任何直属下级。

  还有一部分层次结构,它们在通常情况下是均衡的,但某一级别中的某些成员可能缺少独特的特征。这种层次结构称为不规则层次结构。地理位置层次结构就是不规则层次结构的一个示例,该层次结构中包含Country、State和City这3个级别。在Country为USA的条目中,可能包含Washington州和Seattle市。如果想要在该层次结构中添加Country为Greece、City为Athens的一个条目,可以将其添加到Country和City级别。但是,在Country为Greece的条目中没有State,因此成员Athens直接与Greece相关。顶级成员按照不同的路径路由到最低级别成员的层次结构即称为不规则层次结构。总结来说,维度就是具有若干级别的均衡或非均衡层次结构。它面向主题,主要用作进行详细业务分析的基础。

    欢迎大家阅读浏览,部分内容来源于网络,如有侵权,请联系我们删除!

+ 查看更多我们的客户 / Our client

    24小时技术支持
    18931045623
    在线客服

首创简介

    首创网络成立于2012年,是一家专业的品牌网站设计和网络营销推广公司,服务领域涵盖网站设计、市场策划、企业画册及VI视觉设计、网站域名空间等领域,公司拥有一批高素质人才,着力打造品牌网站设计制作和网上营销策略执行两大优势。

    十年来,凭借对市场趋势敏锐的洞察,和对消费者、企业形态深刻的理解,我们服务的已遍及京津冀、长三角、珠三角等领域,行业覆盖政府机构、企事业单位、无线通讯、环保、电子、医药、交通、园林、地产等行业,诸多知名企业,如广州京信集团、广东联通广州分公司、搜狐家居广州站、搜狐家居邯郸站等,都鉴证了首创设计公司的品牌设计思想与能力,首创设计公司也与诸多企业勃的市场经济中互促共生。

在线客服


  • 扫描加微信

  • 扫描加QQ

  • 扫描浏览手机版
首创网络邯郸公司
邯郸公司
服务热线:0310-4559740 / 18931045623  公司地址:邯郸市丛台区颐高广场B座13层1304室  客户接待:邯郸市陵园路669号康桥国际B06