写在前面

本文隶属于专栏《100个问题搞定大数据理论体系》,该专栏为笔者原创,引用请注明来源,不足和错误之处请在评论区帮忙指出,谢谢!

本专栏目录结构和文献引用请见100个问题搞定大数据理论体系

解答

Cube是MOLAP中使用的一种技术。

MOLAP表示基于多维数据组织的OLAP实现(Multidimensional OLAP)。

以多维数据组织方式为核心,也就是说, MOLAP使用多维数组存储数据。

多维数据在存储中将形成“立方块Cube”的结构。

其特点是将细节数据和聚合后的数据均保存在Cube中,所以以空间换效率,查询时效率高,但生成Cube时需要大量的时间和空间。

补充

Cuboid

给定一个数据模型,我们可以对其上的所有维度进行组合。

对于 N 个维度来说,组合的所有可能性共有 2 种。

对于每一种维度的组合,将度量做聚合运算,然后将运算的结果保存为一个物化视图,称为 Cuboid 。
所有维度组合的 Cuboid 作为一个整体,被称为 Cube 。

所以简单来说,一个 Cube 就是许多按维度聚合的物化视图的集合

OLAP的多维分析操作

OLAP的目标是满足决策支持或者满足在多维环境下特定的査询和报表需求,它的技术核心是"维"这个概念。

“维”( Dimension)是人们观察客观世界的角度,是一种高层次的类型划分。

“维”一般包含着层次关系,这种层次关系有时会相当复杂。通过把一个实体的多项重要属性定义为多个维,使用户能对不同维上的数据进行比较。

因此,OLAP也可以说是多维数据分析工具的集合。

OLAP 的基本多维分析操作有钻取、切片和切块,以及旋转等。

  1. 钻取是为了改变维的层次,变换分析的粒度。它包括向上钻取(rollup)和向下钻取(drilldown)。 rollup是在某一维上将低层次的细节数据概括到高层次的汇总数据,或者减少维数;而
    drilldown则相反,它从汇总数据深入到细节数据进行观察,或增加维数。
  2. 切片和切块是在一部分维上选定值后,观察数据在剩余维上的分布。如果剩余的维只有两个,则是切片;如果有三个,则是切块。
  3. 旋转是为了变换维的方向,即在表格中重新安排维的放置(如行列互换)。
上一篇 下一篇