写在前面

本文隶属于专栏《100个问题搞定大数据理论体系》,该专栏为笔者原创,引用请注明来源,不足和错误之处请在评论区帮忙指出,谢谢!

本专栏目录结构和文献引用请见100个问题搞定大数据理论体系

解答

维度表
维度表示你要对数据进行分析时所用的一个量,比如你要分析产品销售情况, 你可以选择按类别来进行分析,或按区域来分析。
通常来说维度表信息比较固定,且数据量小

事实表
表示对分析主题的度量。
事实表包含了与各维度表相关联的外键,并通过join方式与维度表关联。事实表的度量通常是数值类型, 且记录数会不断增加,表规模迅速增长

比如消费事实表: Prod_id(引用商品维度表), Timekey(引用时间维度表),Place_id(引用地点维度表), Unit(销售量)。

事实表的设计是以能够正确记录历史信息为准则,维度表的设计是以能够以合适的角度来聚合主题内容为准则。

Q.E.D.


大数据开发工程师,精通 Spark,擅长 Java 和 Scala