写在前面

本文隶属于专栏《100个问题搞定大数据理论体系》,该专栏为笔者原创,引用请注明来源,不足和错误之处请在评论区帮忙指出,谢谢!

本专栏目录结构和文献引用请见100个问题搞定大数据理论体系

解答

ETL,是英文Extract-Transform-Load的缩写,用来描述将业务系统的数据从来源端经过抽取(extract)、转换(transform)、加载(load)至目的端的过程。

ETL的目的是将企业中的分散、零乱、标准不统一的数据整合到一起,为企业的决策提供分析依据。

Q.E.D.


Apache Spark Contributor