Data Engineering2020-04-042699 字7 分钟从数据湖到数据仓库:概念对齐、分层落地与 Inmon/Kimball 建模取舍本文梳理了数据仓库、数据集市与数据湖的核心概念与差异,并从工程视角总结了构建数仓的关键步骤。随后对比了 Inmon(自顶向下)与 Kimball(自底向上)两种数仓方法论,说明各自的适用场景与取舍。文章还给出了常见数仓分层(ODS/DWD/DWS/DM)的落地视图,并进一步解释事实表、维度表、缓慢变化维、退化维等关键建模概念,最后用星型、雪花、星座模型帮助读者建立更直观的建模框架。 Data Warehousemore...
Data Engineering2020-04-031397 字4 分钟Pentaho时间维度表最佳实践:全量、增量与混合抽取实战本文详解如何使用 Pentaho Data Integration (Kettle) 生成时间维度表,涵盖全量抽取、增量抽取和混合抽取三种模式,配合 PostgreSQL 实现标准缓慢变化维输出,并对比三种模式的适用场景与优劣,适合 ETL 初学者和数据工程师快速上手。 Data Warehouse ETL Pentahomore...