0xLuca5博客

= 共你相识三千天我无名无姓 =

cover

文章列表

从数据湖到数据仓库:概念对齐、分层落地与 Inmon/Kimball 建模取舍

本文梳理了数据仓库、数据集市与数据湖的核心概念与差异,并从工程视角总结了构建数仓的关键步骤。随后对比了 Inmon(自顶向下)与 Kimball(自底向上)两种数仓方法论,说明各自的适用场景与取舍。文章还给出了常见数仓分层(ODS/DWD/DWS/DM)的落地视图,并进一步解释事实表、维度表、缓慢变化维、退化维等关键建模概念,最后用星型、雪花、星座模型帮助读者建立更直观的建模框架。

more...
Canal 从原理到实战:单机部署、Kafka、HA 与 canal-admin

本文介绍 Canal 的核心原理与部署使用流程:从 MySQL Binlog/主从复制机制出发,说明 Canal 的工作方式;给出 MySQL 环境与权限配置、单机 Canal 部署与 Canal Client 示例;进一步讲解对接 Kafka 的关键参数、消费示例与位点保存;最后补充 HA 架构与 canal-admin 的安装与注册要点,帮助快速搭建可用于生产的增量订阅链路。

more...
Pentaho 全家桶:从 ETL 到可视化,一个开源平台全搞定

Pentaho 是基于 Java 的开源 BI 套件,涵盖 ETL、报表、仪表盘、数据分析全链路。本文介绍其三大核心套件——PDI(数据集成/Kettle)、PRD(报表设计)、PBA(BI 平台)的功能与优势,对比社区版与商业版差异,并展示统一数据交换、数仓迁移、数据脱敏、智能运维等典型应用场景,帮助你快速了解这把「数据工程瑞士军刀」的全貌。

more...
Hexo Next7主题优化

Hexo NexT7 主题从零到美的完整优化指南。涵盖基础配置、四种 Scheme 布局切换、导航菜单与侧边栏定制、标签/分类/关于页面创建、进度条与打赏功能、Mac 风格代码块美化、超链接样式调整、本地搜索集成、六大评论系统(Disqus/Gitalk/livere/Valine/畅言)对比与配置、图片懒加载优化、Live2D 看板娘(基础版+升级版)部署,以及文章隐藏技巧。一篇搞定博客颜值升级。

more...
...