本文以图书馆类比深入浅出地介绍 Druid 分布式分析型数据存储系统。首先阐述 Druid 的定位与技术特点(高吞吐摄入、低延迟查询、列存储、按时间切分),然后详解五类核心节点架构(Broker 接查询、Indexer 导入、Historical 存储段、Coordinator 调度、外部依赖 ZooKeeper/MetaStore/Deep Storage),并介绍核心概念 DataSource、Event、Segment。数据摄入部分覆盖批处理(本地文件、HDFS、CSV)与实时摄入(Tranquility Server/Kafka、Kafka Indexing Service),对比 Realtime 节点与 Kafka Indexing Service 的优劣。查询部分介绍 REST API 的常用查询类型(Timeseries、TopN、GroupBy、Scan 等)以及 Druid SQL 的启用与使用要点。全文通过生动类比与实战配置帮助读者快速上手 Druid。
.jpg?table=block&id=30052c4c-a1ae-8157-bf94-ee362dfb62ed&t=30052c4c-a1ae-8157-bf94-ee362dfb62ed)

