OLAP 引擎知识体系概览
什么是 OLAP
OLAP(Online Analytical Processing,联机分析处理)是面向分析场景的查询引擎,特点是大批量读取、聚合计算、低延迟响应。
OLTP vs OLAP
| 对比 | OLTP | OLAP |
|---|---|---|
| 场景 | 在线交易 | 分析查询 |
| 操作 | 增删改查 | 大量 SELECT + 聚合 |
| 延迟 | 毫秒 | 亚秒~秒 |
| 代表 | MySQL、PostgreSQL | ClickHouse、Doris |
OLAP 引擎分类
| 类型 | 代表 | 特点 |
|---|---|---|
| MPP 数据库 | ClickHouse、Doris、StarRocks | 自带存储,列式存储,高性能 |
| SQL 查询引擎 | Presto/Trino、Impala | 不自带存储,查询 HDFS/Hive |
| 预计算引擎 | Apache Kylin、Druid | 构建 Cube,预聚合 |
核心知识导航
| 主题 | 说明 |
|---|---|
| ClickHouse | 列式存储、MergeTree、高性能聚合 |
| Doris/StarRocks | MPP、实时分析、简单运维 |
| 列式存储原理 | 列式 vs 行式、压缩、向量化 |
| 物化视图 | 预计算、自动刷新、查询加速 |
| OLAP 引擎对比 | 各引擎选型建议 |