数据建模知识体系概览
什么是数据建模
数据建模是根据业务需求,设计数据逻辑结构和物理存储的过程。好的数据模型是数据仓库、数据分析和 BI 报表的基石。
建模方法论
| 方法论 | 代表 | 特点 | 适用场景 |
|---|---|---|---|
| ER 建模 | 3NF 范式 | 消除冗余、保证一致性 | OLTP 业务系统 |
| 维度建模 | Kimball | 星型/雪花模型、面向分析 | 数据仓库、BI |
| DataVault | Dan Linstedt | Hub-Link-Satellite、可审计 | 企业级大型数仓 |
| 宽表建模 | 大宽表 | 一张表包含所有字段 | OLAP 引擎、快速查询 |
数据分析师该掌握什么
- 必须掌握:维度建模(星型/雪花)、宽表设计
- 了解即可:ER 建模(DBA 主导)、DataVault(架构师主导)
核心知识导航
| 主题 | 说明 |
|---|---|
| ER 模型与数据建模 | 实体、属性、关系、ER 图 |
| 宽表设计 | 宽表设计原则、优缺点、适用场景 |
| 指标模型设计 | 指标系统建模、原子/派生/复合指标 |
| OneTable 大宽表方案 | 一张表查所有、预计算、物化视图 |
| 数据建模实战 | 电商/SaaS/社交场景建模案例 |
建模落地流程
| 步骤 | 输入 | 输出 |
|---|---|---|
| 1. 需求分析 | 业务需求、指标口径 | 分析主题、维度/指标列表 |
| 2. 概念建模 | 主题域划分 | ER 图草稿 |
| 3. 逻辑建模 | 概念模型 | 表结构、字段定义、关系 |
| 4. 物理建模 | 逻辑模型 | DDL、分区策略、索引 |
| 5. 上线迭代 | 物理模型 | 数据写入、验证、优化 |