跳到主要内容

数据建模知识体系概览

什么是数据建模

数据建模是根据业务需求,设计数据逻辑结构和物理存储的过程。好的数据模型是数据仓库、数据分析和 BI 报表的基石。

建模方法论

方法论代表特点适用场景
ER 建模3NF 范式消除冗余、保证一致性OLTP 业务系统
维度建模Kimball星型/雪花模型、面向分析数据仓库、BI
DataVaultDan LinstedtHub-Link-Satellite、可审计企业级大型数仓
宽表建模大宽表一张表包含所有字段OLAP 引擎、快速查询
数据分析师该掌握什么
  • 必须掌握:维度建模(星型/雪花)、宽表设计
  • 了解即可:ER 建模(DBA 主导)、DataVault(架构师主导)

核心知识导航

主题说明
ER 模型与数据建模实体、属性、关系、ER 图
宽表设计宽表设计原则、优缺点、适用场景
指标模型设计指标系统建模、原子/派生/复合指标
OneTable 大宽表方案一张表查所有、预计算、物化视图
数据建模实战电商/SaaS/社交场景建模案例

建模落地流程

步骤输入输出
1. 需求分析业务需求、指标口径分析主题、维度/指标列表
2. 概念建模主题域划分ER 图草稿
3. 逻辑建模概念模型表结构、字段定义、关系
4. 物理建模逻辑模型DDL、分区策略、索引
5. 上线迭代物理模型数据写入、验证、优化

相关链接