数据质量知识体系概览
什么是数据质量
数据质量是衡量数据是否准确、完整、一致、及时的程度。数据质量差会导致分析结论错误、决策失误。
数据质量六大维度
| 维度 | 定义 | 示例问题 |
|---|---|---|
| 准确性 | 数据值是否正确 | 金额为负数 |
| 完整性 | 是否有缺失 | user_id 为 NULL |
| 一致性 | 不同数据源是否一致 | A 表和 B 表的订单数不同 |
| 及时性 | 数据是否按时到达 | T+1 报表延迟到 T+2 |
| 唯一性 | 是否有重复数据 | 同一订单出现两次 |
| 有效性 | 格式/范围是否合规 | 手机号不是 11 位 |
核心知识导航
| 主题 | 说明 |
|---|---|
| 质量维度详解 | 六大维度的检测方法和 SQL |
| 质量规则与检测 | 自动化质量检测规则 |
| 数据血缘 | 追踪数据来源和影响范围 |
| 数据治理 | 组织层面的数据管理 |
| 质量监控与告警 | 实时监控和异常告警 |