数据治理
问题
什么是数据治理?数据分析师需要参与哪些数据治理工作?
答案
数据治理全景
数据治理是在组织层面建立数据管理的规范、流程和工具,确保数据资产可信可用。
数据分析师的治理职责
| 职责 | 具体工作 |
|---|---|
| 指标口径统一 | 定义并维护指标字典,避免同名不同义 |
| 数据质量反馈 | 发现数据问题后反馈给数据工程团队 |
| 文档维护 | 维护报表/看板的数据说明 |
| 数据安全 | 报表中不暴露用户隐私数据 |
元数据管理
| 元数据类型 | 说明 | 示例 |
|---|---|---|
| 技术元数据 | 表结构、字段类型 | 表名、列名、分区 |
| 业务元数据 | 业务含义 | 字段中文名、口径说明 |
| 操作元数据 | ETL 执行信息 | 更新时间、数据量、负责人 |
小团队的最小化治理
- 维护一份指标字典(Google Sheet / Notion)
- 关键表加上dbt test 质量检测
- 建立数据变更通知机制(源表改了通知下游)
常见面试问题
Q1: 各部门对同一指标定义不同怎么办?
答案:
- 由数据团队牵头制定统一指标字典
- 在指标平台上注册,所有看板引用同一口径
- 定期召开指标评审会,解决口径争议
- 不在数据层面做弥合——先统一业务定义
Q2: 数据治理如何衡量效果?
答案:
- 质量指标:数据质量检测通过率、报警次数
- 使用指标:表被查询的次数、无人使用的表数量
- 时效指标:T+1 报表按时产出率
- 满意度:业务方对数据质量的评分