跳到主要内容

数据治理

问题

什么是数据治理?数据分析师需要参与哪些数据治理工作?

答案

数据治理全景

数据治理是在组织层面建立数据管理的规范、流程和工具,确保数据资产可信可用。

数据分析师的治理职责

职责具体工作
指标口径统一定义并维护指标字典,避免同名不同义
数据质量反馈发现数据问题后反馈给数据工程团队
文档维护维护报表/看板的数据说明
数据安全报表中不暴露用户隐私数据

元数据管理

元数据类型说明示例
技术元数据表结构、字段类型表名、列名、分区
业务元数据业务含义字段中文名、口径说明
操作元数据ETL 执行信息更新时间、数据量、负责人
小团队的最小化治理
  1. 维护一份指标字典(Google Sheet / Notion)
  2. 关键表加上dbt test 质量检测
  3. 建立数据变更通知机制(源表改了通知下游)

常见面试问题

Q1: 各部门对同一指标定义不同怎么办?

答案

  1. 由数据团队牵头制定统一指标字典
  2. 在指标平台上注册,所有看板引用同一口径
  3. 定期召开指标评审会,解决口径争议
  4. 不在数据层面做弥合——先统一业务定义

Q2: 数据治理如何衡量效果?

答案

  • 质量指标:数据质量检测通过率、报警次数
  • 使用指标:表被查询的次数、无人使用的表数量
  • 时效指标:T+1 报表按时产出率
  • 满意度:业务方对数据质量的评分

相关链接