统计学基础知识体系概览
为什么数据分析师需要统计学?
统计学是数据分析的理论基石。如果 SQL 和 Python 是"怎么做",统计学则回答"结论是否可靠"。没有统计学基础,你的分析结论可能只是噪声、巧合或偏差。
| 场景 | 需要的统计知识 |
|---|---|
| "这个指标涨了 5%,是真涨还是波动?" | 假设检验、置信区间 |
| "A/B 测试结果显著吗?" | p 值、统计功效 |
| "用户画像怎么分群?" | 聚类、分布分析 |
| "哪个因素影响最大?" | 回归分析、相关性 |
| "预估值的误差范围?" | 标准误、置信区间 |
面试定位
数据分析面试中统计学通常考查:描述统计指标选择、假设检验理解、A/B 测试相关统计概念。不会考太深的公式推导,重点是理解概念并能实际应用。
统计学知识全景图
核心知识导航
| 主题 | 说明 | 面试重要度 |
|---|---|---|
| 描述性统计 | 均值/中位数/标准差、分位数、分布形态 | ⭐⭐⭐⭐⭐ |
| 概率分布 | 正态分布、二项分布、中心极限定理 | ⭐⭐⭐⭐ |
| 假设检验 | p 值、t 检验、卡方检验、ANOVA | ⭐⭐⭐⭐⭐ |
| 置信区间 | 区间估计、样本量计算、误差幅度 | ⭐⭐⭐⭐ |
| 相关与回归 | 相关系数、线性回归、R² | ⭐⭐⭐⭐ |
| 贝叶斯统计 | 贝叶斯定理、先验后验、贝叶斯 A/B 测试 | ⭐⭐⭐ |
| 常见统计陷阱 | 辛普森悖论、幸存者偏差、多重比较 | ⭐⭐⭐⭐⭐ |
描述统计 vs 推断统计
| 对比 | 描述统计 | 推断统计 |
|---|---|---|
| 目标 | 概括现有数据特征 | 从样本推断总体 |
| 方法 | 均值、中位数、标准差、图表 | 假设检验、置信区间、回归 |
| 不确定性 | 无(直接描述事实) | 有(需要量化误差和置信水平) |
| 示例 | "上月 DAU 均值 5000" | "DAU 的 95% 置信区间为 [4800, 5200]" |