跳到主要内容

统计学基础知识体系概览

为什么数据分析师需要统计学?

统计学是数据分析的理论基石。如果 SQL 和 Python 是"怎么做",统计学则回答"结论是否可靠"。没有统计学基础,你的分析结论可能只是噪声、巧合或偏差。

场景需要的统计知识
"这个指标涨了 5%,是真涨还是波动?"假设检验、置信区间
"A/B 测试结果显著吗?"p 值、统计功效
"用户画像怎么分群?"聚类、分布分析
"哪个因素影响最大?"回归分析、相关性
"预估值的误差范围?"标准误、置信区间
面试定位

数据分析面试中统计学通常考查:描述统计指标选择假设检验理解A/B 测试相关统计概念。不会考太深的公式推导,重点是理解概念并能实际应用


统计学知识全景图


核心知识导航

主题说明面试重要度
描述性统计均值/中位数/标准差、分位数、分布形态⭐⭐⭐⭐⭐
概率分布正态分布、二项分布、中心极限定理⭐⭐⭐⭐
假设检验p 值、t 检验、卡方检验、ANOVA⭐⭐⭐⭐⭐
置信区间区间估计、样本量计算、误差幅度⭐⭐⭐⭐
相关与回归相关系数、线性回归、R²⭐⭐⭐⭐
贝叶斯统计贝叶斯定理、先验后验、贝叶斯 A/B 测试⭐⭐⭐
常见统计陷阱辛普森悖论、幸存者偏差、多重比较⭐⭐⭐⭐⭐

描述统计 vs 推断统计

对比描述统计推断统计
目标概括现有数据特征从样本推断总体
方法均值、中位数、标准差、图表假设检验、置信区间、回归
不确定性无(直接描述事实)有(需要量化误差和置信水平)
示例"上月 DAU 均值 5000""DAU 的 95% 置信区间为 [4800, 5200]"

相关链接