汇总
欢迎来到数据分析面试题库!这里收集了常见的数据分析、数据工程与业务分析相关面试题及其答案。
分类导航
| 分类 | 说明 |
|---|---|
| SQL 基础 | SELECT、JOIN、子查询、聚合函数、数据类型 |
| SQL 分析进阶 | 窗口函数、CTE、透视、行列转换、复杂聚合 |
| Python 数据分析 | Pandas、NumPy、Polars、数据清洗、Jupyter |
| 统计学基础 | 描述统计、概率分布、假设检验、置信区间、贝叶斯 |
| 数据可视化 | Matplotlib、Seaborn、Plotly、图表选型、设计原则 |
| BI 工具 | Tableau、Power BI、Metabase、Superset、看板设计 |
| Excel 与电子表格 | 数据透视表、VLOOKUP、Power Query、高级公式 |
| 数据仓库 | 维度建模、星型/雪花模型、分层架构(ODS/DWD/DWS/ADS) |
| ETL 与数据管道 | Airflow、dbt、CDC、数据清洗、调度编排 |
| 数据建模 | ER 模型、范式、反范式、宽表设计、指标体系 |
| A/B 测试 | 实验设计、样本量计算、显著性检验、常见陷阱 |
| 指标体系 | 北极星指标、AARRR、指标拆解、数据异动分析 |
| 业务分析方法 | 漏斗分析、留存分析、RFM、归因分析、用户分群 |
| 数据质量 | 数据治理、质量规则、异常检测、数据血缘 |
| 大数据计算 | Hive、Spark、Flink、Impala、Presto/Trino、数据倾斜 |
| OLAP 引擎 | ClickHouse、Doris/StarRocks、列式存储、物化视图 |
| 数据湖 | HDFS、Iceberg、Delta Lake、Hudi、Lakehouse、ORC/Parquet |
| 机器学习基础 | 回归、分类、聚类、特征工程、模型评估 |
| 数据采集与埋点 | 埋点设计、SDK、日志采集、实时与离线 |
| 数据合规与安全 | GDPR、数据脱敏、权限管理、PII 处理 |
| 案例分析 | 经典业务分析案例、面试 Case 拆解、分析报告撰写 |
| 系统设计 | 数据平台、实时数仓、指标平台、数据中台 |
| 场景题 | 数据异动排查、口径不一致、数据倾斜、慢查询 |