内容平台分析案例
场景
你是某短视频/资讯平台的数据分析师,发现最近一个月用户人均使用时长从 45 分钟下降到 38 分钟,请分析原因并提出优化方案。
分析框架
第一步:指标拆解
第二步:内容供给分析
-- 内容供给量和质量的变化
SELECT
DATE_FORMAT(publish_time, '%Y-%m') AS month,
COUNT(*) AS total_content,
COUNT(DISTINCT creator_id) AS active_creators,
-- 内容质量分布
ROUND(AVG(quality_score), 2) AS avg_quality,
SUM(CASE WHEN quality_score >= 80 THEN 1 ELSE 0 END) AS high_quality_count,
ROUND(SUM(CASE WHEN quality_score >= 80 THEN 1 ELSE 0 END) / COUNT(*) * 100, 2) AS high_quality_pct
FROM content
WHERE publish_time >= '2023-10-01'
GROUP BY DATE_FORMAT(publish_time, '%Y-%m')
ORDER BY month;
第三步:消费端分析
-- 用户消费行为变化(内容完播率、互动率)
SELECT
DATE_FORMAT(view_date, '%Y-%m') AS month,
COUNT(DISTINCT user_id) AS viewers,
AVG(watch_duration / video_duration) AS avg_completion_rate,
AVG(view_count_per_user) AS avg_views_per_user,
-- 互动率
SUM(likes + comments + shares) / COUNT(*) AS engagement_rate,
-- 负反馈
SUM(CASE WHEN action = 'not_interested' THEN 1 ELSE 0 END) / COUNT(*) AS negative_feedback_rate
FROM content_views
GROUP BY DATE_FORMAT(view_date, '%Y-%m');
第四步:推荐系统诊断
| 检查项 | 指标 | 健康值 | 当前值 | 状态 |
|---|---|---|---|---|
| 点击率 | 推荐内容 CTR | ≥ 15% | 12% | ⚠️ |
| 完播率 | 平均完播率 | ≥ 60% | 48% | ❌ |
| 多样性 | 品类覆盖度 | ≥ 8 品类 | 5 品类 | ❌ |
| 新鲜度 | 24h 内容占比 | ≥ 40% | 35% | ⚠️ |
| 头部集中度 | Top10% 创作者流量占比 | ≤ 50% | 65% | ❌ |
常见陷阱:信息茧房
如果推荐系统过度依赖协同过滤,用户容易陷入内容茧房,导致审美疲劳和使用时长下降。需要在精准推荐和探索多样性之间找平衡。
第五步:创作者生态分析
-- 创作者分层与流失率
WITH creator_tiers AS (
SELECT
creator_id,
CASE
WHEN followers >= 100000 THEN '头部'
WHEN followers >= 10000 THEN '腰部'
ELSE '尾部'
END AS tier,
-- 近 30 天发布量
SUM(CASE WHEN publish_date >= DATE_SUB(CURDATE(), INTERVAL 30 DAY) THEN 1 ELSE 0 END) AS recent_posts,
-- 上个 30 天发布量
SUM(CASE WHEN publish_date BETWEEN DATE_SUB(CURDATE(), INTERVAL 60 DAY)
AND DATE_SUB(CURDATE(), INTERVAL 30 DAY) THEN 1 ELSE 0 END) AS prev_posts
FROM creators c
JOIN content ct ON c.creator_id = ct.creator_id
GROUP BY creator_id, tier
)
SELECT
tier,
COUNT(*) AS creator_count,
AVG(recent_posts) AS avg_recent_posts,
AVG(prev_posts) AS avg_prev_posts,
ROUND((AVG(recent_posts) - AVG(prev_posts)) / NULLIF(AVG(prev_posts), 0) * 100, 2) AS post_change_pct,
-- 沉默创作者(近 30 天 0 发布)
SUM(CASE WHEN recent_posts = 0 THEN 1 ELSE 0 END) AS silent_creators
FROM creator_tiers
GROUP BY tier;
第六步:分析结论与建议
## 根因总结
人均使用时长下降 7 分钟的主要原因:
1. 腰部创作者发布量环比下降 20%,内容供给不足(贡献 4 分钟下降)
2. 推荐品类集中度过高,用户审美疲劳(贡献 2 分钟下降)
3. 低质量内容占比上升 8%(贡献 1 分钟下降)
## 优化建议
| 方向 | 措施 | 指标目标 | 优先级 |
|------|------|---------|--------|
| 供给 | 腰部创作者激励计划 | 发布量 +20% | P0 |
| 推荐 | 增加探索性推荐比例 | 品类覆盖 ≥8 | P0 |
| 质量 | 强化低质内容打压 | 优质占比 +10% | P1 |
| 互动 | 优化评论区和互动玩法 | 互动率 +5% | P2 |
面试应答要点
内容平台分析的双边视角
内容平台是典型的双边市场:创作者(供给侧) 和 用户(消费侧)。分析时必须同时看两端:
- 供给侧:创作者数量、发布频率、内容质量
- 消费侧:消费量、完播率、互动率、留存
- 连接层:推荐系统效率、分发公平性