跳到主要内容

内容平台分析案例

场景

你是某短视频/资讯平台的数据分析师,发现最近一个月用户人均使用时长从 45 分钟下降到 38 分钟,请分析原因并提出优化方案。

分析框架

第一步:指标拆解

总使用时长=DAU×人均使用时长总使用时长 = DAU \times 人均使用时长 人均使用时长=人均浏览内容数×平均每条内容消费时长人均使用时长 = 人均浏览内容数 \times 平均每条内容消费时长 人均浏览内容数=活跃时长平均浏览间隔人均浏览内容数 = \frac{活跃时长}{平均浏览间隔}

第二步:内容供给分析

-- 内容供给量和质量的变化
SELECT
DATE_FORMAT(publish_time, '%Y-%m') AS month,
COUNT(*) AS total_content,
COUNT(DISTINCT creator_id) AS active_creators,
-- 内容质量分布
ROUND(AVG(quality_score), 2) AS avg_quality,
SUM(CASE WHEN quality_score >= 80 THEN 1 ELSE 0 END) AS high_quality_count,
ROUND(SUM(CASE WHEN quality_score >= 80 THEN 1 ELSE 0 END) / COUNT(*) * 100, 2) AS high_quality_pct
FROM content
WHERE publish_time >= '2023-10-01'
GROUP BY DATE_FORMAT(publish_time, '%Y-%m')
ORDER BY month;

第三步:消费端分析

-- 用户消费行为变化(内容完播率、互动率)
SELECT
DATE_FORMAT(view_date, '%Y-%m') AS month,
COUNT(DISTINCT user_id) AS viewers,
AVG(watch_duration / video_duration) AS avg_completion_rate,
AVG(view_count_per_user) AS avg_views_per_user,
-- 互动率
SUM(likes + comments + shares) / COUNT(*) AS engagement_rate,
-- 负反馈
SUM(CASE WHEN action = 'not_interested' THEN 1 ELSE 0 END) / COUNT(*) AS negative_feedback_rate
FROM content_views
GROUP BY DATE_FORMAT(view_date, '%Y-%m');

第四步:推荐系统诊断

检查项指标健康值当前值状态
点击率推荐内容 CTR≥ 15%12%⚠️
完播率平均完播率≥ 60%48%
多样性品类覆盖度≥ 8 品类5 品类
新鲜度24h 内容占比≥ 40%35%⚠️
头部集中度Top10% 创作者流量占比≤ 50%65%
常见陷阱:信息茧房

如果推荐系统过度依赖协同过滤,用户容易陷入内容茧房,导致审美疲劳和使用时长下降。需要在精准推荐和探索多样性之间找平衡。

第五步:创作者生态分析

-- 创作者分层与流失率
WITH creator_tiers AS (
SELECT
creator_id,
CASE
WHEN followers >= 100000 THEN '头部'
WHEN followers >= 10000 THEN '腰部'
ELSE '尾部'
END AS tier,
-- 近 30 天发布量
SUM(CASE WHEN publish_date >= DATE_SUB(CURDATE(), INTERVAL 30 DAY) THEN 1 ELSE 0 END) AS recent_posts,
-- 上个 30 天发布量
SUM(CASE WHEN publish_date BETWEEN DATE_SUB(CURDATE(), INTERVAL 60 DAY)
AND DATE_SUB(CURDATE(), INTERVAL 30 DAY) THEN 1 ELSE 0 END) AS prev_posts
FROM creators c
JOIN content ct ON c.creator_id = ct.creator_id
GROUP BY creator_id, tier
)
SELECT
tier,
COUNT(*) AS creator_count,
AVG(recent_posts) AS avg_recent_posts,
AVG(prev_posts) AS avg_prev_posts,
ROUND((AVG(recent_posts) - AVG(prev_posts)) / NULLIF(AVG(prev_posts), 0) * 100, 2) AS post_change_pct,
-- 沉默创作者(近 30 天 0 发布)
SUM(CASE WHEN recent_posts = 0 THEN 1 ELSE 0 END) AS silent_creators
FROM creator_tiers
GROUP BY tier;

第六步:分析结论与建议

## 根因总结

人均使用时长下降 7 分钟的主要原因:
1. 腰部创作者发布量环比下降 20%,内容供给不足(贡献 4 分钟下降)
2. 推荐品类集中度过高,用户审美疲劳(贡献 2 分钟下降)
3. 低质量内容占比上升 8%(贡献 1 分钟下降)

## 优化建议

| 方向 | 措施 | 指标目标 | 优先级 |
|------|------|---------|--------|
| 供给 | 腰部创作者激励计划 | 发布量 +20% | P0 |
| 推荐 | 增加探索性推荐比例 | 品类覆盖 ≥8 | P0 |
| 质量 | 强化低质内容打压 | 优质占比 +10% | P1 |
| 互动 | 优化评论区和互动玩法 | 互动率 +5% | P2 |

面试应答要点

内容平台分析的双边视角

内容平台是典型的双边市场:创作者(供给侧)用户(消费侧)。分析时必须同时看两端:

  • 供给侧:创作者数量、发布频率、内容质量
  • 消费侧:消费量、完播率、互动率、留存
  • 连接层:推荐系统效率、分发公平性

相关链接