Ai的应用实例 5:数据分析与研究
Lio Vex 个人记录

分析任务的标准流程

  1. 明确业务问题:你要回答什么?用于谁的决策?
  2. 定义指标口径:指标怎么计算?时间范围?去重规则?
  3. 整理数据:字段、缺失、异常、分组维度
  4. 分析与对比:趋势、结构、分群、漏斗、相关性
  5. 可视化表达:选对图表,不堆图
  6. 输出洞察与建议:结论→证据→建议→风险
  7. 验证与迭代:实验/AB 测试/回归验证

分析需求

1
2
3
4
5
6
7
8
你是一名资深数据分析师。为了避免误解,请先向我提出 8 个澄清问题(按优先级排序),覆盖:
- 业务目标与决策场景
- 指标定义与口径
- 数据来源与字段
- 时间范围与粒度
- 需要的对比维度(人群/渠道/地区等)
- 输出形式(表格/图表/报告/结论页)
在我回答后,再给出分析方案与产出结构。

指标体系与口径

指标口径表(建议每次分析都先写)

1
2
3
4
5
6
7
8
9
10
11
12
请为以下分析建立“指标口径表”,每个指标包含:
- 指标名称
- 定义(一句话)
- 计算公式
- 统计粒度(日/周/月)
- 去重规则
- 数据字段来源
- 注意事项(常见误差来源)

指标列表如下:
【粘贴你关心的指标】
输出:Markdown 表格

口径校验提示

1
2
请检查这些指标口径是否存在冲突/歧义(例如:UV是否去重、订单是否含退款、活跃是否含登录),
并给出统一口径建议与理由。

数据整理

数据字段梳理

1
2
3
4
5
6
7
8
请根据我提供的字段列表,判断:
1)哪些字段是维度(可分组)
2)哪些字段是指标(可计算)
3)缺哪些关键字段(影响哪些结论)
4)建议新增的 5 个派生字段(例如:周、渠道归因、用户分层等)

字段列表如下:
【粘贴字段】

按月/按类型汇总

1
2
3
4
5
6
7
请将【数据集】按“月份 + 类型”进行汇总,输出:
- 汇总表(月份×类型)
- 每月总量趋势结论(不少于 5 条)
- 占比结构变化结论(不少于 5 条)
- 异常点(峰值/断崖)与可能原因

输出:Markdown(表格 + 结论清单)

异常值与缺失值处理

1
2
3
4
5
6
请给出数据清洗规则建议,覆盖:
- 缺失值(删除/填充/保留标记)
- 异常值(阈值、IQR、分位数截断等可选)
- 重复数据(去重规则)
- 时间对齐(跨时区/跨自然日)
并说明每条规则会对结论产生什么影响。

常用分析框架

趋势分析(时间序列)

1
2
3
4
5
6
请对【指标】在【时间范围】内做趋势分析:
- 总体趋势(上升/下降/波动)
- 关键拐点(至少 3 个)
- 可能驱动因素(每个拐点 2 个假设)
- 下一步验证方式(需要补哪些数据/做哪些对比)
输出:结论清单 + 建议

结构分析(构成/占比)

1
2
3
4
5
6
请对【指标】做结构分析(按【维度】分组):
- Top/Bottom 项
- 占比变化
- 结构是否“变集中/变分散”
- 业务含义与风险
输出:表格 + 结论 + 建议

分群分析(用户/客户分层)

1
2
3
4
5
6
7
8
请按【分群规则】对用户进行分层,并比较各层的:
- 规模
- 核心指标(至少 3 个)
- 行为特征
- 应对策略(每层 2 条)

分群规则示例:新用户/老用户、高价值/低价值、活跃/沉默等
输出:分群表 + 策略建议

漏斗分析(转化链路)

1
2
3
4
5
6
7
8
请对以下漏斗进行分析:
漏斗步骤:【步骤1→步骤2→步骤3→…】
要求输出:
1)每步转化率与掉队率
2)最大流失点(Top 2)
3)可能原因假设(每点 3 条)
4)优先级最高的 3 个改进动作(含指标)
输出:表格 + 行动清单

相关性与驱动因素(表述因果)

1
2
3
4
5
请分析【指标A】与【指标B】是否相关:
- 先给相关性方向与强弱(定性/定量均可)
- 给出 3 个潜在混杂因素
- 提出验证因果的思路(实验/分层对比/时间滞后)
要求:明确区分“相关”与“因果”,避免过度结论。

可视化选择

选图指南

  • 折线图:看趋势(随时间变化)
  • 柱状图:看对比(类别之间差异)
  • 堆叠柱:看结构变化(占比随时间/类别变化)
  • 饼图:只适合少类别的构成(≤5 类)
  • 散点图:看相关关系与离群点
  • 漏斗图:看转化链路
  • 热力图:看二维分布/密度(如时段×行为)

让 AI 推荐图表

1
2
3
4
我需要展示【结论/问题】给【受众】(例如:领导/业务/产品)。
数据维度是【时间/类别/人群】,核心指标是【…】。
请你推荐最合适的 3 种图表,并说明每种图表适合表达什么信息。
同时给出“图标题 + 轴含义 + 需要的字段”。

输出洞察的标准写法(结论=可被行动)

结构:结论 → 证据 → 解释 → 建议 → 风险/假设

洞察写作

1
2
3
4
5
6
7
8
请将分析结果整理为“洞察报告”,每条洞察按以下结构输出:
- 结论(1句)
- 证据(数据点/对比)
- 解释(为什么会这样:1~2条假设)
- 建议(可执行动作:负责人/时间/指标)
- 风险与假设(哪些条件成立才有效)

要求:至少输出 5 条洞察,按影响力排序。

实验与验证

A/B 测试设计模板

1
2
3
4
5
6
7
请为【假设】设计一个 A/B 测试方案,输出:
1)目标指标(主指标/护栏指标)
2)实验组与对照组定义
3)样本量/周期的估算思路(定性即可)
4)需要控制的变量
5)结果判断标准(什么情况下算赢)
6)潜在风险与应对(例如:污染、季节性、外部干扰)

事后复盘验证

1
2
3
4
5
6
我们做了【动作/改动】,请给出验证它是否有效的分析方案:
- 对比窗口(改动前后各多久)
- 对照组选择(如有)
- 需要看的指标与口径
- 如何排除外部因素
- 结论输出结构(结论/证据/建议)

图文解读

用户行为热图解读(找流失点)

1
2
3
4
5
6
请解读这张用户行为热图,输出:
1)三个关键流失点(按影响排序)
2)每个流失点的可能原因(每点 2 条)
3)改进方向(用“向哪里优化”的语言描述)
4)建议优先做的 3 个实验(含指标)
要求:不要空话,要能落到具体页面/环节/动作。

看板解读(从数据到行动)

1
2
3
4
5
请解读这张数据看板:
1)先用 5 条要点总结看板告诉我们的事实
2)指出 3 个异常/值得关注的变化
3)给出 3 条可执行建议(每条含指标与截止时间)
4)列出你还需要补充的 5 个信息(用于提高结论准确度)

跳转指引

Powered by Hexo & Theme Keep (AGPL-3.0)