30 段访谈 · 5 个主题 · 每个论点都引用真实访谈原话
Agent 抽出每条有信息量的语句、在沙盒里按句向量聚类、提议 5-7 个主题让你确认。每张主题卡含出现频次 / 在多少位被访者中出现 / 3-5 条原话引用。框架存好,下轮研究自动按同一分类编码。
Agent 抽出每条有信息量的语句、在沙盒里按句向量聚类、提议 5-7 个主题让你确认。每张主题卡含出现频次 / 在多少位被访者中出现 / 3-5 条原话引用。框架存好,下轮研究自动按同一分类编码。
Agent 给每条有信息量的语句做嵌入 · 在沙盒里聚类 · 提议主题让你确认。每个点是一句被访者原话 · 颜色是它落进的主题。
不是"AI 总结的主题" · 主题卡引用 3-5 条来自不同被访者的原话作为锚点 · 主研可逐条审计。
“我直到第五天才意识到 · 我可以直接把整个文件夹丢进去让它写。”
“第一次登录我就盯着看 · 9 个面板都开着 · 没人告诉我从哪入手。”
“在我让团队拿真实数据用之前 · 我需要看到每个任务的成本数字。”
主题 + 定义 + 编码规则写成 codebook.json 落到 Drive 的研究目录。Q2 一开始 Agent 先读这个 json · 用同一套主题对新一批访谈编码 · 然后产出差异报告。
{
"themes": [
{ "id": "T1", "label": "Onboarding overwhelm", "n": 28 },
{ "id": "T2", "label": "Wants keyboard control", "n": 19 },
{ "id": "T3", "label": "Aha late", "n": 24 },
{ "id": "T4", "label": "Pricing anxiety", "n": 11 },
{ "id": "T5", "label": "Audit-trail trust", "n": 14 }
]
}纯文本 / Markdown / DOCX / PDF 都吃。手上还是录音?先用 /tools/meeting-minutes 转写 —— 那条路径更便宜更快。每份转写要么文件名带被访者标识、要么开头一行写明。
让主题自己浮出(归纳式)、按你已有的框架编码(演绎式)、或者和上一轮对比(纵向)。归纳式模式下,Agent 会先在对话里把提议的主题摆出来 —— 改名、合并、拆分由你定。你不点头就不渲染最终 PDF。
产物 PDF 落到你的 Drive:主题卡 + 2D 关系图 + 原话引用墙(每个主题 3-5 条)+ 已编码语句附录。Agent 同时把编码框架写成 codebook.json 放到同一目录 —— 下季度的研究读这个 json · 按同一套主题编码。
便宜的定性工具吐主题名却没依据。这里每张主题卡都带 3-5 条来自不同被访者的原话 —— 你能直接看到主题为什么成立、不用盲信标签。编码本附录列出所有已编码语句,主研可逐条审计。
句向量聚类在你 workspace 绑定的沙盒里跑、用开源嵌入模型。访谈记录始终在沙盒边界内 · 只有指名产物(PDF / 框架 JSON)落到你的 Drive。我们不会拿用户访谈做训练。
你在对话里拒绝某个主题("这两合并 / 这个标签不对"),决定会写进框架 JSON。未来一轮再尝试相似聚类,Agent 会把先前的拒绝作为上下文提示 —— 你判断是确实有新情况还是继续延用之前的拒绝。
多数定性工具每个项目都从零开始。这里编码本始终在你 workspace 里。Q2 接住 Q1 的主题、新增、淘汰 —— Agent 把变化清单展示给你。一年下来你有一份能讲清"用户怎么谈我们产品如何演变"的连续研究框架,而不是 4 个互不相连的研究。
在对话里讲就行。常见调整:"A 和 B 合并 · 是同一个发现两个角度看"、"C 拆开 · 这里其实藏着两个子主题"、"D 改名叫'X' · 这个受众这么说的"。Agent 按你的修改重渲染 PDF · 决定写进框架。Agent 的工作是提候选结构 · 你的工作是判断数据真正在说什么。