30 段访谈 · 5 个主题 · 每个论点都引用真实访谈原话

Agent 抽出每条有信息量的语句、在沙盒里按句向量聚类、提议 5-7 个主题让你确认。每张主题卡含出现频次 / 在多少位被访者中出现 / 3-5 条原话引用。框架存好,下轮研究自动按同一分类编码。

看一眼你能拿到什么

主题分布图
1 页 / 共 4·主题分布图
头部主题卡
2 页 / 共 4·头部主题卡
原话引用墙
3 页 / 共 4·原话引用墙
编码本附录
4 页 / 共 4·编码本附录

30 段访谈 · 浮出 5 个主题

Agent 给每条有信息量的语句做嵌入 · 在沙盒里聚类 · 提议主题让你确认。每个点是一句被访者原话 · 颜色是它落进的主题。

T1上手时信息过载28
T2想要更多键盘操作19
T3价值发现晚 · Aha 来得晚24
T4对计费透明的焦虑11
T5信任来自可审计的轨迹14

每个主题 · 引用真实被访者原话

不是"AI 总结的主题" · 主题卡引用 3-5 条来自不同被访者的原话作为锚点 · 主研可逐条审计。

T3
P-014 · founder
我直到第五天才意识到 · 我可以直接把整个文件夹丢进去让它写。
T1
P-007 · designer
第一次登录我就盯着看 · 9 个面板都开着 · 没人告诉我从哪入手。
T4
P-022 · CFO
在我让团队拿真实数据用之前 · 我需要看到每个任务的成本数字。

编码框架写到 Drive · 下季研究读这个文件

主题 + 定义 + 编码规则写成 codebook.json 落到 Drive 的研究目录。Q2 一开始 Agent 先读这个 json · 用同一套主题对新一批访谈编码 · 然后产出差异报告。

/研究/新用户上手/codebook.json
2.4 KB · 5 主题 · 96 已编码语句
存到 Drive
{
  "themes": [
    { "id": "T1", "label": "Onboarding overwhelm", "n": 28 },
    { "id": "T2", "label": "Wants keyboard control", "n": 19 },
    { "id": "T3", "label": "Aha late", "n": 24 },
    { "id": "T4", "label": "Pricing anxiety", "n": 11 },
    { "id": "T5", "label": "Audit-trail trust", "n": 14 }
  ]
}
新用户主题-2026年5月.pdf
1.8 MB
codebook.qda.xml
REFI-QDA spec
statements.csv
96 行 · 含主题分配

它怎么工作

步骤 01

丢访谈记录进来

纯文本 / Markdown / DOCX / PDF 都吃。手上还是录音?先用 /tools/meeting-minutes 转写 —— 那条路径更便宜更快。每份转写要么文件名带被访者标识、要么开头一行写明。

步骤 02

选编码模式 · 确认主题

让主题自己浮出(归纳式)、按你已有的框架编码(演绎式)、或者和上一轮对比(纵向)。归纳式模式下,Agent 会先在对话里把提议的主题摆出来 —— 改名、合并、拆分由你定。你不点头就不渲染最终 PDF。

步骤 03

取走 PDF + 编码框架

产物 PDF 落到你的 Drive:主题卡 + 2D 关系图 + 原话引用墙(每个主题 3-5 条)+ 已编码语句附录。Agent 同时把编码框架写成 codebook.json 放到同一目录 —— 下季度的研究读这个 json · 按同一套主题编码。

为什么用 Vecbase 做这件事

每个主题都引用被访者原话 · 不是"模型找出 5 个主题"

便宜的定性工具吐主题名却没依据。这里每张主题卡都带 3-5 条来自不同被访者的原话 —— 你能直接看到主题为什么成立、不用盲信标签。编码本附录列出所有已编码语句,主研可逐条审计。

嵌入向量在沙盒里跑 · 你的数据不变成训练数据

句向量聚类在你 workspace 绑定的沙盒里跑、用开源嵌入模型。访谈记录始终在沙盒边界内 · 只有指名产物(PDF / 框架 JSON)落到你的 Drive。我们不会拿用户访谈做训练。

你拒绝的主题会被记录 · Agent 不会偷偷塞回来

你在对话里拒绝某个主题("这两合并 / 这个标签不对"),决定会写进框架 JSON。未来一轮再尝试相似聚类,Agent 会把先前的拒绝作为上下文提示 —— 你判断是确实有新情况还是继续延用之前的拒绝。

编码框架一轮比一轮成熟 · 不是每次从零开始

多数定性工具每个项目都从零开始。这里编码本始终在你 workspace 里。Q2 接住 Q1 的主题、新增、淘汰 —— Agent 把变化清单展示给你。一年下来你有一份能讲清"用户怎么谈我们产品如何演变"的连续研究框架,而不是 4 个互不相连的研究。

常见问题

在对话里讲就行。常见调整:"A 和 B 合并 · 是同一个发现两个角度看"、"C 拆开 · 这里其实藏着两个子主题"、"D 改名叫'X' · 这个受众这么说的"。Agent 按你的修改重渲染 PDF · 决定写进框架。Agent 的工作是提候选结构 · 你的工作是判断数据真正在说什么。

90 秒内,拿到你的成品

登录后把任务交给 Agent —— 成品自动落到你的 Drive。