丢 20 篇 PDF · 拿回一份 30 页带引用的综述

Agent 读完每一篇,再用 Deep Research 顺着引文网络补出你没收但应该收的关键文献、画出引用网络,最后写一篇带行内引用的综述 —— 每个论点都能追到真实 DOI。BibTeX 文件同步交付,直接贴进 Overleaf。

看一眼你能拿到什么

封面 + 摘要
1 页 / 共 4·封面 + 摘要
引用网络
2 页 / 共 4·引用网络
主题综合
3 页 / 共 4·主题综合
参考文献
4 页 / 共 4·参考文献

引用网络 · 你提供的 + Deep Research 补出来的

海军蓝节点 · 你上传的 22 篇 PDF。金色节点 · Deep Research 沿引文网络前后各扩 2 层补出来的。每个金色节点在进入综述前 · 由你投票纳入。

Hamilton 2018He 2020Kipf 2017
你提供的 · 22Deep Research 补出的 · 13你投票排除的 · 2
parse_pdf22 篇 · pdfplumber + markitdown
deep_research前后各扩 2 层 · 13 篇候选
render_reviewweasyprint · APA 7 · biblatex

每个论点都引用真实论文 · 例 3

没有编造作者。下面每条原文对应综述里某段 · 都能追到真实 DOI。

主题 1 · GNN 层的归纳式简化
在 GCN 中去掉特征变换和非线性 · 不会损害推荐精度 · 反而大幅提升训练效率。
He et al., 2020 · SIGIR·doi:10.1145/3397271.3401063
主题 3 · 物品-物品协同信号的图形化建模
用户-物品二部图中的高阶连接 · 携带了经典嵌入方法无法捕捉的协同信号。
Wang et al., 2019 · KDD·doi:10.1145/3292500.3330989
主题 5 · 重型 GNN 真的必要吗?
在标准基准上 · 调优良好的 MF baseline 已经追平大多数图方法 · 暗示已发表的"提升"很大程度来自训练技巧、不是图结构本身。
Mao et al., 2021 · CIKM·doi:10.1145/3459637.3482008
literature-review.pdf
32 pages · APA 7
references.bib
35 entries
citation-graph.svg
paths + labels

它怎么工作

步骤 01

把手上的论文丢进来

单 PDF / zip / 已有 .bib 都行。20-80 篇是甜蜜区间。Agent 全文阅读、不是只看摘要,记录每个事实出自哪一篇。

步骤 02

挑综述风格

投稿期刊系统综述?博士论文导论叙述性综述?元分析数据抽取?不同路径遵循不同社区规范 —— Agent 严格执行,审稿人不会因为格式打回你的稿子。

步骤 03

取走综述 + 文献库

综述 PDF 落到你的 Drive,每个引用都解析到真实 DOI。.bib 是 Overleaf / Zotero 期望的标准格式。引用网络 SVG 展示 Agent 走过的网络;Agent 在你原始集合之外新增的论文会高亮标出来 —— 你拍板是否纳入。

为什么用 Vecbase 做这件事

每个引用都是真实 DOI · 没有编出来的"Smith 等 2017"

普通对话模型会编出听起来很合理的引用,因为它们被训练去写流畅文本。这里 Agent 只引用它确实读过(你的 PDF)或通过 Deep Research 取到真实元数据的论文。某个论点撑不住,Agent 在对话里直说 —— 它不会编引用源。

它会找出你不知道该收的论文

Agent 沿引文网络前后各追 2 层(谁后续引了它 / 它建立在什么之上),再扫 4-6 个相关期刊找漏。你拿到一份"候选"列表,决定纳入哪些再进综述 —— 决定权在你手上,但语料不再只是导师碰巧发给你的那些。

沙盒里跑真 PDF 解析 · 公式 / 表格不丢

便宜的"AI 摘要"工具把 PDF 抽成纯文本 · 丢掉所有公式和表格 —— 而那里恰恰藏着真实结果。这里在沙盒里跑 `pdfplumber` + `markitdown` 解析 · 表格走 `camelot-py` · 公式和结构化行都能保留。综述里可以直接引用真实的效应量数字 · 不是"作者发现了正向效应"这种含混话。

一张可以让你质疑的引用网络图

Agent 交付一张 SVG 引用网络:节点是论文、边是引用、颜色区分"原始集合"vs"Agent 后补"。可以在对话里追问"为什么丢掉这个分支"或"右下角那个 2024 年聚类纳入",综述会按你的修改重新生成。

常见问题

20-80 篇一次过最舒服。超 100 篇 Agent 会建议把语料按主题分批、综述按章节写 —— 最终仍是一篇连贯文档,但语料管理保持理智。硬上限由沙盒存储决定(200MB PDF ≈ 150 篇典型论文)。

90 秒内,拿到你的成品

登录后把任务交给 Agent —— 成品自动落到你的 Drive。