你问过 LLM 摘要研究论文,就知道问题:你拿到一份精炼的三段执行摘要,基本上什么都没讲。方法不见了。限制不见了。实际数字被软化或弄错。你学到这个主题存在,不是论文怎么讲它。
更好的摘要来自问具体问题,不是要「摘要」。
论文真正需要读者抽出来的东西
一篇研究论文有四个读者在意的东西:
- 主张(Claim) — 论文说什么是真的?
- 证据(Evidence) — 什么实验 / 数据 / 证明支撑主张?
- 限制(Limitations) — 主张在什么条件下失败或弱掉?
- 新东西(What's new) — 比起既有文献,这篇加了什么?
通用摘要只给你主张跟精炼版的证据。限制跟新意被丢掉,因为比较难简洁摘要。
更好的 prompt 瞄准这四个:
对这篇论文,给我:
1. 主要主张,一句话。
2. 支撑这个主张的最强证据(具体数字 / 实验)。
3. 论文承认的或你能识别的三个限制。
4. 比起先前工作,这里真正新的是什么。
5. 最令人意外或反直觉的发现。
用 Claude 4.5 或 GPT-5;两个都能很好处理长 context 论文 PDF。Gemini 2.5 Pro 对非常长论文(50+ 页)很出色。
自己读摘要跟结论
用 AI 之前,读摘要跟结论。它们很短。告诉你论文是否值得花时间。AI 摘要对「第一轮相关性」问题杀鸡用牛刀。
摘要让论文听起来正是你需要的,再 AI 深入抽取。摘要让你不确定,要 AI 重新表述摘要不会 help — 你只会拿到同样不确定的精炼版。
什么时候读方法
大部分论文,方法是你可以叫 AI 摘要而没太多风险的部分。pattern 重复(「我们用 X 数据集、Y 模型、Z 评估」),AI 处理得好。
例外:方法本身就是贡献的论文。任何提出新训练方法、架构、评估框架的。这种 AI 摘要常常漏掉真正的技术贡献。任何你可能用其方法的论文,自己读方法。
AI 够用时方法的有用 prompt:
够详细描述方法,让我能粗略复制实验:
- 他们用什么数据?
- 什么模型 / 技术?
- 什么评估指标?
- 关键超参数或选择是什么?
- 跟什么基线比?
抓 hedge 词
研究论文有可预测的 hedge pattern。AI 摘要倾向丢掉或过度抹平。具体 prompt 有帮助:
列出这篇论文里每个含 hedge 语言的主张:
「可能」、「也许」、「暗示」、「有可能」、「看起来」、「倾向」。
每一个,标注实验是否实际支持更强主张,或 hedge 是真实的。
这暴露作者在资料弱时软化(常见) vs 适当谨慎(也常见)。对政策跟决策论文这很关键。
跟相关工作比较
对任何声称改进过去工作的论文,问:
对这篇论文比较的每个相关工作:
- 那个过去工作的主张是什么?
- 这篇量了什么比较好,差多少?
- 比较公平吗(同样数据集、同样指标、同样计算)?
大部分 AI 摘要对比较含糊带过。比较细节常常是研究论文作弊的地方(不同数据集、樱桃挑指标、计算量大很多)。直接 prompt 强迫模型把它本来会抹平的浮上表面。
长论文跟综述论文
30+ 页论文(特别是综述),Gemini 2.5 Pro 的长 context 真的有用。可以贴整个 PDF 问分节问题:
- 「对 3-5 节,综述涵盖哪些方法,每个的强弱说什么?」
- 「综述指出当前研究有什么缺口?」
- 「综述里多次引用的论文哪些是基础、哪些是近期的?」
非常长的技术论文(教科书、论文),这个方法抽出意外有用的结构化知识。
AI 不能取代什么
三件事永远自己验证:
数字。 AI 在摘要里幻觉数字大概 5-10%。如果一个数字对你的决策重要,在来源验证。
关键主张。 你要引用什么东西,点进原文。摘要过程会微妙扭曲主张,你不想曲解一篇论文。
论文好不好。 AI 摘要抓不到实验设计的明显问题、缺少基线、p-hacked 结果。你需要领域知识或同行评议搜寻来评估论文品质。
什么时候不要用 AI 读论文
你在学这个领域。读新领域基础论文的全部意义在于自己穿越的经验。AI 摘要跳过你大脑整合想法的部分。
论文很短。任何 8 页以下的,直接读。AI 摘要省不了时间。
论文是你不能验证的语言。AI 翻译加摘要把错误叠加。对你读不了的日文论文,AI 能给你起点,但不要只根据摘要做决策。
你会跟专家讨论这篇论文。读二手让你听起来很二手。用 AI 省下的被尴尬抹掉。
实用工作流
- 读摘要跟结论。决定是否相关。
- 是的话,把 PDF 丢进 Claude 或 Gemini。
- 问结构化 prompt(主张、证据、限制、新意)。
- 根据有趣的问追问。
- 读对你的工作真正重要的章节。
- 任何你会引用的数字验证。
每篇总时间:深入理解 10-30 分钟 vs 仔细读 2-3 小时。压缩在规模上重要(每周 10+ 篇),但对任何你会行动的东西,还是要至少自己读方法跟主要结果。
决策树
- 快速相关性检查:自己读摘要
- 标准论文、想要结构化抽取:结构化 prompt + Claude 4.5 或 GPT-5
- 非常长的论文或综述:Gemini 2.5 Pro 完整 PDF
- 你会行动或引用的论文:AI 抽取 + 自己深读
- 学习领域时的基础论文:自己读
下一步
- 建一个你结构化抽取过的论文的 Anki 风个人卡片
- 看 Elicit 跟 Consensus 做学术专门搜寻
- 看 NotebookLM 在一个 workspace 里整合多篇论文
- 看一下摘要场景的特定幻觉 pattern