如何阅读论文

发布于 作者: S. Keshav

引言

本文是How to Read a Paper的译文。

摘要(Abstract)

研究人员需要花费大量时间阅读研究论文。然而,这项技能却很少被系统教授,导致许多精力被浪费。本文概述了一种实用且高效的“三遍阅读法(three-pass method)”来阅读研究论文,并进一步说明如何利用该方法进行文献综述(literature survey)

引言(Introduction)

研究人员阅读论文有多种原因:为会议或课程审稿、跟进本领域的最新进展,或进入一个新领域时进行文献综述。一个典型的研究人员每年可能要花费数百小时阅读论文。

高效阅读论文是一项至关重要却鲜少被教授的技能。因此,研究生初学者往往只能通过反复试错来自行摸索。在这一过程中,学生会浪费大量精力,并常常感到沮丧。

多年来,我一直使用一种简单的 “三遍阅读法”,以避免在尚未获得整体认识之前就陷入论文的细节之中。该方法能帮助我估计评阅一组论文所需的时间。此外,我还能根据自身需求和可用时间,灵活调整论文评估的深度。本文将介绍这种方法,以及它在进行文献综述时的应用。

三遍阅读法(The Three-Pass Approach)

其核心思想是:最多用三遍来阅读论文,而不是从头到尾线性地通读。每一遍都有明确目标,并在前一遍的基础上展开:

  • 第一遍:获得对论文的整体认识
  • 第二遍:理解论文内容,但不深入细节
  • 第三遍:深入理解论文的每一个方面

第一遍(The First Pass)

第一遍是一次快速浏览,目的是获得论文的鸟瞰视角(bird’s-eye view),并判断是否有必要继续深入阅读。这一遍通常只需 5–10 分钟,包括以下步骤:

  1. 仔细阅读标题、摘要和引言
  2. 阅读各章节和子章节标题,忽略其他内容
  3. 快速浏览数学内容(如有),判断其理论基础
  4. 阅读结论部分
  5. 浏览参考文献,心中标记已经读过的文献

完成第一遍后,你应当能够回答所谓的 “五个 C(the five Cs)”

  1. Category(类别):这是什么类型的论文?测量论文?现有系统的分析?研究原型的描述?
  2. Context(背景):它与哪些论文相关?使用了哪些理论基础?
  3. Correctness(正确性):其假设看起来是否合理?
  4. Contributions(贡献):论文的主要贡献是什么?
  5. Clarity(清晰度):论文写得是否清楚?

基于这些信息,你可能会选择不再继续阅读(甚至不打印出来,从而节约纸张)。原因可能包括:你对该论文不感兴趣、对该领域了解不足,或作者的假设不成立。对于不属于你研究方向、但未来可能相关的论文来说,第一遍已经足够。

顺便一提,当你自己写论文时,应当预期大多数审稿人(和读者)只会进行一遍阅读。因此,务必选择清晰连贯的章节标题,并撰写简洁而全面的摘要。如果审稿人在一遍阅读后无法理解论文要点,论文很可能会被拒;如果读者在五分钟内无法抓住亮点,论文可能根本不会被认真阅读。正因如此,近年来科学期刊中越来越常见一种用单一精选图表来概括论文的图形摘要(graphical abstract)

第二遍(The Second Pass)

第二遍需要更加仔细地阅读论文,但可以忽略证明等细节。阅读过程中,建议记下关键点,或在页边写下评论。奥格斯堡大学(Uni Augsburg)的 Dominik Grusemann 建议你:

“记下你不理解的术语,或你可能想问作者的问题。”

如果你是论文审稿人,这些笔记将在撰写评审意见以及参加程序委员会会议时发挥重要作用。

在第二遍中,应重点关注:

  1. 仔细查看图表和插图,尤其是曲线图:

    • 坐标轴是否正确标注?
    • 是否使用了误差条来体现统计显著性? 这些常见错误往往能区分出仓促、粗糙的工作真正优秀的研究
  2. 标记尚未阅读但与论文高度相关的参考文献,以便后续深入学习背景知识。

对于有经验的读者而言,第二遍通常需要 不超过一小时。完成后,你应能掌握论文的核心内容,并能向他人概括论文的主要观点及其支持证据。这种理解深度适合你感兴趣、但并非研究专长的论文。

有时,即便完成第二遍,你仍然无法理解论文。这可能是因为主题对你而言是全新的,术语和缩写不熟悉;或者作者使用了你不理解的证明或实验技术;也可能是论文写作质量较差,充斥着未经论证的断言和大量前向引用;当然,也可能只是因为你太累了。此时你可以选择:

  • (a) 暂时搁置论文,寄希望于未来不需要理解它
  • (b) 稍后再读,先补充相关背景知识
  • (c) 坚持下去,进入第三遍阅读

第三遍(The Third Pass)

真正理解一篇论文,尤其是作为审稿人时,第三遍是必不可少的。其关键在于:尝试在脑中“重新实现”这篇论文——也就是说,采用与作者相同的假设,重新构建其工作。

通过将你的“虚拟重构”与原论文进行对比,你不仅能清楚地识别其创新点,还能发现隐藏的缺陷和假设

这一遍需要对细节投入极大的注意力。你应当:

  • 识别并质疑每一个陈述中的假设
  • 思考如果是你,会如何呈现某个想法

这种“实际论文”与“虚拟实现”的对比,能为你提供对论文证明方式和表达技巧的深刻洞见,并很可能将其纳入你自己的工具箱。在此过程中,也应随手记录未来研究的灵感

对初学者而言,这一遍可能需要数小时;即便是经验丰富的读者,也往往需要一到两个小时。完成第三遍后,你应能够凭记忆重建论文的整体结构,并明确指出其优点和不足,尤其是:

  • 隐含假设
  • 缺失的关键引用
  • 实验或分析方法中潜在的问题

进行文献综述(Doing a Literature Survey)

在进行文献综述时,论文阅读能力将经受真正的考验。你可能需要阅读数十篇论文,甚至是在一个并不熟悉的领域。那么,应该读哪些论文呢?以下是三遍阅读法的应用方式。

第一步:使用学术搜索引擎(如 Google ScholarCiteSeer),结合精心选择的关键词,找到该领域中 3–5 篇近期被高度引用的论文。对每篇论文做第一遍阅读,然后阅读其“相关工作”部分。你通常可以获得该领域近期研究的概览,运气好的话,还能直接找到一篇综述论文。如果找到了,恭喜你——只需阅读该综述即可。

第二步:在参考文献中寻找重复出现的引用和作者姓名。这些往往代表该领域的关键论文和核心研究者。下载这些关键论文并留存,然后访问这些研究者的个人主页,查看他们近期的发表情况。这有助于你识别该领域的顶级会议,因为最优秀的研究人员通常会在顶级会议上发表成果。

第三步:访问这些顶级会议的官方网站,浏览其最新的会议论文集。通过快速扫描,通常可以发现近期高质量的相关工作。这些论文与之前收集的论文一起,构成你文献综述的第一版。对它们进行两遍阅读;如果发现它们都引用了你之前未注意到的关键论文,就获取并阅读该论文,如此反复迭代。

如果你是为了撰写评审意见而阅读论文,建议同时阅读 Timothy Roscoe 的《Writing reviews for systems conferences》。如果你计划撰写技术论文,则应参考 Henning Schulzrinne 的综合性网站,以及 George Whitesides 对论文写作流程的精彩概述。此外,Simon Peyton Jones 也维护了一个涵盖研究技能全谱系的网站。

Iain H. McLean(Psychology, Inc.)整理了一份可下载的 “评审矩阵(review matrix)”,利用三遍阅读法简化实验心理学论文的评审流程。经过少量修改,该工具也可能适用于其他研究领域。

致谢(Acknowledgments)

本文档的第一版由我的学生起草:Hossein Falaki、Earl Oliver 和 Sumair Ur Rahman,在此表示感谢。我也受益于 Christophe Diot 富有洞察力的评论,以及 Nicole Keshav 一丝不苟的文字校对。

我希望将本文作为一份持续演进的文档,并根据收到的反馈不断更新。欢迎通过电子邮件向我提出任何改进建议。多年来,来自众多读者的鼓励性反馈也在此一并致谢。