零基础如何读论文

应要求读一些论文,但是对我零基础的来说实在是太难了。所以来问问到底怎么正确地读论文。
论文中出现的每一个公式或者原理都要掌握来龙去脉吗?有些论文学科交叉的内容实在是太多了,从一个 reference 看到另一个 reference,然后再到 reference 里的 reference,无限套娃。但凡出现一个公式完全看不懂,东引一本书西引一本书,我还要需要去把书里的内容都学一遍吗?我感到非常的沮丧 :pensive:和精疲力竭 :tired_face:,快想放弃了。我感觉我只有两条狗的智商,好想紫砂。到底该怎样正确地读论文?

肯定不能“去把书里的内容都学一遍”。带着目的去读:问自己问什么要读这篇论文?想要获得什么?(不同时候的目的不一样,比如第一遍的时候侧重于相比于现有研究的关键创新,想复现时侧重文章里的实现和实验部分)

我有时候感觉论文里关键思想可以很简练(短短一句话),但是为了呈现她的方法的好处,必须要说背景、与相关研究的关系和好处,以及工程实现方法(算法/框架)、并做大量的实验与现有方法的结果比较。

有些引用的方法,名称看似很高级,好像我要弄懂它 dei 完整地读另外的文章/书本章节,但是实际上可能并不难,或者在本论文工作中并不是核心(可能是 trick 或者锦上添花的东西)。

有时候某个领域的文章看多了,会发现越看越容易懂,很多是 incremental improvement。早期看会学习不少领域基础知识,这些在看后面的论文时也可能遇到。

现在流行 conference 的 paper 作者有配套的介绍视频和 slides 或者网站,也许比 paper 好懂。

ReadPaper.pdf (9.5 KB) (https://www.eecs.harvard.edu/~michaelm/postscripts/ReadPaper.pdf

HowtoReadPaper.pdf (72.7 KB)

1 Like

how to read “How to Read a Paper” :grinning:

不同学科差的太多了,有些学科确实需要学习极大量的基础知识才能开始科研(比如数学),不然从第一句话就看不懂了。
多数工科可以从一篇最经典的开始读,这种论文一般都写在教科书里了,后人的解读有很多。

This is definitely a meta-learning problem in which you learn to learn.

举个例子,我正在看 computer vision 领域的内容,但是我读的论文实现的方法并不是 image-based,而是类似于动作捕捉。论文对使用的神经网络的框架只是简单一提,而大多数篇幅都在论述物理约束之类的,而我对 rigid body dynamics algorithm 相关内容没有任何了解。我是否应该先去系统学习这一基础知识?

那肯定要学基础知识啦,否则等于门都没摸着

那经典论文网上解读就有很多了,我感觉慢慢看问题不大,看懂最开始的那篇,后面的就顺理成章了