学术写作逻辑
Writing AI Conference Papers: A Handbook for Beginners 阅读
提出问题——抽象出背后的原理——提出自己的解决方案和具体的实现——实验验证
A little squiggle of paint by Picasso can be as beautiful as an intricate painting by Rembrandt. —— Novelty in Science (highly recommended for readers)
Find the Core Idea
- 当有了一些有趣的发现和实验结果,如何定义文章的核心主题,所有文章主题大可分为三类
- Insight:对一些已经有的进一步解释
- Performance:有更好的效果
- Capability:做了一些之前没有做的事情
- 当有了一些有趣的发现和实验结果,如何定义文章的核心主题,所有文章主题大可分为三类
摘要 -> 引言 -> 正文,作为三个层次,在每个层次上,不断扩展,每一层都是前一层的扩展。
在坚持核心思想的同时,开始概述你打算在论文中呈现的内容。首先制作一张简单的幻灯片,向你的同伴、同事或导师展示你的研究方法和成果,以评估他们的理解程度。有意识地从不熟悉你工作的研究人员那里寻求反馈,以确定理解上的潜在差距,可能是有益的。
围绕贡献陈述,在结果部分进行扎实的分析。许多读者在决定阅读整篇论文之前,会先通过检查结果来评估这种方法的有效性。他们会看看你的贡献是否与实验结果相符。即使对你的方法的有效性有很强的信心,你也可能需要额外的比较和消融实验。重要的是创建更多的表格和视觉效果,选择最重要的方面来展示。
Introduction
- 把读者放在心中最重要的位置
- 开门见山,论文的新颖和有趣方面应该尽早体现
- 用更多的空间来描述原创和新颖的想法
- 最终前任工作,肯定历史贡献,再指出不足
- page one figure 很重要
Related work
更好的方法是关注不同的方法与你所作的事情之间的关系。不要列出其他技术的所有缺点,而是解释你如何改进它们。你可以先写一篇独立于你的作品的文献综述。您可以对前面的方法进行分类和排序(例如,某一方法是先驱),此时,重要的是要注意正确的讨论。防御弹性:没写完一句话都要考虑审稿人可能从哪个角度攻击这句话
- 言出有据:“Problem A是本领域的关键问题且尚未得到解决”,这时就要考虑到审稿人可能会问:“为什么说这是关键问题?它造成的后果有多严重?这种后果对最终性能影响大吗?”这就需要我们完善引用
- 轻重适当:
- 我们有直接的证据时:The performance improves, which is attributed to that XXX can … (后面要高调地把证据展示出来)
- 没有直接的证据,但有一些可视化等间接证据:The performance improves, which may be explained that XXX can …
- 几乎没有证据,只是感觉应该是这样的,反正跟我们的motivation是相符的:The performance improves, suggesting that XXX can …
- 不要用自讨苦吃的主观词汇:在学术写作这种场合使用诸如obviously之类的带有强烈主观色彩的词汇没有任何好处。如果审稿人能看出你的结果好,不需要你自己强调这个obviously;如果审稿人看不懂,你越强调他就会越迷惑
迷惑时间:“迷惑时间”是读者在阅读过程中每一次“咦,这是啥”到“哦,原来是这样”之间的时间的总和。当代人类的耐心是有限的,一篇文章的总的迷惑时间越短,可读性就越高
- 提出概念后应就近解释:建议在给出其名字以后直接解释其实质
- 指代对象应该毫无歧义:如果我们的写作水平有限,无法让长句完全不带歧义的话,就应该将其拆为短句。没有人会因为你缺少展示高超英语水平的长难句而拒你的文章!
- 不要在需要读者集中注意力时多次引用数页后的内容:不然读者翻过去再翻回来的这段时间里思维就断了。读者思维的连续性也是可读性的一部分,毕竟论文是线性叙事。
信息密度:
气氛组语句不应过于冗长
- 不要太长
- 不相关的不要写
- 不要写成历史书
- 尽量跟主旨有点关系
精炼语言
- 用简练的语言准确表达意思是一门技术活,具有本质的困难性。建议多看英语母语者写的论文和其他文字内容,特别是那些有丰富教学经验的年轻选手
The image classification performance on ImageNet is 79.99%
改为 The ImageNet top-1 accuracy is 79.99%.As can be observed in Table 1, A outperforms B.
改为 Table 1 shows that A outperforms B.Table 1 shows that the accuracy of model A is 81.0% and the accuracy of model B is 80.0%, so we conclude that model A outperforms model B.
改为 Table 1 shows that model A outperforms model B by 1.0% in the accuracy (81.0% v.s. 80.0%)图表附近应是全文中信息密度最高的地方,重要的解释和阐述距离图表越近越好
- 如果图表中有缩写,那么标题里最好就有解释。
- 如果希望强调Table 5中的某个结果,那么分析这一结果的语句最好跟Table 5在同一页上,而且那句话前后最好就有“Table 5”这几个字。这是因为读者可能根本不会仔细看你写的文字,而是先看图表再去找跟图表中的内容关联的文字。一眼看到Table 5中某个亮眼的结果并感到好奇时,他很可能用pdf阅读器的搜索功能来搜“Table 5”。
- 不要指望读者自己从复杂的表格中自己想明白应该拿谁去跟谁对比以得出结论,我们应该把希望形成对比的内容放在一起。如果这样的表格很难设计的话,哪怕为此必须得把某个结果(一般是需要跟若干组结果全对比一遍的baseline)重复几行也在所不惜。没有人会因为表格设计不够优雅而拒你的论文,但看不明白表格进而血压升高的审稿人是真的会。
几个小技巧:
1. 尝试把图串一遍,看故事是否完整。努力提高图表质量,做到图表自明,即不看论文也能看懂。
2. 看文本和图片的详略是否得当,尽量去掉冗余,把重要的信息放在显眼的位置。
3. 先考虑怎么写一篇满分作文(严谨性),再想着写一篇好作文(美观性)。
4. 查缺补漏,把细节、引用处理清楚;最容易引起迷惑的错误是符号或者缩写没定义和用法前后不统一。
5. 想想哪些东西其实不是常识,需要在论文里说清。这里可能隐藏了一些作者的创新,被作者误认为是大家都认可的知识,见图 2。多和其它人讨论,可以慢慢地把错误认知给修正。要在写作时就考虑不同的读者群体。
6. 在最终修改的时候,着重检查容易被看到的部分,比如图的配字,公式等。
- Checklist
[ ] 通读图表以确保故事完整。努力提高图表的质量,使其不言自明。
[ ] 检查符号、缩写和引用中的任何不一致之处。
[ ] 文本和图表的详细程度是否合适?
[ ] 将重要信息放在显眼的位置。
[ ] 图中的文字和图例可以大一点吗?
[ ] 是否可以通过使用列分割、保留文本和删除冗余等方法来提高表的理解速度?
[ ] 检查各种数字是否复制错误
[ ] 搜索问号以检查 latex 错误
[ ] 确保所有图表都在正文中提到,并且提到的顺序与图表出现的顺序一致
[ ] 标题很明显。避免语法错误,建议使用句号
[ ] 矢量化图表
[ ] 检查所有的公式是否完整,它们在编辑过程中很容易被忽略
[ ] 通读所有字幕,统一大小写风格
[ ] 确认正文页之外没有数字
[ ] 检查匿名性;您可能需要删除确认
[ ] 确保页数正确,避免被拒绝
1 | @misc{WritingAIPaper2024, |
- Rebuttal
顶会rebuttal技术浅谈:站着,还把论文中了——丁霄汉
实事求是,拒绝假装卑微
更好的策略是列出几篇代表性文章标题:你看看这几篇也有一定影响力,他们也没做这个实验嘛。当然了,既然你要了,我们也就做了,虽然意义不大,还是谢谢你了。停止辩经,指出谁在划水
你的AC也未必看得上他分到的审稿人。如果你能实事求是地给出审稿人不称职的证据,AC可能也懒得看他的意见——到了后续的讨论阶段,跟乐子人打交道浪费的可是他的时间啊。 例如,下面这段来自我某一次给AC打的小报告。作为审稿过程的一部分,具体的内容是不能公开的,我只能概括了一下。 We feel it necessary to bring to your attention that some of the comments from Reviewer X confuse us a lot. It seems that the reviews lack some common knowledge of the deep learning literature.对事不对人,我们反对的只是他的言论,不要直接表达对审稿人的不满,不然会显得很不专业。所有对他的言论的指控都必须基于坚实的依据和简单的逻辑。他的言论必须是显而易见地荒诞,才值得你打小报告。AC也很忙,我们不能期望AC在对文章还不是很熟的情况下花几分钟来思考明白为什么某一句comment有事实性的严重错误。不要让AC有“你在教我做事”的感觉。我们可以说希望AC做决定时将这些review的质量问题纳入考虑,不要说希望AC排除这个审稿人的评分。
花式引战,勾起内部讨论
We would like to note that XXX distinguishes our method from YYY and ZZZ, which is appreciated by Reviewer Y and Z. 除了让审稿人更容易重新审视自己的判断以外,这样做还可能起到的一个正面效果是激发rebuttal后AC带领审稿人进行的讨论(“各位审稿人,我看了rebuttal,注意到了你们的评价各不相同,你们说说这是怎么回事?”)。如果AC觉得讨论是热烈而有益的,自己没白忙活,也收获了一些知识,那么作为引发讨论的素材,你的文章可能会得到一些印象分。要改就改,不画虚空大饼
如果审稿人说得对,你也想改,那就要在rebuttal中让他们知道你真的会改。由于会议论文只有一次审稿,审稿人和AC会担忧你的修改是不可控的(超出篇幅限制、删除了他们没想让你删的东西、引入了新的错误等)。所以要尽量避免虚空画饼