- 超越:上海交通大学ACM班廿年逐梦路
- 俞勇主编
- 2218字
- 2022-10-24 11:17:05
第一篇
风华正茂
旅美作家的修行之路
我读博士的主要动机之一是喜欢写paper。来到北美之后的博士生活,也确实有一大部分时间是在学习如何写paper。因此在北美待了几年之后我们都喜欢上了自嘲为“旅美作家”。写paper本身是非常有意思的一件事。它是一个当下的作者与未来的读者之间的一次交流。所以它要求作者在现时现在就要想清楚,未来的读者从今天的你这里能带走什么;所以在写paper的过程中,我们无时无刻不在思考,读者的take-away message是什么。为了让这些信息简单明了的展示在读者面前,作者需要在写作的过程中花很多“小心思”。首先paper中提到的发现要概括在简洁明了;否则一旦读者对于你的表达产生了疑惑,那么你要表达的中心思想就很难传达到读者的心中。因此许多paper的写作其实是可以看到“八股”之气的。这并不是论文作者们在偷懒,或者写作水平不行,写不出华彩的文风;而是为了知识的传达而做到的一些取舍。“标准”论文的模板之所以被很多人采用,是因为它最大化地降低了读者理解的复杂度。这样一来,读者就可以花最小的精力来理解一篇paper,这样也能让它更加被欣赏。
在此基础之上,行文的语言选择也要在不引起歧义的前提下尽可能的简洁;这样读者可以把更多的精力放在理解你所要传达的思想本身,而不必花太大的精力去理解晦涩的文法。我在读PhD阶段的两位导师都很擅长写paper,其中一位是一个受正统常青藤教育的美国白人。他在我2—3年级的时候会非常细致的帮我改paper,这让我受益匪浅。每次在我会把我的paper draft pdf发给他,他会用一个iPad上叫作Good Note的软件在我的draft上作批注,再发回给我。这样我可以非常清晰地看到每一句话的表达是怎么被简化的;哪里由于写得过于拗口导致他完全理解不了我在写些什么。从此以后我在自己改paper的时候也喜欢把PDF传到iPad上,用GoodNote先标注,再在latex源文件上作修改。这更让我明白一个让人能读懂的paper是怎么改出来的。
由于我在PhD training是system security(系统安全)与programming language(编程语言),所以我的paper喜欢把许多实际上的创新内容融合到一篇paper里。因此这样的paper对于一些机器学习这类paper长度比较短的领域来说,通常会让读者觉得实质内容过于dense。但尽管如此,在我收到过的所有review中,我最喜欢的一条,大致意思是说“文章非常长,非常dense,但是我非常享受读这个文章,读每一章都有新的发现,而且比较好理解”。
当然写dense paper是要付出代价的,那就是能跟进你工作的人不多。在我所有的paper里,引用最高的,要么是发现类(一堆实验结果),要么是挖坑类(快速弄个比sota好,但是很容易被打败的结果)。我的三篇顶会best paper的引用在我的列表里连前五也挤不进去。
写paper固然有趣,但是它也只是一种特定形式的“交流”(communication)。我直到在伯克利做博后之后,才意识到交流的重要性。我16年开始我的博后生活之后,拉了几个ACM班的学弟学妹来一起搞paper。在第一年的过程中我犯了一个很严重的问题,那就是任何问题在我觉得对的做法,我就觉得大家都应该觉得对,大家都应该按照我说的来做。在我们合作一篇transferable adversarial example的论文的过程中这一问题被暴露得尤为明显。我对于这篇paper的想法是要把实验做得非常翔实,因此安排了许多实验;但是由于实验多的缘故,且学弟由于ACM比赛刚结束,并不习惯在跑大实验之前进行unit test,导致许多次实验结果都被检查出有问题。这样就导致大量的时间都被浪费了,很多实验需要重新跑。这样的结果是谁都不想看到的,因此在项目进程中搞得每个人都非常的紧张,每个人的压力都很大。索性paper最后中了,也是我所有paper中citation最高的一篇。但是这篇paper的一作学弟后来放弃了读PhD,我谨慎猜想可能与这段经历也是有一定关系的。
我回想我的博士生导师平常是怎么跟我交流的,想从中提取一些经验。仔细回想之下,我还是认真体会到了正统美式教育体制下的导师是怎么跟学生交流的。似乎从我读PhD一开始,我的paper的大部分想法,都是由我来提出来的,再由我的导师进行润色。这跟在由国内教育体制下培养出来的PhD有很大的不同。我的另一个导师是清华出来到美国留学的,她就会提出想法让学生来实现,而不是由学生去主导研究的进行。那这是不是因为我的白人导师没想法呢?在我的仔细回想之后,发现并不是这样的。通常我的导师都是本身就有很多想法,但是也会让我自己去弄出个draft。当然这个draft跟他的想法肯定有很多的不同;这个时候他也通常不会直接把他的想法抛出来给我,而是跟我讨论我的draft有哪些问题,而在讨论这些问题需要怎么解决的时候适当地把他已经想好的解决方案解释给我听。因为我在完成draft的时候肯定是非常深入地思考过我们要解决的问题的,所以能非常快速地听懂他的解决方案,有时会同意,有时会有我自己的顾虑。但无论如何,他都给了我一个能非常平滑的接受他的idea的渠道。在我仔细地回忆了跟我导师学习的三年经历之后,我觉得这大概是交流最理想的情况吧。
我把总结出的经验应用到下一年的实践里。这一年我只带了一个ACM班的学弟,但是我们非常高产。从年初开始合作,到年底学弟申请,我们已经共同完成了五篇paper,并且有几篇已经发表在了顶会上。主要是学弟的心理态度明显稳定很多,算是一大进步。
我觉得交流本身是一种修行;而且是一种在国内大家平常不会特别强调的修行。我在这条路上一边学习一边实践。享受着它带来的工作上的便利,也在不断总结做得不到位的地方带来的经验教训。借着20周年这个机会把我自己的经历略作记录,以此与学弟学妹们共勉。
简介:刘畅,男,ACM班2005级。高中毕业于吉林省吉林市第一中学。博士毕业于马里兰大学。曾在加州大学伯克利分校做博士后。研究方向:深度学习,程序分析、生成与安全。现就职于阿里巴巴达摩院研究员。