Crafting Your Research Future by Charles Ling / Qiang Yang 笔记

下载网址:http://www.morganclaypool.com/doi/abs/10.2200/S00412ED1V01Y201203ENG018

笔记作者:Kyle @ PKU

1. 研究的基础知识

1.1 什么是研究

什么是研究:基于可重复的观察和可验证的结果更新我们对于世界的理解

科学Science:发现新理论、新范式、新方法、算法

工程Engineering:使用新技术、设计、流程、方法解决实际问题

1.3 研究者都做什么?

  1. 探索想出新的Idea。为了确保Idea的新颖性,必须做大量的文献调研工作
  2. 验证和实现这些新的Idea
    ​3. 将1和2的成果写成手稿或论文
  3. 评审他人的手稿和论文
  4. 管理学术期刊、组织学术论文
  5. 参加会议
  6. 申请Grant
  7. 培养研究生,尤其是PhD学生
  8. 给研究生和本科生上课
  9. 行政工作
  10. 研究的商业化

1.4 对于研究者来说,什么能力和技术最重要

  • 对研究的激情、关注、热情和兴趣
  • 好奇心和创造力
  • 批判和独立思考
  • 愿意冒险Risk Taking
  • 学术正直
  • 快速学习、解析和解决问题的能力
  • 勤奋
  • 较强的沟通能力Communication

1.5 作为一个研究者的Pro和Cons

Pros

  • 较高的职业满足感
  • 受保护的研究环境
  • 相对理想的收入
  • 非常受尊敬

Cons

  • 为了保持竞争力,每周工作超过40小时,每天超过8小时
  • 较长时间的准备,即入行比较慢
  • 较为狭窄的职业选择

1.6 博士和硕士的区别是什么?

博士的研究成果应该是有资格发表在顶级期刊或会议上的,而硕士论文只需要发表在一般期刊或会议上即可。

具体的:

  • 硕士论文可以可以将前人的工作应用到新问题和应用中,博士论文呢需要包含具有重大意义的新理论、方法和应用
  • 硕士论文可以是对前人工作的细微改变,博士论文应该是研究某个领域一个新的主题并做出较大贡献
  • 硕士论文可以是对现有工作的综述,博士论文必须有新的方法,并要通过理论或实验来与之前的工作相对比
  • 硕士论文可以研究当前研究所存在的问题,即研究其消极Negative的一面,而博士论文应该包含积极的效果,即改进
  • 最终,博士毕业生毕业后就成为独立研究者,应该可以直接胜任高校教授的职务

2.Ph.D研究的目标

2.1 目标1:成为某个领域最好的那个人

  • 在某一个特定的也许不太大的领域,从新颖性和重要性上看,你的研究在你完成博士论文时是全世界最好的,在这个领域你是少数几个专家之一。
  • 在3、4年级时,你的研究应该是推动了当下的最优秀的知识。
  • 博士学习早期,你应该探索多个不同的领域,但是很快应该聚焦到某一个领域,然后在该领域做一些有深度的研究。

如果不努力,你是不可能推动某一个领域的发展的。你不需要对某一个领域的所有主题都了如指掌,但是你需要成为某一个领域的专家

目标1不是很容易做到的几种情况:

  1. 花费大量的时间在不同的领域探索,即研究没有最终聚焦
  2. 探索了多个领域,并且也做出了一些小贡献,但是这些贡献不足以为你奠定你在某一个领域的地位,即你没有做到Own一个area,这种情况下,博士论文会比较跳跃,并且不容易通过答辩
  3. phd学生非常热衷于找到那些可以通过较少努力就产生贡献的领域。只有当你在延伸你导师的研究的情况下才可能出现,并且这种情况下,你很可能不会变成一个独立研究者

关于研究边界:

  • 博士论文应该前后连贯,聚焦在一个主题上。
  • 但是成为大学教授后,可以研究多个领域

2.2 目标2:可以独立研究

即应该能够独立的找到新的idea,做坚实的研究以及发表顶级论文。

2.3 拿到博士学位的3个重要任务

  1. 找到新idea
  2. 做坚实的研究Solid Research
  3. 发表顶级论文

2.4 读博期间的几个里程碑事件

  1. 完成课程
  2. 通过资格考试:通过资格考试后别沉迷,因为可能一睡不醒
  3. 开题:找到一个博士题目,做详尽的文献研究,找到新的问题并提出解决方案。需要对这个问题做详尽的解释,所有解决这个问题的方法,分析他们的优缺点,以及你拟定的解决方案
  4. 答辩

注意:

3. 起步阶段:找到新的Idea,并组织你的计划

3.1 第一年

找到有趣的问题后:

  1. 与导师交流,他可能会给你推荐论文或提出可能的研究方向
  2. 找到这个领域的综述论文
  3. 关注该领域的演讲和专刊
  4. 参加会议,与研究者交流,看看大家都在做什么,以及难度如何
  5. 寻找近期发表的较有影响力的论文,做批判和创造性的阅读
  6. 撰写该领域的综述

3.2 如何查找相关文献

寻找近期发表的高影响力论文:

  • 寻找有声望的期刊和会议,通过影响因子可以识别一个期刊的影响力
  • 知名学者的论文通常较为有影响力
  • 学术搜索引擎返回的前几条结果通常是影响力比较高的,尽管他们没有公开自己的算法。Google Scholar返回的结果可以估计出是按照引文来排的,如何获取新成果呢?使用时间过滤器
  • 阅读找到的高影响力论文,从里面找到所使用的不同关键词,然后继续检索。并且还可以通过Cited by来找到引用本文的文章,很快你就有数百篇文章了

3.3 如何阅读论文

读论文不同于读课本,课本是用来理解和学习的,而读论文的目的是希望找到研究idea并且超过原作者。即读课本的目的是为了接受现有知识,读论文的目的是为了输出新知识。

2种不好的习惯:

  1. 对一篇论文花费非常多的时间,搞懂每个细节,就像读教科书一样
  2. 在读论文的时候被某些小细节带偏了,偏离了Big Picture。例如,假如在做监督学习时发现使用了二次规划,没必要区读一本800页厚的关于二次规划的书。正确的方法是基于需求的学习,假如确实碰到了缺失的重要知识,尽快学会它,然后回来。

正确的阅读方法是:快速的理解问题、假设和基本观点以及提出的解决方案。

用30%的时间来读和理解一篇论文的主要思想和解决方法。对于一篇10页的会议论文,只需要1到2个小时。

如何做到?一篇论文通常分为摘要和正文,正文又有不同的章节,然后又分了小结。一篇书写较为合理的论文,其高层观点和解决方案应该在高层次的标题或章节中有所体现,对于较低层的细节可以扫一眼就过去。

大约15分钟来读introduction和摘要,来确定这篇论文是否与你的研究相关

剩下70%的时间用来做

  • 批判性思考:论文有什么错误,假设合理吗?问题提的对吗?解决方案是否有技术瑕疵?
  • 创造性思考:对于同一个问题,还能选择什么方法?如果我去做,会做的更好吗?

对于博士生来说,非常重要的是,从此刻开始形成批判和创造性思考的习惯,不管是读报纸还是看电视

读论文时,Read Less,Think More。对于大多数人来说,读论文是为了发现新的研究领域

3.4 如何找到新Idea

比较冒险的办法(不建议):从Future work或明显的下一步来找idea,但是这些工作很可能原作者已经在做了,此外,你也可能受限于作者的思想。

方法1:当在读论文的时候,发现了新的想法或者假设,应该在论文空白处标明。当你在积极地思考时,务必把想到的记下来,然后深入研究。很可能,随着你思考的深入,你可能会在一些意想不到的场合冒出新的idea,建议在冒出这些idea的那瞬间,立马把它记下来

对于某些成熟的领域,看的论文越多,发现可创新的机会越少。这种情况在某些成熟的领域是可能的。应该在那些比较热门或新颖的研究领域里找题目。

方法2:头脑风暴法:任何观点都不能被批评,所有想出来的idea放在黑板上,用来激发新的想法

  • 结合read less, think more以及头脑风暴:选出团队里的一个人,让他读一篇新论文的Problem,然后大家进行头脑风暴,如何解决,如何做的更好,当前论文存在什么问题
  • 在找idea的时候一定要大胆,要敢于提出与前人研究大不相同的观点。

不要只是在前人的工作上做一些小的修修补补,你的新想法应该是问题驱动或者应用驱动的,而不是解决方案驱动的,即不要总是想要改进别人的解决方案,要想着怎么解决问题本身。

案例:

最早A1学生想做cost-sensitive学习,他做了文献综述,对他了解这个领域是一个很好的方法,他也改进了一些方法,但是这些改进都算不上博士论文级别的研究。于是大家进行头脑风暴,在现实生活中还有没有其他类型的cost没有被研究过,经过头脑风暴,大家发现different data acquisition costs还没与研究过。

3.5 从Idea到研究和研究主题

一个小idea可以形成一片会议论文,多个小idea或者一个开创性的new idea可以形成一篇博士论文。

好的研究主题:

  • 你对它的激情和兴趣
  • 你的技术实力
  • 研究领域的新颖程度和热度,最好选择比较新的,如果是一个老的领域,你可能需要花大量的时间了解前人的工作
  • 你导师的Vision和观点
  • 你的未来职业规划

3.6 如何确定自己是否在正确的路上呢?

一个验证自己博士题目的方法就是完成主要三任务,即:

  1. 找到新的idea
  2. 做坚实的研究
  3. 发表文章

在第一年的后半部,以及第二年,你应该开始在你感兴趣的领域做研究并且发表论文。从小的、有趣的研究开始。得到好的结果后,可以提交到会议或者期刊。从中等水平的会议和期刊开始。

其他验证方法:

  1. 与导师和其他博士同学讨论你的可能选题
  2. 与其他在同领域的研究者通过email讨论你的idea
  3. 在会议上与其他人交流,但是,会议上人们往往不会做太批判性的反馈
  4. 阅读近期发表的该领域的博士论文,将你的研究的深度和广度与他们的做对比

3.7 制定计划

最好在二年级下学期定好你的博士论文计划,即带有二级标题的目录,以及相应部分所牵扯的需要解决的研究问题。接下来,依次解决这些问题,做坚实的研究,发表高水平论文。研究计划不是一成不变的,对于计划一定要灵活,可以跳过那些太难或不容易产生结果的问题,并且可以添加新的问题,但是一定要有足够的聚焦,不要跑遍,你的所有问题一定是围绕博士主题的。

4. 做坚实的研究

4.1 研究过程概述

1 . 按照高级别标准确定一个新颖和可能有高影响力的问题
2. 找到一个候选解决方案
3. 做理论或实证研究,做显著性测试
4. 显著性测试通过则完成一轮研究,否则从第2步重新开始

早期的解决方案通常会失败,因为你想到的点子,别人可能也想到了,并且试过了。只不过别人只是发表了积极的结果,因此你没有意识到事实上这个解决方案并不好.

研究分类:

  1. 理论研究:利用数学来表示假设,利用逻辑推理和数学推导来证明
  2. 实证研究:与实践紧密相关。实证性的假设可以用自然语言描述,并且需要实验来验证,做实验时,要求研究者要有尖锐的眼镜来发现有趣的或怪异的结果
    • Killer application:那些可能给人们带来直接好处的研究

4.2 Jim Gray对于good research的标准

Jim Gray was an American computer scientist who was credited for major developments in database theory and a proponent of the fourth paradigm in scientific discovery.

  • 有显而易见的益处
  • 很容易表述
  • 没有明显的解决方案
  • 对于进展和解决方案的检测有标准,并且可以将一个大问题分解成小问题,可以看到中间步骤

很多学生的研究不能继续,一个很重要的原因是,拿不到真实的数据,因此无法做有标准的检测,这就要求学生去单位实习,从而拿到数据来做研究

4.3 研究矩阵Research Matrix

矩阵法

  • x轴:方法和技术
  • y轴:问题和子问题

将问题你感兴趣的问题形式化的表示出来,然后分解成为子问题,找到所有子问题的解决方法和技术,然后寻找矩阵中的空白点

4.4 进行研究

(1)做研究的第一步,将研究目标表示为一句可以理解的话

假如你要设计一个比Google更好的搜索引擎,那么你应该明确的定义的更好使什么意思,然后形成你的假设。

一个假设样例:在搜索结果中使用社会网络信息比不使用可以得到更为精确地排序结果。

对上句进行扩写:我的算法ABC使用大量用户的社交网络信息以及超链接信息,我认为相比于PageRank算法,ABC可以给出更好的排序结果

假设越具体越容易聚焦。具体的假设还可以可以让你确定基线以及评测体系。

(2)实验设计

  • 明确数据集。通常原始数据集是带有噪音的、不完整的。可以对数据进行取样,在取样时,应注意样本的分布问题,应确保不同类型的数据都有取样。
  • 确定自由变量和独立变量,从而确定他们在非独立变量上的影响。通常实验维持其他变量不变,而改变其中一个变量,查看结果,最终形成图表。
  • 取得实验结果后,应该做结果分析,一方面,需要告诉读者我们的结果是否显著,另一方面,利用领域知识来解释该显著性是否可以被体会到

4.5 寻找自己在学术界的位置

从矩阵的横轴看问题。当你对一个子问题的内涵和复杂度有很深入的了解后,你可以开始提出疑问:

  1. 方法x能被用于这个问题吗?
  2. 如果我能成功把方法x用于该问题,会带来什么影响呢?
  3. 如果方法x不能用于该问题,这说明了什么呢?

方法x与方法y的优势和劣势是什么?也许x比y的效率高,但是y的精度比x高。从坐标轴的横轴,可以提出许多令人激动的研究问题,从而写出许多高水平研究论文。

纵向的看这个矩阵。假如你对方法的内在优劣势非常熟悉,可以考虑将相同的方法用于一系列相关的问题上。

方法和问题就是锤子和钉子,要么拿着一个锤子找不同的钉子,要么用不同的锤子去砸同一个钉子。假如你有一个锤子,任何东西看起来都像钉子

4.6 实证研究vs.理论研究

(1)研究分类

实证研究,理论研究,在工程领域,又被成为基础研究和应用研究。

  • 理论研究:可以形成很好的假设,通过该假设可以形成推断并基于观察对某现象进行验证。理论研究提出模型和假设。可以陈述一种事实,该事实源于观察但是高于观察。好的理论具有较强的泛化能力。
  • 实证研究:不容易形成假设,需要实验验证和数据收集

面向系统的研究是个灰色地带。很多研究人员仅仅开发一个系统,认为这是他的研究。实际上,除非带有后续分析,否则不算一个研究。可以通过创建一个系统,来验证,基于条件C,方法X比方法Y要好。

尽管你不能通过开发系统成为研究者,但是假如你带着假设开发系统,那么你就是了。即在开发系统之前你要弄明白你要证明什么,而不是纯粹的开发系统。

(2)开展实证研究

实证研究怎么上手?最好的办法是重复前人的工作,并重建它们的系统。原因:

  1. 可以了解系统的细节
  2. 可以了解系统的复杂性和问题的研究范围,深入思考如何开展自己的研究。如果不开发系统,人们容易低估研究的范围
  3. 这个系统可以作为基线系统
  4. 开发系统的过程可以使你发现前人研究的弱点,,进而提出你的假设

##(3)理论的作用##

  1. 用来被实验证明或者被推翻:先提出理论,然后人们通过实验来验证这种理论,比如图灵提出的基于图灵机开发的数字计算机可以达到与人相同的智能。
  2. 用来证实实验或推翻实验:先有实验,后有理论,刚开始各种实验各不相关,后来有人提出一个理论来解释这些实验,比如爱因斯坦的相对论。

4.7 协作

跨领域研究的回报率很高,因为在这种情况下研究者会跳出自己的研究领域来审视研究。

5. 撰写和发表论文

研究的级别:

  • top-notch(top 5%)
  • very good(top 5-25%)
  • good(top 25-50%)
  • so-so(bottom 50%)

5.3 什么是好论文

期刊或会议会召集一群有声望的学者来评估论文,一篇论文会发给2-5位相关领域的评审者。评审者会对论文进行打分,并写明分数的理由。

评审者在评审论文时考虑的问题:

  1. 研究是否新颖
  2. 结果是否显著
  3. 论文的技术是否可靠
  4. 论文内容呈现是否清晰
  5. 是否接受该论文
  6. 你对你的评审观点自信吗?

上述问题中,问题4会影响1、2、3的得分,经验表明,至少有1半的论文由于行文差而得分收到影响

5.4 关于论文的几个隐藏的真相

(1)论文应该真实、诚实并且精确

尽可能的减少论文中的偏见,讨论自己工作的优点,同时也需要讨论缺点。结果必须真实而精确。研究所使用的材料、数据和结果应该做一段时间的保存(几年)以备其他研究者验证。

(2)关于剽窃

  • 引文剽窃,即作者基于他人的工作,但是没有引用,即没有在论文中给予他们工作认可,而让人以为本文的工作是完全基于自己的原创。
  • 相似内容一稿多投
  • 不能直接复制别人的内容,即使你要描述他人的工作,也不能直接拿来别人写的句子。即使是自己写过的句子也不行,除非你能得到利益相关方的书面允许。
  • 假如必须引用他人的句子,应该加引号,并且做引文标注

一种比较简单的避免版权问题的方法:在读过一段内容后,过几个小时,然后凭自己的记忆重新写出来。

(3)把你研究的所有细节全部写清楚,这样别人才能在读过你的论文后重现你的结果

5.5 导师、校对者和学生的角色

  1. 导师
    • 帮你理解目标、逻辑流、组织以及论点
    • 帮你识别具体的误解
    • 为你的论文提供高水平的建议
    • 在最终提交前做最终检查
  2. 学生
    • 在前几篇论文中与导师紧密合作,学习如何写论文
    • 讯速变得独立
  3. 校对者
    • 当结构、论点、组织等都完成了,校对者复杂修改语言错误

5.6 导师怎么帮助学生提高写作水平

有些导师会在纸上改错,然后学生录入到电脑上。通常的问题是,一方面学生看不懂老师的书写体,另一方面,很多修改学生并不理解为什么要这么改。这对于学生的提高没什么帮助。

PI法(Progressive Improvement)

  1. 首先,让学生写以小部分,比如让他写摘要、引言和一部分研究内容。不让学生全部写完的原因是,他的第一篇论文几乎肯定要全部重写。
  2. 然后与学生坐下来,把第一页逐字逐句的过一遍。在这个过程中,对于任何一处改进,你必须说明为什么你要这么改。并让学生记下来,学生需要从这里面总结经验。
  3. 然后让学生回去把全文改一遍,下次看,第一页应该改的差不多了。如果大量出现已经提到的错误,那么就需要警告学生。

5.7 会议和期刊的区别

会议:CS领域的会议论文是full-length,6到12页的论文,通常是双栏的。

会议论文审稿期比期刊要短,并且评审过程也与期刊不同,因此适合发表快速发展领域的研究。参会也可以与其他研究者建立联系,形成你的网络。

年度会议有deadline。

会议论文有页数限制,而期刊没有。

如何选择会议:大多数重要研究者会参加的会议,或者接受率低于1/3的会议。

如何选择期刊:基于影响因子排序,前20%的期刊

5.8 会议论文的评审过程

当ddl临近时,会议主席们会开始那些明显不合格的论文,比如格式不对,或者长度超了的论文。会有有多个高级PC,每个PC负责一组论文。一篇论文通常由3个评审者,他们与作者没有直接的关系。

评审者首先关注创新性和显著性。假如在摘要和引言中找不到,那么可能就会被拒掉了。然后会关注,那些可以证明为文章创新性背书的证据。例如,你说你改进了一个方法,但是你只是用了很小的数据集,或者并没有与主流的方法进行对比,那么你的创新性就缺乏基础。

评审者首先会在摘要中找“In this paper”之类的子句来确定本文的创新点。然后根据这些创新点去寻找详细论述(基于top down refinement去寻找)。首先评审者会去阅读引言。如果没有找到任何详细论述,那么论文就写的不太好,如果多次出现这种情况,那么很可能就会拒绝这篇论文。然后,假如在摘要和引言中作者没有很好地说明自己的创新性,那么论文还是可能被拒。如果找到了研究结果,但是发现相关引文很少,那么可能作者对这个领域还不是很了解,也可能会拒绝。上述过程需要20分钟。通过了上面的步骤,评审者会再花30分钟或更多时间来仔细研究论文的推导、理论、结果,并查阅相关文献,甚至咨询其他专家的意见,最终才会推荐这篇论文。

有些会议会把允许作者对意见进行在线反馈。抓住这个机会,提供简洁、清晰和有分量的反馈。

最终论文的接受是由SPC(Senior Program Committe Member)和chair决定的,决定是最终的,一般不允许申诉。

5.9 期刊论文的评审过程

主编将评审任务分给普通编辑,普通编辑负责召集评审人员。录用与否由主编说了算。

期刊论文不限制页数,因此可以使得期刊论文写的更深入。另外一方面,审稿周期比较长,即会通过多轮的修改意见和反馈,最终成型。经过一轮评审后,可能的结果是:直接接受,经过较小修改后接受,经过较大修改后接受,拒绝。除了对论文进行修改,作者还应该对评审者所提出的疑问做出一一解答。回复信可能很长,应该认真书写。如果评审的意见很中肯,那么作者应该对论文做相应的修改。第二轮修改还有可能被拒。

会议论文是一次性的评审,一旦被拒没有申诉的机会。而期刊论文是多次评审,这个过程是互动的。

会议论文扩充后转投期刊论文:对于有些会议,他们有版权合作,会直接将会议论文转到某个期刊上。也有一些会议论文,需要至少添加20%到30%的内容才能发到期刊上。这些内容可能是,更详尽的实验结果或者理论结果,以及对相关工作的讨论。在提交这类期刊论文时,最好明确的给主编写清楚,你加了什么内容。

6. 论文写作常见谬误和Tips

6.1 谬误1:很明显我的论文写的很好

研究论文的主题应该是我们的研究工作做出了新颖又显著的贡献,通常按照如下的逻辑进行论证:

  1. 这个问题对于推动人类知识的发展很重要
  2. 前人的工作A、B。。。存在某些不足
  3. 我们提出了新的理论、方法、设计、流程Z。比如强调你是第一个提出的人,或者Z的结果很令人惊讶。
  4. 我要证明,Z在某些方面比A、B等要好。比如,你是否通过理论证明了?还是要通过实验证明了?
  5. 讨论Z的优缺点。对于缺点要坦诚。结果要诚实、不夸张、精确。Z的缺点也是将来的工作方向。

对于上面提到的每一句话,最好都能有理有据。比如 ,你说这个问题很重要,那么最好拿出引文来,别人也说很重要。

  • To the best of our knowledge, we are the first to propose…As far as we know
  • 在说自己的贡献时,可以使用谦虚词
  • 在描述你的贡献时,一定使用主动语态,被动语态会导致读者不能确定哪些贡献是你做的。确保读者能分清哪些是你的工作,哪些是别人的工作
  • 在批评别人的时候,也要谦虚,It seems that the previous work…

6.2 谬误2:读者应该理解我的文章

论文写得越清晰,越简单越好,不要故意把话写得复杂。你的读者,尤其是评阅人非常忙,没人会花很多时间来理解你的论文。而普通研究人员希望通过阅读你的论文快速找到你的创新点。

对于科研人员的一个分水岭就是你能把“你的论文真简单”当做一种赞美而不是批评。

6.3 10/30检验

  • 对于一个一般的评阅人,他能否在10分钟内弄清楚你在研究什么问题以及你的贡献是什么?
  • 对于一篇10页的论文,他能否在30分钟做出决定来接受你的论文?

6.4 自上而下逐渐细化的论文(general-to-specific style)

你的论文其实就是把你的主要观点从不同层次讲4遍:

  • 题目:10个词:题目应含有积极的或令人激动地词汇。写题目是一种艺术。题目最好别超过1行。确保你没有见过相似的或雷同的题目。
  • 摘要:200个词:摘要最好避免使用技术词汇
  • 引文:1000个词:通常两页,re-tell你的中心主题。与摘要相比,你对于每一部分的论述要更详细
    • 引言要强调背景,即这个问题为什么重要、都有谁研究过这个问题,谁是你的目标读者,有什么类似的技术被使用过。
    • 同样的,因为应尽量避免使用技术术语和具体细节。
    • 实际上,引言里的每一部分,都应该对应了摘要中的一句话,并且顺序是相同的。
    • 摘要中的每句话,可以转为引言中的3到20句话,即形成一个段落。比如你的摘要包含句子A,B,C,那么你的引言应包括A1,A2…B1,B2..C1,C2..
    • 本文的观点是在引言的最后写一个本文的结构,而Simon Peyton Jones认为这句话没人看,应该夹在引言中间。
    • Previous work: 主要目的是为了表明你对这个领域很了解,从而可以确保你对你自己贡献的描述的可信性。这部分不要太长,但是要说明白你与别人工作的区别。
  • 正文:5000个词
    • 每一个段落应该只有一个中心主题。这个段落的第一句话应该是一个概括性的句子。

优秀摘要实例

General web search engines, such as Google and Bing, play an important role in people’s life. [The problem is important] However, most of them return a flat list of webpages based only on keywords search. [Previous works have certain weaknesses] It would be ideal if hierarchical browsing on topics and keyword search could be seamlessly combined. In this paper we report our attempt toward building an integrated web search engine with a topic hierarchy. We implement a hierarchical classification system and embed it in our search engine. [A very high- level summary of our work] We also design a novel user interface that allows users to dynamically request for more results when searching any category of the hier-archy. [Emphasizing novelty and usefulness] Though the coverage of our current search engine is still small, [be upfront on the weakness of the work] the results, including a user study, have shown that it is better than the flat search engine, and it has a great potential as the next-generation search engine. [Using positive words to show the significance and impact of the work.]

6.5 关于下级标题

层次不要太深,如果太深了,考虑把上级标题提升一级。

每一部分都要有一个简介或引言。如果你的标题为3,3.1,3.1.1那么在3和3.1之间,应该写一个3的简介,在3.1和3.1.1之间,应该有一个3.1的简介。

6.6 写作Tips

  1. 使用特定的词来告诉读者你要讲的是什么内容
    • 比如你用briefly告诉读者这只是个简介。用in details告诉读者下面是详细介绍。让读者选择是否要阅读。
  2. 使用简单句而不是复杂句。
  3. 全文的术语要统一
    • 与写散文那种要求词汇丰富度不同,在论文中,术语要尽量统一。如果你要用的术语不太常规,那么应该在论文的开始部分明确的定义一下,或者包括一个术语表。
  4. 使用例子!全文都用!
    • 当你需要解释一个抽象的概念或者一个复杂的模型,最好使用例子来解释。解释越早越好,不要先给读者灌一堆难以理解的概念。
  5. 使用图、表、照片。
    • 对于这些内容的使用不必吝啬。放开用就可以了。
  6. 写清楚你的动机和理由。
    • 比如一个公式,你为什么要用这个参数。你的工作为什么可以取得比较好的效果。
  7. 提出一些可能别人会想到的问题,然后自己解答。
    • 例如,你在描述你的解决方案时,别人可能会想到,为什么不用A方法,而是要用B方法呢?对于实验,可能别人想问,为什么。当然,你可以提前写下你的动机或理由。但是,如果行文不允许你解释,那么你可以加上一句。One might wonder, One might argue that…然后紧跟一个简短的答案就可以了。
  8. 关键点要强调并且重复。
    • 假如你的某些观点很重要,那么应该不断地重复,可以使用多种形式,比如句子,图表,列表,标题等。
  9. 为论文的内容形成关联。
    • 比如见Section.. for more details. As we discussed in Section. Recall that。
  10. 格式化你的论文
    • 图和说明文字不在同一页。
    • 图的说明文字最好直接放在图下面。
    • 字体问题:尤其是图中的文字。年轻学者还会犯得一个错误就是把所有的信息都放在图上,实际上,应该把最相关的信息放在图上,其他不重要的可以舍弃,否则图会很难看。

7 撰写博士论文和答辩

7.1 博士论文

当你答辩的时候,你就是你所研究的这个领域最牛的人,答辩的目的就是要告诉委员会这个事实。

Thesis是关于世界的一种假说或观点。博士论文包含所有你要验证这种假说或观点的证据,以及你对结果的思考

7.2 撰写方式:自上而下和自下而上

(1)自上而下

起于一个中心论点。这个论点应该简单明了,即使非领域专家也能看懂。然后使用研究矩阵方法,将论文分为几个子问题,然后每个子问题都有一个introduction,一个解决方案综述,你的解决方案,以及实验验证。

自上而下法的优点

  1. 学生和导师可以较早的知道中心论题
  2. 可以及早发现缺失的问题和解决方案
  3. 可以训练学生的grant申请写作
  4. 可以较容易的定义一致的术语和符号

7.3 答辩

博士的标准:

  1. 为现存的一个很有挑战性的问题提出了一种更好的解决方案
  2. 识别一个新问题,显式化的对这个问题进行描述,提出一种新的解决方案,实际上这就是开创了一个新的领域
  3. 对于某一领域的主要方法提出一种新的方法论,然后提出你自己的见解。

博士论文展示应该表明你:

  1. 知道所有关于这个问题的解决方法,能轻松地讨论他们的优缺点
  2. 知道如何设计一个解决方案,并且对他的优缺点进行评估
  3. 掌握了对一个问题进行展示的能力,包括对不同的听众,在不同的场合下,给予不同的时间。

Presentation的能力是PhD与普通人的区别。

答辩的内容:

  1. 问题是什么
  2. 问题为什么重要
  3. 相关工作有哪些,他们是怎么解决的有什么优缺点
  4. 你的解决方案为什么比别人的强

常见答辩问题:

  1. 请用3句话概述你的贡献
  2. 你要解决的问题是什么
  3. 你的哪个贡献具有奠基性的价值
  4. 你的方案的主要缺陷是什么
  5. 如果你要重新做一遍你的phd研究,你会怎么做?

8 博士毕业后

教授典型的一天

7:00 吃饭,检查邮件
8:00 30分钟锻炼
8:30 在路上喝一杯咖啡,读更多的邮件,检查自己9点课程的PPT
9:00 本科课程开始,1个半小时
10:30 与学生讨论问题
11:00 参加会议,讨论研究生招生问题
12:00 吃饭,可能和学生讨论问题,这样可以节省时间
13:00 参加一个博士答辩
15:00 与博士开组会
16:30 参加一个本学院的研讨会,可以学到新东西
17:30 撰写项目申请
18:00 回家吃饭
20:30 撰写与其他人合作的论文
22:30 预定他参会的行程

发表评论

电子邮件地址不会被公开。 必填项已用*标注