0%

NGS分析介绍一:前言

NGS分析介绍一:前言

写在前面

研究生毕业了,一直想把上学期间的研究工作做一个总结。一方面给自己,不再从事相关工作了,将来肯定会越来越遗忘;另一方面这些东西也能给师弟师妹和相关从事人员一些启发和经验帮助,起到一个入门作用。毕业已经两个月了,当时在学校的时候就有这样的想法,但当时忙于各种毕业论文的事情,此事就暂时搁浅了。现在总归是开始了,后续可能还会有变异检测数据分析系列。我希望能尽可能把我研究生所做的课题做一个完备的总结。

背景简介

上个世纪,DNA双螺旋结构的发现诞生了分子生物学,中心法则的发现解决了遗传信息的传递途径和流向问题,遗传密码的破译解决了遗传信息本身的物质含义,而DNA测序技术的发明使人类得以完备的了解自身的遗传秘密。

1977年,Sanger发明了双脱氧链终止法DNA测序技术。基于Sanger测序法,1990年开展了人类基因组计划(human genome project, HGP),包括中国在内的6个国家历时13年,揭开了人类全基因组约2.5万个基因的近30亿个碱基对的秘密。之后,人类基因组单体型图计划(HapMap计划),构建了人类DNA序列中多态位点的常见模式。

自2005年以来,Illumina公司的Solexa,罗氏公司的454和ABI公司的SOLiD等新一代测序技术(Next Generation Sequencing,NGS)相继诞生。相比之前的Sanger测序,基于大规模平行测序思想的第二代测序技术具有高通量和低成本的特点,因此又被称为高通量测序技术。随着高通量测序技术的出现,基因研究领域快速发展。2008年启动了国际千人基因组计划(1000 Genomes Project),对27个种群的约2500个样本进行测序和研究,旨在提供最详尽的人类遗传变异图谱,并且所有数据全部免费公开,为科研人员提供了极大的便利。

随着第二代测序技术的发展,其不足之处也日益凸显,读长较短为后续序列拼接及注释等工作带来困难。以PacBio公司的SMRT测序技术为代表的第三代单分子测序技术涌现出来,其特点就是采取单分子读取技术,读长较长,而且测序过程无需进行PCR扩增,这进一步降低了测序成本。目前还有以纳米孔测序技术为代表的第四代测序技术,该技术完全抛弃了复杂的生物或化学方面的处理,直接根据单个碱基穿过纳米孔通道时引起的电流变化进行测量,但该测序技术还处于实验室阶段,并未进行商业化。不过罗氏公司正逐步放弃第二代测序平台454的业务,转而研发第四代纳米孔测序技术。此外,Illumina和Lifetech等公司也在研发这项技术。通过该技术,将来有望能实现以几小时、数百美元的成本完成人类个体在全基因组范围内的测序。

基因组测序技术的快速发展,从根本上改变了人们研究生命科学的方式,同时也推动着基因组学以及其分支学科的发展,甚至促进其他与基因组密切相关学科的产生和创立。

——源自我的毕业论文

给实验室师弟师妹

因为你们可能是第一次接触生物信息学,第一次接触NGS分析,第一次接触基因组变异检测,会学好多东西。有一些生物方面的东西,但并不难学习。要对自己充满信心,保持一个良好的心态,保持一颗好学的心。

这里给师弟师妹一点忠告,那就是勤奋。勤奋不代表一切,但不可或缺,勤奋好学才能一直进步,相反懒惰带来一些恶劣的品质。你会感谢三年研究生涯的刻苦努力,而不是虚度三年浪费这大好时光。

课余

这个可能不是和我们课题完全对口,但了解一些周边的知识,有助于自己的学习。