华农生物信息发展及拙见

2024-07-02 37浏览

昨天,百检网博主黄健老师的博文《不靠谱的中国生物信息学专业大学竞争力排行榜》引来不少关注,其中很多人对排名**的华中农业大学不屑一顾,一方面怀疑其能力,另一方面又有点看暴发户的心里。华农是本人的母校,硕士在狮子山下学的是数量遗传学,现在也算得上是在做生物信息的工作,看到大家对母校如此的不理解当然很不高兴了,已经很久没有写过博客了,今天非常冲动要在此间建立一点沟通。

我写这篇博文,并不是想和大家争辩到底谁排**,因为这种争辩对我来讲毫无意义。我今天只想讲一讲我所了解的华农生物信息学科的情况和我个人对于生物信息学的理解。我觉得华农对于生物信息学科的培育和建设是非常成功同时也很值得同行借鉴。

冰冻三尺,非一人之寒

做研究想一夜成名,特别是这种整个学科的崛起,没有坚实的基础和长期的积累是**不可能的,正所谓冰冻三尺非一日之寒也。

这就要从生物信息的历史说起。生物信息这个学科是*近几年才出现的,一个新学科可定不可能横空出世,之前肯定有很多人在做相似的工作。做相似工作的很大一部分人就在从事本人在华农学习的专业——数量遗传学——主要的工作就是通过表型和分子标记对动物和植物进行遗传改良和育种——是*开始将统计学、分子生物学和遗传学相结合的学科,也是分子生物学和遗传学*早的应用之一,还有一大波人在做生物统计、结构生物学等。我们不妨称这一阶段为,生物信息的潜伏期。该阶段持续了非常长的时间,主要原因是研究素材的匮乏,前期主要是表型标记,后阶段融入分子生物学所用到的标记通量也都是非常低的。

后来随着基因芯片、测序和其他组学技术的兴起,分子标记的通量大大增加,统计学、分子生物学和遗传学不得不把另一个兄弟——计算机科学拉进来处理这庞大而无序的生物学数据,渐渐地发展起来了计算生物学和生物信息学。开始了生物信息学全面应用到生命科学各个领域的爆发期。由此兴起的概念也一个个更加高大上,从混合线性模型的关联分析升级到全基因组关联分析(GWAS)、全外显子测序(WEX)、全基因组测序(WGS)、转录组、蛋白质组、代谢组、系统生物学等。大部分人也是这一阶段,了解到这些概念之后才开始接触生物信息学的。

华中农业大学的动物、植物育种专业都是其传统优势学科,且都是全国重点学科,该领域为数不多的院士华农也占据多个席位。这里有被称为中国转基因天堂的作物遗传育种与改良国家重点实验室和大名鼎鼎的张启发教授,目前数量遗传学的另一颗冉冉升起的新星——严建兵教授也出自华农并任教华农——30出头正在以每年至少一篇NG和多篇10分以上的文章建立起自己的学术地位。

星星之火可以燎原

有意思的是从事我前面提到的这些工作的人,从来都不说自己是做生物信息的。主要也是因为生物信息太杂,迅速兴起后覆盖到生命科学的每个角落,大家也都蜂拥而上,可谓趋之若鹜。但是,杂乱之下往往容易迷失,无根之树难以常青。

然而总有冷静的坚守者,能够经历住大浪淘沙的考验。在这一波热潮中华农并没有大肆铺开摊子,只在生命科学院开设了一个很小的生物信息专业,招收的本科学生也并不多。另一方面,全校的动、植物和微生物的各个应用领域的教授们都不约而同的开始加强本领域的数据分析水平和应用。华农将更多的重点放在了研究生的培养上。

这样坚持了很多年,直到2014年我从华农毕业也只有生命科学院有生物信息专业,其他学院的都是去生科院学习,然后应用到本专业的数据分析中,而不改变原来的专业名称——即使是超强的数量遗传学专业。这种做法,形成的一种现象就是很多年前开始华农的相对较大的研究团队就已经配备了本专业内相对专业的数据分析力量,并且这种力量能够不断延续,水平持续提高。直至去年生物信息学才从生命科学院独立出来成立了“信息学院”,听说还整合了其他院系传统优势数据分析力量,华农信息学院的网站(http://coi.hzau.edu.cn/index.php?m=Index&s=navigate&cid=41)上的固定职位来看看不出来,但是听我以前的课题组讲,我们组一位师兄可能会进入新建立的“信息学院”。但从另外一方面来看,张启发老师实验室的数量遗传团队和严建兵老师都没有加入新建的“信息学院”。

我不好说华农这么晚才大力发展生物信息这个学科是好还是坏,相信大家也各有看法,特别是院里的老师们。但是我非常欣赏的是华农的这种务实的态度,注重每个点,让其应用领域的分析水平切实提高起来,星星之火渐成燎原之势,再乘势崛起。而不是早早把资源整合起来,比比谁人多,团队大,炒一把概念,后面就不知道干嘛了。

实践出真知

纵观华农生物信息的发展,我个人觉得这种发展模式也是符合生物信息本身的性质:

一、生物信息直到目前为止还是一门服务性学科,其主要表现在:1.生物信息本身没有重大的理论建立,其理所有论基础都是依附于生物学的已有理论,因此生物信息学目前阶段*大的应用就是作为工具帮助生物科学家验证基于生物学建立起来的假说。2.已有的生物学理论都是用生物学的方法建立起来的,目前还没有依靠生物信息学建立起来的重大基础理论——这也生物信息学本身是否能够独立出来的一个重要标志。

因此,服务性学科就应该从各个学科的服务开始做起。*好不要一帮做生物的拉一帮做计算机的说我们合作吧——搞交叉学科生物信息,我有理论基础你懂数据分析互相补充,然后一拍即合相互称自己是搞生物信息的,感觉自己是相互平等的,却从来不去思考具体的问题与应用。

二、生物信息*好的应用方向在医学和动植物育种。现在公共数据容易获取,而做数据分析实现起来又容易(相比做实验)——这样发文章快!因此很多人想通过此捷径,在别人的基础上改改算法,换换方法来发表自己的论文。但这样的文章价值并不高,热头一过,你又得跟进新的热点,而且因为数据越来越开放,做的人也越来越多,这种跟风会一次比一次难。我倒是觉得还不如把自己的已有知识和基础跟某个具体的应用结合起来,在一个新的应用上一点点学习,开发新的东西,*终完成整个工作——这种工作虽然难,且慢但是来得有价值。

这就需要我们做生物信息的人,勇于承认自己的工具性(服务性)——现在的人都不愿意自己被别人当成工具使用,特别是知识分子,读了这么多书个个心高气傲,相互不服气,至少也要弄个相互平等。

敢于把自己的知识应用到某个领域,当然走出这一步其他的路也就错过了——生物信息学者的另外一个毛病就是,总是希望自己什么都能做,总希望跟多个领域的人同时合作,这样就可以面面俱到,显得自己很有能力,很重要。实际上很简单,什么都行就是什么都不行,有你无你都不重要。我个人一直觉得,生物信息做出重大进展的突破口就在医学和动植物育种两个方面,这里的问题都是具体的,要么成功要么失败,很简单。

三、生物信息学*重要的不在于发表文章而在于解决问题:你的工作解决了什么科学问题或者你开发的工具帮助别人解决某个问题,更甚者你在应聘的时候描述一下你曾经做过某个没有成功的具体问题都比你换个方法、算法发了个文章强。

以上都是个人的理解,离开华农也好几年了,许多人事都发生了变化,但我自己能感觉得到,不论走到哪里,那些年在华农的沉淀会一直影响着我。不妥之处,欢迎批评指正。