发现基因数据背后的“知识”

日期:2019-03-28 10:17    来源:北京日报

分享:
字号:        

  原标题:发现基因数据背后的“知识”

  

  

  郑洪坤

  高级工程师、北京百迈客生物科技有限公司董事长,曾获“北京市优秀中国特色社会主义事业建设者”“2015年度中关村高端领军人才”等称号。

  基因研究,是前沿科学,代表着高新技术发展方向,吸引大批科研人员攻坚。郑洪坤的团队正在做的研究,就是发现基因数据背后的“知识”,绘出了全世界第一张猕猴桃的基因组图,搭建中国第一个基因大数据云计算平台,让基因科技从偏重实验研究逐步向产品化发展,使传统行业能用上基因科技,让老百姓享受基因科技应用成果。

  独创的东西才能在市场站稳脚

  2001年大学一毕业,郑洪坤就去了国内最早从事基因测序的华大公司,一干就是8年。8年间,他从一名最基层的技术员做起,培养出了严谨的科学家思维和敏锐的市场化眼光,坐到了副总经理的位置。

  2007年,行业内出了一项新技术——高通量基因测序。这项技术的出现,一下就把基因测序的检测成本降低了很多。也就是在这一年,华大公司也面临转型,郑洪坤被派了新任务,从技术岗位转到了营销岗位。

  “我是一个想法很多的人,但当时在华大觉得自己的很多想法实现不了,施展不开拳脚,索性就辞职了。”2009年,刚刚29岁的郑洪坤拉上了5名同事,组成自己的团队,“想趁着自己还年轻,出去闯一闯。”

  6个人,有技术、有营销,是一个比较成熟的团队。之前在华大,郑洪坤已经在业内有了很好的口碑,所以公司刚起步的时候,就接到了不少项目,开头并不难。

  为了让公司能稳步发展,第一年,他们每个人每个月只领2000元的工资,基本上只够吃饱饭的。可郑洪坤并不觉得苦,他已经对创业做好了充分的准备。

  那些年,基因测序技术进入国内时间不长,市场正在蓬勃发展,许多人看到了其中的创新创业机会,郑洪坤前后,就有数名华大公司骨干离开公司去单独创业。想法多、热衷创新的郑洪坤告诉同伴:“我们得有自主独创的东西,才能在这个市场站稳脚跟。”

  简化基因组测序技术,就是郑洪坤带领团队自主研发的新技术。这项技术的核心在于如何准确筛选出基因组中那1%最具有代表性的基因。

  比如人类要找到控制身高的基因,如果只找一个高个子的,再找一个矮个子的,这样对比他们的基因是看不出问题的,必须得找一堆高个子和一堆矮个子的基因来对比,也就是群体基因开发。

  但一个人的基因本身就很多,如果每项都要检测,成本太高了,根本测不起,所以就得从每个人身上选取1%最具有代表性的基因来检测,从而确定到底是哪项基因决定了身高。郑洪坤团队新研发的这项技术,就能精准地挑选出这1%最具代表性的基因进行检测,从而实现成本大幅度的降低。

  第一年就有了自主创新的技术,直到现在,这项技术都是他们的核心竞争力。

  绘出全世界第一张猕猴桃基因组图

  郑洪坤给自己的公司取名为“百迈客”,是从单词BIOMARKER音译过来的。BIOMARKER是生物技术领域的专有名词,是一种生物标志物名称,“我们公司的工作就是围绕BIOMARKER。”

  对郑洪坤来说,BIOMARKER还有一个特殊的含义,bio有生物技术的意思,marker可以翻译成标志物,“我就想把公司做成行业里的标杆!”

  但在当时,国内的生物产业还远远落后于国际水平。中国科学家要想迎头赶上,困难重重。

  2011年,一个合作伙伴找来,想做猕猴桃的基因组项目,绘制猕猴桃全基因组图谱。

  猕猴桃本来就是中国产的,由新西兰引种改良成了奇异果,拿到全世界去卖。猕猴桃又被称为“水果之王”,维生素C的含量非常高,绘制基因图谱,可以找到决定维生素C含量的基因。

  “对我们来说,猕猴桃变奇异果就是基因资源流失的例子,应该从基因组的范畴扳回一城。”郑洪坤有个大胆的想法:让全世界第一张猕猴桃的基因组图,从中国的科学家团队手里做出来!

  项目第一时间启动。郑洪坤配备了一个四人的实力团队,另外把专门做基因组组装的合伙人和技术骨干,全都放进了猕猴桃项目组。

  有一个已知的对手摆在那——新西兰一家基因测序机构,早在2008年就有上百人的科研团队开始研究猕猴桃基因组,但一直没有成功,主要是碰到了一些技术难题,卡壳了。

  一定要抢在前面!郑洪坤还是有信心的,他觉得自己的公司在技术上是有优势的。猕猴桃项目的最大难点在于,它是木本植物,杂合度很高,父本和母本的基因差别很大,而怎么准确把基因连接起来,匹配成功,则是最大的难点,这也是整个行业公认的难题。新西兰的科学家团队也是卡在了这个难题上。

  整个团队没日没夜,分析每一个基因片段,和时间赛跑。郑洪坤也把大量的时间和精力投入到猕猴桃基因组项目中。2013年,全球第一张猕猴桃全基因组图谱面世!仅用了不到两年的时间!

  项目组写好了论文,投到学术界享有盛誉的英国《NATURE》(《自然》)系列杂志。但没想到,论文发过去了半年,竟没有一丝回音。

  团队成员都很着急,去问杂志社,因为正常情况下,两个月就能出结果。杂志社编辑答复:按照规定,每篇论文都要经过行业内的三名专家审核,而其中一名审稿人迟迟没有给杂志社反馈,杂志社也很无奈,最终决定更换审稿人。

  郑洪坤告诉记者,他后来才知道,这位迟迟没有给出反馈的审稿人,就是新西兰猕猴桃基因组研发团队的科学家!

  “当时真是被吓得一激灵!我们的研究成果竟然在对手手里,那种心情真是没法说,心里悬着一颗石头。”幸好,好事多磨,就在杂志社更换了审稿人后,反馈随之而来:猕猴桃基因组的研究论文将在《Nature Communications》系列杂志上发表!

  猕猴桃基因组文章在《Nature Communications》杂志上成功发表,大大鼓舞了团队的信心。

  2016年,郑洪坤公司的白菜和芥菜这两个基因组项目也取得了实质性进展,绘制出了基因组图,对农业育种有很大的指导意义。同时,这两项研究在2016年10月的《NATURE GENETICS》(《自然遗传》)杂志上发表论文,还成了当期的封面。

  “满满的自豪,要知道《自然遗传》可以说是这个领域最顶级的杂志,搞生命科学的人,恨不得一辈子的追求就是在这本杂志上发表论文。”郑洪坤的团队一下走到了“世界顶级”,但他们的研发道路并没有停止。从这以后,公司每年都能在《自然遗传》杂志上发表好几篇论文。

  突破基因测序的“天花板”

  科技,迭代的速度在不断加快;作为科技工作者,要不断地创新以适应。在基因测序行业,有一条规则是:竞争并不在于谁走得快,而在于谁走得远。

  基因测序服务公司已有不少。最初公司会更强调做一些和别人不一样的产品,但是随着行业发展成熟,可用的技术就摆在眼前,所有人都能接触到,想从战略上做创新比较难。

  郑洪坤不得不面对这一行业的“天花板”,需要“持续创新”。

  “80后”的郑洪坤,与同龄人有过一个相似的爱好:酷爱计算机。上大学时,生命科学其实并不是郑洪坤的第一志愿,他一心想学计算机,但无奈被调剂了志愿。可郑洪坤并没有因此放弃他的爱好,他在大学里就自学计算机,学编程、搞数据库。毕业那年,他连读研究生所需的200元体检费都拿不出,当时手里就剩七八十元了,索性花了60元,报名全国计算机等级考试。这下,郑洪坤顺利考了个四级证书,相当于在大学里多修了一个专业。

  正是这一爱好,为郑洪坤打开了创新的另一扇窗。

  郑洪坤越做越发现,市场对基因大数据的管理分析需求很大,但各家提供的,基本上都只是数据,没有人去做整合,更没有对数据进行分析解读。这样一来,数据也就只是数据而已,没法探究到数据背后的价值。

  “其实基因行业与互联网有很多相似的地方。互联网是一个技术,可以应用到很多领域,基因也是如此,它可以应用到很多行业中,例如基因+科研、基因+大数据、基因+医疗等。我希望基因科技从偏实验室、偏研究的领域逐步往与生活关系更密切的产品化方向发展,使传统行业都能用上基因科技,让老百姓真正感受到它发挥的作用。”郑洪坤用“基因+”来形容基因组学造福人类的前景,他深知在庞大的基因数据库里其实潜藏着亟待深入挖掘的“富矿”。

  爱琢磨的郑洪坤有了“跨界”的想法:基于大数据,把基因数据管理和解读整合起来,做成一种服务推向市场。“很想看看基因和大数据碰撞在一起,能撞出怎样的火花。”

  起初,公司的投资人并不同意这个项目,认为回钱太慢,看不见利润。但郑洪坤很坚持自己的想法,“基因是个很有用的东西,要把基因从研究领域转到应用领域上去,这样人类才能受益。我非常看好这个前景!”

  投入了一百多人的研发团队,历时三年,郑洪坤公司研发的中国第一个基因大数据云计算平台2014年正式上线。这是一个共享平台,涉及大数据存储、云计算、生物信息、软件开发等多个交叉学科,研发难度可想而知。郑洪坤还记得刚开始做的时候,自己把云计算、大数据、生命科学等各个领域的精英集中在一起,“但他们互相都听不懂对方在说什么,很难把各自的想法融合在一起。”中途好些人退出,又不断地有新人进来,在反复的磨合和头脑风暴后,才有了这个云计算平台的诞生。

  这是一个大数据提炼为“知识”的平台。所谓“知识”,就是指基因片断的作用,如某种基因会导致某种基因疾病等。在云平台里,不仅科研人员能够进行基因数据分析存储,从事生物信息技术的研发人员,也可以把自己开发的应用软件上传到云端共享,而随着用户数据的不断积累,云计算平台也具有了自我迭代的能力。

  目前,云计算平台为医学健康、农业育种等领域的两万余用户,提供了基因数据存储、分析、共享等业务。平台集成了8个基因大数据库,100多款分析软件以及大量文献和云课堂。

  郑洪坤说,云计算平台现在还只是给科学家和医生用户开放使用,等他们都用顺畅了,再开放给普通用户使用,那就意味着进入个人基因组时代,“到了那个时候,每个人测完自己的基因,就会有很多针对个人的精准选择,像国家推的精准医疗,不同的人治疗方案不一样,就是根据基因的特点,来决定用药,说到底最根本的不同就是基因的不同。”

  如今,郑洪坤的团队已由当年的“六壮士”发展成为400余人的大团队,吸纳了一批国内外知名大学的高精尖人才,每年还吸引50名应届毕业生加入。公司年产值过亿元。郑洪坤大数据时代的基因梦已经扬帆起航,“未来,我们期待通过云平台,发现更多的基因数据背后的‘知识’,让基因技术更好地造福人类。”

  新闻背景

  基因测序的价值

  基因是指控制生物性状的遗传信息,通常由DNA序列来承载。基因也可视作基本遗传单位,亦即一段具有功能性的DNA或RNA序列。也就是说并不是所有序列都叫基因,基因片段只占DNA序列总长的不到3%。

  基因相当于神奇的密码,控制着生物的特性。破解这些密码,得先测定每种生物的DNA序列。

  基因测序,将对我们的生活带来重大改变。基因测序技术应用范围较广,主要分为科研服务、医疗应用服务以及非医疗基因检测服务。其中,医疗应用服务是目前应用基因测序技术中活跃度较高且发展潜力较大的部分,涉及无创产前筛查、遗传病诊断、植入前胚胎遗传学诊断、肿瘤诊断等诸多领域。

  我国的基因测序技术已发展至第三代,第三代测序技术是指单分子测序技术,对每一条DNA分子进行单独测序,很好地规避了二代测序的软肋。(骆倩雯)

您访问的链接即将离开“首都之窗”门户网站 是否继续?