昆都伦门户网

首页 > 正文

基因测序企业“解码”生命,华为云为他们带来解码“秘钥”

www.tenimizer.com2020-01-30

“当我们的流量呈指数级增长时,很难想象计算能力和存储资源会受到什么样的限制。”

北京希望集团生物技术有限公司(以下简称希望集团)首席信息官朱颖一年多前在谈到业务发展中的信息技术瓶颈时,引用了一个形象例子:目前,我们每天可以生成100TB满载流量的数据。假设脱机计算机房现在有一个PB存储容量,它将在10天后满。这100TB的存储资源在早期可能已经花费了我100多万元,但这只是硬件投资,不包括功耗和人工维护成本。如果没有足够的资源怎么办?另外一百万美元将被花掉,一大笔钱将被花在系统建设上?

作为世界上最大的第三代基因测序公司之一,希望集团从2017年到2018年完成了完整的第三代测序技术平台,并正式开始向世界各地的用户提供PromethION人类基因组测序服务。简而言之,与第二代测序技术相比,第三代测序技术的应用就像用高速铁路代替燃料车一样。

“速度”很快,测序能力已经大大提高。然而,在流量激增的同时,希望集团也遇到了最大的“瓶颈”。除了朱颖之前提到的存储资源问题之外,该公司还在计算能力、信息技术运营和维护、成本控制以及人力部署等诸多方面遇到了挑战。

尚云:迎接行业挑战

基于第三代基因测序技术,虽然大量基因片段可以同时快速测序,但数据存储也呈现指数级增长。“如果要分析和计算这些数据文件,每天大约需要10万个核小时来完成计算。这超出了最初机房的想象。”

朱颖说希望小组的科学家和工程师主要从事基因研究,所以他们不会在信息技术上花费太多的精力和资源。“我们必须将研究人员从复杂的信息技术基础设施中解放出来,让每个人都把更多精力投入到他们应该参与的基因组学研究中。”

”事实上,这要求我们不仅要有足够的资源,还要在计算能力和存储方面有很强的可扩展性。我们可以随时不断扩展这种能力,并可以根据需求接受和释放这种能力。”朱颖坚定地说:“我们已经决定全力以赴!”

可以说,希望集团一两年前遇到的这些困难也是整个基因测序行业面临的共同挑战。

自20世纪90年代“人类基因组计划”启动以来,已经对30亿个碱基和数万个基因序列进行了测序。基因测序,一种“读取”人类生命代码的技术,已经从第一代、第二代逐渐进入第三代。

同时,随着基因测序技术的成熟,个人基因测序行业迅速进入繁荣时期,越来越多关注健康和生活质量的人开始对基因测序提出更高的要求。然而,与第二代相比,第三代基因的测序数据量也增加了100倍。第三代基因技术在提供更科学、更准确的测序结果的同时,也遇到了计算能力和存储容量方面的信息技术资源瓶颈。解决效率低下、投资巨大、成本增加的问题迫在眉睫。

与基因测序公司的挑战相对应,公众在享受基因测序服务时面临的痛点:需要很长时间来测试。昂贵的专业测试,不透明的市场价格,甚至混乱;缺乏对测试结果的权威分析和解释.

解密:以获得降低成本和提高效率的创新秘密

有一点是肯定的:基因测序行业将解决自己的棘手问题以及公众需求问题。

从理解的角度来看,“云计算”是整个基因测试行业面临挑战的首选途径。借助云计算、大数据、人工智能算法等科技手段,解决了该行业常见的痛点,最终在“降低成本、提高效率、创新”三个关键词上取得突破。

“事实上,我们两年前就开始考虑云的问题。船方不负担装货费用

朱颖坦言,华为云并不是第一家在云计算领域起步的企业,但正是这三个方面的结合让希望集团决定与华为云一起成长,并在双方即将在各自领域腾飞的阶段,共同实现云计算和基因产业的更多创新举措,给这两个领域的整合和发展带来了一些变化。

朱颖在谈到“理念契合”时强调,最初的希望集团已经选择使用云容器技术方案来实现其对计算资源的多重需求,华为云只是将精确基因组分析的容器解决方案作为其业务重点。

华为云近年来不断加大研发投资,先后推出云容器实例(CCI)服务、现场可编程门阵列加速云解决方案和基因容器服务(GCS)等创新技术。其中,希望集团青睐的基因容器技术已经成为基因产业的首选。华为云基因容器的特点是提供了大量计算资源,大大提高了基因数据分析的效率,30倍全基因组测序(WGS)测序速度可提高近10倍。

同时,针对基因行业常见的瓶颈,如工具碎片化、开发语言多样化、系统维护困难等,华为云的基因容器解决方案也注重“快速、经济、简便、快捷”四个字。

“快速”是指快速排序:支持100,000个容器大小,可以在超高并发性下运行排序分析过程,可以大大缩短排序时间,而面对大规模并发性,得益于高性能容器批处理计算平台火山的高效任务调度能力,可以避免任务死锁,减少等待时间,进一步提高排序分析效率。

“节省”来自经济高效的:计算能力资源,这些资源按需求和每秒收费。根据业务需求灵活匹配CPU/内存,避免浪费,提高性价比。

“简单”是指不运行和维护基于无服务器架构的:容器服务,自动扩展和收缩集群资源,并根据预设规则自动触发和执行分析过程。

“洁”是一个一站式:它将基因测序分析和数据挖掘功能统一到一套流程中,以避免多个系统操作带来的不便。

希望集团和华为云联合打造的精确基因组分析容器解决方案即将发布。该方案以华为云基因容器为基础平台,结合了希望集团多年来在基因行业的业务积累,更贴近基因测序行业客户的需求,从而实现更快、更容易操作和维护、更高性价比的结果。该方案将希望组的原始单流持续时间从22小时减少到17小时,并节省了30%的测序成本。

陪伴:与行业用户一起成长

华为云负责基因测序行业的解决方案总监严斌告诉《理解笔记》,“通过对客户的深入了解,我们可以更好地满足用户的需求,并为他们提供底层的信息技术能力。同时,我们也希望希望集团(Hope Group)等企业能够结合自己的业务提出更多的要求,这样我们的研发团队能够提供更强的支持,陪用户一起发展壮大。”

除了与客户一起成长,华为云还希望通过合作为基因产业的生态环境做出贡献。“为了更好地服务于基因测序行业,我们与希望集团建立了一个联合实验室。其初衷和目的是满足基因产业客户的需求,首先是快速响应和快速闭环,并帮助该产业营造更好的生态氛围。”严斌说。

如今,通过与华为云(Huawei Cloud)的合作,希望集团的200多名研究人员能够专注于他们的核心工作,同时在整合创新的基因领域进行了更多的学术和技术创新,包括在权威学术期刊上发表许多论文,并联合发布基因行业的通用计算标准。

与此同时,国内基因产业15大公司中有13家采用了华为云服务。

此外,金橡医学和华为云联合构建的癌症精密医学基因大数据分析平台、图灵生物和华为云联合开发的生物医学数据分析处理平台基因组堆栈生物医学云平台,以及冯轲计算和华为云联合推出的基于FPGA的基因加速云解决方案,都成为国内基因科学行业云转型的成功案例。

数据显示,2016年参与消费者基因测试并拥有自己数据的个人用户总数约为10万,2017年约为30万。目前,中国个人基因检测服务的人口普及率为0.03%,这一数字在未来五年将达到3.5%。

这些数字意味着到2022年,中国将有5000万人拥有自己的基因组数据。面对市场需求的快速爆发,国内基因测序必将加快整个行业的云转化步伐,以应对行业转型的机遇和挑战。

结论

随着基因科学的全面发展和数据中心的全面云化,基因测序行业“云化”是大势所趋。在基因测序领域,以数据分析和云计算为主导的信息技术已经成为推动行业创新和变革的重要因素。华为云凭借其强大的资源、完整先进的产品组合和强大的服务能力,为更多的基因测序和生物技术企业提供差异化和专业化的服务,这也是华为云能够与业内85%以上的前15强企业合作的主要原因。

基因测序公司的目标是降低成本、提高效率和创新,而公众对基因测序的需求更实惠、检测速度更快、对生活质量的追求更高。在这两个方面,我相信华为云可以做得更多。

9月18日,希望集团和华为云将在华为互联2019网站发布基于容器的精确基因组分析解决方案。请密切注意。

热门浏览
热门排行榜
热门标签
日期归档