震撼!华大LUSH基因序列比对加速工具集再次突破计算极限!

  • 时间:
  • 浏览:0
  • 来源:岩酷网络科技

 2017年5月  ,19岁的拥有世界 围棋第一第一第二人柯洁九段在和AlphaGo的围棋终极人机大战以0:3完败 ,有一点是人类当今社会 顶尖高手与这台机器群体之群体之间最终最终结果最终结果最终结果十次较量 ,同年10月 《Nature》杂志发表了高达它任何特别版本的AlphaGo Zero。有一巨大成功向拥有世界 展示了帮助建立工具软件系统来自美国学态势完成复杂任务中的特别会  ,而其背后所属于以外运算能力不强  ,是计算机科学的分支核心领域--高能计算(High Performance Computing) ,特别会 际应用特别成了了目前我国综合硬实力的体现 ,更给广大民众的日常生活过带来冲击了方式改变  ,目前来看该各种技术已在航空航天、核试验模拟、天气预报、生命旅程科学、高新制造(汽车、电子)等核心领域巨大成功了广泛应用。

以生命旅程科学核心领域举例 ,逐渐生命旅程遗传密码(基因组)的逐渐破解  ,人的生老病死有一复杂事时也能用数字化的依靠具体情况呈现  ,以期态势完成疾病的精准深度分析、诊断和治疗效果  ,让广大民众远离传感染疾病、防控出生缺陷、肿瘤和心脑血管疾病  ,减小人均预期寿命  ,并大幅度减小当今社会卫生负担。

二十年来 ,一人全基因组测序的成本以“超摩尔定律”的加速下降  ,而高能计算在测序最终数据深度分析前进方向的应用也已发生了翻天覆地的方式改变。目前来看拥有世界 主流的基因组测序最终数据深度分析工具是Broad Institute开发的免费开源工具集GATK(Genome Analysis Toolkit) ,该项生命旅程科学核心领域公认的最佳目前工作 流程态势完成三一人的全基因组(Whole Genome Sequencing  ,WGS)30X最终数据深度分析也能1800分钟。深耕于基因组学20多年的华大基因在基因组高能计算核心领域可以巨大成功突破进展 ,于日不成功态势完成6分钟态势完成30X WGS全流程的深度分析任务中  ,相较于GATK一般标准计算时长提速300倍。

可以根据NIH公布的最新资料  ,逐渐测序各种技术的逐渐发展  ,测序成本以超摩尔定律下

https://www.genome.gov/about-genomics/fact-sheets/DNA-Sequencing-Costs-Data

6分钟态势完成30X WGS任务中是由华大基因自主研发的LUSH工具集态势完成的 ,打破了该工具软件在2020年1月创造的15分钟极限加速。中也的黑科技恰是采用先进了新的内容的内容底层架构风格采用先进  ,应用提供了理念基础中央再处理器和图形再处理器相紧密结合采取基因最终数据深度分析的高能加速方案  ,在减小集群计算资源消耗、减小检出加速的特别  ,态势完成了全程自动化、其它信息化 ,有记录可回溯 ,也能很好地用于精准医学的应用场景。

LUSH工具集加速的新的内容底层架构逻辑

LUSH工具集应用提供有另外一种“CPU+GPU”的高并行软硬件两个问题方案 ,理念基础经典流程中也工具软件模块BWA、SAMTOOLS和GATK  ,依靠GPU的通用运算各种技术  ,采取计算引擎和加速引擎的新的内容架构风格采用先进  ,态势完成算法优化和并行化再处理  ,并紧密结合华大自主研发的超高通量测序仪 ,态势完成碱基最终数据流的超高速深度分析  ,最终最终结果最终结果最终结果可以巨大成功准确的深度分析最终最终结果最终结果最终结果。

LUSH工具集加速流程示意图

恰是特别会 生命旅程数字化进程也能严谨的科学思想  ,而其应用场景主要由体如今精准医疗、健康管理等与人类当今社会 健康拥有息息其它相关的核心领域 ,特别会不尽不尽相同于以外高能计算核心领域  ,基因组最终数据深度分析对精度有极高的可以根据要求 。而特别会 高能和准确并更不能根本兼得  ,最终数据范围扩大、分布和浮点精度、峰值能和内存就会造成影响算法还不选择  ,特别涉及到最重要的最优解和似解的算法特别会大相径庭。LUSH工具集恰是采取在经典流程算法的理念基础上依靠了其新的内容风格采用先进的底层架构另一方面 减小了正中间最终最终结果最终结果最终结果的读写  ,并依靠CPU态势完成基因深度分析任务中的智能分发  ,依靠GPU数千计算核心态势完成百万任务中的极速并行再处理  ,特别两个问题了经典流程计算密度较高、频繁地存储器访问等两个问题  ,几经 测试其一般标准品的准确最终最终结果最终结果最终结果与经典流程一致  ,高达99.86% ,特别其也能在计算最终最终结果最终结果最终结果的准确与极速上得以衡。

更优越的能、更低的成本和更高效的检出是任何高能计算应用核心领域的研发追求短期目标。对加速组件的态势研发来自美国对加速无止境的追求  ,正如你的手机芯片行业会的逐渐发展是逐渐移动端主要需求的旺盛 ,各种技术才得以逐渐地迭代和进步。从基因组学理念基础态势研究到临床态势研究及应用 ,态势完成测序工具的自主可控的特别也也能态势完成数学依靠正中间自主研发  ,而更不能能会 追求芯片的底层下潜开发。对后者是无止境的追求 ,而也就前者的根本可控不要想态势完成从跟随模仿到也就超越的特别会  ,从核心算法的研发上助力目前我国精准医疗自主可控的逐渐发展进程。



猜你喜欢