关键词不能为空

位置:白城汽车新闻网 > 汽车资讯 > 谷歌大脑发布DeepVariant,用深度学习实现精准基因测序-variant

谷歌大脑发布DeepVariant,用深度学习实现精准基因测序-variant

作者:白城汽车新闻网
日期:2020-08-23 22:04:41
阅读:

在许多科学领域,特别是基因组学领域里,重大突破常常归功于新技术的应用。例如诞生于1977年的桑格测序法(Sanger sequencing),是世界上第一个测定人类DNA序列的方法;后来的微阵列芯片技术(microarray technologies)能够进行大规模全基因组实验。新的设备和工具能让我们深入了解基因组,并将其广泛应用于医疗、农业和生态环境。

基因组学中最具变革性的新技术之一是高通量测序(HTS),于21世纪初开始投入商业使用。利用HTS,科学家和临床医生能够以较低成本快速、大量地生成测序数据。

人类体内23对染色体可是由30亿个碱基对组成的,而HTS输出的并不是被分析者完整的基因组序列,而是大约10亿个短序列,称为reads。每个read仅代表100个碱基对,每个碱基对的错误率在0.1%~10%之间。

于是,将HTS的输出结果转化成单一、精确、完整的基因组序列是目前面临的严峻的挑战,尤其是在生物医学领域,这一问题促成了许多组织的努力。例如瓶中基因联盟(GIAB)能够产生高度可信的基因组,可用于验证并作为基准测试。以及精准FDA社区挑战赛,旨在促进创新,提高基于HTS的基因组测试的质量和准确性。

谷歌大脑发布DeepVariant,用深度学习实现精准基因测序

将测序结果与基准基因序列进行比对,会发现与基准不同的碱基。它可能表示一个碱基变体,也有可能是一个错误

近日,谷歌大脑宣布了一种名为DeepVariant的深度学习技术,它可以从HTS序列数据中重建真正的基因组序列,比以往的方法更准确。这项成果是谷歌大脑团队与Verily Life Sciences共同合作两年多的产物,将基因组中的碎片重构问题转化成谷歌擅长的图像分类问题。

谷歌大脑发布DeepVariant,用深度学习实现精准基因测序

测序片段与基准序列的对比结果。A:一对染色体上的单核苷酸多态性;B:一条染色体上的碱基缺失;C:两条染色体上碱基缺失;D:错误引起的碱基变异

研究人员首先用GIAB的参考基因组作为样本,利用这些基因组多处重复的地方,将HTS输出的数据编码成多通道的训练样本,然后在TensorFlow上训练图像分类模型,从实验数据中识别真正的基因组序列。尽管DeepVariant不具备基因组或HTS相关知识,但不到一年的时间,它就赢得了PrecisionFDA Truth Challenge中的最高SNP性能奖(Highest SNP Performance)。到目前为止,它的错误率比之前下降了50%。

谷歌大脑发布DeepVariant,用深度学习实现精准基因测序

谷歌大脑现已发布开源版DeepVariant,希望能让这项技术惠及更多地区。另外,他们还与谷歌云平台(GCP)合作发布了工作流。谷歌大脑的研究人员表示,DeepVariant是第一个将谷歌的计算基础架构和机器学习应用到基因组中的工具,也是将谷歌技术应用于医疗保健和其他科学中的一部分。

白城汽车新闻网一直为网友的需求而努力相关推荐