这一深度学习工具包使得医学、生物学、科学领
英伟达(NVIDIA)和哈佛大学(Harvard)的科学家联合开发了一种深度学习工具包,能够显著减少进行罕见单细胞实验所需的时间和成本,在基因研究方面取得了巨大突破。名为AtacWorks的新的深度学习工具包,可以对整个基因组进行推理,这一过程通常原来需要两天多一点,而现在只需半小时。这种新的工具包也能够让医生研究疾病和基因组变异是如何影响人体非常特定类型的细胞的。
AtacWorks与ATAC-seq协同工作,后者是一种流行方法,用于寻找细胞中可访问的人类基因组部分,旨在发现健康和病变细胞基因组中的开放区域。二者的协同工作,可以帮助科学家判定某个人是否会患上阿尔茨海默症、心脏病或癌症等。
原来ATAC-seq通常需要对成千上万个细胞进行分析,但AtacWorks只用几十个细胞就能得到同样的结果。研究人员还将AtacWorks应用于生成红细胞和白细胞的干细胞数据集,这两种类型通常无法用传统方法进行研究。但是有了AtacWorks,他们能够分别识别出与白细胞和红细胞相关的DNA的不同部分。AtacWorks是一个基于PyTorch的卷积神经网络,它是在匹配ATAC-seq数据集的标记对上训练的。该模型会预测准确、高质量的数据集版本,并识别信号中的峰值。
该模型在Nvidia量核GPU上运行,在30分钟内对整个基因组进行推断,而在一个32个CPU内核的系统上运行则通常需要15个小时。更快、更便宜地分析基因组的能力,将对识别可能导致某些疾病的特定突变或生物标记物大有帮助。它甚至可以帮助研究人员弄清楚这种疾病是如何发生的,从而帮助药物研发。
“对于非常罕见的细胞类型,用现有的方法来研究它们DNA的差异是不可能的,”英伟达研究人员和论文的主要作者Avantika Lal说。“AtacWorks不仅可以帮助降低收集染色质可获得性数据的成本,还可以为药物发现和诊断开辟新的可能性。”
声明:本文版权归原作者所有,转载请注明出处,请勿转载至外网或用于商业用途。