人体中的大多数细胞都具有以数十亿个碱基为中心的完整DNA拷贝。此外,人体的每个细胞都可以轻松地从外部轻松访问嵌入在蛋白质中的DNA的必要部分,并激活基因,使其成为具有各种功能的细胞,例如器官,血液和皮肤。
英伟达(Nvidia)和哈佛大学(Harvard University)的研究人员开发了一种AtacWorks,这是一种AI工具包,可以使研究样本数据中DNA可访问的部分变得更加容易,这在早期检测遗传性疾病(例如癌症)中很常见,即使样本数据。
该工具在NVIDIA Tensor Core GPU上运行称为ATAC-seq(具有高通量测序的转座酶可及染色质测定)的筛选方法,并在32核CPU上运行,以寻找基因组中健康和患病细胞的开放区域。该系统在30分钟内完成了全基因组推断,大约需要15个小时。
此外,ATAC-seq通常需要分析成千上万个单元,但是如果将AttackWorks应用于ATAC-seq,则通过深度学习训练的AI仅用几十个单元就可以获得相同的质量分析结果。例如,研究小组通过仅分析50个构成红细胞和白细胞的干细胞样本,就能够鉴定出每个生产中所涉及的DNA的各个部分。
通过减少基因组分析的时间和成本,AttackWorks可以帮助识别导致特定疾病的细胞病变和生物标记。此外,如果即使只用少量细胞也能进行基因组分析,则将有可能进行诸如鉴定稀有类型细胞中DNA差异的研究,从而降低数据整合的成本,并有望带来新的可能性,例如缩短开发机构在新药开发以及诊断领域。相关信息可以在这里找到。