首页 / 行业
NVIDIA Clara Parabricks助力基因组学和药物研究
2022-02-17 11:07:00
世界上最大的遗传学研究鉴定数据库使科学家能够访问NVIDIA Clara Parabricks,以加速推进基因组学和药物研发领域的发展。
英国生物样本库(UK Biobank)通过让其庞大的数据集和 NVIDIA GPU 加速分析工具在云上可用,使科学家能够访问更多高质量基因组数据和分析。
英国生物样本库是一个大规模的生物医学数据库和研究资源平台,拥有来自英国各地超过50万名参与者的去标识化基因数据集以及医学成像和病例数据,使用者涵盖全球范围内25,000多名注册研究员。
再生元遗传学研究中心(Regeneron Genetics Center)是生物技术领军企业 Regeneron 的高通量测序中心。该中心最近与英国生物样本库合作,对所有生物库参与者的外显子组(基因组蛋白质编码部)进行了测序和分析。
Regeneron 的团队在外显子组测序流程中采用了 NVIDIA Clara Parabricks,这是一款对下一代测序数据进行二级基因组分析的软件套件。
英国生物样本库已经发布了45万个此类外显子组,以供获批的研究人员使用,如今还通过其基于云的研究分析平台,为科学家提供六个月免费使用 Clara Parabricks 的机会。此研究分析平台是由生物信息学平台 DNAnexus 开发的,让科学家能够在 AWS云中使用运行于 NVIDIA GPU 之上的 Clara Parabricks 。
英国生物样本库副首席执行官 Mark Effingham 博士表示:“正如 Regeneron 所展示的那样,使用 Clara Parabricks 的 GPU加速,可实现大规模处理基因组数据集时所需的吞吐量、速度和再现性。英国有许多研究团队都非常希望能够在我们的平台上使用这些加速功能,以获取广泛的数据集。"
Regeneron的外显子组研究借助Clara Parabricks加速
Regeneron 的研究员使用 NVIDIA Clara Parabricks 的 DeepVariant Germline Pipeline ,借助专门针对该遗传中心工作流程的模型来运行分析。
研究人员确定了1200万个编码变体和数百个与健康相关的基因,某些基因与肝病和眼病的风险增加有关,而其他基因则与糖尿病和哮喘的风险降低有关。
研究人员用于高质量变异体检测的独特工具集可通过研究分析平台(Research Analysis Platform)提供给英国生物样本库的注册用户,进而使科学家能够通过运行用于生成初始参考数据集的生物信息学管道,将自己的外显子组数据与来自英国生物样本库的测序外显子组数据相协调。
基于云的平台可提高访问的公平性
研究人员在破译人类以及感染人类的病毒和细菌的基因密码时,往往会受制于自身可用的计算资源。
英国生物样本库正在通过向全球科学家开放其数据集,实现访问的民主化,重点是进一步扩大处于职业生涯早期以及中低收入国家的研究人员使用的范围。研究人员无需下载这一巨大的数据集,通过网络浏览器进入英国生物样本库的云平台,就能在自己的计算资源上使用。
Effingham 说道:“有研究员和临床医生与我们联系,他们希望访问英国生物样本库的数据,但却苦于连处理小规模数据所需的基本计算能力都不具备。而基于云的平台则能够提供访问大规模外显子组测序和全基因组测序分析所需的世界级技术。”
Effingham 表示,使用该平台的研究员只需支付自身分析的计算成本、以及存储生物样本库PB级数据集生成的新数据的费用。
在 DNAnexus 平台上使用 Clara Parabricks 有助于减少这种基因组分析的时间和成本,在5分钟内就能完成在32-vCPU机器上需要花费一小时计算的全外显子组分析,同时也能降低大约40%的成本。
外显子组测序为精准医疗提供洞察
对于研究遗传学和疾病之间联系的研究员,外显子组测序是一个重要的工具,而英国生物样本库的数据集就包含近50万参与者的外显子组。
外显子组约占人类基因组的1.5%,由所有已知的基因及其调控因子组成。通过研究大量人群的外显子组遗传变异,科学家可以更好地了解人群结构划分,帮助研究员解决进化问题并探究基因组的工作原理。
利用像英国生物样本库这样的大规模数据集,还能确定与遗传疾病相关的特定基因变异,包括心血管疾病、神经退行性疾病和某些癌症。
Effingham 表示,外显子组测序甚至还能揭示潜在的遗传驱动因素,这些因素可能会增加或减少个人因COVID-19感染而患严重疾病的风险。随着疫情的持续,英国生物样本库正在向其数据库中添加COVID病例的数据、疫苗接种状态、医学成像数据、以及数千名参与患者的愈后情况。
原文标题:英国生物样本库利用 NVIDIA Clara Parabricks 推进基因组学研究
文章出处:【微信公众号:NVIDIA英伟达企业解决方案】欢迎添加关注!文章转载请注明出处。
审核编辑:汤梓红
最新内容
手机 |
相关内容
写flash芯片时为什么需要先擦除?
写flash芯片时为什么需要先擦除?,擦除,芯片,充电,初始状态,存储单元,数据,Flash芯片是一种非易失性存储器技术,用于存储数据并实现固半导体主控技术:驱动自动驾驶革命的
半导体主控技术:驱动自动驾驶革命的引擎,自动驾驶,交通,自动驾驶系统,数据,车辆,自动,随着科技的不断进步,自动驾驶技术已经成为现实苹果即将推出Mac系列新品,或搭载3nm
苹果即将推出Mac系列新品,或搭载3nm M3芯片,芯片,搭载,推出,全新,市场,研发,近日,有关苹果即将推出新一代Mac系列产品的消息引起了广人形机器人风起,连接器待势乘时
人形机器人风起,连接器待势乘时,连接器,人形机器人,工作效率,性强,研发,光纤,近年来,人形机器人在人工智能领域取得了巨大的进展。随Arbe 4D成像雷达以高分辨率雷达技
Arbe 4D成像雷达以高分辨率雷达技术和先进处理技术消除“幽灵刹车”问题,刹车,成像,分辨率,系统,目标,数据,Arbe 4D成像雷达是一种清华大学研发光电融合芯片,算力超商
清华大学研发光电融合芯片,算力超商用芯片三千余倍,芯片,研发,商用,测试,计算,科学研究,近日,清华大学发布了一项重要科研成果,他们成英特尔不应该担心英伟达Arm架构的P
英特尔不应该担心英伟达Arm架构的PC芯片?恰恰相反,芯片,英伟达,英特尔,调整,研发,推出,英特尔目前是全球最大的半导体公司之一,主要以工业物联网数据采集:从Modbus到MQTT
工业物联网数据采集:从Modbus到MQTT,数据采集,物联网,模式,网关,协议,数据,工业物联网(Industrial Internet of Things,IIoT)的核心任务