让建站和SEO变得简单

让不懂建站的用户快速建站,让会建站的提高建站效率!

考试资讯

中国农业科学院深圳基因组参谋所刘毓文团队和清华大学倪建泉团队合营配置基于东谈主工智能的DNA顺式调控元件想象新措施

发布日期:2024-11-02 00:56    点击次数:75

转自:生物谷

比年来,基于东谈主工智能进行卵白质结构瞻望和卵白编码序列的重新想象为悉数人命科学边界带来了开阔的变革,本年的诺贝尔化学奖也授予了该边界作念出创始性职责的三位科学家。关联词,比拟于只占基因组3%-5%的编码区序列,哄骗东谈主工智能想象基因组中非编码顺式调控元件序列(CREs)的参谋还异常少。

CRE在基因抒发的时空格式中饰演着枢纽扮装,决定了细胞和组织的身份和功能。因此,不管是在合成生物学生物反应器中提高场地产品的抒发、基因调治中精确舍弃药物卵白的抒发,仍是在生物育种中通过微调功能基因的抒发量栽种经济性状的阐扬,齐遑急需要哄骗东谈主工智能想象全新的CRE序列。

增强子是CRE中最为紧要的一类元件,舍弃着基因的时空特异性抒发。关联词,由于增强子调控语法的复杂性,传统的增强子想象措施频繁依赖于繁琐的迭代突变以及已知DNA基序的组合操作,精确想象合适需求的增强子序列面对开阔的局限性。旧年12月,Nature发表的两篇著述初次哄骗深度学习算法进行了增强子的重新想象,然而其蓄意模子还存在优化的空间,且想象的增强子在活性上相关于当然序列栽种异常有限,并莫得绝对开释重新想象DNA序列在合成生物学边界的开阔后劲。

为进一步探索增强子想象的惩办决策,中国农业科学院深圳基因组参谋所刘毓文团队和清华大学倪建泉团队合营在Nucleic Acids Research在线发表了题为“A novel interpretable deep learning-based computational framework designed synthetic enhancers with broad cross-species activity”的参谋论文(https://doi.org/10.1093/nar/gkae912)。

该参谋配置了DREAM(DNA cis-Regulatory Elements with controllable Activity design platforM,DREAM)的蓄意框架,旨在透澈变革增强子等顺式调控元件的想象面容。DREAM代表DNA顺式调控元件的可控活性想象平台,这个名字哀而不伤地反应了其中枢功能。DREAM具有高度的可推广性息争释性,大致自动重新想象具有用户理思性质的运转子、增强子、千里默子。通过深度学习时代,DREAM自动学习和识别与调控活性算计的DNA“词汇”,并基于这些学问精确瞻望增强子的活性。

基于该措施,参谋东谈主员初次想象出了在向上10亿年分化物种(包括哺乳动物、鸟类、鱼类、虫豸和酵母等)中具有保守功能的增强子序列,揭示了增强子调控语法的跨物种保守性。此外,想象出的超强增强子活性显耀高于不同物种中常用的最强增强子,同期也初次想象出了基因抒发约束效果显耀的千里默子序列,为合成生物学基因抒发操作提高了新的高效元件。

临了,参谋东谈主员还将想象的增强子告捷整合入果蝇基因组中,初次取得了佩戴东谈主工智能想象调控元件的成体动物。在成体果蝇中,阐发基因的抒发量栽种了1万倍以上,为基于CRE元件优化的合成生物学育种提供了紧要表面依据和时代参考。

DNA顺式调控元件的可控活性想象平台

通过基于Squeeze-and-Excitation重眼光机制的深度学习时代 (SENet),DREAM自动学习和识别与调控活性算计的DNA“词汇”,并基于这些学问精确瞻望增强子的活性。参谋标明,与现存的其他基于序列瞻望功能的模子比拟(包括Nature中初次增强子想象用到的DeepSTARR算法),DREAM的增强子活性瞻望模块在准确性和性能上有显耀栽种。

DREAM具有超高的元件活性瞻望性能

此外,DREAM兼具超高的元件活性性能瞻望才略以及精粹的生物学可解释性,因此DREAM不错将学习到的增强子的调控语法用于后续的元件想象任务之中。在PCC、MSE等四项见地上,DREAM均超过当今主流的顺式调控元件瞻望模子。

同期DREAM大致有用地拿获调控元件算计的DNA motif的特征。同期基于该框架,作家揭示了增强子元件中motif具有的位置效应以及距离依赖的上位性效应。由于其透明性,用户不错明确地了解在调控元件的想象和优化历程中,元件活性相关的紧要的DNA特征是怎样被哄骗和组织的。

DREAM不错拿获增强子算计的DNA motif并揭示motif的位置效应以及距离依赖的上位性效应

参谋东谈主员哄骗DREAM模拟了果蝇基因组中发育增强子和捏家增强子进化动态,并告捷想象出具有超强活性的增强子元件。这些元件的序列分析标明想象序列在motif的数量,空间排布、各种性、联长途于以及GC含量等方面具有与当然元件千差万别的性质。

作家合成了增强子DreaMer001,通过双荧光素酶施行测定其活性达到了果蝇基因组中最强自然增强子的3.6倍,同期构建了转基因果蝇在体内测量了该元件元件的活性,收尾标明该元件在果蝇体内不错提高阐发基因转录活性约10000倍,进一步评释了该元件具有极强的增强转录活性的才略。

更为紧要的是,这些经过DREAM想象的高活性合成增强子不仅在果蝇S2细胞中阐扬出超高的活性,还在包括东谈主类、小鼠、猪在内的多种物种的不同细胞系中具有超强的活性(平均为CMV增强子活性的2倍以上),在SF9细胞中DREAM想象的增强子活性是Hr5增强子活性的15.7倍,另外该东谈主工想象元件在鸡(DF1细胞)以及鱼(精原细胞)别离是CMV增强子活性的7.6倍和26.6倍。这标明DREAM有才略通过蓄意想象比当然进化产生的更高效的基因调控元件,也揭示了增强子调控语法的跨物种保守性。

另外,DREAM框架具有的精粹可推广性,作家进一步展示了细胞特异性的强增强子,高AT含量超强增强子,具有固定酶切位点强增强子,以及强千里默子元件的想象。值得真贵的是,作家哄骗DREAM取得了大致缩小基因抒发44.7倍的超强千里默子DreaMer002。这些收尾评释了DREAM的想象遵循在骨子应用中具有鄙俗的应用场景和可靠性。

DREAM想象的高活性增强子在多物种的不同细胞系中具有超强的调控活性

中国农业科学院深圳基因组所刘毓文参谋员和清华大学医学院倪建泉证据注解为本参谋的共同通信作家;基因组所博士后李昭宏、博士生张圆圆、清华大学博士生彭博、和基因组所硕士生秦胜华为本文的共同第一作家。刘毓文参谋员恒久从事非编码CRE的高通量定量和调控语法领略,并应用于复杂性状遗传机制领略;倪建泉证据注解恒久从事果蝇中基因剪辑时代的配置和应用。该参谋职责取得了十四五重心研发表情和国度当然科学基金表情的守旧。

(转自:生物谷)