近日,中國科學(xué)院上海營養(yǎng)與健康研究所建立了端到端篩選目標(biāo)酶的多任務(wù)計(jì)算框架,提高了功能酶的預(yù)測(cè)與發(fā)現(xiàn)效率,并應(yīng)用于真菌毒素降解酶的挖掘。
近年來,深度學(xué)習(xí)在酶的結(jié)構(gòu)、功能與性質(zhì)的大規(guī)模預(yù)測(cè)方面取得了進(jìn)展。然而,由于缺乏面向多模態(tài)輸入和多任務(wù)輸出的統(tǒng)一建模能力,現(xiàn)有方法難以滿足高性能功能酶篩選的需求。針對(duì)這一挑戰(zhàn),研究團(tuán)隊(duì)設(shè)計(jì)并開發(fā)了CACLENS框架,將CGC門控機(jī)制、對(duì)比學(xué)習(xí)與交叉注意力等方法深度融合,構(gòu)建出可同時(shí)執(zhí)行多項(xiàng)預(yù)測(cè)任務(wù)的一體化酶篩選平臺(tái)。
CACLENS能夠以較低的計(jì)算成本同時(shí)完成反應(yīng)類型分類、酶EC號(hào)預(yù)測(cè)與反應(yīng)可行性評(píng)估三項(xiàng)關(guān)鍵任務(wù),并在多個(gè)任務(wù)上展現(xiàn)出優(yōu)勢(shì)。具體而言:在反應(yīng)類型分類中,清洗處理ADP/ATP/H+等常見輔因子后,模型性能優(yōu)于現(xiàn)有方法;在EC號(hào)預(yù)測(cè)方面,整體表現(xiàn)超過主流模型CLEAN;在反應(yīng)可行性評(píng)估中,即使采用偏向ESP與EnzRank的評(píng)估策略,CACLENS仍取得更佳結(jié)果,并能穩(wěn)健處理未見過或與訓(xùn)練集序列相似度較低的酶。
針對(duì)真菌毒素玉米赤霉烯酮(ZEN),研究以CACLENS的多任務(wù)聯(lián)合預(yù)測(cè)結(jié)果為基礎(chǔ),在大規(guī)模序列空間中篩選出10個(gè)潛在降解酶候選體。研究通過基因合成、異源表達(dá)與純化獲得相應(yīng)酶蛋白,并對(duì)其降解性能開展實(shí)驗(yàn)驗(yàn)證。結(jié)果表明,約一半的候選酶具有對(duì)ZEN的催化活性,其中ZD4與ZD7能夠在體外體系中降解超過90%的ZEN。
整體來看,CACLENS在三項(xiàng)任務(wù)中均展現(xiàn)出預(yù)測(cè)能力,證明其在功能酶篩選方面具有應(yīng)用潛力。這一成果為多領(lǐng)域的新型功能酶挖掘提供了技術(shù)支撐,并為未來構(gòu)建智能化酶工程設(shè)計(jì)平臺(tái)、深入挖掘真菌毒素降解新酶奠定了基礎(chǔ)。
相關(guān)研究成果在線發(fā)表在《先進(jìn)科學(xué)》(Advanced Science)上。研究工作得到國家自然科學(xué)基金和國家重點(diǎn)研發(fā)計(jì)劃等的支持。

基于多任務(wù)模型的新功能酶智能挖掘與篩選框架

ZEN與ZOL及其降解產(chǎn)物的色譜圖
