精準(zhǔn)設(shè)計(jì)育種,加速新種質(zhì)創(chuàng)制
人工智能,可期!
葡萄,因其獨(dú)特的風(fēng)味和口感,深受人們喜愛。種下一粒葡萄種子,從種子萌發(fā)到結(jié)出果實(shí),需要3年。而想要培育出“令人滿意的”葡萄品種,需要的時(shí)間更久。能否找到一種既“快速”又“簡便”的方法實(shí)現(xiàn)葡萄品種的“個(gè)性化”設(shè)計(jì)?育種家為此絞盡了腦汁。
中國農(nóng)業(yè)科學(xué)院深圳農(nóng)業(yè)基因組研究所(嶺南現(xiàn)代農(nóng)業(yè)科學(xué)與技術(shù)廣東省實(shí)驗(yàn)室深圳分中心)周永鋒團(tuán)隊(duì)提出利用人工智能指導(dǎo)葡萄育種的新方法,有望大幅縮短育種周期,且預(yù)測準(zhǔn)確度高達(dá)85%,相比傳統(tǒng)方法,育種效率可提高400%。該研究有望實(shí)現(xiàn)葡萄的精準(zhǔn)設(shè)計(jì)育種,加速葡萄品種創(chuàng)新,并為其他多年生作物育種提供方法參考。近日,該研究成果發(fā)表在《自然·遺傳學(xué)(Nature Genetics)》上。
從2.0到4.0 葡萄育種技術(shù)“跨越”
“葡萄美酒夜光杯,欲飲琵琶馬上催。”這句千古流傳的詩句反映了當(dāng)時(shí)人們對(duì)葡萄的喜愛。
有研究表明,1萬多年前,人們就開始嘗試“改造”葡萄,所謂“改造”,就是有選擇性地通過特定手段對(duì)原有葡萄性狀進(jìn)行改良,這一過程又被稱為育種。
早期,人們發(fā)現(xiàn)野生葡萄后,會(huì)把品質(zhì)優(yōu)良的葡萄苗保存下來,通過一代又一代的繁育,只留下符合要求的后代,這種方法固然有用,但高度依賴自然種質(zhì)資源,可改良程度有限,因此,被稱為育種1.0技術(shù)。
后來,人們發(fā)現(xiàn)如果既想要葡萄“產(chǎn)量高”,也想要“甜度高”,可以把“產(chǎn)量高”的葡萄品種和“甜度高”的葡萄品種進(jìn)行雜交,以培育出聚合了雙親優(yōu)良性狀的雜交后代。這種方法滿足了有針對(duì)性選育葡萄品種的需求,但育種周期十分漫長,往往需要經(jīng)過數(shù)十年的篩選,工作量極大,且由于葡萄高度雜合,雜交后,后代會(huì)出現(xiàn)性狀分離,雜交效果并不理想。該方法被稱為育種2.0技術(shù)。
進(jìn)入二十一世紀(jì)以來,隨著分子生物學(xué)、數(shù)量遺傳學(xué)、生物信息學(xué)等學(xué)科的興起,育種家提出育種3.0技術(shù),即分子育種:通過分子標(biāo)記來“設(shè)計(jì)”性狀;并在此基礎(chǔ)上,提出育種4.0,即智能設(shè)計(jì)育種:基于海量基因組和遺傳數(shù)據(jù)進(jìn)行分析預(yù)測,以提高育種效率和精確度。全基因組選擇育種便是其中最具代表性的一種。
總長度1.43Gb 構(gòu)建全面的葡萄泛基因組
目前,葡萄育種仍停留在2.0階段。要想實(shí)現(xiàn)從2.0到4.0的跨越,首先需要足夠全面、準(zhǔn)確的基因組數(shù)據(jù)。為此,周永鋒團(tuán)隊(duì)自2015年起,便開始聚焦葡萄的設(shè)計(jì)育種工作,并于2023年發(fā)布首個(gè)葡萄端粒到端粒完整參考基因組圖譜,相關(guān)研究以封面文章發(fā)表在《園藝研究(Horticulture Research)》上。然而,要實(shí)現(xiàn)精準(zhǔn)“設(shè)計(jì)”,一個(gè)基因組數(shù)據(jù)遠(yuǎn)遠(yuǎn)不夠。
在此基礎(chǔ)上,周永鋒團(tuán)隊(duì)又陸續(xù)對(duì)包括野生種和栽培品種在內(nèi)的9個(gè)二倍體葡萄品種進(jìn)行測序、組裝,得到18個(gè)端粒到端粒的單倍型基因組,并整合已有的基因組數(shù)據(jù),構(gòu)建了目前最全面、最準(zhǔn)確的的葡萄泛基因組(Grapepan v1.0),總長度達(dá)1.43Gb,是單個(gè)參考基因組大小的近3倍。
為了進(jìn)一步弄清楚葡萄基因與性狀之間的關(guān)聯(lián),周永鋒團(tuán)隊(duì)從近萬份葡萄品種中選取了400多份有代表性的葡萄品種,連續(xù)3年對(duì)包括果穗大小、漿果中代謝物含量、漿果大小和果皮顏色等在內(nèi)的29個(gè)農(nóng)藝性狀進(jìn)行調(diào)查,構(gòu)建了葡萄基因型圖譜和性狀圖譜。在此基礎(chǔ)上,周永鋒團(tuán)隊(duì)利用數(shù)量遺傳學(xué)分析,鑒定到148個(gè)與農(nóng)藝性狀顯著相關(guān)的位點(diǎn),其中122個(gè)位點(diǎn)為首次發(fā)現(xiàn)。研究發(fā)現(xiàn),調(diào)控不同性狀的位點(diǎn)間存在關(guān)聯(lián)性,如可溶性固形物含量和漿果寬度相關(guān)位點(diǎn)鄰近。此外,不同葡萄群體(釀酒、鮮食、美洲鮮食雜種)之間存在顯著分化的區(qū)域,這些區(qū)域中存在與漿果顏色、果皮澀味、漿果形狀、果穗重量、果肉硬度、果實(shí)大小等相關(guān)的多個(gè)性狀相關(guān)的遺傳位點(diǎn),表明對(duì)農(nóng)藝性狀歧化選擇促進(jìn)了釀酒與鮮食葡萄的分化。
預(yù)測準(zhǔn)確率高達(dá)85% 早期選擇更優(yōu)化
全面、準(zhǔn)確的基因組數(shù)據(jù)是精準(zhǔn)“設(shè)計(jì)”育種的基礎(chǔ),而如何深入挖掘這些數(shù)據(jù)來優(yōu)化育種策略并指導(dǎo)育種,是智能育種必須回答的問題。周永鋒團(tuán)隊(duì)決定引入機(jī)器學(xué)習(xí),通過構(gòu)建預(yù)測模型,根據(jù)評(píng)分進(jìn)行早期個(gè)體的預(yù)測和選擇,從而指導(dǎo)、優(yōu)化育種策略。
在研究中,研究人員將包含了性狀和基因型的數(shù)據(jù)劃分為3個(gè)子集:訓(xùn)練集、驗(yàn)證集和測試集。利用機(jī)器學(xué)習(xí)算法解析基因型與性狀數(shù)據(jù)間的復(fù)雜網(wǎng)絡(luò)關(guān)系,運(yùn)用訓(xùn)練數(shù)據(jù)集構(gòu)建了首個(gè)葡萄全基因組選擇模型,研究進(jìn)一步通過驗(yàn)證集調(diào)整模型參數(shù),對(duì)模型進(jìn)行優(yōu)化,最后測試數(shù)據(jù)集評(píng)估最終模型的性能。研究結(jié)果表明,結(jié)合了結(jié)構(gòu)變異信息的多基因評(píng)分預(yù)測模型,其預(yù)測準(zhǔn)確率高達(dá)85%。
通過這一模型,育種家可以快速準(zhǔn)確地評(píng)估大量育種材料的遺傳潛力,從而更好地選擇優(yōu)良品種。與雜交育種需要根據(jù)葡萄成熟后的表型作出判斷相比,全基因組選擇育種技術(shù)在葡萄幼苗時(shí)期就可以預(yù)測其成熟后的性狀,盡早剔除掉不符合條件的幼苗,減少了不必要的人工成本和投入,在葡萄育種應(yīng)用中有很大的應(yīng)用潛力,提高葡萄育種效率,加速葡萄新種質(zhì)的創(chuàng)制,革新葡萄育種策略。
目前,相關(guān)研究成果已申請獲批國家發(fā)明專利6項(xiàng),已申請國際專利1項(xiàng)。
(宋雅娟)
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.