AI育種:從“拆盲盒”到“精準(zhǔn)選”
對二十年前的育種專家而言,研究棉花基因數(shù)據(jù),就像翻閱著一本沒有標(biāo)點(diǎn)的書。
張?zhí)煺娼淌趲ьI(lǐng)的團(tuán)隊(duì),二十余年來一直努力破譯這本“書”。為了解決傳統(tǒng)育種的難題,團(tuán)隊(duì)系統(tǒng)分析了全球5000余個(gè)棉花品種,一點(diǎn)點(diǎn)解析出79642個(gè)基因中隱藏的遺傳密碼——通過綜合運(yùn)用基因組學(xué)、生物信息學(xué)和群體遺傳學(xué)等方面的理論和技術(shù),他們鑒定出1000多個(gè)和產(chǎn)量、品質(zhì)相關(guān)的基因位點(diǎn),成功構(gòu)建全球首個(gè)棉花多組學(xué)數(shù)據(jù)庫平臺COTTONOMICS。三年來,平臺訪問量已超9萬次,成為棉花研究的“知識中心”。
在解析底盤育種大數(shù)據(jù)之外,團(tuán)隊(duì)還構(gòu)建了幾乎覆蓋全部優(yōu)異基因的核心種質(zhì)庫,研發(fā)出全基因組選擇育種液相芯片——“浙大棉芯”!斑@款芯片不但能快速、精準(zhǔn)地破譯育種棉花的‘基因密碼’,還會像‘成績單’一樣清晰呈現(xiàn)其基因表現(xiàn),讓數(shù)據(jù)都一目了然,幫助育種人員制定更精準(zhǔn)的雜交方案。”
為了讓技術(shù)真正“落地”,團(tuán)隊(duì)聯(lián)合華為、北京大蚯蚓數(shù)字科技開展攻關(guān),便誕生了如今的“AI育種家(AI Breeder for Crops)”智能育種平臺。團(tuán)隊(duì)成員介紹,這枚芯片能夠加速計(jì)算效率能力提升100倍,棉花雜交育種組合效率提升20倍,棉花育種周期直接從傳統(tǒng)的6-8年壓縮到3-4年。
現(xiàn)在打開平臺,育種人員不用再去“啃”復(fù)雜的數(shù)據(jù)分析報(bào)告:想查詢某個(gè)棉花品種的高產(chǎn)、優(yōu)質(zhì)或者抗病基因,可以直接輸入問題,平臺便能立刻調(diào)出結(jié)果;要設(shè)計(jì)棉花雜交親本選配和基因聚合育種方案,輸入目標(biāo)性狀,系統(tǒng)很快就能生成方案。
這是因?yàn),該平臺具備智能解析植株表型并輸出直接結(jié)果的能力,同時(shí)采用了對話式交互設(shè)計(jì),支持基因信息檢索、精準(zhǔn)育種方案生成及后代性狀預(yù)測。在此設(shè)計(jì)下,這位智能育種“專家”將復(fù)雜的分析流程轉(zhuǎn)化為直觀操作,大幅優(yōu)化了用戶體驗(yàn),而通過嚴(yán)密的數(shù)據(jù)架構(gòu)設(shè)計(jì),全過程的安全性、可控性也得以保障。
更完備的是,“AI育種家”設(shè)計(jì)之初就具備多作物擴(kuò)展能力,正在延伸應(yīng)用于水稻、大豆、油菜、西瓜、西蘭花等作物的育種研究,讓更多作物育種都能享上“AI福利”。
基因篩選:“做核酸”的新裝備
有了先進(jìn)的育種技術(shù),如何在播種前就確定哪顆種子攜帶我們需要的優(yōu)質(zhì)基因?
“一般來說,1000顆種子里,可能只有3顆含有目標(biāo)基因,過去靠人工篩選,簡直是‘大海撈針’!睘榇耍锵到y(tǒng)工程與食品科學(xué)學(xué)院應(yīng)義斌教授領(lǐng)銜的智能生物產(chǎn)業(yè)裝備創(chuàng)新團(tuán)隊(duì)開發(fā)了通用式小顆粒種子微創(chuàng)取樣機(jī)器人、自動化測序建庫機(jī)器人及種子分選機(jī)器人成套裝備,有效解決了這個(gè)痛點(diǎn)。
在實(shí)驗(yàn)室里,機(jī)械臂輕輕吸起一粒小麥種子:先通過機(jī)器視覺和深度學(xué)習(xí)算法識別種子的“頭尾”,精細(xì)地調(diào)整好姿態(tài),再用刀片切割出微量樣本并進(jìn)行分析——這個(gè)過程仿佛是給種子“做核酸”,既不傷害種子活性,又能快速實(shí)現(xiàn)對大批量種子的基因分析。
“以前人工一天最多測800顆種子,現(xiàn)在機(jī)器人一天能測至少8000顆,效率提了10倍以上,取樣精度還超過50%!眻F(tuán)隊(duì)項(xiàng)目負(fù)責(zé)人周鳴川研究員說,切割的樣本通過自動化測序建庫機(jī)器人測定樣本中是否含有目標(biāo)基因型。生成的基因測定結(jié)果會同步到種子分選機(jī)器人系統(tǒng)中,如果有目標(biāo)基因型機(jī)器人就會保留樣本的母本進(jìn)行后續(xù)的播種培育,相反機(jī)器人就會丟棄母本。有了這套機(jī)器人裝備,育種學(xué)家播種前就能鎖定“好種子”,大大降低了育種成本和時(shí)間。
此外,團(tuán)隊(duì)還開發(fā)了細(xì)胞顯微育種操作機(jī)器人,可以實(shí)現(xiàn)細(xì)胞和微小組織的自主化操作與靶向外源基因精準(zhǔn)導(dǎo)入,為育種學(xué)家提供了從細(xì)胞到小顆粒種子跨尺度新式育種工具。
技術(shù)監(jiān)測:讓數(shù)據(jù)“開口說話”
種子產(chǎn)業(yè)高質(zhì)量發(fā)展的同時(shí),植株生長過程中的監(jiān)護(hù)也格外重要。不過,要想知道一株植株長得好不好、抗病能力強(qiáng)不強(qiáng),光靠肉眼觀察可不夠。
走進(jìn)浙大溫室,何勇教授和岑海燕教授領(lǐng)銜的植物表型創(chuàng)新團(tuán)隊(duì)正在給幼苗做“體檢”——研究人員逐一為幼苗掃碼,放上傳送帶,流水線就自動啟動:先澆灌補(bǔ)水,再用可見光相機(jī)、深度相機(jī)和多光譜相機(jī)從不同角度拍照,最后由AI算法“拼”出該幼苗的3D模型。
何勇和岑海燕團(tuán)隊(duì)長期致力于植物表型光學(xué)成像與智能感知研究,上述場景就源于團(tuán)隊(duì)自主研發(fā)的溫室全自動高通量三維植物表型平臺(3D Plant Phenotyper)。
“這個(gè)模型,不僅能精準(zhǔn)還原植物的根、莖、葉形態(tài),和實(shí)物一模一樣,還能獲取葉片里的葉綠素、水分和氮素等含量,這些指標(biāo)對判斷作物健康狀態(tài)尤為關(guān)鍵。”團(tuán)隊(duì)成員解釋道,過去靠肉眼看苗情,只能判斷“長得好不好”,現(xiàn)在連“為什么好”“哪里需要調(diào)整”都能說清。更高效的是,每株植物均配有二維碼“身份證”,可自動記錄重量、灌水量及生長過程,數(shù)據(jù)實(shí)時(shí)存儲,操作人員一鍵上樣即可采集數(shù)百個(gè)可見和不可見性狀,為后續(xù)育種分析提供了極大便利。
這套平臺的“核心武器”,是團(tuán)隊(duì)自主開發(fā)的、國際領(lǐng)先級別的植物器官級實(shí)例分割A(yù)I算法和三維多光譜成像技術(shù)——能精準(zhǔn)“拆分”植物的每一片葉、每一根莖,再結(jié)合三維多光譜點(diǎn)云重構(gòu)模型,全方位展現(xiàn)植物的“健康狀況”。如今,它已經(jīng)成為種質(zhì)資源鑒定、智慧農(nóng)業(yè)研究的有力“數(shù)據(jù)靠山”。