• 中國農(nóng)藥工業(yè)協(xié)會
  • 金旺智能
  • 中國農(nóng)藥工業(yè)協(xié)會
  • 作物123
  • 報告訂閱咨詢
當(dāng)前位置: 首頁 > >

數(shù)據(jù)、算法、算力:數(shù)字育種產(chǎn)業(yè)化拐點將至

責(zé)任編輯:左彬彬 來源:35斗 日期:2024-01-15



“培育出高產(chǎn)、優(yōu)質(zhì)、抗性強的作物品種,這是所有育種家的夢想,如果你手里有300份材料,該怎么通過數(shù)字化手段去實現(xiàn)它?

 

首屆數(shù)字種業(yè)論壇上,天豐智慧技術(shù)總監(jiān)邢鴻雁博士的這一提問,引發(fā)了在場聽眾的深思……

 

就傳統(tǒng)育種而言,選育動植物新品種過程十分漫長。一個植物新品種一般需要8-10年,畜禽新品種甚至要花費數(shù)十年乃至上百年。部分育種家努力鉆研半生,最終也沒有出來一個大品種。又或者,新品種選育出來便已被瞬息萬變的市場淘汰,傾注其中的心血不免令人惋惜。

 

眾所周知,種質(zhì)資源是育種的基礎(chǔ),育種家第一步要做的便是“淘金”。截至2022年底,我國長期保存的農(nóng)作物種質(zhì)資源數(shù)量已達(dá)53.9萬份。保存數(shù)量雖位居世界第二,但作物種質(zhì)資源利用率僅為3.0%~5.0%,有效利用率僅為2.5%~3.0%。

 

種質(zhì)資源的收集、保存、鑒定,所耗人力、時間和財力成本巨大,育種家要深入田間地頭做種植材料的鑒定十分困難,盡管他們樂此不疲。

 

有人將傳統(tǒng)育種比喻為“選美”,育種的最終結(jié)果全靠育種家的眼睛,即便是在大數(shù)據(jù)、人工智能火爆的當(dāng)下,育種家的經(jīng)驗仍舊不可取代。

 

可是,面對一座如此龐大、尚待開發(fā)的種質(zhì)資源大山,單靠育種家的一步一履,或難登頂。

 

近年來,“BT+DT”成為了全球育種行業(yè)最熱門的詞匯。目前,國外種業(yè)已進(jìn)入“常規(guī)育種+生物技術(shù)+信息化”的育種“4.0時代”,而我國仍處在以雜交選育、分子育種為主的“2.0-3.0時代”。

 

以拜耳、科迪華為代表的國際種業(yè)巨頭,利用人工智能、機器學(xué)習(xí)等技術(shù),結(jié)合海量基因組、表型和環(huán)境數(shù)據(jù)的分析,進(jìn)行種子的選擇、優(yōu)化,已紛紛構(gòu)建起成熟的數(shù)字化育種體系。

 

2020年,拜耳在美國亞利桑那州的馬拉納開設(shè)自動化溫室,作為其新的全球玉米產(chǎn)品設(shè)計中心,可整合端到端的數(shù)字化育種過程,加速其玉米新品種迭代進(jìn)程。

 

在種業(yè)企業(yè)全面擁抱數(shù)字技術(shù)的同時,國際互聯(lián)網(wǎng)巨頭也在積極布局育種賽道。

 

去年,谷歌的母公司Alphabet公開推出“Mineral”,該項目籌劃已久,自2014年來平均每天可以采集到190000個農(nóng)田數(shù)據(jù)點。利用這些數(shù)據(jù),Mineral 開發(fā)了80個高性能機器學(xué)習(xí)模型,幫助企業(yè)、農(nóng)民、研究人員和育種家預(yù)測作物產(chǎn)量、增加產(chǎn)量、防治害蟲和雜草。

 

Google Ventures合伙人Andy Wheeler曾表示,“數(shù)據(jù)將是推動下一波農(nóng)業(yè)生產(chǎn)率提高的工具?!?/span>

 

再看國內(nèi),數(shù)字技術(shù)在交通、消費、物聯(lián)網(wǎng)等領(lǐng)域已發(fā)展得十分成熟。近些年,阿里、騰訊、京東等互聯(lián)網(wǎng)巨頭在農(nóng)業(yè)賽道頻頻落子。可以說,國內(nèi)要發(fā)展數(shù)字育種,既是大勢所趨,也是恰逢其時。

 

回到開篇的提問,數(shù)字化育種究竟該如何從展望走向落地,從經(jīng)驗復(fù)制走向自主研發(fā),乃至成熟的產(chǎn)業(yè)化應(yīng)用呢?最近,35斗參加了首屆數(shù)字種業(yè)論壇,從數(shù)十位專家學(xué)者的報告和訪談中,我們總結(jié)出了一些可行的方向和答案:


追趕:把握數(shù)字化機遇,為育種插上隱形翅膀

 

跨界:多元人才涌入,跑好數(shù)字革命的接力棒

 

降維:減少算法和模型內(nèi)卷,卷應(yīng)用贏面更大

 

聯(lián)合:細(xì)致分工與一體化鏈接,重塑行業(yè)生態(tài)

 

標(biāo)準(zhǔn):直面育種數(shù)據(jù)爆炸,回歸育種本質(zhì)邏輯


 

追趕:把握數(shù)字化機遇,為育種插上隱形翅膀

 數(shù)字2.jpg


發(fā)展數(shù)字育種契合當(dāng)前我國農(nóng)業(yè)政策和發(fā)展戰(zhàn)略,這是一個非常好的機會。

 

擁有40余年育種經(jīng)驗的前亞太種子協(xié)會(APSA)主席、前先正達(dá)中國政府事務(wù)總監(jiān)張孟玉表示,我國的數(shù)字技術(shù)在農(nóng)業(yè)以外的其他行業(yè)發(fā)展迅速并逐步成熟,如無人機、無人交通、物聯(lián)網(wǎng)、區(qū)塊鏈應(yīng)用、供應(yīng)鏈管理等。但在數(shù)字農(nóng)業(yè)和數(shù)字種業(yè)方面,剛剛起步,十分滯后。

 

在有限的應(yīng)用中,設(shè)施農(nóng)業(yè)又占據(jù)了大頭。水肥一體化、溫度光源控制、云平臺管理等領(lǐng)域常常可見數(shù)字化身影。目前,信息技術(shù)在以跨國企業(yè)為代表的種業(yè)企業(yè)逐步得到使用,于中國種業(yè)而言,抓住數(shù)字化機遇,任重而只爭朝夕。

 

對此,中國農(nóng)業(yè)大學(xué)郭偉龍副教授也提出了一個很有趣的思考:我們常說基因組學(xué)已經(jīng)有很多數(shù)據(jù),為什么還要數(shù)字化?數(shù)字化究竟是什么含義?

 

哪怕是數(shù)據(jù)庫也會有好幾個層次,數(shù)據(jù)化和數(shù)字化有著迥異的差距。

 

通過測序技術(shù)采集并獲取大量基因組信息,這個只是數(shù)據(jù)化的過程。我們真正要做的是數(shù)字化,基于海量基因型、表型和環(huán)境組學(xué)數(shù)據(jù),利用算法、模型形成的育種知識庫,對于指導(dǎo)實踐可能更有價值、效率。

 

種業(yè)4.0是一個以數(shù)字化為基礎(chǔ)的創(chuàng)新時代。

 

華大制造李勇副研究員認(rèn)為,西方國家之所以發(fā)展起成熟的育種體系,恰恰是其數(shù)字積累起來的領(lǐng)先優(yōu)勢。如果傳統(tǒng)的種業(yè)無法和西方競爭,那么分子育種和數(shù)字育種將是趕超的絕佳機會。我國種質(zhì)資源豐富,在研發(fā)力量上也逐漸出現(xiàn)了從政府、科研機構(gòu)到企業(yè)的轉(zhuǎn)變,這是一個良好的信號。

 

也許,大數(shù)據(jù)早已在數(shù)字經(jīng)濟(jì)的舞臺上大展拳腳、屢創(chuàng)佳績。如今涉足育種領(lǐng)域,它的神秘面紗正在一點一點揭開,蓄勢待發(fā)。

 

 

跨界:多元人才涌入,跑好數(shù)字革命的接力棒


 數(shù)字.jpg


育種家的戰(zhàn)場,不止于實驗室,也在田野,更在云端。

 

數(shù)字化育種時代,不僅需要遺傳學(xué)、分子生物學(xué)、生物信息學(xué)等領(lǐng)域的“BT”人才,還迫切需要數(shù)據(jù)科學(xué)、人工智能、物聯(lián)網(wǎng)、自動化控制、統(tǒng)計學(xué)等相關(guān)背景的“DT”人才共同參與。

 

拜耳作物科學(xué)的王林博士提到,種子的產(chǎn)出潛力很關(guān)鍵,要能適應(yīng)不同農(nóng)民、農(nóng)場的種植環(huán)境。育種不僅僅局限于基因組方面的研發(fā),也需要涉及種子“周邊”,如殺蟲、除草、種子管理等。因此,拜耳的育種研發(fā)始終是圍繞著客戶最終的需求來規(guī)劃。

 

西南民族大學(xué)青藏高原研究院的王嘉博副研究員,其博士研究背景是軟件開發(fā)和算法,如今卻在藏區(qū)的牦?;蚪M選育工作上干勁十足。

 

在被問到如何與老一輩育種家合作,推動種業(yè)數(shù)字化轉(zhuǎn)型時,他提到:我父親從事大豆的傳統(tǒng)育種已有30年,也持續(xù)做出了自己的成果。當(dāng)我和他討論現(xiàn)代的分子技術(shù)、數(shù)字技術(shù)時,父親表示“實踐是最好的答案”。

 

新技術(shù)的出現(xiàn)肯定會帶來革命。一代人比一代人要強,技術(shù)發(fā)展也會一代比一代更先進(jìn)。只有深入田間地頭,用數(shù)字技術(shù)真正地推動種業(yè)進(jìn)步,才能讓老一輩的人相信:這桿槍交給我們可以放心。

 

中國農(nóng)科院作物所的張學(xué)勇研究員也在接受訪談時表示:這次參會最強烈的感受,就是希望在青年身上。對我們這一輩的育種家來說,田間的數(shù)據(jù)、實驗室的數(shù)據(jù)有很多,但是缺乏海量數(shù)據(jù)的有機整合。而國際上的種業(yè)競爭,其實就是國家種質(zhì)資源的智能化競爭。

 

或許,當(dāng)新一代育種家接過這份沉重的“接力棒”時,“彎道超車”或能更快實現(xiàn)。


 

降維:減少算法和模型內(nèi)卷,卷應(yīng)用贏面更大

 


數(shù)字3.jpg


在過去的一年里,以Chat GPT的火爆為標(biāo)志,諸如通義千問、文心一言、PaLM 2等生成式人工智能領(lǐng)域的大語言模型紛紛涌現(xiàn)。百度創(chuàng)始人李彥宏曾公開表示:模型本身并不直接產(chǎn)生價值,基于基礎(chǔ)大模型開發(fā)出來的應(yīng)用才是模型存在的意義。

 

郭偉龍副教授認(rèn)為,人工智能技術(shù)從計算機領(lǐng)域來講已經(jīng)很成熟,方法已經(jīng)卷到了一定程度,現(xiàn)在不再卷模型,而是卷應(yīng)用。邢鴻雁博士也提到,對于數(shù)字育種來說,不用去卷算法,哪個好用就用哪個。

 

天豐智慧CEO張洪也強調(diào),種業(yè)科技方面我國的發(fā)期刊數(shù)量處于絕對領(lǐng)先優(yōu)勢,但從科學(xué)到技術(shù)已經(jīng)出現(xiàn)斷層,從技術(shù)到工程化實現(xiàn)還有很長的路要走。

 

構(gòu)建育種大模型可以幫助預(yù)測和找到優(yōu)勢的基因,大幅提升育種效率。但是,“有用”一定是決定算法、模型選擇的關(guān)鍵因素。

 

以大豆為例,“中央一號文件”連續(xù)4年聚焦大豆擴(kuò)種。中國農(nóng)科院作物所的李英慧研究員表示,利用基因組、轉(zhuǎn)錄組、常規(guī)表型等多組學(xué)技術(shù)的聯(lián)合分析,團(tuán)隊成功發(fā)掘了300多個與產(chǎn)量、抗病蟲等相關(guān)的基因。

 

然而,解鎖大豆耐密植基因只是第一步,團(tuán)隊更希望的是,讓這些基因能夠被育種家切實利用,回應(yīng)大豆高度依賴進(jìn)口的國情。

 

正如慧諾瑞德創(chuàng)始人韓志國所言,表型技術(shù)可以實現(xiàn)高通量、自動化獲取和產(chǎn)量、品質(zhì)、抗性相關(guān)的信息數(shù)據(jù),看上去非常高大上,脫去華麗的外衣就是光譜檢測技術(shù)。我們思考的是:能否為產(chǎn)業(yè)做一點事?

 

從這個角度來看,無論是極智生物的高通量基因測序平臺,還是天豐智慧的GS預(yù)測育種,抑或是慧諾瑞德的高通量表型鑒定,讓技術(shù)更加落地、平臺更加實用,或許才是千千萬萬個數(shù)字化育種人員的終極夢想。

 

 

聯(lián)合:專業(yè)分工與一體化鏈接,重塑行業(yè)生態(tài)


 00.png


在這場數(shù)字化革命中,傳統(tǒng)種企或許才是感觸最深的。

 

去年,來自紅船啟航地的浙江大禾種業(yè)董事長朱娟,毅然決然地加入了數(shù)字種業(yè)聯(lián)盟,擁抱數(shù)字化育種,尋求企業(yè)轉(zhuǎn)型。

 

朱娟認(rèn)為,在數(shù)字化育種中,傳統(tǒng)種企更多關(guān)注“效率”,如何精準(zhǔn)地能夠為種業(yè)企業(yè)和農(nóng)民的增收增效服務(wù),這是企業(yè)最關(guān)注的點。數(shù)字種業(yè)聯(lián)盟的成立,有望實現(xiàn)種業(yè)企業(yè)、科研單位從點到線的有機鏈接,對于加速傳統(tǒng)種企業(yè)加速品種迭代會起到至關(guān)重要的推動作用。

 

中國農(nóng)科院作科所/國家南繁研究院張學(xué)才研究員對此的思考是:提高育種過程的效率,而不僅僅是單一技術(shù)的效率。要解決好種質(zhì)、算法和育種實踐的結(jié)合問題,從種到收、從選品種到測序,每個過程、環(huán)節(jié)都需要數(shù)字化賦能。

 

李勇研究員也表示,數(shù)字育種的價值鏈很長,而行業(yè)的專業(yè)化服務(wù)遠(yuǎn)遠(yuǎn)不夠,這也是我們強調(diào)的數(shù)字化聯(lián)盟的重要性所在。

 

合肥智能育種加速器大科學(xué)裝置(海霸設(shè)施)首席科學(xué)家吳麗芳強調(diào),通過平臺將各環(huán)節(jié)的數(shù)據(jù)、技術(shù)和設(shè)備進(jìn)行整合,為育種家提供便利是大科學(xué)裝置的創(chuàng)立初衷。

 

我們不需要做重復(fù)的工作,要充分利用各方資源,合作共贏。未來,在種質(zhì)創(chuàng)新、新基因快速挖掘、知識產(chǎn)權(quán)保護(hù)、核心種質(zhì)資源數(shù)據(jù)共享等方面,大家有很多合作空間。

 

在國家種業(yè)振興大背景下,如何將行業(yè)內(nèi)好的育種技術(shù)真正落地,做到產(chǎn)業(yè)化應(yīng)用非常關(guān)鍵。

 

極智基因創(chuàng)始人焦成智表示,單打獨斗非常難,通過組建聯(lián)盟,把各方先進(jìn)的育種技術(shù)進(jìn)行整合,真正賦能下游的新品種培育、種質(zhì)的創(chuàng)新,甚至未來農(nóng)業(yè)食品加工等一系列的產(chǎn)業(yè)應(yīng)用。

 

 

標(biāo)準(zhǔn):直面育種數(shù)據(jù)爆炸,回歸育種本質(zhì)邏輯



000.jpg


當(dāng)前,全球正處于“數(shù)據(jù)爆炸”時代。

 

2022年我國數(shù)據(jù)產(chǎn)量達(dá)8.1ZB,同比增長22.7%,全球占比達(dá)10.5%,位居世界第二。其中,農(nóng)業(yè)數(shù)據(jù)的增量更是達(dá)到了50%至80%的水平。在環(huán)境氣候、基因組測序、作物生長指標(biāo)、地方統(tǒng)計等方面,種業(yè)從來不差數(shù)據(jù)。

 

在會議現(xiàn)場,張學(xué)才提出了一個有趣的觀點:“數(shù)據(jù)并不是越多越好”。

 

他提到,測序數(shù)據(jù)越多越好,標(biāo)記數(shù)量則不一定越多越好,算法也不一定越高級越好。對育種的人來講,數(shù)據(jù)庫能否承受存儲和計算的壓力,讓人覺得你不是在玩數(shù)據(jù),你是來實踐做育種,這才是最重要的。

 

每天都有源源不斷的數(shù)據(jù)產(chǎn)生,在某些方面,也給育種家造成了困擾。

 

韓志國表示,大家在做表型采集時常常有不同的命名方式,這給大數(shù)據(jù)處理增加了難度。同時,不同的表型平臺的信息化難以打通,很重要的一點在于表型的數(shù)據(jù)實在太大。

 

我們也一直在尋找表型數(shù)據(jù)領(lǐng)域更簡化的指標(biāo),從而助力育種和關(guān)鍵的種植流程決策連接起來,這個或許會成為產(chǎn)業(yè)化落地應(yīng)用的關(guān)鍵點。

 

張學(xué)才強調(diào),育種是一個龐雜的過程,其中牽扯到標(biāo)準(zhǔn)化和系統(tǒng)化問題。包括命名格式的統(tǒng)一、流程的優(yōu)化、頂層設(shè)計的完善,都需要遵循科學(xué)性原則。當(dāng)每一粒種子有了清晰的ID,包括來源、年份、名稱等;當(dāng)每家育種信息系統(tǒng)的底層框架達(dá)成一致,數(shù)字育種才能真正成型。

 

到那時,再復(fù)雜的數(shù)據(jù)輸入和輸出也會變得簡單、高效。

 

 

寫在最后

 種子.jpg


作物育種猶如建房子,正在由“建平房時代”進(jìn)入“建高樓時代”。雖然平房和高樓其房間的功能變化不大,但其建設(shè)的流程和工藝已有天壤之別。

 

未來的育種,將是“設(shè)計育種”,需要有科學(xué)的規(guī)劃,優(yōu)良的設(shè)計,精細(xì)的施工,完善的監(jiān)理,嚴(yán)密的檢測,出色的管理,高效的協(xié)作,缺一不可。

 

這兩段話由我國著名水稻育種家劉定富老師所說。今天,它也出現(xiàn)在了由極智生物、天豐智慧、慧諾瑞德三家企業(yè)共同發(fā)起的數(shù)字種業(yè)聯(lián)盟的規(guī)劃書上。這些文字正是關(guān)于聯(lián)盟成立初衷、所追求事業(yè)最為形象與深刻的說明。

 

未來,在聯(lián)盟的助力下,我們也期望一代又一代育種家的終極夢想能從紙面躍至現(xiàn)實。

中國農(nóng)藥工業(yè)網(wǎng) 版權(quán)所有

地址:北京市朝陽區(qū)農(nóng)展館南里通廣大廈7層

電話:010-84885233 京公網(wǎng)安備11010502025163