技術(shù)
導(dǎo)讀:中國(guó)農(nóng)業(yè)科學(xué)院作物科學(xué)研究所、國(guó)家南繁研究院與阿里達(dá)摩院聯(lián)合研發(fā)出全流程智慧育種平臺(tái),實(shí)現(xiàn)了育種數(shù)據(jù)管理和分析、計(jì)算加速、AI 預(yù)測(cè)親本及優(yōu)良品種的育種全流程整合。
近日,全球植物科學(xué)頂尖期刊《分子植物》(Molecular Plant)刊載了中國(guó)科學(xué)家的最新研究,中國(guó)農(nóng)業(yè)科學(xué)院作物科學(xué)研究所、國(guó)家南繁研究院與阿里達(dá)摩院聯(lián)合研發(fā)出全流程智慧育種平臺(tái),實(shí)現(xiàn)了育種數(shù)據(jù)管理和分析、計(jì)算加速、AI 預(yù)測(cè)親本及優(yōu)良品種的育種全流程整合。
該平臺(tái)的數(shù)據(jù)容量、運(yùn)行速度以及數(shù)據(jù)安全號(hào)稱“達(dá)到世界先進(jìn)水平”,全球已有 23 家科研機(jī)構(gòu)率先使用。
論文共同一作兼通訊作者李慧慧介紹說,種子是農(nóng)業(yè)的“芯片”,對(duì)農(nóng)業(yè)發(fā)展至關(guān)重要,但傳統(tǒng)育種方式成本高、工作量大,往往需要耗時(shí)十年甚至更久。在 AI 等技術(shù)加持下,“智慧育種”可通過模擬作物生長(zhǎng)氣候、土壤及生長(zhǎng)周期等信息,綜合作物表型、基因型等數(shù)據(jù)建立模型,進(jìn)而預(yù)測(cè)作物性狀、篩選優(yōu)異基因型,大幅縮短育種周期。
不過,智慧育種需要高通量數(shù)據(jù)分析,依賴龐大的計(jì)算和建模、復(fù)雜的操作,對(duì)育種家挑戰(zhàn)很大。中國(guó)農(nóng)業(yè)科學(xué)院作物科學(xué)研究所、國(guó)家南繁研究院與達(dá)摩院融合生物技術(shù)和 AI 技術(shù),合作開發(fā)出高通量計(jì)算平臺(tái),在網(wǎng)頁(yè)端為育種家提供“一站式、低門檻”的服務(wù)。
具體而言,該平臺(tái)整合了種質(zhì)資源信息管理、育種試驗(yàn)設(shè)計(jì)與模擬、海量育種組學(xué)數(shù)據(jù)存儲(chǔ)、高通量數(shù)據(jù)分析以及智能育種決策等模塊,支持大規(guī)模組學(xué)信息、表型信息數(shù)據(jù)的整合利用與深度挖掘。
數(shù)據(jù)顯示,該平臺(tái)已被全球 23 家科研機(jī)構(gòu)用于育種研究,包括中國(guó)水稻研究所、中國(guó)科學(xué)院遺傳與發(fā)育生物學(xué)研究所、國(guó)際畜牧研究所、荷蘭瓦格寧根大學(xué)等。
為加速育種決策運(yùn)算,智慧育種平臺(tái)引入多種大數(shù)據(jù)計(jì)算、人工智能模型、自動(dòng)化處理模塊。論文通訊作者、達(dá)摩院智慧育種科學(xué)家顧斐介紹,平臺(tái)實(shí)現(xiàn)針對(duì)基因測(cè)序數(shù)據(jù)的變異位點(diǎn)計(jì)算加速 110 倍,基因型過濾加速 25 倍以上,群體遺傳學(xué)分析加速 1000 倍以上。
針對(duì)全基因組選擇算法,平臺(tái)的準(zhǔn)確率平均提升 15% 以上,預(yù)測(cè)穩(wěn)定性提升 5%。此外,該平臺(tái)數(shù)據(jù)存儲(chǔ)容量達(dá) 1PB,可支持上百個(gè)用戶同時(shí)開展高效的育種大數(shù)據(jù)管理、調(diào)度和分析