人民網
人民網

國務院國資委規劃發展局副局長胡武婕:推動行業高質量數據集加速匯聚共享  為人工智能產業提供充足“養分”

2025年05月02日10:42 | 來源:人民網
小字號

人民網福州5月2日電 (陳藍燕、李唯一)“數據的價值,在於更大規模的互聯互通和開放共享。希望通過試點帶動示范,推動不同行業數據集之間的匯聚和共享,為人工智能通識和泛化的能力提供更好的訓練‘養分’。”國務院國資委規劃發展局副局長胡武婕4月30日接受記者採訪時表示。

當天,第八屆數字中國建設峰會“數據要素安全與流通基礎設施分論壇”分論壇在海峽國際會展中心舉辦。胡武婕在接受採訪時就央企在發展人工智能產業的有關情況進行介紹。

人工智能作為引領新一輪科技革命和產業變革的戰略性技術,正深刻影響和改變人類生產生活方式。

“當下,央企人工智能產業發展正處於重要的戰略機遇期。”胡武婕表示,我國數據資源豐富,產業體系完備,應用場景廣闊,市場空間巨大,央企全面開展“AI+”專項行動,推動人工智能技術賦能千行百業,如在能源領域,實現智能開採、智能調度﹔在制造領域,實現智能產線、智能質檢等,提升傳統產業的生產效率、產品質量和管理水平,促進產業轉型升級,新質生產力加快培育。

在胡武婕看來,隨著多模態、全雙工、慢思考等大模型技術取得突破性進展,通用基礎大模型的綜合能力顯著提升。具身智能作為連接人工智能與物理世界的重要載體,在海量數據驅動下,正通過跨域自主學習與強化學習推理的結合,逐步走向商業化。這些技術進步和應用落地都為央企人工智能產業的發展提供了強大動力。央企憑借豐富的應用場景、算力和數據資源,能夠充分利用把握技術突破,在相關領域協同各方,開展深度產業研發與應用實踐,力求在人工智能發展征程上當好排頭兵和主力軍。

高質量、大規模、多樣化的數據集與計算能力、模型架構共同構成了人工智能發展的三大支柱。在當前發展態勢下,隨著國產芯片供給的增加和基礎模型的開源態勢,各方在算力和模型算法層面的差距正在不斷拉平,數據要素價值凸顯,已成為人工智能競爭的核心領域。​

“在開源實現基礎模型能力免費共享后,關鍵在於以各行各業的高質量數據集作為‘養料’,持續進行垂類場景的訓練優化,推動基礎模型在千行百業落地應用,央企有責任、有能力在打通落地‘最后一公裡’上發揮作用。”胡武婕強調。

2024年,國務院國資委規劃發展局首批啟動交通物流、綠色低碳、金融服務3個行業數據集建設試點。2025年,又接續布局智慧能源、工業制造、應急安全、醫療衛生、農業農村等7個領域數據集建設,推動央企發揮自身海量數據積澱優勢,牽引帶動產業各方深化數據要素協同共享、優化數據資源高效安全開發利用,積極探索數據資產有序合規交易流轉商業模式。

在第八屆數字中國建設峰會期間,國務院國資委集中發布首批10個行業30項央企人工智能行業高質量數據集,樹立央企典范。同時,首批成立交通物流、綠色低碳、智慧能源等三大行業中央企業數據產業共同體,后續將分批次成立其他重點行業央企數據產業共同體。這一系列舉措旨在深化數據資源開發利用和開放共享,以高質量數據集建設賦能大模型訓練、助力高價值場景落地。

一年多來,央企在應用、數據、算力、模型等方面取得了明顯成效:在場景賦能方面,通過搭建開放合作平台、擴大應用場景採購規模等方式,構建起“央企搭台、生態共舞”的協同創新格局,目前已在工業制造、能源電力、智能網聯汽車等國民經濟重點領域,布局超過500個標杆性應用場景。在數據建設方面,積極探索行業數據開發利用和共建共享機制,深度參與國家數據標注基地建設,打造一批可信數據空間、數據元件等數據要素流通基礎設施,已在交通物流、金融服務、綠色低碳等重點行業領域構建一批高質量數據集。在智能算力方面,著力打造自主可控的智算底座,建成4個國產萬卡智算中心,依托“息壤”等央企算力平台,面向全國提供算力調度服務。在基座模型方面,緊跟國際前沿,“九天”“星辰”“元景”基礎大模型具備全模態、復雜推理及智能體應用能力,建設“魔樂”開源社區、累計服務超100家企事業單位。搭建人工智能煥新服務平台,可對外提供央企算力、數據、模型等多種能力和服務。

胡武婕表示,下一步,國務院國資委將進一步推動央企“AI+”專項行動走深走實,突出應用導向,堅持自主可控,夯實產業底座,協同產業各方,加速構建一批行業高質量數據、落地一批戰略性高價值場景,助力人工智能產業健康有序發展。

(責編:江葦杭、劉卿)

分享讓更多人看到

返回頂部