|
| ——探訪國家青藏高原科學(xué)數(shù)據(jù)中心 |
在成都飛往拉薩的航班上,透過飛機(jī)舷窗俯瞰,青藏高原雪峰如海,冰川如練。這片250萬平方公里的土地,既是世人眼中的“世界屋脊”,更是孕育了長江、黃河、雅魯藏布江等10多條大江大河的“亞洲水塔”。
然而,要算清這座水塔的水量賬,過去幾乎是不可能的事。“當(dāng)?shù)匮鯕庀”�、溫度低、風(fēng)雪大、輻射強(qiáng),導(dǎo)致普通監(jiān)測儀器故障率高、壽命短、維護(hù)也極為困難。”中國科學(xué)院青藏高原研究所研究員李新說,“就算儀器扛住了高寒低溫的惡劣環(huán)境,數(shù)據(jù)也很難傳回來。”
如今,這個(gè)局面正在被改變。在北京林萃路,一個(gè)由十幾名研究員領(lǐng)銜的“數(shù)據(jù)工廠”——國家青藏高原科學(xué)數(shù)據(jù)中心(以下簡稱“中心”),正在為“亞洲水塔”打造可靠的數(shù)字底座。截至今年5月,中心發(fā)布的數(shù)據(jù)集總數(shù)達(dá)8585個(gè),累計(jì)下載量達(dá)6PB。
攻克數(shù)據(jù)關(guān)卡
“青藏高原的每一組數(shù)據(jù),都來之不易。”中心主任李新說。
高原上,冬天零下二三十度是家常便飯,普通監(jiān)測設(shè)備撐不過一個(gè)冬天就“罷工”。“有時(shí)候辛辛苦苦把設(shè)備架好,第二年開春去看,已經(jīng)被風(fēng)吹雪掩,無法使用了。”李新說。
即便設(shè)備扛住了,青藏高原近80%的地區(qū)沒有通訊網(wǎng)絡(luò)覆蓋,4G信號(hào)更是奢望,數(shù)據(jù)存在存儲(chǔ)卡里,就是傳不出來。過去,科考隊(duì)只能一次次進(jìn)山,靠人工下載取回?cái)?shù)據(jù)。“雅魯藏布江大峽谷就是典型的‘通信盲區(qū)’,高山深谷人力難以到達(dá),很難采集到有效數(shù)據(jù)并傳輸?shù)街行摹?rdquo;李新感慨道。
為解決這些難題,中心自主研發(fā)了適應(yīng)高寒極端環(huán)境的衛(wèi)星物聯(lián)網(wǎng)觀測終端,還研制出無人機(jī)高速中繼系統(tǒng)、無人機(jī)載徑流監(jiān)測系統(tǒng)、“智能鷹眼”等新裝備,硬是在高原上織起了一張“天—空—地”立體監(jiān)測網(wǎng)。
天基層面,中心整合高分系列衛(wèi)星、風(fēng)云系列衛(wèi)星等國產(chǎn)衛(wèi)星及國際衛(wèi)星資源,實(shí)現(xiàn)對(duì)青藏高原全域的周期性監(jiān)測;空基層面,運(yùn)用無人機(jī)搭載多種智能載荷,對(duì)冰川凍土、雅魯藏布江大峽谷、拉魯濕地等重點(diǎn)區(qū)域?qū)嵤└叻直媛�、高頻次觀測;地基層面,通過在六大流域24個(gè)地面觀測站部署中心研發(fā)的物聯(lián)網(wǎng)監(jiān)測信息系統(tǒng),持續(xù)采集水文、氣象、生態(tài)等62類關(guān)鍵指標(biāo)的原位數(shù)據(jù),累計(jì)接收數(shù)據(jù)超過20億條。
此外,中心還建立了覆蓋數(shù)據(jù)全生命周期的動(dòng)態(tài)安全管理機(jī)制,為每個(gè)數(shù)據(jù)集賦予全球唯一的DOI“身份證”,實(shí)現(xiàn)數(shù)據(jù)精準(zhǔn)溯源。
讓數(shù)據(jù)“活”起來
在做好數(shù)據(jù)存檔的同時(shí),中心還致力于讓數(shù)據(jù)真正“活”起來,釋放其科學(xué)價(jià)值。一組數(shù)字足以說明其效果:中心注冊(cè)用戶超過14萬,2025年平臺(tái)數(shù)據(jù)下載量超過2100TB、頁面訪問量超過1.65億次;三分之二的數(shù)據(jù)完全公開、免注冊(cè)下載,國際下載占比高達(dá)27%……
“第三方測評(píng)機(jī)構(gòu)按可查找、可訪問、可互操作、可重用原則評(píng)估地學(xué)領(lǐng)域的數(shù)據(jù)中心,我們中心多次獲得第一。雖然我們的數(shù)據(jù)量不算大,但下載量和流通速度常年排名靠前。”中國科學(xué)院青藏高原研究所研究員、國家青藏高原科學(xué)數(shù)據(jù)中心副主任馮敏告訴記者。
在國家數(shù)據(jù)中心體系里,中心率先引入同行評(píng)審機(jī)制。每個(gè)數(shù)據(jù)集不僅要先技術(shù)評(píng)審,檢查完整性、元數(shù)據(jù)規(guī)范性,還要送專家?guī)爝M(jìn)行同行評(píng)議。
“專家要打開數(shù)據(jù)、檢查方法、評(píng)估精度,并給出反饋,這相當(dāng)于給數(shù)據(jù)做一次‘學(xué)術(shù)審稿’。像期刊審稿一樣,專家不僅指出問題,更提出建議,幫助數(shù)據(jù)提交者改進(jìn)。”馮敏說,依托在線數(shù)據(jù)庫運(yùn)作系統(tǒng),觀測數(shù)據(jù)中哪個(gè)數(shù)值異常、什么時(shí)候采集的、誰采集的,都能追溯到。
得益于嚴(yán)格的質(zhì)量把控,中心的數(shù)據(jù)產(chǎn)品開始在高水平科學(xué)研究中發(fā)揮關(guān)鍵作用。以青藏高原湖泊研究為例,依托中心數(shù)據(jù)產(chǎn)品,科學(xué)家對(duì)湖泊數(shù)量、面積、水量變化有了更精準(zhǔn)的把握,支撐了一系列高水平成果的產(chǎn)出;研制的首套中國區(qū)域75年長時(shí)序近地面氣象驅(qū)動(dòng)數(shù)據(jù),已成為高原氣候變化研究和工程安全評(píng)估的關(guān)鍵數(shù)據(jù);全球地表太陽輻射數(shù)據(jù),為新能源資源評(píng)估提供了重要依據(jù)。
截至今年4月,對(duì)中心表示致謝的論文已超過11000篇,且數(shù)量呈快速上升態(tài)勢。2025年10月,中心申報(bào)的“地球大數(shù)據(jù)創(chuàng)新青藏高原高質(zhì)量數(shù)據(jù)集”入選國家數(shù)據(jù)局發(fā)布的“高質(zhì)量數(shù)據(jù)集典型案例”,總規(guī)模超過600TB。
數(shù)據(jù)不光支撐科研,還直接服務(wù)國家需求和產(chǎn)業(yè)發(fā)展。“中心發(fā)布的數(shù)據(jù)已應(yīng)用于川藏鐵路建設(shè)、雅魯藏布江下游水電工程、冰湖潰決應(yīng)對(duì)等國家重大工程;同時(shí),還有多家企業(yè)依托中心發(fā)布的產(chǎn)品,優(yōu)化了產(chǎn)業(yè)布局,比如比亞迪汽車股份有限公司利用中心共享的太陽輻射、植被、社會(huì)經(jīng)濟(jì)數(shù)據(jù)進(jìn)行了大數(shù)據(jù)分析,助力公司決策。”李新說。
AI賦能地球“管理”
當(dāng)前,人工智能(AI)賦能千行百業(yè)的熱潮正席卷而來。在地球科學(xué)領(lǐng)域,遙感、地理信息雖已廣泛引入AI,但在支撐地球系統(tǒng)預(yù)測和決策層面,AI的潛力仍未得到充分釋放。“如何讓AI真正理解地球系統(tǒng)的復(fù)雜過程,依然是一個(gè)難題。”李新說。
這正是中心團(tuán)隊(duì)選擇深入研究的方向。在數(shù)據(jù)產(chǎn)品研發(fā)上,中心已建立起“多源觀測+AI智能融合+物理模型同化”的復(fù)合生產(chǎn)模式。針對(duì)青藏高原復(fù)雜的地形、氣候環(huán)境,中心通過融合多源觀測和模型模擬結(jié)果,生成了高分辨率氣候驅(qū)動(dòng)、冰川湖泊分布與變化等一系列數(shù)據(jù)產(chǎn)品。其中,中國區(qū)域氣象要素驅(qū)動(dòng)數(shù)據(jù)集兩套版本累計(jì)被瀏覽31萬余次、下載4.4萬余次。
“數(shù)據(jù)產(chǎn)品的價(jià)值,最終要看科學(xué)家能不能直接拿來用。AI幫我們解決了復(fù)雜環(huán)境下數(shù)據(jù)生產(chǎn)的效率問題,但每一個(gè)產(chǎn)品背后,都還需要實(shí)測數(shù)據(jù)的校準(zhǔn)和專家的把關(guān)。”馮敏說。
在此基礎(chǔ)上,中心正將目光投向更具挑戰(zhàn)性的目標(biāo)——地球系統(tǒng)的建模與數(shù)字孿生。中心團(tuán)隊(duì)提出了“AI驅(qū)動(dòng)的青藏高原觀測—數(shù)據(jù)—模型一體化”框架,探索引入多主體強(qiáng)化學(xué)習(xí)方法,讓多個(gè)智能體在虛擬環(huán)境中模擬推演氣溫上升、冰川消融、湖泊擴(kuò)張、人類適應(yīng)等過程的演變規(guī)律,為地球系統(tǒng)預(yù)測和災(zāi)害預(yù)警提供決策支持。
“與通用大語言模型不同,我們更強(qiáng)調(diào)在地球系統(tǒng)預(yù)測和決策中發(fā)揮作用。不僅要預(yù)測,更要能評(píng)估決策干預(yù)的效果;不僅要技術(shù)上可行,更要對(duì)實(shí)際有用。”李新說。
面向未來,中心與中國科學(xué)院磐石模型團(tuán)隊(duì)、浦江實(shí)驗(yàn)室團(tuán)隊(duì)等團(tuán)隊(duì)交流,探索數(shù)據(jù)同化、強(qiáng)化學(xué)習(xí)、因果分析在數(shù)字孿生地球中的結(jié)合,逐步構(gòu)建能夠模擬和預(yù)測高原地球系統(tǒng)變化的數(shù)字孿生平臺(tái)。“我們希望數(shù)據(jù)不只是記錄高原發(fā)生了什么,更能為理解高原變化的機(jī)制、應(yīng)對(duì)未來的不確定性提供科學(xué)依據(jù)。”李新說。
從破解“獲取難、傳輸難”到擁抱“AI”,這群在高原上“追數(shù)據(jù)”的人,正以數(shù)據(jù)為筆,在雪域高原書寫新的可能。