楠木軒

礦床與地質大資料研究前景

由 梁丘憐翠 釋出於 科技

大資料的世界是一個由大量活動構件與多元參與者元素所構成的生態系統,終端裝置提供商、基礎設施提供商、網路服務提供商、網路接入服務提供商、資料服務使能者、資料服務提供商、觸點服務、資料服務零售商等一系列的參與者共同構建的生態系統。資料的資源化、與雲計算的深度結合、高效的資料管理及資料生態系統複合化程度的加強將是大資料研究的趨勢。

基於大資料分析技術,大資料分析應包括以下幾方面的基本內容。

1. 資料探勘

大資料分析的理論核心就是資料探勘演算法。不同的資料型別和格式,需要不同的資料探勘演算法,以更加科學地呈現資料本身具備的特點。各種多元統計方法,由於能透過相關關係挖掘出深度價值,因此是重要的資料探勘分析工具。

2. 預測性分析

大資料表徵的是過去,但可以用來預測未來的變化。預測性分析是大資料分析最終應用的重要領域之一,它從大資料中挖掘出特點,透過科學建模型,代入新資料,即可預測未來。

3. 資料視覺化分析

大資料視覺化是大資料分析的基本要求,它可以直觀地呈現大資料特點,同時能夠非常容易地被人類所接受。常見的視覺化技術包括基於集合、圖示、影象的技術,面向畫素的技術和分散式技術等。

4. 語義引擎構建

由於資料採集的多元化,資料型別的非結構化,如何將多樣的資訊轉化成計算機可以識別和計算的語言是進行大資料分析的基礎。

5. 資料管理

在地質時空大資料模型構建中,資料融合是基礎性的研究課題,它貫穿於礦床與地質研究物件認知模型、礦床與地質時空資料感知模型、礦床與地質時空資料分析模型、礦床與地質時空資料探勘模型、礦床與地質時空資料預測模型及地質時空資料決策模型的研究中。

各類專題的地質時空大資料鏈組織與實現,有賴於地質時空大資料平臺的系統解決方案和整體架構,以及資料融合方法和技術研究,有賴於超算環境下礦床與地質時空大資料索引、排程機制和大資料引擎,有賴於建立統一的運行雲平臺及智慧監測、預警與管控的資料鏈,發展礦床與地質時空大資料的安全儲存、檢索與隱蔽傳輸方法和技術。

未來的大資料研究,將嚴重依賴於大資料平臺的建設。平臺建設需要從以下幾方面著力。

1. 建立一套執行機制

大資料建設是一項有序的、動態的、可持續發展的系統工程,必須建立良好的執行機制,以促進建設過程中各個環節的正規有序,實現統合,搞好頂層設計。

2. 規範一套建設標準

沒有標準就沒有系統。應建立面向不同主題、覆蓋各個領域、不斷動態更新的大資料建設標準,為實現各級各類資訊系統的網路互連、資訊互通、資源共享奠定基礎。

3. 搭建一個共享平臺

資料只有不斷流動和充分共享,才有生命力。應在各專用資料庫建設的基礎上,透過資料整合,實現各級各類指揮資訊系統的資料交換和資料共享。

4. 培養一支專業隊伍

大資料建設的每個環節都需要依靠專業人員完成,因此,必須培養和造就一支懂指揮、懂技術、懂管理的大資料建設專業隊伍。

其中,大資料平臺是基礎資料平臺,用於統一組織、儲存和管理相關部門的全部工作資料,實現基礎資料、地理資訊資料和業務資料的共享,提高業務管理、應急處理、服綜合管理和分析決策能力。

礦床與地質大資料研究前景

礦床與地質時空資料除擁有一般大資料的“4V”共性特徵外,也有自己顯著的個性特點,突出體現在其專業背景特點上。對礦床與地質領域的不同來源、不同獲取方式、不同結構及不同格式的離散資料,開展結構化重建、關聯分析、地學建模,將加速地學知識的融匯,深化對地球系統的認識和理解,有望引發地球科學研究方式的變革。

大資料理念和分析技術應用將是成礦規律研究的重要內容。成礦規律研究將更充分地利用與“礦”有關的各種資料,包括在一定的地質歷史時期或構造運動階段,在一定的地質構造單元及構造部位,與一定的地質成礦作用有關的時間、空間、成因及礦床產狀的資料,還包括龐大的礦床成因方面的資料資訊(如成礦溫度、成礦壓力、流體包裹體、同位素、微量元素等礦床地球化學資料)。

地質調查大資料研究,將針對以往解決的不理想的地質問題入手,充分利用新一代資訊科技,更新當前資料處理環境,著重進行地質資料的智慧分析與深度挖掘。在大資料處理方法上,將建立基於統一基礎地理空間的多源資料整合與管理系統,將地質、構造、礦點、地球物理、地球化學、遙感鑽孔等各類資料整合到統一的資料庫中,利用雲計算、大資料等方法,對多源綜合資料進行整合、展示、分析和挖掘,由此建立資料驅動的成礦遠景圖件。同時,開展有效的三維模擬(主要是反演),目前已有的三維地質建模軟體(如國外的GOCAD、MVS、MicroStation、Surpac,國內的QuantyView、GeoView、GeoMo3D、Titan3DM 等)將得到進一步的最佳化和功能拓展。

礦床與地質大資料研究已有一定的基礎。例如,加拿大Diagnos 公司在過去10年中為不同礦產勘查公司完成了數百個大資料分析、挖掘,進而圈定靶區的專案。這些專案位於加拿大魁北克、安大略、新不倫瑞克、紐芬蘭,美國內華達州,多明尼加共和國,墨西哥,布吉納法索,以及坦尚尼亞等地。2011 年,Diagnos 公司編制了加拿大魁北克西北地區金、銅、銀、鋅和鎳的成礦遠景圖,覆蓋面積33.09萬km2。2012 年便取得了總計5242個礦權(佔地2335km2),覆蓋了最有遠景和未勘查的目標。

深部找礦靶區的預測是未來5~10 年礦床學研究的新熱點,大資料分析成為不可或缺的技術。多元資料的整合,以及不同學科、不同尺度的資料在三維空間的對比分析是其重要途徑。這方面的研究基礎包括澳大利亞以找礦為目的開展的四維地質填圖;荷蘭建立的全國1000m 以淺的3D 地層框架模型;加拿大將三維地質填圖用於盆地地下水調查;英國建立的全國4 個尺度的三維地層框架模型;法國在地質調查等諸多領域開展三維地質建模;德國在北部多個盆地進行跨界三維地質建模;美國針對資源與環境評價開展三維地質框架研究等。

我國長期地質調查和探測取得的海量地質基礎調查資料,將是超級計算機服務的重點物件之一。六年蟬聯世界第一的“天河二號”超級計算機落戶中山大學,並委託中山大學管理,可以成為強大的技術支撐平臺。“天河二號”系統集高效能計算、大資料分析和雲計算於一體,能高效地處理普通雲計算不能處理的計算密集型問題,並能滿足對複雜大資料開展精準、實時分析的需求。