台灣電力股份有限公司8月26日招標「大數據及資料共享平台建置」,預算78,750,000元。評選委員為方鄒昭聰、葉麗雲、詹志銘、唐國華、劉天賜、余素貞、王金墩、李亦堅、李信璋(後四位任職台電)。
據台電公司指出,這項專案規劃建置一全公司共用之大數據及資料共享平台,其內容主要包括「資料交換平台」、「資料儲存及運算平台」、「視覺化資料分析平台」等3大單元。
台電公司表示,需求功能為:
一、資料交換平台
提供資料接收(Data Receipt)、資料驗證及品保(Data Validation or Quality Assurance) 及資料轉換(Translation)等功能,透過自動化排程機制,有效管理資料傳輸流程,並可統一監控各資料傳送過程及流向,減少人員介入操作及風險,且具備資料稽核記錄,確保資料完整傳送。
二、資料儲存及運算平台
提供各單位大數據運用所需之高速計算、資料儲存及程式語言開發之資源,能有效地管理及調配硬軟體資源,且具有高擴充性,可在不更改既有軟硬體設計下進行水平擴充,提升整體資料存放容量及運算效能。
在高速計算方面,提供高效能的分散式運算(Distributed computing)環境,並具有記憶體運算(In-memory computing)特點,能夠於極短時間內進行大量的資料處理分析,滿足不同分析應用的計算需求。
在資料儲存方面,採用資料湖泊加資料倉儲之混和式架構,提供大數據分析應用所需之儲存空間,可支援結構化、半結構化及非結構化等資料格式,以存放各單位分享之資料集。
在程式語言開發方面,提供互動式的整合性開發環境,方便存取資料集及程式碼,並具備版本管控功能,可協助使用者有效管理相關資源。
三、視覺化資料分析平台:
提供視覺化分析工具,可藉由拖拉方式快速建立多種互動式報表,支援多種圖形表達,有助於觀察出以其他資料呈現方式不易察覺到的資料特性。同時,提供各種統計或決策分析之元件,使用者並可依需要自由搭配設計,並能以互動式進行操作,快速進行資料分析,且可整合程式語言,引用程式語言提供之演算法或分析模型。
Comments