隨著新興信息技術的發展及廣泛應用,人類社會已經進入數據爆發式增長時代,數據治理能力正在成為組織新優勢,大數據的價值愈發凸現。2015年,國務院發布《促進大數據發展行動綱要》,標志著大數據在我國的發展與應用上升到國家戰略層面。2016年,《政務信息資源共享管理暫行辦法》出臺,明確共享開放是原則,非共享開放是例外。在國家政策的推動下,全國卷起一股大數據應用熱潮,各地紛紛建設政務大數據平臺,各種數據中心雨后春筍般的急劇發展。然而,在看似前景大好背后,許多政府還停留在趕時髦或炒概念階段,一味“建機房、上設備、堆數據”,缺乏基礎工作和統籌工作、頂層設計工作,數據“少”、“差”、“死”、“亂”等現象不斷發生。

 
  那么如何改善這種現象,快速提升我國政務大數據的能力和水平?從信息生命周期的角度,我們要保證數據來源清晰、傳播無阻、使用無礙、維護簡單。這個過程中,數據基因系統起到了關鍵性的作用。
 
  來源清晰。傳統的信息系統,僅為滿足特定功能而生,數據結構差異性大,大量數據存放于歷史遺留應用中,委辦局間碎片化、零散化、低效率的數據交互和分析普遍存在,導致政府數據來源極為復雜,不可直接使用。而數據基因系統,可通過對城市機房、服務器、應用系統、數據庫等數據資產的梳理,建立部門數據資產清單,通過系統建立之間的相互關系,理清楚系統與系統之間、系統與數據庫、表之間、數據與數據之間的關系,實現數據—數據表—數據庫—應用系統—服務器—機房(云)的關系展現,確保每個信息來源清晰。
 
  傳輸無阻。信息從一個系統傳輸到另外一個系統的前提是兩個系統擁有相同標準的數據元。而目前,政府通常的做法是建設一個交換共享平臺,通過這個平臺使不同系統的數據得以共享和交換,然而這需要花費大量的時間和資金,比如需要開發系統接口,有多少系統,就要多少接口,對于新建的系統也一樣。事實上,政府不同部門每年都需要建立大量的信息系統,因此需要不斷開發接口來進行共享。那么是不是可以直接做一套標準,讓后續系統都按照這個標準設置數據,如此系統間便可實現直接交換?答案是肯定的,數據基因系統最大的特點是通過對各部門、各應用系統數據元池的清洗比對,篩選出各部門共性、關鍵的主數據,建立涉及核心數據的標準字段池,對字段的命名、格式、長度等屬性進行規范。如果新增的系統也是按照這套標準開發,則無需開發新的接口,可直接與交換共享平臺進行無縫對接,省時省力。
 
  使用無礙。使用是指在信息到達最終用戶手中后對數據進行的分析、統計和以其為基礎進行管理和決策。礙,一方面是體制機制的原因,一方面是數據本身的原因,比如數據不能用、不好用等。政務大數據應用牽扯到很多關聯部門,存在著利益主體及相關者,如果一味建數據中心、數據平臺,忽視數據的信息規則,導致許多部門有理由“扯皮”或“推脫”,不愿將數據開放共享,數據中心和數據平臺數據嚴重缺失或數據復用率極其低下。因此,為確保數據使用無礙,亟需建立一個健壯的信息體系,使數據活化,各部門用起來順心和放心。借助數據基因系統,可建立有序的信息規則,從網絡、系統、數據庫、制度、標準等多方面保障信息最大程度的共享與開放,從根本和底層上解決了數據發展難題,并有助于信息體系的成長發展。此外,數據基因系統還擁有強大的大數據分析能力,不僅可以直觀顯示各部門信息資源、數據元數量統計情況,各部門信息資源、數據元共享、開放情況,還能輔助數據質量建設,通過關聯分析,了解各應用系統之間數據標準體系的建設情況。
 
  維護簡單。維護是指對數據的管理,這種管理包括存放、讀取、傳輸、拷貝、備份等。如何讓數據維護簡單,一是統性能卓越,本身不易出錯,二是操作方便,業務人員能夠迅速處理各項需求。國脈互聯董事長、浙江大學客座教授楊冰之最近有個新觀點,數據與系統分離是未來數據體系的主要方向。如何理解呢,一般我們新建一個系統時,需要新建一個數據庫做支撐,那么在維護時,需要對這個數據庫進行維護,如果系統功能非常復雜,維護起來是相當吃力的。而通過數據基因系統,未來的系統不需要再新建一個數據庫,而是直接從數據基因系統數據庫中抽取所需要的數據,如果新系統的數據基因系統沒有,則可在基因系統中增加相應的數據,即數據與系統分離。這樣做的好處,一個是確保所有數據具有穩定性、統一性,可復制性、可剪輯性,保障內部信息的規則的一致性,二是極大降低了維護成本,新系統的開發運維只需要關注如何創新應用,不再需要考慮數據如何維護。三是可滿足多部門、多用戶、跨平臺的數據查詢、訂閱、共享等需求,統一調度與處理。
 
  隨著政務大數據的發展,各地政府亟需進行統一的數據標準和規劃,解決因條塊分割問題嚴重而形成的“數據孤島”,“信息煙囪”,真正實現各地、各系統政務數據的互聯互通、共享共用、開放運營和融合應用。
 
  作者:國脈研究員陳樂燕
責任編輯:admin