大數據指無法在一定時間范圍內用常規軟件工具進行捕捉、管理和處理的數據集合,是需要新處理模式才能具有更強的決策力、洞察發現力和流程優化能力的海量、高增長率和多樣化的信息資產。
大數據包括結構化、半結構化和非結構化數據,非結構化數據越來越成為數據的主要部分。據調查報告顯示,企業中80%的數據都是非結構化數據,這些數據每年都按指數增長60%。在以云計算為代表的技術創新大幕的襯托下,這些原本看起來很難收集和使用的數據開始容易被利用起來了,通過各行各業的不斷創新,大數據會逐步為人類創造更多的價值。
國內外大數據標準化的幾大領域包括
一、基礎標準
基礎標準為整個標準體系提供包括總則、術語、參考模型等基礎性標準,是整個標準體系的基石,其重要性不言而喻。在這一領域,ISO/IEC制定了ISO/IEC 20546—《信息技術-大數據-概覽與術語》以及ISO/IEC 20547—《信息技術-大數據-參考架構》系列標準,參考架構系列標準包括框架與應用、用例與需求、參考架構、安全和隱私、標準化路線圖等5個分冊,作為大數據基礎性標準考慮得相當全面。
而ITU-T的SG13也發布了ITU-T Y.3600—《基于云計算的大數據需求與能力》,作為該研究組大數據系列標準的基礎,該標準定義了大數據生態系統中的相關角色及其活動,并規范了基于云計算的大數據的需求和能力。遺憾的是,ISO/IEC與ITU-T這兩大國際標準化組織并沒有像當初制定云計算標準時那樣聯合制定術語和參考架構這樣的基礎性標準,聯合制定的標準無疑具備更大的影響力和更高的可參考性。
二、數據標準
數據標準主要針對底層數據相關要素進行規范。包括數據資源和數據交換共享兩部分,其中數據資源包括元數據、數據元素、數據字典和數據目錄等,數據交換共享包括數據交易和數據開放共享相關標準。
大數據的核心價值在于對多個不同來源的數據進行關聯分析,因此包括數據交易、數據開放共享在內的相關標準就顯得尤為重要。只有參與方遵循共同的標準,數據的交易與開放共享才能更為高效。在這一領域,ITU-T已發布了Y.3601—《大數據-數據交換框架與需求》,同時以此為基礎正在制定《大數據-數據溯源需求》、《大數據-數據集成概覽和功能需求》、《大數據-數據保留概覽與需求》、《大數據-元數據框架與概念模型》等一系列數據標準。
三、管理標準
管理標準作為數據標準的支撐體系,貫穿于數據生命周期的各個階段,主要對數據管理、運維管理和評估三個層次進行規范。
數據是企業的寶貴資產已成為業內共識,但如何對數據資產進行有效管理目前還處在非常原始的階段,業界急需數據資產管理標準對相關工作進行規范指導。ITU-T SG16在今年7月剛剛立項了一個國際標準《數據資產管理框架》,該標準主要定義了數據資產的基本概念,梳理了數據資產管理的需求,提出了數據資產管理的框架。
在國內,CCSA成立了大數據技術標準推進委員會(CCSA TC601),其中的數據資產管理工作組專門從事數據資產管理方面的標準化研究工作,已發布了《數據資產管理實踐白皮書(2.0)》,目前正在編寫3.0版本。未來TC601將繼續進行主數據、數據標準和數據質量等標準制訂,并研究數據資產管理評估的模型。
四、安全和隱私標準
數據安全和隱私保護作為數據標準體系的重要部分,貫穿于整個數據生命周期的各個階段。大數據安全雖仍繼承了傳統數據安全保密性、完整性和可用性等特性,但也有其特殊性,主要表現在個人隱私保護、跨境數據流動等方面。歐盟于今年5月頒布的《通用數據保護條例》(General Data Protection Regulation,簡稱GDPR),也進一步凸顯了大數據時代數據隱私保護的重要性。
大數據行業的發展趨勢
趨勢一:數據的資源化
何為資源化,是指大數據成為企業和社會關注的重要戰略資源,并已成為大家爭相搶奪的新焦點。因而,企業必須要提前制定大數據營銷戰略計劃,搶占市場先機。
趨勢二:與云計算的深度結合
大數據離不開云處理,云處理為大數據提供了彈性可拓展的基礎設備,是產生大數據的平臺之一。自2013年開始,大數據技術已開始和云計算技術緊密結合,預計未來兩者關系將更為密切。除此之外,物聯網、移動互聯網等新興計算形態,也將一齊助力大數據革命,讓大數據營銷發揮出更大的影響力。
趨勢三:科學理論的突破
隨著大數據的快速發展,就像計算機和互聯網一樣,大數據很有可能是新一輪的技術革命。隨之興起的數據挖掘、機器學習和人工智能等相關技術,可能會改變數據世界里的很多算法和基礎理論,實現科學技術上的突破。
趨勢四:數據科學和數據聯盟的成立
未來,數據科學將成為一門專門的學科,被越來越多的人所認知。各大高校將設立專門的數據科學類專業,也會催生一批與之相關的新的就業崗位。與此同時,基于數據這個基礎平臺,也將建立起跨領域的數據共享平臺,之后,數據共享將擴展到企業層面,并且成為未來產業的核心一環。
趨勢五:數據泄露泛濫
未來幾年數據泄露事件的增長率也許會達到100%,除非數據在其源頭就能夠得到安全保障。可以說,在未來,每個財富500強企業都會面臨數據攻擊,無論他們是否已經做好安全防范。而所有企業,無論規模大小,都需要重新審視今天的安全定義。在財富500強企業中,超過50%將會設置首席信息安全官這一職位。企業需要從新的角度來確保自身以及客戶數據,所有數據在創建之初便需要獲得安全保障,而并非在數據保存的最后一個環節,僅僅加強后者的安全措施已被證明于事無補。
趨勢六:數據管理成為核心競爭力
數據管理成為核心競爭力,直接影響財務表現。當“數據資產是企業核心資產”的概念深入人心之后,企業對于數據管理便有了更清晰的界定,將數據管理作為企業核心競爭力,持續發展,戰略性規劃與運用數據資產,成為企業數據管理的核心。數據資產管理效率與主營業務收入增長率、銷售收入增長率顯著正相關;此外,對于具有互聯網思維的企業而言,數據資產競爭力所占比重為36.8%,數據資產的管理效果將直接影響企業的財務表現。
趨勢七:數據質量是BI(商業智能)成功的關鍵
采用自助式商業智能工具進行大數據處理的企業將會脫穎而出。其中要面臨的一個挑戰是,很多數據源會帶來大量低質量數據。想要成功,企業需要理解原始數據與數據分析之間的差距,從而消除低質量數據并通過BI獲得更佳決策。
趨勢八:數據生態系統復合化程度加強
大數據的世界不只是一個單一的、巨大的計算機網絡,而是一個由大量活動構件與多元參與者元素所構成的生態系統,終端設備提供商、基礎設施提供商、網絡服務提供商、網絡接入服務提供商、數據服務使能者、數據服務提供商、觸點服務、數據服務零售商等等一系列的參與者共同構建的生態系統。
如今,這樣一套數據生態系統的基本雛形已然形成,接下來的發展將趨向于系統內部角色的細分,也就是市場的細分;系統機制的調整,也就是商業模式的創新;系統結構的調整,也就是競爭環境的調整等等,從而使得數據生態系統復合化程度逐漸增強。
文章來源: 互聯網/OFweek