概念特征
隨著“云計算”、“互聯(lián)網(wǎng)”、“物聯(lián)網(wǎng)”的快速發(fā)展,大數(shù)據(jù)也吸引了越來越多的關(guān)注,成為社會熱點之一。從2001 年“大數(shù)據(jù)”一詞在Gartner的研究報告出現(xiàn)至今,業(yè)內(nèi)對“大數(shù)據(jù)”一詞的定義仍未統(tǒng)一。Gartner 給出了這樣的定義,“大數(shù)據(jù)”是需要新處理模式才能具有更強的決策力、洞察發(fā)現(xiàn)力和流程優(yōu)化能力的海量、高增長率和多樣化的信息資產(chǎn)。
麥肯錫全球研究所對“大數(shù)據(jù)”給出的定義是:一種規(guī)模大到在獲取、存儲、管理、分析方面大大超出了傳統(tǒng)數(shù)據(jù)庫軟件工具能力范圍的數(shù)據(jù)集合,具有海量的數(shù)據(jù)規(guī)模、快速的數(shù)據(jù)流轉(zhuǎn)、多樣的數(shù)據(jù)類型和價值密度低四大特征。
業(yè)界通常用4個V(即Volume、Velocity、Variety、Value)來概括大數(shù)據(jù)的特征。
1、海量的數(shù)據(jù)規(guī)模(Volume)數(shù)據(jù)量大,存儲單位從GB到TB,直至PB、EB。隨著信息技術(shù)的高速發(fā)展,數(shù)據(jù)開始爆發(fā)性增長,社交網(wǎng)絡(微博、推特、臉書等)、移動網(wǎng)絡、各種智能終端等,都成為數(shù)據(jù)的來源。
2、快速的數(shù)據(jù)流轉(zhuǎn)(Velocity)大數(shù)據(jù)的交換和傳播是通過互聯(lián)網(wǎng)、云計算等方式實現(xiàn)的,遠比傳統(tǒng)媒介的信息交換和傳播速度快捷。大數(shù)據(jù)對處理數(shù)據(jù)的響應速度有非常嚴格的要求,要求快速響應,市場變化快,實時分析而非批量分析,數(shù)據(jù)輸入、處理與丟棄立刻見效。數(shù)據(jù)的增長速度和處理速度是大數(shù)據(jù)高速性的重要體現(xiàn)。
3、多樣的數(shù)據(jù)類型(Variety)不同的數(shù)據(jù)源,非結(jié)構(gòu)化數(shù)據(jù)如視頻、圖片、音頻等,其特點是數(shù)據(jù)間沒有因果關(guān)系;以及半結(jié)構(gòu)化數(shù)據(jù)如HTML文檔、郵件、網(wǎng)頁等,其特點是數(shù)據(jù)問的因果關(guān)系弱。這種類型的數(shù)據(jù)將會越來越多,需要進行清洗,整理,篩選等操作,變?yōu)榻Y(jié)構(gòu)數(shù)據(jù)。
4、價值密度低(Value)價值密度的高低與數(shù)據(jù)總量的大小成反比。由于數(shù)據(jù)采集的不及時,數(shù)據(jù)樣本不全面,數(shù)據(jù)可能不連續(xù)等等,數(shù)據(jù)可能會失真,但當數(shù)據(jù)量達到一定規(guī)模,可以通過更多的數(shù)據(jù)達到更真實全面的反饋。如何通過強大的機器算法更迅速地完成數(shù)據(jù)的價值“提純”成為目前大數(shù)據(jù)背景下亟待解決的難題。
大數(shù)據(jù)產(chǎn)業(yè)鏈包括一切與大數(shù)據(jù)的產(chǎn)生與集聚(數(shù)據(jù)源)、組織與管理(存儲)、分析與發(fā)現(xiàn)(技術(shù))、交易、應用與衍生產(chǎn)業(yè)相關(guān)的所有活動。大數(shù)據(jù)產(chǎn)業(yè)鏈按照數(shù)據(jù)價值實現(xiàn)流程,包括數(shù)據(jù)源、大數(shù)據(jù)硬件支撐層、大數(shù)據(jù)技術(shù)層、大數(shù)據(jù)交易層、大數(shù)據(jù)應用層與大數(shù)據(jù)衍生層等六大層級,每一層都包含相應的IT 硬件設施、軟件技術(shù)與信息服務等。
1、數(shù)據(jù)源
數(shù)據(jù)源是大數(shù)據(jù)產(chǎn)業(yè)鏈的第一個環(huán)節(jié),是大數(shù)據(jù)產(chǎn)業(yè)發(fā)展的基礎(chǔ)。目前數(shù)據(jù)源主要集中在政府管理部門、互聯(lián)網(wǎng)巨頭、移動通訊企業(yè)等手中,具體有政府數(shù)據(jù)源提供商、行業(yè)數(shù)據(jù)源提供商、企業(yè)數(shù)據(jù)源提供商、互聯(lián)網(wǎng)數(shù)據(jù)源提供商、物聯(lián)網(wǎng)數(shù)據(jù)源提供商、移動通訊數(shù)據(jù)源提供商、第三方數(shù)據(jù)服務企業(yè)等等。
2、大數(shù)據(jù)硬件支撐層
大數(shù)據(jù)硬件是指數(shù)據(jù)產(chǎn)生、采集、傳輸、存儲、計算等一系列與大數(shù)據(jù)產(chǎn)業(yè)鏈相關(guān)的硬件設備。包含傳感器、移動智能終端、各種有線/無線傳輸設備、存儲設備、服務器、網(wǎng)絡/安全設備等。國內(nèi)目前缺少面向大數(shù)據(jù)的成熟系統(tǒng),參與者多是正在試圖轉(zhuǎn)型的傳統(tǒng)IT 廠商,如華為、浪潮、聯(lián)想、曙光等公司。
3、大數(shù)據(jù)技術(shù)層
大數(shù)據(jù)技術(shù)層是指實現(xiàn)一切大數(shù)據(jù)采集與預處理、存儲管理、大數(shù)據(jù)分析挖掘、大數(shù)據(jù)安全和大數(shù)據(jù)可視化的技術(shù)手段,是大數(shù)據(jù)價值實現(xiàn)的重要條件。
4、大數(shù)據(jù)交易層
大數(shù)據(jù)交易層細分主要包括大數(shù)據(jù)資產(chǎn)評估、大數(shù)據(jù)指數(shù)、大數(shù)據(jù)定價、大數(shù)據(jù)交易、數(shù)據(jù)撮合、大數(shù)據(jù)基金、大數(shù)據(jù)信托、大數(shù)據(jù)期貨、大數(shù)據(jù)融資、大數(shù)據(jù)確權(quán)、大數(shù)據(jù)托管、大數(shù)據(jù)全生命周期管理、大數(shù)據(jù)交易標準等等。
5、大數(shù)據(jù)應用層
大數(shù)據(jù)的價值最終體現(xiàn)在大數(shù)據(jù)的應用上,大數(shù)據(jù)應用層是大數(shù)據(jù)價值最大化一個環(huán)節(jié)。整體而言,全球的大數(shù)據(jù)應用處于發(fā)展初期,中國大數(shù)據(jù)應用才剛剛起步。目前,大數(shù)據(jù)應用在各行各業(yè)的發(fā)展呈現(xiàn)“階梯式”格局:互聯(lián)網(wǎng)行業(yè)是大數(shù)據(jù)應用的領(lǐng)跑者,政府、金融、電信、交通、醫(yī)療等領(lǐng)域積極嘗試大數(shù)據(jù),其中政府、金融會在近幾年呈現(xiàn)爆發(fā)式增長。
6、大數(shù)據(jù)衍生層
大數(shù)據(jù)衍生層是指基于大數(shù)據(jù)分析和應用而衍生出來的各種新業(yè)態(tài)。大數(shù)據(jù)產(chǎn)業(yè)鏈衍生層目前主要包含互聯(lián)網(wǎng)理財、互聯(lián)網(wǎng)基金、大數(shù)據(jù)金融、大數(shù)據(jù)咨詢、大數(shù)據(jù)標準、大數(shù)據(jù)知識庫、大數(shù)據(jù)雙創(chuàng)平臺等等。
近年來,在傳統(tǒng)能源供應日趨緊張,環(huán)境保護壓力加大的背景下,新能源成為我國重要的能源戰(zhàn)略。
隨著現(xiàn)代生命科學快速發(fā)展,以及生物技術(shù)與信息、材料、能源等技術(shù)加速融合,高通量測序、基因組編輯和生物信息分析等現(xiàn)代生物技術(shù)突破與產(chǎn)業(yè)化快速演進,生物經(jīng)濟正加速成為繼信息經(jīng)濟后新的經(jīng)濟形態(tài),對人類生產(chǎn)生活產(chǎn)生深遠影響。
新能源汽車行業(yè)涉及國家能源安全、環(huán)保以及汽車產(chǎn)業(yè)興衰等,目前世界主要汽車大國美/歐/日/韓等都已相繼對新能源汽車行業(yè)進行了一系列戰(zhàn)略布局,國內(nèi)主要車企也相繼提出了各自的新能源汽車戰(zhàn)略,新能源汽車產(chǎn)業(yè)化、本土化浪潮勢不可擋。