許多公司已經(jīng)在積極使用大數(shù)據(jù),只是它們沒(méi)有稱之為大數(shù)據(jù)罷了。雖然“大數(shù)據(jù)”一詞有諸多爭(zhēng)議,可是這項(xiàng)技術(shù)還是變得對(duì)公司業(yè)務(wù)來(lái)說(shuō)必不可少。
大數(shù)據(jù)
據(jù)Dresner咨詢服務(wù)公司的一項(xiàng)新調(diào)查顯示,結(jié)果發(fā)現(xiàn),沒(méi)有人知道大數(shù)據(jù)到底是啥東西;大概同樣數(shù)量的公司實(shí)際上在用大數(shù)據(jù)處理有意義的任務(wù)。
是不是覺(jué)得很吃驚?
你應(yīng)該不會(huì)吃驚。畢竟,盡管多年前就有人預(yù)言大數(shù)據(jù),可是大多數(shù)公司仍在努力將小數(shù)據(jù)充分利用起來(lái)。
這倒不是說(shuō)大數(shù)據(jù)并不是很重要,也不是說(shuō)如今許多公司沒(méi)有從數(shù)據(jù)中獲得重大價(jià)值。大數(shù)據(jù)很重要,許多公司也在從數(shù)據(jù)切實(shí)獲得好處。但是,想從大數(shù)據(jù)獲得價(jià)值,許 多公司首先要變得務(wù)實(shí)。
誰(shuí)需要大數(shù)據(jù)?
正如Datamation雜志的詹姆斯·馬奎爾(James Maguire)所寫(xiě),Dresner咨詢服務(wù)公司并沒(méi)有看到大數(shù)據(jù)大范圍采用的現(xiàn)象。
只有17%的公司承認(rèn)如今在使用大數(shù)據(jù),另有47%推遲到未來(lái)使用,但何時(shí)使用還不確定。如此看來(lái),難怪報(bào)告的作者得出結(jié)論:“盡管經(jīng)過(guò)了長(zhǎng)期的造聲勢(shì)和炒作,可是眼下,大數(shù)據(jù)分析技術(shù)的實(shí)際部署還是無(wú)法廣泛適用于大多數(shù)企業(yè)組織?!?
大數(shù)據(jù),啥也不是?
答案是否定的。畢竟,報(bào)告的調(diào)查對(duì)象中59%又聲稱,大數(shù)據(jù)“至關(guān)重要”,盡管明顯沒(méi)有用大數(shù)據(jù)來(lái)處理任何任務(wù)。顯然這里有某個(gè)因素在作祟……
我認(rèn)為,這“某個(gè)因素”完全是確定性的。
你不斷使用那個(gè)詞……
早在2012年,NewVantage Partners就顛覆了公眾對(duì)于大數(shù)據(jù)中的“大”的實(shí)際含義的認(rèn)識(shí)。盡管媒體大肆報(bào)道PB級(jí)數(shù)據(jù)問(wèn)題,幕后推手基本上是Hadoop及其生態(tài)系統(tǒng)的廠商,但事實(shí)上,大多數(shù)公司并不存在所謂的PB級(jí)數(shù)據(jù)問(wèn)題。
正如這項(xiàng)調(diào)查所發(fā)現(xiàn)的那樣,大多數(shù)公司面臨的主要問(wèn)題還是數(shù)據(jù)的種類(lèi)和速度。
市場(chǎng)終于開(kāi)始心領(lǐng)神會(huì),將越來(lái)越多的資金投入到可以更輕松地管理不同類(lèi)型數(shù)據(jù)的技術(shù)(比如MongoDB等NoSQL數(shù)據(jù)庫(kù)和DataStax版本的Cassandra),以及處理流數(shù)據(jù)的技術(shù)(比如Apache Spark)。
與此同時(shí),企業(yè)繼續(xù)求助于更傳統(tǒng)的數(shù)據(jù)基礎(chǔ)設(shè)施,比如甲骨文數(shù)據(jù)基礎(chǔ)設(shè)施。正如DB-Engines在2015年年底盤(pán)點(diǎn)中發(fā)現(xiàn)的那樣,就總的人氣而言,甲骨文是去年提升幅度最大的廠商(從發(fā)布崗位、技術(shù)論壇提及率和谷歌搜索等方面來(lái)衡量)。
超過(guò)風(fēng)頭甚勁的NoSQL,超過(guò)云優(yōu)先的亞馬遜,超過(guò)其他任何廠商或技術(shù)。
當(dāng)然,甲骨文的這種人氣抬升一方面與大數(shù)據(jù)毫無(wú)關(guān)系,而是緣于管理整齊的行列數(shù)據(jù)。但是從NewVantage Partners的調(diào)查數(shù)據(jù)來(lái)看,這種比較“小”的數(shù)據(jù)仍是大多數(shù)大數(shù) 據(jù)分析技術(shù)的處理對(duì)象。
另外拋開(kāi)這種結(jié)構(gòu)化數(shù)據(jù),我懷疑許多公司仍沒(méi)有認(rèn)為多種多樣、高速度的數(shù)據(jù)是“大數(shù)據(jù)”。這可能是很少有公司聲稱在用大數(shù)據(jù)處理許多任務(wù)的一個(gè)原因。正如MySQL數(shù)據(jù)庫(kù)工程師賈斯汀·斯旺哈特(Justin Swanhart)所說(shuō):“大數(shù)據(jù)毫無(wú)意義。你還不如問(wèn)別人他們想要什么顏色的數(shù)據(jù)庫(kù)。”
簡(jiǎn)而言之,大數(shù)據(jù)活蹦亂跳,但是許多公司未必認(rèn)為它是“大數(shù)據(jù)”。
那又如何?
對(duì)于正在想自己是不是被大數(shù)據(jù)甩在后頭的企業(yè)來(lái)說(shuō),現(xiàn)在別再瞎擔(dān)心了。正如Gartner的分析師尼克·霍德克(Nick Heudecker)所說(shuō),“大數(shù)據(jù)”已遷移到更熟悉的類(lèi)別:
先進(jìn)分析和數(shù)據(jù)科學(xué)
商業(yè)智能和分析
企業(yè)信息管理
內(nèi)存中計(jì)算技術(shù)
信息基礎(chǔ)設(shè)施
大多數(shù)企業(yè)已經(jīng)在搞充分利用大數(shù)據(jù)的項(xiàng)目,它們只是根本沒(méi)有稱之為大數(shù)據(jù)。即使如此,還是有大量工作要做。正如麻省理工學(xué)院斯隆學(xué)院數(shù)字商業(yè)中心的研究員邁克爾·施拉格(Michael Schrage)所說(shuō):
“預(yù)測(cè)分析最深遠(yuǎn)的影響不是來(lái)自從數(shù)量上改進(jìn)預(yù)測(cè)的質(zhì)量,而是來(lái)自從根本上改變企業(yè)組織考慮問(wèn)題和機(jī)會(huì)的角度?!?
換句話說(shuō),許多公司可能已經(jīng)擁有將大數(shù)據(jù)充分利用起來(lái)的必要技術(shù)。它們?nèi)鄙俚氖?,渴望從根本上改變將那些?shù)據(jù)充分利用起來(lái)的方式。有一群分析員解讀數(shù)據(jù)是一回事,利用那些分析結(jié)果、促動(dòng)公司業(yè)務(wù)的實(shí)時(shí)變化是另一回事。
這不是你從某家廠商所能買(mǎi)到的那種東西。它一定需要在企業(yè)的DNA內(nèi)部發(fā)生變化。既要更準(zhǔn)確地了解大數(shù)據(jù),又要用大數(shù)據(jù)切實(shí)處理一些任務(wù),企業(yè)確實(shí)面臨艱巨的任務(wù)。
原文標(biāo)題: Big data's big problem? Most companies don't realize they're already using it
編輯:apple.lei