大數(shù)據(jù)的核心價(jià)值到底是什么?
先說結(jié)論:大數(shù)據(jù)的終極核心價(jià)值在于“資源優(yōu)化配置”。
無論是大數(shù)據(jù)在農(nóng)業(yè)的使用也罷,工業(yè)的使用也罷,抑或是在金融行業(yè)的使用也罷,終究都是經(jīng)過大數(shù)據(jù)技能來獲悉事情開展的本相,終究使用這個“本相”來愈加合理的配置資本。
具體來說,要實(shí)現(xiàn)大數(shù)據(jù)的核心價(jià)值,還需要前兩個重要的步驟,第一步是通過“眾包”的形式收集海量數(shù)據(jù),第二步是通過大數(shù)據(jù)的技術(shù)途徑進(jìn)行“全量數(shù)據(jù)挖掘”,最后利用分析結(jié)果進(jìn)行“資源優(yōu)化配置”。

只說概念大家肯定沒法直觀的理解上面的觀點(diǎn),那就將幾個咱們都接觸過的例子講一講大數(shù)據(jù)是怎么通過這三步發(fā)揮核心價(jià)值的?
第一步、通過“眾包”產(chǎn)生和收集數(shù)據(jù)
高德地圖、百度地圖都有實(shí)時(shí)路況的功能,但大家有沒有想過實(shí)時(shí)路況的數(shù)據(jù)是怎么收集的?實(shí)際上經(jīng)過了三個階段,開始是跟交通口的一些公司合作,獲取交通流量監(jiān)測設(shè)備的數(shù)據(jù),這個方法缺陷很明顯,一個是受制于人,一個是想擴(kuò)大監(jiān)測范圍就要部署大量設(shè)備,費(fèi)時(shí)費(fèi)力,而且還受法律制約。于是一些專門做路況的公司開始用出租車當(dāng)浮動車收集數(shù)據(jù)。但這種辦法還是無法覆蓋大量的大小路段,隨著移動互聯(lián)網(wǎng)的普及,高德地圖的APP能夠?qū)崟r(shí)上傳大量機(jī)動車的速度和位置信息,經(jīng)過去噪和綜合分析,就形成了覆蓋率極高的實(shí)時(shí)路況信息。這就是一個典型的“眾包”過程。
嚴(yán)謹(jǐn)一點(diǎn)來說,眾包指的是一個公司或機(jī)構(gòu)把過去由員工執(zhí)行的工作任務(wù),以自由自愿的形式外包給非特定的(而且通常是大型的)大眾網(wǎng)絡(luò)的做法。
大數(shù)據(jù)的“海量數(shù)據(jù)”就是由“眾包”產(chǎn)生的。廣義上,用戶的行為數(shù)據(jù),各種傳感器的數(shù)據(jù),也都是“眾包”的形式,只要是由過去集中式的產(chǎn)生模式擴(kuò)散到分布式的模式,都是眾包的形式。
第二步、通過“全量數(shù)據(jù)挖掘”獲知“真相”
曾經(jīng)看過一個視頻,通過分析阿里巴巴全年的數(shù)據(jù)得到的阿里巴巴的世界貿(mào)易與全國貿(mào)易的趨勢。視頻中體現(xiàn)的不僅是阿里巴巴集團(tuán)的運(yùn)營情況,其實(shí)也部分反映了整個中國的經(jīng)濟(jì)運(yùn)行情況。而且這些數(shù)據(jù)不是通過采樣得來的,就是真真切切的“全量數(shù)據(jù)”。我們再也不用通過“管中窺豹”的形式來推測全局,而是直接通過“上帝視角”來窺視真相。這就是大數(shù)據(jù)的魅力,我們獲得了前所未有的獲取真相的能力,而且對于大型互聯(lián)網(wǎng)公司來說,即使是PB級別的數(shù)據(jù)分析也是準(zhǔn)實(shí)時(shí)的,我們下一個小時(shí)就能夠得知上一個小時(shí)的全量數(shù)據(jù)分析結(jié)果,這樣的能力是前所未有的。
第三步 大數(shù)據(jù)的核心價(jià)值——“資源優(yōu)化配置”
前段時(shí)間,滴滴打車曾通過投票和訂單分析的方式得出了北上廣深四地的加班大樓排行榜,敝司不幸排名第三,但事實(shí)真的是即使加班很晚也很難打到車啊?。∷缘蔚未蜍嚫麨椤暗蔚纬鲂小敝?,也拋出了他們偉大的愿景,那就是利用大數(shù)據(jù)分析實(shí)時(shí)綜合調(diào)度“快車”、“專車”、“出租車”、“順風(fēng)車”甚至是滴滴巴士的資源,實(shí)現(xiàn)全局的交通資源優(yōu)化。事實(shí)也是如此,滴滴的司機(jī)們越來越多的需要完成“指派任務(wù)”,而不是集中去搶高凈值客戶。也許對于個別單體來說他們的利益降低了,但全局的資源配置卻避免了全局的資源浪費(fèi)和過度競爭,無疑大大提高了交通資源的使用效率。
所以我們說,基于大數(shù)據(jù)分析的結(jié)果,進(jìn)行資源優(yōu)化配置,才是大數(shù)據(jù)應(yīng)用的落地點(diǎn)和真正價(jià)值。

而“資源優(yōu)化配置”的價(jià)值,又遠(yuǎn)遠(yuǎn)超出我們能夠想象的層面,在資本寒冬即將來臨的大背景下,利用大數(shù)據(jù)實(shí)現(xiàn)資源的高效利用,顯得更加重要。廣告行業(yè)利用DMP、DSP進(jìn)行廣告的精準(zhǔn)投放,房地產(chǎn)行業(yè)利用大數(shù)據(jù)分析價(jià)值洼地,宜信利用大數(shù)據(jù)建設(shè)征信系統(tǒng)降低壞賬率,券商陸續(xù)推出大數(shù)據(jù)基金,全部都是廣義的“資源優(yōu)化配置”的體現(xiàn)。大數(shù)據(jù)也遠(yuǎn)遠(yuǎn)不再停留在學(xué)術(shù)和“分析現(xiàn)象”的階段,而是在各行各業(yè)實(shí)現(xiàn)了落地并發(fā)揮著非常非常重要的價(jià)值。
我是在互聯(lián)網(wǎng)廣告行業(yè)從事程序化購買系統(tǒng)建設(shè)的,而這個行業(yè)也是大數(shù)據(jù)最先發(fā)揮價(jià)值的地方。舉個最簡單的例子來說明大數(shù)據(jù)在廣告資源優(yōu)化配置上的作用。寶潔集團(tuán)是我們的客戶,而寶潔的產(chǎn)品有非常強(qiáng)的用戶性別傾向性,護(hù)舒寶的廣告就應(yīng)該投給女性,投給男性就是赤裸裸的浪費(fèi)。而吉列的目標(biāo)用戶就只是男性。之前保潔集團(tuán)是怎么做廣告的?就是海投品牌廣告,不分性別的海投,那這個做法在投放之前就已經(jīng)確切無疑的知道有一半廣告費(fèi)用時(shí)浪費(fèi)的。但沒有辦法,因?yàn)槲覀儧]有大數(shù)據(jù)技術(shù)來發(fā)掘用戶的性別。
而隨著DMP(Data Management Platform)技術(shù)的不斷成熟,越來越多的廣告主建立起自己的用戶數(shù)據(jù)中心,可以不斷積累客戶的各種用戶行為,進(jìn)而判斷出用戶的性別,再通過DSP(Demand Side Platform)系統(tǒng)定向投放,最終可以為寶潔節(jié)省一半的廣告預(yù)算。
上面的例子正是廣告資源的優(yōu)化配置,事實(shí)上DMP系統(tǒng)對用戶畫像的構(gòu)建精確程度遠(yuǎn)超人們的想象,精準(zhǔn)投放的各類篩選條件也越來越精細(xì)?,F(xiàn)在微信支持精確到設(shè)備的精準(zhǔn)投放,也就是未來完全可能實(shí)現(xiàn)精確到每個人終端的精準(zhǔn)投放,這都依賴于大數(shù)據(jù)對于用戶行為的挖掘,最終實(shí)現(xiàn)整個廣告行業(yè)的效果提升。
很多同學(xué)可能會說大數(shù)據(jù)的核心是數(shù)據(jù)挖掘,是分布式存儲,是NLP,是深度學(xué)習(xí),但這一切其實(shí)只是大數(shù)據(jù)的技術(shù)途徑,大數(shù)據(jù)的終極核心價(jià)值就在于“資源優(yōu)化配置”。
馬哥學(xué)習(xí)交流群
馬哥教育大數(shù)據(jù)學(xué)習(xí)群 481324949