數據是有價值(zhi)的(de),但大(da)數據最核心的(de)價值(zhi)到底是什(shen)(shen)么(me)?能夠用大(da)數據來作什(shen)(shen)么(me)呢?
我(wo)總(zong)結了(le)一下(xia),大數據最核心的作用(yong)和價值有四個方面:
1) 查看數據規律,來探索事物的(de)運行規律和特征(zheng)
2) 發現數據(ju)變(bian)化(hua),來(lai)探(tan)索業(ye)務(wu)的(de)變(bian)化(hua)和業(ye)務(wu)問題(ti)
3) 理清數據關(guan)系,來(lai)尋(xun)找影響業務運(yun)行的(de)關(guan)鍵因素
4) 擬(ni)合(he)數據模型,來(lai)預判業務在未(wei)來(lai)的發展趨勢
下面我將為大家舉一些案(an)例(li),看如(ru)何(he)利用大數據來實現這些價值。
3.1 探索規律
利用大數據來探索業務運(yun)行的規律(lv)和特(te)征。
拿產品(pin)的(de)(de)銷(xiao)量分析來說,我們收集產品(pin)的(de)(de)銷(xiao)量數據,作趨勢分析,得到下圖(tu)所示的(de)(de)按照時(shi)間維度(星期)的(de)(de)折線圖(tu)。
從數(shu)據的(de)(de)(de)(de)特征可以看出(chu),產品(pin)的(de)(de)(de)(de)銷(xiao)量基本上是隨著(zhu)時(shi)間在(zai)逐步上升的(de)(de)(de)(de),周末(mo)的(de)(de)(de)(de)產品(pin)銷(xiao)量比較高,即非工(gong)作日比工(gong)作日的(de)(de)(de)(de)產品(pin)銷(xiao)量要高,這是絕大(da)多數(shu)零(ling)售(shou)店(dian)的(de)(de)(de)(de)銷(xiao)售(shou)規律,即“周末(mo)是交易(yi)高峰時(shi)間”。
而銷量高(gao),也就意味著(zhu)在(zai)產品銷售上(shang)的規(gui)律,即客流量比較大,看來周末上(shang)街購物(wu)的人數比較多(duo)。所以,從(cong)業務角度(du)看,也就發現了客流量在(zai)時間上(shang)的分布規(gui)律。
基(ji)于(yu)客流(liu)量的(de)分(fen)布(bu)規律,就(jiu)可以提出如下的(de)業務建(jian)議或(huo)策略:在人力安排上(shang)(shang),周末(mo)需要更(geng)多(duo)的(de)銷(xiao)售(shou)員工上(shang)(shang)班;在庫存管理上(shang)(shang),在周四(si)或(huo)周五就(jiu)要安排人員檢(jian)查庫存,確保庫存中有足夠的(de)產品在周末(mo)售(shou)賣(mai);在營(ying)銷(xiao)活動的(de)時(shi)間安排上(shang)(shang),要想達到(dao)更(geng)好的(de)品牌宣(xuan)傳效果或(huo)者銷(xiao)售(shou)業績,就(jiu)得選擇在客流(liu)量多(duo)的(de)周末(mo)時(shi)間進(jin)行宣(xuan)傳和促銷(xiao),等(deng)等(deng)。
所以,大數據能(neng)夠幫助我們做決策,是怎樣(yang)做到的呢?
背后的思維其實很簡單,就是(shi),先利用(yong)數據來(lai)探索業(ye)務的發展(zhan)規(gui)律和(he)特征(zheng),再利用(yong)業(ye)務規(gui)律,按(an)規(gui)律來(lai)決策,就能(neng)夠做到事半功倍的效果。
哲學告訴(su)我們,任何(he)事物都是發展(zhan)的,發展(zhan)必定是有(you)規律(lv)的,即萬物皆有(you)規律(lv)。
任何客觀事物(wu),大(da)到天(tian)體運行(xing),中(zhong)到社會發展(zhan),小(xiao)到原子分子的運行(xing),都是(shi)有規律的。而大(da)數據,則(ze)是(shi)探(tan)索事物(wu)規律的有效的工(gong)具!
3.2 發現變化
利用大數據來發現業務運(yun)行的變化和問題。
谷歌公(gong)司的(de)流(liu)感趨(qu)勢預(yu)測產品(pin)(Google Flu Trends, GFT)是2008年推出(chu)的(de)一款預(yu)測流(liu)感的(de)產品(pin),可以(yi)說是比較早的(de)一個大數據(ju)產品(pin)了。
正常情(qing)況下,傳統的(de)(de)疫(yi)情(qing)報(bao)告是由(you)各地(di)(di)醫院、診所(suo)和(he)醫務人員向美國CDC(疾病控制和(he)預防中心)上報(bao)的(de)(de),但這種(zhong)方(fang)法(fa)往(wang)(wang)往(wang)(wang)會有10~14天的(de)(de)時間(jian)延遲(chi),而(er)在(zai)這兩(liang)周內,疫(yi)情(qing)有可能早已(yi)經迅速擴散。而(er)谷歌(ge)的(de)(de)這款產品,卻可以(yi)利用(yong)了(le)各個地(di)(di)區用(yong)戶搜索(suo)關鍵詞的(de)(de)數據(ju)量來(lai)判斷流(liu)感(gan)的(de)(de)傳播情(qing)況,來(lai)實時呈現或預測流(liu)感(gan)蔓延到哪個地(di)(di)區了(le),這對(dui)于CDC及時控制疫(yi)情(qing)具有更大的(de)(de)指導(dao)意(yi)義。
谷歌工程師(shi)每天(tian)(tian)(tian)都(dou)會(hui)(hui)對搜索(suo)感(gan)(gan)冒相(xiang)關詞的(de)(de)(de)(de)(de)搜索(suo)量做(zuo)分析,在(zai)(zai)正常(chang)情(qing)況下(xia),某地(di)區(qu)每日(ri)的(de)(de)(de)(de)(de)搜索(suo)量都(dou)會(hui)(hui)在(zai)(zai)一個正常(chang)的(de)(de)(de)(de)(de)范(fan)圍(wei)內(nei)波動(dong)。但如果有一天(tian)(tian)(tian)(比如12號開(kai)始),某地(di)區(qu)的(de)(de)(de)(de)(de)搜索(suo)量開(kai)始持續上升,這上升的(de)(de)(de)(de)(de)背(bei)后,其實體(ti)現(xian)的(de)(de)(de)(de)(de)是患(huan)感(gan)(gan)冒人數的(de)(de)(de)(de)(de)增加。這就(jiu)是GFT產品(pin)背(bei)后的(de)(de)(de)(de)(de)數據思(si)維,基于搜索(suo)詞的(de)(de)(de)(de)(de)熱(re)度(du)來預(yu)測(ce)流(liu)感(gan)(gan)的(de)(de)(de)(de)(de)爆發(fa)。這個產品(pin),甚至可(ke)以在(zai)(zai)流(liu)感(gan)(gan)爆發(fa)前的(de)(de)(de)(de)(de)7-14天(tian)(tian)(tian)就(jiu)能夠做(zuo)出預(yu)判。因此,國家(jia)或(huo)企業都(dou)可(ke)以基于此預(yu)測(ce)進行相(xiang)應的(de)(de)(de)(de)(de)準(zhun)備(bei)活(huo)動(dong)。
所以,可(ke)以基于數據的變化,而探知業務的變化,從(cong)而可(ke)以進一步思考(kao)給出相應的業務判(pan)斷和業務建議(yi)。即,數據的變化就意味著業務的變化。
這也(ye)是(shi)我們做決策(ce)的(de)另一個底(di)層邏輯(ji),找到(dao)業務(wu)短(duan)板(ban)和(he)變化(hua),給出(chu)應(ying)對策(ce)略。最典型的(de)就是(shi)運營分析(xi),通(tong)過(guo)大量的(de)KPI指標來呈現(xian)業務(wu)運營的(de)各個環節的(de)發展情況,以找到(dao)需要改進的(de)環節,并做出(chu)優化(hua)建(jian)議(yi)。
世界是(shi)(shi)物質的(de),而物質是(shi)(shi)運動的(de),變化是(shi)(shi)事物的(de)本質。
一(yi)切事物都在(zai)運動變化(hua),這些運動變化(hua)是(shi)可以被探知的。大數據,則是(shi)及時發(fa)現事物變化(hua)的一(yi)個工具。
3.3 理(li)清關系(xi)
美國印(yin)第(di)安納大學(xue)的(de)(de)(de)教授約翰·博倫(Johan Bollen),曾(ceng)發表(biao)了一(yi)篇文(wen)章《Twitter情(qing)(qing)(qing)緒(xu)(xu)預測(ce)股票(piao)市場》。這(zhe)些教授們一(yi)直想弄清楚到底是什么(me)因素在(zai)(zai)影響股票(piao)的(de)(de)(de)漲(zhang)和跌(die),以(yi)及能(neng)否預測(ce)股市的(de)(de)(de)漲(zhang)或跌(die)。于是,他(ta)們收集了2008~2010年(nian)期間在(zai)(zai)Twitter上(shang)發表(biao)的(de)(de)(de)上(shang)億條(tiao)(tiao)條(tiao)(tiao)文(wen),然后(hou)做(zuo)了一(yi)個(ge)(ge)對用(yong)戶情(qing)(qing)(qing)緒(xu)(xu)的(de)(de)(de)量化(hua)模型,就(jiu)是根據發表(biao)條(tiao)(tiao)文(wen)的(de)(de)(de)字詞來(lai)估算用(yong)戶的(de)(de)(de)情(qing)(qing)(qing)緒(xu)(xu),并將其量化(hua)為一(yi)個(ge)(ge)情(qing)(qing)(qing)緒(xu)(xu)數(shu)(shu)值。一(yi)個(ge)(ge)用(yong)戶就(jiu)有一(yi)個(ge)(ge)情(qing)(qing)(qing)緒(xu)(xu)指(zhi)標,然后(hou),他(ta)們把(ba)(ba)當(dang)天(tian)發表(biao)條(tiao)(tiao)文(wen)的(de)(de)(de)所有用(yong)戶的(de)(de)(de)情(qing)(qing)(qing)緒(xu)(xu)指(zhi)標綜合起來(lai),最后(hou)形成了一(yi)個(ge)(ge)客(ke)戶群的(de)(de)(de)綜合情(qing)(qing)(qing)緒(xu)(xu)指(zhi)數(shu)(shu)。最后(hou),他(ta)們把(ba)(ba)這(zhe)個(ge)(ge)客(ke)戶群的(de)(de)(de)綜合情(qing)(qing)(qing)緒(xu)(xu)指(zhi)數(shu)(shu)按照(zhao)時間的(de)(de)(de)維度連接(jie)起來(lai)就(jiu)形成了一(yi)條(tiao)(tiao)情(qing)(qing)(qing)緒(xu)(xu)曲(qu)(qu)線(xian),然后(hou),再把(ba)(ba)這(zhe)條(tiao)(tiao)情(qing)(qing)(qing)緒(xu)(xu)曲(qu)(qu)線(xian)和道瓊(qiong)斯指(zhi)數(shu)(shu)曲(qu)(qu)線(xian)進(jin)行比對。經過不斷的(de)(de)(de)優化(hua)他(ta)們量化(hua)情(qing)(qing)(qing)緒(xu)(xu)的(de)(de)(de)模型,他(ta)們很驚(jing)奇地(di)發現,這(zhe)條(tiao)(tiao)情(qing)(qing)(qing)緒(xu)(xu)曲(qu)(qu)線(xian)的(de)(de)(de)波動居然和股票(piao)曲(qu)(qu)線(xian)的(de)(de)(de)漲(zhang)跌(die)有著驚(jing)人一(yi)致(zhi)(如(ru)下圖所求(qiu))。
仔細觀察一(yi)下(xia),下(xia)圖的(de)情(qing)緒(xu)曲(qu)線(xian)與股(gu)票(piao)曲(qu)線(xian)并不(bu)是(shi)完全重疊的(de),而(er)是(shi),情(qing)緒(xu)曲(qu)線(xian)在股(gu)票(piao)曲(qu)線(xian)波動的(de)之(zhi)前。也(ye)就是(shi)說,當情(qing)緒(xu)曲(qu)線(xian)往后挪3~4天(tian)以后,情(qing)緒(xu)的(de)波動和股(gu)票(piao)的(de)漲跌(die)就基本上吻(wen)合了,這也(ye)就說明,可以利用情(qing)緒(xu)來初(chu)步(bu)判斷股(gu)票(piao)的(de)漲跌(die),這開啟了大數據炒股(gu)的(de)新時代。
用大數據的技術語言(yan)來說,就是(shi),情緒(xu)指(zhi)數與股票指(zhi)數的具有相(xiang)關性。
相(xiang)(xiang)關(guan)性分(fen)析(xi),是大數據時代用(yong)得最多的一類分(fen)析(xi)方(fang)法(fa)之一,可用(yong)來探索事物之間的相(xiang)(xiang)互影(ying)響和相(xiang)(xiang)互制約的關(guan)系。
比如(ru),企業的采購(gou)、生廠、設計(ji)、市場、售后等等,都是相(xiang)互影響(xiang)和相(xiang)系制約的。
唯物(wu)辯證法認為,世界上的一切事物(wu)都處(chu)在(zai)普(pu)遍聯系中,沒有任何一個(ge)事物(wu)是(shi)孤立(li)地(di)存在(zai)的。聯系是(shi)指事物(wu)之間以及事物(wu)內部諸要素之間相(xiang)互(hu)(hu)連結、相(xiang)互(hu)(hu)依賴、相(xiang)互(hu)(hu)影響(xiang)、相(xiang)互(hu)(hu)作用、相(xiang)互(hu)(hu)轉化(hua)等(deng)相(xiang)互(hu)(hu)關系。
一句話,萬(wan)物(wu)皆有(you)聯系!而大數據,成為探索事物(wu)間(jian)相互(hu)聯系的一種有(you)效的手段。
3.4 預測未來
大數據的(de)核心是預測。
在2008年,當大多數企業(ye)在經(jing)濟危(wei)機(ji)中掙扎時,阿里巴巴卻相對輕松地地度過了此次危(wei)機(ji),因為阿里巴巴提前就預測(ce)到經(jing)濟危(wei)機(ji)要來了。
他(ta)們是(shi)如(ru)何預測到經濟危(wei)機(ji)要(yao)來的(de)呢?其實馬(ma)云在(zai)很多次場合都說過,他(ta)說阿里巴巴有兩(liang)大類(lei)重要(yao)的(de)數(shu)據(ju),一類(lei)是(shi)交易數(shu)據(ju),另一類(lei)是(shi)詢盤數(shu)據(ju)。詢盤數(shu)據(ju),指(zhi)的(de)就是(shi)在(zai)網(wang)站(zhan)的(de)瀏覽數(shu)據(ju)、搜索數(shu)據(ju)、點出(chu)數(shu)據(ju)等等。
很顯(xian)然(ran)(ran),詢盤(pan)數(shu)據(ju)和(he)交(jiao)易(yi)數(shu)據(ju)是(shi)有(you)(you)關(guan)(guan)系(xi)的(de)(de)。首先,詢盤(pan)量(liang)(liang)和(he)交(jiao)易(yi)量(liang)(liang)存在(zai)(zai)(zai)(zai)正相關(guan)(guan)的(de)(de)關(guan)(guan)系(xi);其(qi)次(ci),詢盤(pan)數(shu)據(ju)肯(ken)定發(fa)生(sheng)在(zai)(zai)(zai)(zai)交(jiao)易(yi)數(shu)據(ju)的(de)(de)前面(mian)。阿(a)里巴巴每個(ge)月都會(hui)對(dui)這兩大類數(shu)據(ju)進(jin)行統(tong)計(ji)和(he)分(fen)析,找(zhao)到他(ta)(ta)們的(de)(de)關(guan)(guan)系(xi)和(he)規律(lv)。在(zai)(zai)(zai)(zai)2008年的(de)(de)年初,他(ta)(ta)們發(fa)現詢盤(pan)數(shu)據(ju)已經(jing)持續幾個(ge)月都在(zai)(zai)(zai)(zai)下降(jiang)了(le),盡管此(ci)時交(jiao)易(yi)數(shu)據(ju)并沒(mei)有(you)(you)明顯(xian)的(de)(de)下降(jiang)趨勢(shi),但基于上(shang)面(mian)的(de)(de)關(guan)(guan)系(xi),可預見,在(zai)(zai)(zai)(zai)未來(lai)的(de)(de)交(jiao)易(yi)數(shu)據(ju)也肯(ken)定會(hui)下降(jiang)。因此(ci),阿(a)里巴巴才作出了(le)“經(jing)濟危(wei)機”的(de)(de)初步判(pan)斷,然(ran)(ran)后,再收集更多的(de)(de)數(shu)據(ju)來(lai)驗證這個(ge)判(pan)斷的(de)(de)正確(que)性,并進(jin)而作了(le)大量(liang)(liang)的(de)(de)準備,從而安然(ran)(ran)度過這次(ci)經(jing)濟危(wei)機。
大(da)家都知(zhi)道(dao),大(da)數(shu)(shu)據(ju)分析的(de)是已(yi)經(jing)(jing)發(fa)(fa)(fa)生(sheng)過(guo)的(de)數(shu)(shu)據(ju),那么過(guo)去的(de)數(shu)(shu)據(ju)已(yi)經(jing)(jing)發(fa)(fa)(fa)生(sheng)了還(huan)有什(shen)么用呢?其(qi)實,大(da)數(shu)(shu)據(ju)只是借分析過(guo)去的(de)數(shu)(shu)據(ju),來探(tan)索事物(wu)的(de)規律和(he)特(te)征,其(qi)目的(de)是為了預判事物(wu)在未來的(de)發(fa)(fa)(fa)展變(bian)化或發(fa)(fa)(fa)展趨勢,
因(yin)此,大數(shu)據的(de)目的(de)是(shi)預(yu)測(ce),基于對(dui)事物(wu)的(de)預(yu)測(ce)結果,用(yong)來作出相應的(de)策(ce)略(lve)調(diao)整。如果預(yu)測(ce)的(de)結果不是(shi)我們想要(yao)的(de),則(ze)需要(yao)調(diao)整相應的(de)策(ce)略(lve),施加影(ying)響因(yin)素,使得(de)事物(wu)朝(chao)著我們想要(yao)的(de)方(fang)向去發展。
所以,大數(shu)據(ju)描述的是過去(qu),表達的卻是未(wei)來!只有預(yu)見未(wei)來,才能(neng)把握未(wei)來!
可見,大數據之所以能夠用來進行(xing)業務(wu)決策,不外乎就是通過對(dui)數據的(de)分析(xi),來實現對(dui)業務(wu)特征、業務(wu)規(gui)律、業務(wu)變(bian)化的(de)把(ba)握,以及影響業務(wu)變(bian)化的(de)關鍵因素進行(xing)分析(xi),來達到(dao)了(le)解(jie)業務(wu),預測(ce)業務(wu)未來發展的(de)目的(de)。
所以,大數據分(fen)析的核心價值,就是去(qu)發現數據的特征、變(bian)化(hua)和關系。
因為數(shu)據的(de)(de)特征就(jiu)是(shi)業(ye)(ye)務的(de)(de)特征,數(shu)據的(de)(de)變化(hua)就(jiu)是(shi)業(ye)(ye)務的(de)(de)變化(hua),數(shu)據間的(de)(de)關(guan)系就(jiu)是(shi)業(ye)(ye)務因素間的(de)(de)關(guan)系。
轉載://bamboo-vinegar.cn/zixun_detail/111710.html