過(guò)去需要用百年才能走完的一個(gè)時(shí)代現(xiàn)在可能用幾十年、十幾年就完成了,英國(guó)的工業(yè)革命從發(fā)芽到在全世界生根用了一百年,美國(guó)的信息高速公路從一項(xiàng)絕密計(jì)劃到讓世界變成一個(gè)村落用了二三十年,而移動(dòng)互聯(lián)網(wǎng)、云計(jì)算、大數(shù)據(jù)現(xiàn)在正席卷全球,讓各國(guó)的政府、企
過(guò)去需要用百年才能走完的一個(gè)時(shí)代現(xiàn)在可能用幾十年、十幾年就完成了,英國(guó)的工業(yè)革命從發(fā)芽到在全世界生根用了一百年,美國(guó)的信息高速公路從一項(xiàng)絕密計(jì)劃到讓世界變成一個(gè)村落用了二三十年,而移動(dòng)互聯(lián)網(wǎng)、云計(jì)算、大數(shù)據(jù)現(xiàn)在正席卷全球,讓各國(guó)的政府、企業(yè)都在將其視為一個(gè)金礦,希望能從中占得先機(jī)。大數(shù)據(jù)的理論研究應(yīng)該有十幾年的歷史,隨著研究的進(jìn)行,相關(guān)的應(yīng)用也已經(jīng)投入到無(wú)論是實(shí)驗(yàn)室或者是尖端企業(yè)的內(nèi)部,而離我們的日常生活還很遙遠(yuǎn)。我想在不久的將來(lái)最重要的是將大數(shù)據(jù)應(yīng)用到我們的日常生活中,讓每個(gè)人都成為大數(shù)據(jù)的貢獻(xiàn)者、管理者和獲利者。但是,大數(shù)據(jù)正在經(jīng)受已有制度、規(guī)則以及傳統(tǒng)思維模式的挑戰(zhàn),我們需要的是變革,從思維上建立與大數(shù)據(jù)的一致性。
當(dāng)硬盤(pán)等存儲(chǔ)設(shè)備的價(jià)格變得越來(lái)越便宜了,當(dāng)數(shù)據(jù)中心在全球部署得越來(lái)越密集,當(dāng)服務(wù)器的運(yùn)算速度越來(lái)越快的時(shí)候,我們可以存儲(chǔ)所有的數(shù)據(jù),存儲(chǔ)若干年,幾十年的數(shù)據(jù),從這些數(shù)據(jù)當(dāng)中無(wú)論是橫向角度還是縱向角度都可以去分析潛在的規(guī)律。這種分析方式是對(duì)采樣分析的挑戰(zhàn),采樣分析在過(guò)去很長(zhǎng)一段時(shí)間為我們分析數(shù)據(jù)帶來(lái)了便利,并且有一定的準(zhǔn)確性。然而隨著時(shí)代的變更,細(xì)分在社會(huì)中占的比重越來(lái)越大。例如問(wèn)卷調(diào)查“對(duì)就業(yè)城市的選擇”,過(guò)去可能在大街上隨便發(fā)上千份調(diào)查問(wèn)卷,然后回來(lái)做個(gè)統(tǒng)計(jì)就算分析出大家的喜好了,然而在以前大家會(huì)認(rèn)同這個(gè)數(shù)據(jù)。然而這個(gè)數(shù)據(jù)可靠嗎?太不可靠了,因?yàn)榻邮軉?wèn)卷的人都是同一地域的人,都是同一年齡層次的人,都是同一行業(yè)的人,不能代表更廣大人群的心聲。這就是采樣分析的弊端,無(wú)法從細(xì)分的角度去詮釋數(shù)據(jù)樣板的規(guī)律,給出靠譜的解釋。大數(shù)據(jù)的做法將顛覆傳統(tǒng),它不會(huì)是當(dāng)需要進(jìn)行一次問(wèn)卷調(diào)查的時(shí)候就去搜集樣板信息,這樣無(wú)論是從時(shí)間、地域、人群都輸在了起跑線上。假設(shè)企業(yè)的招聘錄用信息都已經(jīng)做了電子化處理,大數(shù)據(jù)應(yīng)用將對(duì)這個(gè)整體樣板進(jìn)行分析從年齡層面、從行業(yè)層面、從地域?qū)用娼o出就業(yè)城市選擇的不同答案。
從古至今,我們都一直在精益求精,這讓我們?nèi)〉?了很多舉世矚目的成就,例如我們研究物質(zhì),我們探尋到物質(zhì)是由原子組成的,而后原子這個(gè)最小單位被打破了,它的內(nèi)部還有質(zhì)子和電子,又過(guò)了多少年,質(zhì)子和電子也被認(rèn)為不是最小單位,還有夸克。這是一種態(tài)度,需要堅(jiān)持,這個(gè)方向有利于我們能懷著追求極致的情懷繼續(xù)在科學(xué)的道路上前行。然而現(xiàn)在有了另外一個(gè)方向,這個(gè)方向要求我們放棄精準(zhǔn),我們需要把注意力專(zhuān)注到事物的發(fā)展方向上即可,這個(gè)發(fā)展方向就是一種可能,可能就代表一種預(yù)測(cè)??觳突纳钭屛覀儗?duì)未來(lái)會(huì)怎么樣,對(duì)下一步會(huì)怎么樣的需求越來(lái)越大。海量的數(shù)據(jù)不應(yīng)該被塵封,應(yīng)該發(fā)光發(fā)熱,為我們預(yù)測(cè)未來(lái),預(yù)測(cè)變化。不知道大家注意到?jīng)]有,現(xiàn)在QQ已經(jīng)開(kāi)始做圖像識(shí)別方面的工作了,當(dāng)你瀏覽好友相冊(cè)的時(shí)候,QQ應(yīng)用程序會(huì)掘取其中的人臉,讓你填寫(xiě)該人臉的真實(shí)名字,如果每個(gè)人都在做這項(xiàng)工作,隨著歲月的積淀,有一天QQ就可以直接告訴你相片中的每個(gè)人是誰(shuí)了,同時(shí)也可以想其他好友推薦美好的瞬間。這就是一種精準(zhǔn)的預(yù)測(cè),雖然不可能是100%,但是能告訴我們?cè)敢獾玫降男畔?。我們的?guó)家也在定期搜集衣食住行方面的數(shù)據(jù),不斷的優(yōu)化計(jì)算CPI的模型,為有效控制和預(yù)測(cè)通脹提供參考。
中國(guó)人歷來(lái)講究因果,不僅知其然,更要知其所以然。如果在大數(shù)據(jù)面前,我們?nèi)脏┼┎恍荩敲磳适Ш芏嗫赡苄?,放在商業(yè),就會(huì)浪費(fèi)商機(jī),放在醫(yī)療,就會(huì)讓病人錯(cuò)過(guò)某些疾病治療的良機(jī)。大數(shù)據(jù)之所以不關(guān)注因果關(guān)系,那是因?yàn)榇髷?shù)據(jù)發(fā)現(xiàn)相關(guān)關(guān)系更能說(shuō)明問(wèn)題,而且這種解釋就是理所當(dāng)然的。大數(shù)據(jù)分析發(fā)現(xiàn)當(dāng)某一種數(shù)據(jù)增加時(shí),另外一種數(shù)據(jù)也會(huì)跟著增加,如果將二者結(jié)合看,在現(xiàn)有認(rèn)知下并不能發(fā)現(xiàn)二者的因果關(guān)系。我們?yōu)槭裁床粩R置因果,先應(yīng)用這種得出的結(jié)論,看這個(gè)結(jié)論是否能產(chǎn)生效益。零售業(yè)巨頭沃爾瑪在這方面的研究走在了前列,通過(guò)記錄每位購(gòu)物者的購(gòu)物清單,還記錄當(dāng)天的天氣,經(jīng)過(guò)長(zhǎng)時(shí)間的研究,發(fā)現(xiàn)當(dāng)颶風(fēng)來(lái)臨時(shí),手電筒和蛋撻的銷(xiāo)量劇增,手電筒的需求是源于如果發(fā)生停電,手電筒可以支撐照明,但是每個(gè)人都不明白為什么這個(gè)時(shí)候大家都愛(ài)吃蛋撻。沒(méi)有必要糾結(jié)為什么,以后颶風(fēng)來(lái)臨,就把手電筒和蛋撻放在一起賣(mài)吧,這樣銷(xiāo)售量果然大增。
大數(shù)據(jù)在未來(lái)面臨的挑戰(zhàn)主要是兩方面:一是思維和制度的變革;二是記錄信息的方式需要全面的電子化。未來(lái),隨著政企網(wǎng)、智慧城市、智能交通這些新興事物在城市里面變得習(xí)以為常,人們都愿意采用電子化的方式記錄和管理我們的信息,那么大數(shù)據(jù)一定會(huì)有更大的用武之地,產(chǎn)生更大的商業(yè)價(jià)值和社會(huì)效應(yīng)。
聲明:本網(wǎng)頁(yè)內(nèi)容旨在傳播知識(shí),若有侵權(quán)等問(wèn)題請(qǐng)及時(shí)與本網(wǎng)聯(lián)系,我們將在第一時(shí)間刪除處理。TEL:177 7030 7066 E-MAIL:11247931@qq.com