第一:統(tǒng)計學知識。(推薦學習:Python視頻教程)
這是很大一部分大數(shù)據(jù)分析師的短板。當然這里說的不是簡單的一些統(tǒng)計而已。而是包括均值、中位數(shù)、標準差、方差、概率、假設(shè)檢驗等等具有時間、空間、數(shù)據(jù)本身。差不多應(yīng)該是理工科的高等數(shù)學的知識,甚至還高一點兒。要能夠建模,要不然你分析出來的結(jié)果離實際相差十萬八千里的話,估計要不了幾天,你就會被卷鋪蓋走人了。當然,做個一般的大數(shù)據(jù)分析師,就不會涉及到很深的高等數(shù)學知識了,但要做一個牛B的大數(shù)據(jù)分析師,還是要學習學習再學習。
第二:很多人想不到的,你還是把EXCEL玩熟悉吧。
當然不需要掌握的高大全,也得要掌握常用的函數(shù),比如重點包括但不限于sum,count,sumif,countif,find,if,left/right,時間轉(zhuǎn)換,透視表,各種圖表做法等之類的。如果數(shù)據(jù)量不算是特別大的話,Excel能夠解決很多問題。比如,篩選部分贓數(shù)據(jù),排序,挑選滿足條件的數(shù)據(jù)等等。
第三:分析思維的練習。
比如結(jié)構(gòu)化思維、思維導圖、或百度腦圖、麥肯錫式分析,了解一些smart、5W2H、SWOT等等那就更好了。不一定要掌握多深多全,但一定要了解一些。
第四:數(shù)據(jù)庫知識。
大數(shù)據(jù)大數(shù)據(jù),就是數(shù)據(jù)量很多,Excel就解決不了這么大數(shù)據(jù)量的時候,就得使用數(shù)據(jù)庫。如果是關(guān)系型數(shù)據(jù)庫,比如Oracle、mysql、sqlserver等等,你還得要學習使用SQL語句,篩選排序,匯總等等。非關(guān)系型數(shù)據(jù)庫也得要學習,比如:Cassandra、Mongodb、CouchDB、Redis、 Riak、Membase、Neo4j 和 HBase等等,起碼常用的了解一兩個,比如Hbase,Mongodb,redis等。
第五:業(yè)務(wù)學習。
其實對于大數(shù)據(jù)分析師來說,了解業(yè)務(wù)比了解數(shù)據(jù)更重要。對于行業(yè)業(yè)務(wù)是怎么走的對于數(shù)據(jù)的分析有著非常重要的作用,不了解業(yè)務(wù),可能你分析的結(jié)果不是別人想要的。
第六:開發(fā)工具及環(huán)境。
比如:Linux OS、Hadoop(存儲HDFS,計算Yarn)、Spark、或另外一些中間件。目前用得多的開發(fā)工具python等等語言工具。
總之,要做一個高級或總監(jiān)級的大數(shù)據(jù)分析師那是相當?shù)臒X的。要學習了解的東西如果只是單純的數(shù)據(jù)方面的話,那業(yè)務(wù)和統(tǒng)計知識的學習是必不可少的。如果是實用型的大數(shù)據(jù)分析師可能只掌握某些部分就可以。大數(shù)據(jù)開發(fā)工程師的話,基本就是掌握開發(fā)環(huán)境、開發(fā)語言以及各種圖表的應(yīng)用,也是可以滿足的。畢竟,一個公司要團隊協(xié)作,一人懂一部分就可以搞出分析產(chǎn)品出來了。認定一項事情就去干!越干越輕松,越干越牛B!
更多Python相關(guān)技術(shù)文章,請訪問Python教程欄目進行學習!
聲明:本網(wǎng)頁內(nèi)容旨在傳播知識,若有侵權(quán)等問題請及時與本網(wǎng)聯(lián)系,我們將在第一時間刪除處理。TEL:177 7030 7066 E-MAIL:11247931@qq.com