小白學(xué)習(xí)Python數(shù)據(jù)挖掘
Python現(xiàn)已穩(wěn)坐機(jī)器學(xué)習(xí)的榜首言語(機(jī)器學(xué)習(xí)編程言語之爭(zhēng),Python奪冠),尤其是深度學(xué)習(xí)結(jié)構(gòu)Torch宣告支撐Python以后。所以學(xué)習(xí)Python進(jìn)行數(shù)據(jù)發(fā)掘是性價(jià)比是最高的(自己也拋棄了運(yùn)用了3年多的R言語)。而運(yùn)用Python進(jìn)行數(shù)據(jù)發(fā)掘是最近幾年才開端火起來的,之前網(wǎng)上許多的資料都是對(duì)于Python網(wǎng)頁開發(fā)等。但運(yùn)用Python進(jìn)行數(shù)據(jù)發(fā)掘的側(cè)重點(diǎn)現(xiàn)已徹底不一樣了。自己即是浪費(fèi)了許多時(shí)刻來篩選這些博客、書本。所以就有了這篇文章,希望能幫我們少走一點(diǎn)彎路。
本文章主要從數(shù)據(jù)挖掘的角度出發(fā),談?wù)勅绾稳腴T數(shù)據(jù)挖掘。本文不能保證你能成為大神,但是如果能踏踏實(shí)實(shí)地學(xué)習(xí)完,找一份年薪15w+的工作還是不太難的,考慮到市場(chǎng)上人才的稀缺。本人也是非計(jì)算機(jī)專業(yè),所以希望給非計(jì)算機(jī)的人一點(diǎn)參考。現(xiàn)在市場(chǎng)上數(shù)據(jù)挖掘的人才非常缺少,現(xiàn)在大一點(diǎn)的企業(yè)都需要數(shù)據(jù)分析、數(shù)據(jù)挖掘的人才,但是國目前只有3所大學(xué)開設(shè)了相關(guān)的本科專業(yè),計(jì)算機(jī)專業(yè)的人也不會(huì)搶這飯碗,因而,造成了數(shù)據(jù)挖掘市場(chǎng)上人才的供給不足,所以給了一大堆非科班出身人很多的機(jī)會(huì)。
一、Python 基礎(chǔ)語法學(xué)習(xí)
如果只推薦一本書,強(qiáng)烈推薦《跟老齊學(xué)Python》,Python中的核心概念做了非常棒的講解,深刻而不失幽默。
如果想系統(tǒng)的學(xué)習(xí)推薦密歇根大學(xué)的《學(xué)習(xí)使用Python編程并分析數(shù)據(jù)》系列課程。
廖雪峰Python教程 簡(jiǎn)單易上手的Python基礎(chǔ)語法教程,值得學(xué)習(xí), Python 2和Python 3版本都有。
二、 機(jī)器學(xué)習(xí)理論
基本經(jīng)典的機(jī)器學(xué)習(xí)書籍
機(jī)器學(xué)習(xí)入門(中/英)(谷歌大牛的課程)
機(jī)器學(xué)習(xí)(喬治亞理工大學(xué)計(jì)算機(jī)課程)
周志華的西瓜書《機(jī)器學(xué)習(xí)》
深入一些的可以考慮李航的《統(tǒng)計(jì)學(xué)習(xí)方法》
還有偏統(tǒng)計(jì)的斯坦福的教授寫的《統(tǒng)計(jì)學(xué)習(xí)導(dǎo)論》,深入版本的《The Elements of Statistical Learning》(英文影印版)
上面推薦的都是非常不錯(cuò)機(jī)器學(xué)習(xí)的入門書籍,都是經(jīng)典了。
三、Python機(jī)器學(xué)習(xí)代碼學(xué)習(xí)
掌握Python語法的基礎(chǔ)上學(xué)習(xí)《Python for data analysis》是比較不錯(cuò)的選擇,涵蓋了iPython notebook、Numpy、Scipy和Pandas包的使用。
《Python數(shù)據(jù)分析與挖掘?qū)崙?zhàn)》介紹了使用Python進(jìn)行數(shù)據(jù)挖掘的詳細(xì)案例,數(shù)據(jù)和代碼都可以下載,作為機(jī)器學(xué)習(xí)的進(jìn)階學(xué)習(xí)是不錯(cuò)的選擇(這本書也用對(duì)應(yīng)的R語言和Matlab 版本)。
還有Udacity機(jī)器學(xué)習(xí)納米學(xué)位項(xiàng)目代碼(Github上有)
再推薦2本國外網(wǎng)站的書籍,還在early release階段《Python Data Science Handbook》和《Hands On Machine Learning with Scikit-Learn and TensorFlow》,非常好的代碼示范。注冊(cè)Safari Online,可以免費(fèi)看10天。
四、優(yōu)秀博客和微信公眾號(hào)
我推薦的網(wǎng)站和微信公眾號(hào)都是我平時(shí)天天看的,那些水貨大多被我取消關(guān)注了,養(yǎng)成每周清理公眾號(hào)的好習(xí)慣。
1. 數(shù)據(jù)挖掘入門與實(shí)戰(zhàn) 全是干貨,代碼質(zhì)量非常高。
2. 機(jī)器學(xué)習(xí)研究會(huì) 我校老師組織的學(xué)習(xí)平臺(tái),代碼加行業(yè)信息齊飛,質(zhì)量非常高。尤其是我校的AI公開課(有直播),中國頂尖人工智能大腕云集。
3. 新智元 人工智能方向行業(yè)觀點(diǎn),對(duì)于自己把握技術(shù)方向非常重要,比如說自動(dòng)駕駛這個(gè)坑能不能入?
4. 機(jī)器之心 技術(shù)前沿與重量級(jí)新聞。
還有一些其他的,下次再繼續(xù)補(bǔ)充。
還有幾個(gè)博客:
iPhone上可以使用Reeder閱讀器,Instapaper用來保存后稍后閱讀,因?yàn)樾畔⒘勘容^大。
No free Hunch Kaggle競(jìng)賽平臺(tái)的官方博客,包括一些優(yōu)秀的代碼解讀以及高分選手的采訪,十分有用的經(jīng)驗(yàn)(來自不同背景,不同年齡層次,不同職業(yè)的選手)
Analytics Community | Analytics Discussions | Big Data Discussion 干貨技術(shù)文章
新浪微博-愛可可 (北郵PRIS模式識(shí)別實(shí)驗(yàn)室陳老師)
五、計(jì)算機(jī)書本下載網(wǎng)站
再增加幾個(gè)外文書本下載網(wǎng)址:
1. All IT eBooks 全,也許需求運(yùn)用翻*墻下載,翻*墻辦法見文末
2. Library Genesis 各種書本,不局限于編程書本
3. Fox eBook - eBooks Free Download Site
4. Development / Programming / AvaxHome
馬哥學(xué)習(xí)交流群
馬哥教育-Python開發(fā)-1群 335068227
馬哥教育-Python開發(fā)-2群 608459685