數據科學已融合多門學科于一體,包括數學,概率統計,機器學習,自然語言處理,數據倉庫,大數據,可視化,云計算等。
正因為多個學科的交叉和融合,給數據領域的從業者和學習者在使用和學習上帶來的巨大的困難。
為了從互聯網獲取更多相關經驗,收集整理了相關領域有一定價值的博客和站點。
涵蓋的內容有,R語言,數據挖掘,機器學習等,大量的翻譯和原創文章。大量關于NLP(自然語言處理)和機器學習的文章,作者開源了中文分詞器HanNLP。如果要了解在中文上的數據挖掘的相關問題,可以閱讀此博客。我愛自然語言處理的中文站點。同英文站點一樣,文章優質,并且大多都是基于實踐的內容。該站點同"52nlp"一樣,不同的只是更加專注機器學習。來自CSDN的一位博主,多是關于Spark Milb的文章。博主著有《Spark MLlib機器學習》一書,博客的文章同樣質量很高。來自國外的一個博客,豐富的機器學習實踐經驗,包括:神經網絡,深度學習,線性回歸等。作者董西成,著有《Hadoop技 術內幕:深入解析MapReduce架構設計與實現原理》和《Hadoop技術內幕:深入解析YARN架構設計與實現原理》國內比較出名的大數據個人博客,圍繞Hadoop生態圈和Spark的大量文章可供閱讀。比較偏重于Hadoop生態圈,文章的質量很高,能夠解決一些實際生產中遇到的問題。比較綜合的一個站點,很多大數據領域相關的文章,但偏重于資訊。來自博客園蝦皮工作室,文章圍繞Hadoop,適合入門學習。早期學習Hadoop時,閱讀了許多粉絲日志的文章,文章的質量很高,大都是解決一些實際問題。數據科學領域的相關技術,近兩年發展迅猛。有時僅憑個人的經驗很難解決一些問題。互聯網上遍布各類文章和資源,在學習時應該集萬家之長,注重實踐,并善于總結。同上面各博客的博主一樣為知識的開源做一份貢獻,讓知識廣為傳播。
滿滿干貨的大數據技術個人博客收集
您也可以關注我們的官方微信公眾號(ID:ctoutiao),給您更多好看的內容。
聲明:本文由墨加科技企業號發布,依據企業號用戶協議,該企業號為文章的真實性和準確性負責。創頭條作為品牌傳播平臺,只為傳播效果負責,在文章不存在違反法律規定的情況下,不繼續承擔甄別文章內容和觀點的義務。