中文字幕在线观看,亚洲а∨天堂久久精品9966,亚洲成a人片在线观看你懂的,亚洲av成人片无码网站,亚洲国产精品无码久久久五月天

80本值得一讀的最佳數(shù)據(jù)科學(xué)書(shū)籍(一)

2020-12-04    來(lái)源:raincent

容器云強(qiáng)勢(shì)上線(xiàn)!快速搭建集群,上萬(wàn)Linux鏡像隨意使用


數(shù)據(jù)科學(xué)是近幾年最受歡迎的概念。我相信很多人都在尋找進(jìn)入該行業(yè)的入口,最近剛讀了一篇文章,其中列出了一些對(duì)大家可能有幫助的數(shù)據(jù)科學(xué)書(shū)籍。因此,我在本文中進(jìn)行了總結(jié),同時(shí)還對(duì)書(shū)籍進(jìn)行了簡(jiǎn)要介紹,以便可以選擇要閱讀的書(shū)籍。部分可以在網(wǎng)上找到一些數(shù)據(jù)科學(xué)書(shū)籍,文中給出了鏈接。但其中大多數(shù)可能需要在亞馬遜上才能找到。

目錄

第一部分:數(shù)據(jù)科學(xué)家的核心技能

♦  Data Science
♦  Math
♦  Probability and Statistics
♦  Machine Learning
♦  Data Mining
♦  SQL
♦  R
♦  Python
♦  Data Scientist Interview
♦  Algorithm
♦  Handbook
♦  Web Scraping and Data Wrangling
♦  Data Visualization and Storytelling
♦  A/B Testing

第二部分:數(shù)據(jù)科學(xué)高級(jí)技能

♦  Neural Network and Deep Learning
♦  Information Theory
♦  Causal Inference
♦  Sampling
♦  Convex
♦  Growth Analytics
♦  Text Mining and Natural Language Processing
♦  Anomaly Detection
♦  Recommender Systems
♦  Social Network Analysis
♦  Time Series Analysis and Forecasting
♦  Reinforcement Learning and Artificial Intelligence

第三部分:休閑閱讀

第一部分:數(shù)據(jù)科學(xué)家的核心技能

數(shù)據(jù)科學(xué) Data Science

1. The Data Science Handbook:25位出色的數(shù)據(jù)科學(xué)家的建議和見(jiàn)解

 

 

該手冊(cè)中有25位業(yè)內(nèi)專(zhuān)家給出了一些建議,對(duì)初學(xué)者非常有幫助。

2.Data Science for Business:需要了解的有關(guān)數(shù)據(jù)挖掘和數(shù)據(jù)分析思維的知識(shí)

 

 

商業(yè)數(shù)據(jù)科學(xué)由著名的數(shù)據(jù)科學(xué)專(zhuān)家Foster Provost和Tom Fawcett撰寫(xiě),介紹了數(shù)據(jù)科學(xué)的基本原理,并引導(dǎo)您完成從收集的數(shù)據(jù)中提取有用的知識(shí)和業(yè)務(wù)價(jià)值所必需的“數(shù)據(jù)分析思維”。本指南還可以幫助您了解當(dāng)今使用的許多數(shù)據(jù)挖掘技術(shù)。

3.Doing Data Science:Straight Talk from the Frontline

 

 

在許多這些長(zhǎng)達(dá)一章的講座中,來(lái)自Google,Microsoft和eBay等公司的數(shù)據(jù)科學(xué)家通過(guò)展示案例研究和它們使用的代碼來(lái)共享新的算法,方法和模型。如果您熟悉線(xiàn)性代數(shù),概率和統(tǒng)計(jì),并且具有編程經(jīng)驗(yàn),那么這本書(shū)是數(shù)據(jù)科學(xué)的理想入門(mén)。

數(shù)學(xué)Math

4.多元微積分Multivariate Calculus

 

https://ocw.mit.edu/courses/mathematics/18-02sc-multivariable-calculus-fall-2010/index.htm

 

5.線(xiàn)性代數(shù) Linear Algebra

 

 

https://ocw.mit.edu/courses/mathematics/18-06sc-linear-algebra-fall-2011/index.htm

概率統(tǒng)計(jì)Probability and Statistics

6. Introduction to Probability, Statistics, and Random Processes

 

 

這本書(shū)向?qū)W生介紹了概率,統(tǒng)計(jì)和隨機(jī)過(guò)程。工程,各種科學(xué),金融和其他相關(guān)領(lǐng)域的學(xué)生和實(shí)踐者都可以使用它。它為這些主題提供了清晰直觀(guān)的方法,同時(shí)保持了數(shù)學(xué)準(zhǔn)確性。您還可以在線(xiàn)查找課程和視頻。

https://www.probabilitycourse.com

7. OpenIntro Statistics

 

 

OpenIntro項(xiàng)目成立于2009年,旨在通過(guò)生產(chǎn)可免費(fèi)使用和易于修改的出色書(shū)籍和教學(xué)工具來(lái)提高教育質(zhì)量和可用性。而其首創(chuàng)成果是OpenIntro Statistics。相應(yīng)的課程和視頻可以在以下網(wǎng)址找到:https : //www.openintro.org

8.Statistical Inference

 

 

這是許多大學(xué)應(yīng)屆畢業(yè)生的教科書(shū)。

討論理論統(tǒng)計(jì)和理論發(fā)展的實(shí)際應(yīng)用。包括大量涵蓋理論和應(yīng)用的練習(xí)。

9.Applied Linear Statistical Models

 

 

“Applied Linear Statistical Models”是長(zhǎng)期建立的領(lǐng)先權(quán)威文獻(xiàn),也是統(tǒng)計(jì)建模的參考。第五版在不犧牲概念或嚴(yán)格性的前提下,在整個(gè)過(guò)程中增加了對(duì)計(jì)算和圖形分析的使用。通常,5e在示例和練習(xí)中使用較大的數(shù)據(jù)集,并且可以在軟件內(nèi)自動(dòng)進(jìn)行方法而又不會(huì)失去理解的情況下,這樣做就可以了。

10.An Introduction to Generalized Linear Models

 

 

內(nèi)容歸納為標(biāo)題。廣義線(xiàn)性模型簡(jiǎn)介。

11.All of Statistics: 統(tǒng)計(jì)推斷簡(jiǎn)明課程

 

 

本書(shū)適用于希望快速學(xué)習(xí)概率和統(tǒng)計(jì)信息的人。它適合計(jì)算機(jī)科學(xué),數(shù)學(xué),統(tǒng)計(jì)學(xué)和相關(guān)學(xué)科的研究生或高等本科生。

12.Computer Age Statistical Inference: 算法,證據(jù)和數(shù)據(jù)科學(xué)

 

 

Efron和Hastie通過(guò)本書(shū)向我們?nèi)娼榻B了大數(shù)據(jù)時(shí)代的統(tǒng)計(jì)數(shù)據(jù)。

13.Statistics in a Nutshell: 桌面快速參考

 

 

標(biāo)題中的快速參考

14.Bayes' Rule: 貝葉斯分析教程簡(jiǎn)介

 

 

15. Think Bayes:Python中的貝葉斯統(tǒng)計(jì)

 

 

簡(jiǎn)要介紹如何使用Python進(jìn)行貝葉斯統(tǒng)計(jì)

http://www.greenteapress.com/thinkbayes/thinkbayes.pdf

16.黑客的貝葉斯方法

 

 

有關(guān)如何使用Python進(jìn)行貝葉斯統(tǒng)計(jì)的高級(jí)教程

https://github.com/CamDavidsonPilon/Probabilistic-Programming-and-Bayesian-Methods-for-Hackers

17.Practical Statistics for Data Scientists: 50個(gè)基本概念

 

 

該實(shí)用指南說(shuō)明了如何將各種統(tǒng)計(jì)方法應(yīng)用于數(shù)據(jù)科學(xué),告訴您如何避免它們的誤用,并為您提供關(guān)于重要和不重要的建議。

您可以在這里找到它:https : //github.com/andrewgbruce/statistics-for-data-scientists

機(jī)器學(xué)習(xí)Machine Learning

18.An Introduction to Statistical Learning:R中的應(yīng)用

 

 

毫無(wú)疑問(wèn),這是一本好書(shū),該領(lǐng)域的每個(gè)人都應(yīng)該聽(tīng)說(shuō)過(guò)。

http://www-bcf.usc.edu/~gareth/ISL/

https://lagunita.stanford.edu/courses/HumanitiesSciences/StatLearning/Winter2016/about

19.Applied Predictive Modeling

 

 

應(yīng)用預(yù)測(cè)建模涵蓋了整個(gè)預(yù)測(cè)建模過(guò)程。面試或工作前必讀。

20. Python機(jī)器學(xué)習(xí)

 

 

Python Machine Learning Second Edition現(xiàn)在包括流行的TensorFlow深度學(xué)習(xí)庫(kù)。scikit-learn代碼也已完全更新,以包括對(duì)該通用機(jī)器學(xué)習(xí)庫(kù)的最新改進(jìn)和添加。

21.預(yù)測(cè)數(shù)據(jù)分析的機(jī)器學(xué)習(xí)基礎(chǔ):算法,可行的示例和案例研究

 

 

全面介紹了預(yù)測(cè)數(shù)據(jù)分析中使用的最重要的機(jī)器學(xué)習(xí)方法,涵蓋了理論概念和實(shí)際應(yīng)用。

22.Real-World Machine Learning 現(xiàn)實(shí)世界的機(jī)器學(xué)習(xí)

 

 

本書(shū)告訴您如何使用機(jī)器學(xué)習(xí)來(lái)解決實(shí)際問(wèn)題。強(qiáng)烈建議所有數(shù)據(jù)科學(xué)家在實(shí)習(xí)或工作之前閱讀它

23.Learning From Data

 

 

解釋了許多書(shū)中沒(méi)有提到的許多機(jī)器學(xué)習(xí)理論,例如VC維。

https://work.caltech.edu/telecourse.html

24.The Elements of Statistical Learning: 數(shù)據(jù)挖掘,推理和預(yù)測(cè),第二版

 

 

本書(shū)在一個(gè)通用的概念框架中描述了各個(gè)領(lǐng)域的重要思想,例如醫(yī)學(xué),生物學(xué),金融和市場(chǎng)營(yíng)銷(xiāo)。很棒的ESL,我認(rèn)為它很適合翻閱和摘錄。

25.Pattern Recognition and Machine Learning

 

本書(shū)介紹了近似推理算法,可以在無(wú)法給出精確答案的情況下提供快速近似答案。當(dāng)沒(méi)有其他書(shū)籍將圖形模型應(yīng)用于機(jī)器學(xué)習(xí)時(shí),它使用圖形模型來(lái)描述概率分布。

 

數(shù)據(jù)挖掘Data Mining

26.數(shù)據(jù)挖掘原理 Principles of Data Mining

 

 

數(shù)據(jù)挖掘的基本介紹,討論了很多關(guān)聯(lián)規(guī)則。

27.數(shù)據(jù)挖掘概論Introduction to Data Mining

 

 

數(shù)據(jù)挖掘概論介紹了那些初次學(xué)習(xí)數(shù)據(jù)挖掘的人的基本概念和算法。

28. Data Mining Techniques: 用于營(yíng)銷(xiāo),銷(xiāo)售和客戶(hù)關(guān)系管理

 

 

通過(guò)實(shí)際示例介紹如何使用數(shù)據(jù)挖掘從客戶(hù)那里賺錢(qián)。

SQL

29. SQL Cookbook:數(shù)據(jù)庫(kù)開(kāi)發(fā)人員的查詢(xún)解決方案和技術(shù)

 

 

本菜譜提到了SQL查詢(xún)中的許多陷阱,并給出了每個(gè)流行數(shù)據(jù)庫(kù)的查詢(xún)代碼。

R

30.R in Action

 

 

本書(shū)從介紹R語(yǔ)言(包括開(kāi)發(fā)環(huán)境)開(kāi)始。著重于實(shí)際解決方案,該書(shū)還提供了實(shí)際統(tǒng)計(jì)方面的速成課程,并介紹了使用R的功能處理混亂和不完整數(shù)據(jù)的優(yōu)雅方法。

31. R for Data Science

 

 

32. R Packages

 

 

33. Advanced R

 

 

由Hadley Wickham教授撰寫(xiě)。

R for Data Science與Garrett Grolemund一起,介紹了使用R進(jìn)行數(shù)據(jù)科學(xué)的關(guān)鍵工具。R軟件包使用捆綁,文檔化和測(cè)試代碼的軟件包,教導(dǎo)了R的良好軟件工程實(shí)踐。

高級(jí)R幫助您將R掌握為編程語(yǔ)言,并教會(huì)您如何使R打勾。

Python

34.Think Python

 

本指南逐步指導(dǎo)使用該語(yǔ)言,從基本的編程概念開(kāi)始,然后再進(jìn)行功能,遞歸,數(shù)據(jù)結(jié)構(gòu)和面向?qū)ο蟮脑O(shè)計(jì)。適合初學(xué)者

35.Fluent Python

 

 

作者Luciano Ramalho帶領(lǐng)您學(xué)習(xí)Python的核心語(yǔ)言功能和庫(kù),并向您展示如何使代碼同時(shí)更短,更快和更易讀。

36. Python for Probability, Statistics, and Machine Learning

 

 

本書(shū)涵蓋了在這些領(lǐng)域中使用Python模塊說(shuō)明的將概率,統(tǒng)計(jì)數(shù)據(jù)和機(jī)器學(xué)習(xí)聯(lián)系起來(lái)的關(guān)鍵思想。

37. Python數(shù)據(jù)科學(xué)手冊(cè) Python Data Science Handbook

 

 

一本非常全面的手冊(cè)介紹了如何使用Python解決數(shù)據(jù)科學(xué)問(wèn)題。

https://github.com/jakevdp/PythonDataScienceHandbook

數(shù)據(jù)科學(xué)家訪(fǎng)談Data Scientist Interview

38.Data Science Interviews Exposed

 

 

數(shù)據(jù)科學(xué)面試提供數(shù)據(jù)科學(xué)的職業(yè)建議和REAL面試問(wèn)題,以幫助您獲得六位數(shù)的薪水工作!

39.Cracking the PM Interview: 如何找到產(chǎn)品經(jīng)理在技術(shù)領(lǐng)域的工作

 

 

在美國(guó),許多數(shù)據(jù)科學(xué)家都與產(chǎn)品密切相關(guān),甚至其中一些人被聘為產(chǎn)品經(jīng)理,因此這本書(shū)的PM訪(fǎng)談對(duì)數(shù)據(jù)科學(xué)家具有參考價(jià)值。

算法Algorithm

40. Grokking Algorithms:面向程序員和其他好奇者的插圖指南

 

 

《 Grokking算法》是一本完整而友好的指南,它教您如何將常見(jiàn)算法應(yīng)用于程序員每天面對(duì)的實(shí)際問(wèn)題。

41.使用Python解決算法和數(shù)據(jù)結(jié)構(gòu)問(wèn)題 Problem Solving with Algorithms and Data Structures Using Python

 

 

算法和數(shù)據(jù)結(jié)構(gòu)的研究對(duì)于理解計(jì)算機(jī)科學(xué)的意義至關(guān)重要。這些就是本書(shū)的全部?jī)?nèi)容。

電子版:http : //interactivepython.org/runestone/static/pythonds/index.html

42.Algorithms in a Nutshell:實(shí)用指南

 

 

快速查看的算法指南。

Handbook

43.數(shù)據(jù)科學(xué)手冊(cè) The Data Science Handbook

 

 

數(shù)據(jù)科學(xué)的全面概述,涵蓋了掌握該學(xué)科所需的分析,編程和業(yè)務(wù)技能

Web Scraping and Data Wrangling

44. Web Scraping with Python: 從現(xiàn)代Web收集數(shù)據(jù)

 

 

通過(guò)本實(shí)用指南,您將學(xué)習(xí)如何使用Python腳本和Web API一次收集和處理數(shù)千個(gè)甚至數(shù)百萬(wàn)個(gè)Web頁(yè)面中的數(shù)據(jù)。實(shí)際上,僅使用 Octoparse 即可滿(mǎn)足您的Web抓取需求。

45. Data Wrangling with Python: 簡(jiǎn)化生活的提示??和工具

 

 

本書(shū)教您如何清除凌亂的原始數(shù)據(jù)。將其整理成您想要的方式。

46. Regular Expressions Cookbook

 

 

盡管正則表達(dá)式很煩人,但您必須面對(duì)它。您可以使用本書(shū)來(lái)檢查所需的正則表達(dá)式。

數(shù)據(jù)可視化和故事Data Visualization and Storytelling

47.Communicating Data with Tableau: 設(shè)計(jì),開(kāi)發(fā)和交付數(shù)據(jù)可視化

 

 

本實(shí)用指南向您展示如何使用Tableau Software將原始數(shù)據(jù)轉(zhuǎn)換為引人入勝的數(shù)據(jù)可視化效果,以提供洞察力或允許查看者自己瀏覽數(shù)據(jù)。

48. Interactive Data Visualization for the Web: D3設(shè)計(jì)簡(jiǎn)介

 

 

此完全更新和擴(kuò)展的第二版將帶您了解D3的基本概念和方法,D3是最強(qiáng)大的JavaScript庫(kù),用于在Web瀏覽器中直觀(guān)地表達(dá)數(shù)據(jù)。

49.使用Python和JavaScript進(jìn)行數(shù)據(jù)可視化:抓取,清理,瀏覽和轉(zhuǎn)換數(shù)據(jù)

 

 

在本動(dòng)手指南中,作者Kyran Dale教您如何使用一流的Python和JavaScript庫(kù)(包括Scrapy,Matplotlib,Pandas,F(xiàn)lask和D3)構(gòu)建基本的dataviz工具鏈,以構(gòu)建引人入勝的基于瀏覽器的可視化。

50.Storytelling with Data: 業(yè)務(wù)專(zhuān)業(yè)人員的數(shù)據(jù)可視化指南

 

 

本書(shū)演示了如何超越常規(guī)工具來(lái)獲取數(shù)據(jù)的根源,以及如何使用數(shù)據(jù)來(lái)創(chuàng)建一個(gè)引人入勝,內(nèi)容豐富,引人入勝的故事。

A / B測(cè)試

51. A / B Testing:將點(diǎn)擊轉(zhuǎn)化為客戶(hù)的最強(qiáng)大方法

 

 

52.Designing with Data: 通過(guò)A / B測(cè)試改善用戶(hù)體驗(yàn)

 

 

第二部分:數(shù)據(jù)科學(xué)高級(jí)技能

第三部分:休閑閱讀

請(qǐng)?jiān)陉P(guān)注更新

by Paul Black 來(lái)源:bigdatanews

原文:https://www.bigdatanews.datasciencecentral.com/profiles/blogs/80-best-data-science-books-that-are-worthy-reading

標(biāo)簽: 數(shù)據(jù) 

版權(quán)申明:本站文章部分自網(wǎng)絡(luò),如有侵權(quán),請(qǐng)聯(lián)系:west999com@outlook.com
特別注意:本站所有轉(zhuǎn)載文章言論不代表本站觀(guān)點(diǎn)!
本站所提供的圖片等素材,版權(quán)歸原作者所有,如需使用,請(qǐng)與原作者聯(lián)系。

上一篇:五個(gè)給機(jī)器學(xué)習(xí)和數(shù)據(jù)科學(xué)入門(mén)者的學(xué)習(xí)建議

下一篇:一看就懂的10個(gè)數(shù)據(jù)可視化技巧