123,123,123

本書將帶領讀者一起主動擁抱機器學習，快樂翻越高等數(shù)學、算法分析、工程實踐這三座大山。面對三類讀者（會用即可、想深入學習、想成為專家）的學習動機和閱讀需求，全書一共用19章來講解機器學習的各種模型，包括機器學習中基礎和關鍵的線性回歸、邏輯回歸、決策樹、貝葉斯、支持向量機、KNN等。全書具有語言表達輕快、模型講解細致、圖表配備眾多的特色。

本書可供計算機、人工智能、大數(shù)據(jù)等專業(yè)的大學生、研究生閱讀，也可供需要用到機器學習技術的廣大工程技術人員、研究人員作為參考。

機器學習對于眾多軟件從業(yè)人員的誘惑是無需多言的。然而櫻桃好吃樹難栽，大多數(shù)初學者最終未能到達成功的彼岸，不少甚至連中途未到就放棄了。

工作關系，我也曾經(jīng)多次試圖走進機器學習的殿堂。每次所下的決心雖然不小但卻無功而返。放棄的原因并不復雜，經(jīng)常都是由于對一個概念、一個原理、一個公式實在無法理解所導致的。比如，我看過的書中，關于線性回歸都是引用現(xiàn)成的算法函數(shù)，沒有看到過這個函數(shù)在數(shù)學上倒底是怎么實現(xiàn)的，因此對于給定的幾個散點，如果不借助現(xiàn)成的算法函數(shù)，我確實沒搞明白怎么才能擬合出相應的回歸方程。線性回歸是機器學習算法中最基本、最簡單的算法，但我怎么敢說自己真正理解了線性回歸呢？

相關的圖書買了不少看了不少，浪費些腦細胞不算事兒，心里不好邁過的那道坎是買書浪費了很多錢。作為一名老圖書編輯，牢騷之后往往會對所看的這些書做一些思考或幻想，比如：你不講一下機器學習實驗環(huán)境配置讀者怎么邊學邊做？這個算法原理感覺這么晦澀到底是因為作者水平太高還是因為我水平太低？這個數(shù)學公式如果給出推導過程我是不是就不用東查西查了？公式中的這些符號為什么不能解釋一下？這個地方如果能舉個例子該有多好？這個地方配個圖多直觀？……

我向大家推薦鄧子云老師這本機器學習的書，僅僅是因為我在編輯此書的過程中感覺到，他精確地假設了我的水平，他精確地知道每一個知識點怎么講、講到什么程度我才能懂，他精確地知道我在每一個地方會產(chǎn)生什么樣的疑惑。后來有一次與鄧老師吃飯時我說：鄧老師，你就像我肚子里的蛔蟲，鄧老師說：你學習過程中遇到的坑我基本都遇到過，我只是盡力把坑填平。

簡單的一句話，背后凝聚的是鄧子云老師多年關于機器學習的教學、知識、實踐、經(jīng)驗、思考及責任。這本七十余萬字的長篇巨著，蘊含了數(shù)百張精心設計的實戰(zhàn)插圖，數(shù)十個的公式詳細推導過程及講解，字里行間的點點珠璣，深入淺出的醍醐灌頂……

盡管感覺本書還有不少可優(yōu)化之處，但它確實使我在機器學習的征途中走出了最遠的距離。

周春元

機器學習涉及的知識特別多，令人應接不睱；實際工程應用非常廣，令人不得不學。目前，很多高校開設了人工智能、大數(shù)據(jù)專業(yè)，很多企業(yè)也需要用到人工智能技術。人工智能、大數(shù)據(jù)基礎的知識領域自然還是機器學習。于是，學習機器學習的人越來越多。

當前市面上已有不少有關機器學習的圖書。有的淺嘗輒止，一種模型三五頁就講完了，讓人大致明白但又感覺不著地；有的滿版公式，讓人不得要領；有的只有理論講解沒有實例，讓人不好動手練習。我覺得根據(jù)讀者對知識的學習訴求和規(guī)律來寫作圖書可以解決這些問題。我把對機器學習有學習動機的讀者分成三類：

1．會用即可的讀者。這類讀者的訴求是只要會用某個類庫（如scikit-learn）建立簡單的機器學習模型、能做數(shù)據(jù)分析和預測即可。針對這類讀者，寫一大堆數(shù)學公式?jīng)]有意義。

2．想深入學習的讀者。這類讀者的訴求是要學懂每個模型的數(shù)學原理，會推導公式。這類讀者得掌握微積分、線性代數(shù)、概率論、統(tǒng)計學這四門課程的知識。

3．想成為專家的讀者。這類讀者的訴求是要學習每種模型的高級知識，并能融會貫通地使用開發(fā)工具找到較為理想的模型參數(shù)。那就需要掌握一些更為復雜的數(shù)據(jù)結構、算法分析與設計知識，并能接受厚重的知識閱讀量。

為了滿足這三類讀者的訴求，考慮到機器學習的模型眾多，我不打算在本書中講解所有的機器學習模型，而是針對機器學習中基礎和關鍵的線性回歸、邏輯回歸、決策樹、貝葉斯、支持向量機、KNN這六種模型來進行詳細講解，并采取如下的寫法：

1．第1、2章用于打基礎。講解有關機器學習的基本概念，說明如何使用Python編程做簡單的開發(fā)。

2．對每個模型分3章來講解。第1章滿足會用即可的讀者；第2章滿足想深入學習的讀者；第3章滿足想成為專家的讀者。由于KNN模型相對簡單一些，沒有編寫第3章。

3．每個模型均有實例講解。有的使用scikit-learn庫編程實現(xiàn)，有的自主編程實現(xiàn)。我認為理解了原理，完全可以自己編程實現(xiàn)，只是我們沒有必要這么做。多數(shù)情況下，使用類庫編程即可，理解原理則還能有目標地調節(jié)參數(shù)來找到更為理想的模型。

本書有三點特色：

1．語言表達輕快。我比較喜歡閱讀文字表達像聊天的圖書，自己寫作也將運用這種風格，盡管可能會損失一點數(shù)學的嚴謹性。

2．模型講解細致。對每個模型有關的數(shù)學知識、原理、公式推導都講得很細致。

3．圖表配備眾多。一圖決勝千里，能用圖表達出原理就用圖表達。全書一共配了280多幅插圖和80多張表格。

如果讀者能把本書通讀下來，相信再去閱讀有關某一種模型的專著和學術論文將會輕松很多，也將能看得懂滿版的數(shù)學公式；而且用于工程實踐也不會是難事，讀者要做的更多的是分析業(yè)務場景的需求、構建模型所需的數(shù)據(jù)。

鑒于作者的水平有限，疏漏之處在所難免，敬請讀者多批評、指教，我的郵箱是dengziyun@126.com，歡迎來信溝通交流。

感謝中國水利水電出版社萬水分社的周春元副總經(jīng)理，他經(jīng)常和我探討選題的寫作、宣傳和讀者的需求，給了我創(chuàng)作的動力。感謝我的夫人黃婧女士，她承擔了大量的家務及帶孩子的事務，使得我有時間在工作之余進行創(chuàng)作。還要感謝參考文獻中的很多作者及CSDN、博客園、知乎上的很多博主，他們的創(chuàng)作成果為我的寫作提供了大量的參考資料。

本書的創(chuàng)作只是個開始，如果讀者反饋寫得還不錯，我將繼續(xù)創(chuàng)作討論機器學習其他模型的圖書。最后給出全書為三類讀者準備的學習路線總圖供閱讀、參考。

為減輕讀者購書成本，本書采用了黑白印刷，這可能導致某些圖片的印刷效果不如彩色印刷效果好。因此，特將本書所有圖片及書中源代碼打包，如有需要，讀者可掃描下方二維碼進行免費下載。

你還可能感興趣

我要評論