-
>
全國計算機等級考試最新真考題庫模擬考場及詳解·二級MSOffice高級應用
-
>
決戰行測5000題(言語理解與表達)
-
>
軟件性能測試.分析與調優實踐之路
-
>
第一行代碼Android
-
>
JAVA持續交付
-
>
EXCEL最強教科書(完全版)(全彩印刷)
-
>
深度學習
人工智能科學與技術叢書統計學習理論與方法——R語言版 版權信息
- ISBN:9787302530886
- 條形碼:9787302530886 ; 978-7-302-53088-6
- 裝幀:一般膠版紙
- 冊數:暫無
- 重量:暫無
- 所屬分類:>>
人工智能科學與技術叢書統計學習理論與方法——R語言版 本書特色
從統計學觀點出發,以數理統計為基礎,全面系統地介紹了機器學習的主要方法。 根據全新設計的學習路線圖編寫,注重夯實理論基礎,更便于深化對知識點的理解,建立系統性的全局觀。 對機器學習所涉及的數學基礎進行了完整的解釋和必要的鋪墊,更便于讀者對深化相關知識的理解。
人工智能科學與技術叢書統計學習理論與方法——R語言版 內容簡介
本書從統計學觀點出發,以數理統計為基礎,全面系統地介紹了統計機器學習的主要方法。內容涉及回歸(線性回歸、多項式回歸、非線性回歸、嶺回歸,以及LASSO等)、分類(感知機、邏輯回歸、樸素貝葉斯、決策樹、支持向量機、人工神經網絡等)、聚類(K均值、EM算法、密度聚類等)、蒙特卡洛采樣(拒絕采樣、自適應拒絕采樣、重要性采樣、吉布斯采樣和馬爾科夫鏈蒙特卡洛等)、降維與流形學習(SVD、PCA和MDS等),以及概率圖模型基礎等話題。此外,為方便讀者自學,本書還扼要地介紹了機器學習中所推薦的數學知識(包括概率論與數理統計、凸優化及泛函分析基礎等)。 本書是統計機器學習及相關課程的教學參考書,適用于高等院校人工智能、機器學習或數據挖掘等相關專業的師生研習之用,也可供從事計算機應用,特別是數據科學相關專業的研發人員參考。
人工智能科學與技術叢書統計學習理論與方法——R語言版 目錄
目錄
第1章概率論基礎
1.1基本概念
1.2隨機變量數字特征
1.2.1期望
1.2.2方差
1.2.3矩與矩母函數
1.2.4協方差與協方差矩陣
1.3基本概率分布模型
1.3.1離散概率分布
1.3.2連續概率分布
1.3.3在R中使用內嵌分布
1.4概率論中的重要定理
1.4.1大數定理
1.4.2中央極限定理
1.5經驗分布函數
第2章統計推斷
2.1參數估計
2.1.1參數估計的基本原理
2.1.2單總體參數區間估計
2.1.3雙總體均值差的估計
2.1.4雙總體比例差的估計
2.2假設檢驗
2.2.1基本概念
2.2.2兩類錯誤
2.2.3均值檢驗
2.3極大似然估計
2.3.1極大似然法的基本原理
2.3.2求極大似然估計的方法
2.3.3極大似然估計應用舉例
第3章采樣方法
3.1蒙特卡洛法求定積分
3.1.1無意識統計學家法則
3.1.2投點法
3.1.3期望法
3.2蒙特卡洛采樣
3.2.1逆采樣
3.2.2博克斯穆勒變換
3.2.3拒絕采樣與自適應拒絕采樣
3.3矩陣的極限與馬爾科夫鏈
3.4查普曼柯爾莫哥洛夫等式
3.5馬爾科夫鏈蒙特卡洛
3.5.1重要性采樣
3.5.2馬爾科夫鏈蒙特卡洛的基本概念
3.5.3MetropolisHastings算法
3.5.4Gibbs采樣
第4章非參數檢驗方法
4.1列聯分析
4.1.1類別數據與列聯表
4.1.2皮爾遜(Pearson)的卡方檢驗
4.1.3列聯分析應用條件
4.1.4費希爾(Fisher)的確切檢驗
4.2符號檢驗
4.3威爾科克森符號秩檢驗
4.4威爾科克森的秩和檢驗
4.5克魯斯卡爾沃利斯檢驗
第5章一元線性回歸
5.1回歸分析的性質
5.2回歸的基本概念
5.2.1總體的回歸函數
5.2.2隨機干擾的意義
5.2.3樣本的回歸函數
5.3回歸模型的估計
5.3.1普通*小二乘法原理
5.3.2一元線性回歸的應用
5.3.3經典模型的基本假定
5.3.4總體方差的無偏估計
5.3.5估計參數的概率分布
5.4正態條件下的模型檢驗
5.4.1擬合優度的檢驗
5.4.2整體性假定檢驗
5.4.3單個參數的檢驗
5.5一元線性回歸模型預測
5.5.1點預測
5.5.2區間預測
第6章多元線性回歸
6.1多元線性回歸模型
6.2多元回歸模型估計
6.2.1*小二乘估計量
6.2.2多元回歸的實例
6.2.3總體參數估計量
6.3從線性代數角度理解*小二乘
6.3.1*小二乘問題的通解
6.3.2*小二乘問題的計算
6.4多元回歸模型檢驗
6.4.1線性回歸的顯著性
6.4.2回歸系數的顯著性
6.5多元線性回歸模型預測
6.6格蘭杰因果關系檢驗
第7章線性回歸進階
7.1更多回歸模型函數形式
7.1.1雙對數模型以及生產函數
7.1.2倒數模型與菲利普斯曲線
7.1.3多項式回歸模型及其分析
7.2回歸模型的評估與選擇
7.2.1嵌套模型選擇
7.2.2赤池信息準則
7.2.3逐步回歸方法
7.3現代回歸方法的新進展
7.3.1多重共線性
7.3.2嶺回歸
7.3.3從嶺回歸到LASSO
7.3.4正則化
第8章方差分析方法
8.1方差分析的基本概念
8.2單因素方差分析方法
8.2.1基本原理
8.2.2分析步驟
8.2.3強度測量
8.3雙因素方差分析方法
8.3.1無交互作用的分析
8.3.2有交互作用的分析
8.4多重比較
8.4.1多重t檢驗
8.4.2Dunnett檢驗
8.4.3Tukey的HSD檢驗
8.4.4NewmanKeuls檢驗
8.5方差齊性的檢驗方法
8.5.1Bartlett檢驗法
8.5.2Levene檢驗法
第9章邏輯回歸與*大熵模型
9.1邏輯回歸
9.2牛頓法解Logistic回歸
9.3多元邏輯回歸
9.4*大熵模型
9.4.1*大熵原理
9.4.2約束條件
9.4.3模型推導
9.4.4極大似然估計
第10章聚類分析
10.1聚類的概念
10.2K均值算法
10.2.1距離度量
10.2.2算法描述
10.2.3數據分析實例
10.2.4圖像處理應用舉例
10.3*大期望算法
10.3.1算法原理
10.3.2收斂探討
10.4高斯混合模型
10.4.1模型推導
10.4.2應用實例
10.5密度聚類與DBSCAN算法
第11章支持向量機
11.1線性可分的支持向量機
11.1.1函數距離與幾何距離
11.1.2*大間隔分類器
11.1.3拉格朗日乘數法
11.1.4對偶問題的求解
11.2松弛因子與軟間隔模型
11.3非線性支持向量機方法
11.3.1從更高維度上分類
11.3.2非線性核函數方法
11.3.3機器學習中的核方法
11.3.4默瑟定理
11.4對數據進行分類的實踐
11.4.1基本建模函數
11.4.2分析建模結果
第12章貝葉斯推斷
12.1貝葉斯公式與邊緣分布
12.2貝葉斯推斷中的重要概念
12.2.1先驗概率與后驗概率
12.2.2共軛分布
12.3樸素貝葉斯分類器
12.4貝葉斯網絡
12.4.1基本結構單元
12.4.2模型推理
12.5貝葉斯推斷的應用舉例
第13章降維與流形學習
13.1主成分分析(PCA)
13.2奇異值分解(SVD)
13.2.1一個基本的認識
13.2.2為什么可以做SVD
13.2.3SVD與PCA的關系
13.2.4應用舉例與矩陣的偽逆
13.3多維標度法(MDS)
第14章決策樹
14.1決策樹基礎
14.1.1Hunt算法
14.1.2基尼測度與劃分
14.1.3信息熵與信息增益
14.1.4分類誤差
14.2決策樹進階
14.2.1ID3算法
14.2.2C4.5算法
14.3分類回歸樹
14.4決策樹剪枝
14.4.1沒有免費午餐原理
14.4.2剪枝方法
14.5分類器的評估
第15章人工神經網絡
15.1從感知機開始
15.1.1感知機模型
15.1.2感知機學習
15.1.3多層感知機
15.2基本神經網絡
15.2.1神經網絡結構
15.2.2符號標記說明
15.2.3后向傳播算法
15.3神經網絡實踐
15.3.1核心函數介紹
15.3.2應用分析實踐
附錄A必不可少的數學基礎
A.1泰勒公式
A.2海塞矩陣
A.3凸函數與詹森不等式
A.3.1凸函數的概念
A.3.2詹森不等式及其證明
A.3.3詹森不等式的應用
A.4泛函與抽象空間
A.4.1線性空間
A.4.2距離空間
A.4.3賦范空間
A.4.4巴拿赫空間
A.4.5內積空間
A.4.6希爾伯特空間
A.5從泛函到變分法
A.5.1理解泛函的概念
A.5.2關于變分的概念
A.5.3變分法的基本方程
A.5.4哈密爾頓原理
A.5.5等式約束下的變分
參考文獻
人工智能科學與技術叢書統計學習理論與方法——R語言版 節選
第3章采樣方法 上一章介紹了采樣的概念。例如,想知道一所大學里所有男生的平均身高。但是因為學校里的男生可能有上萬人之多,所以為每個人都測量一下身高存在很大困難,于是從每個學院隨機挑選出100名男生來作為樣本,這個過程就是采樣。然而,本章將要討論的采樣則有另外一層含義。現實中的很多問題可能求解起來是相當困難的。這時就可能會想到利用計算機模擬的方法來幫助求解。在使用計算機進行模擬時,所說的采樣,是指從一個概率分布中生成觀察值的方法。而這個分布通常是由其概率密度函數來表示的。但即使在已知概率密度函數的情況下,讓計算機自動生成觀測值也不是一件容易的事情。 3.1蒙特卡洛法求定積分 蒙特卡洛(Monte Carlo)法是一類隨機算法的統稱。它是20世紀40年代中期由于科學技術的發展,尤其是電子計算機的發明,而被提出并發揚光大的一種以概率統計理論為基礎的數值計算方法。它的核心思想就是使用隨機數(或更準確地說是偽隨機數)來解決一些復雜的計算問題。現今,蒙特卡洛法已經在諸多領域展現出了超強的能力。本節,我們將通過蒙特卡洛法*為常見的一種應用——求解定積分,來演示這類算法的核心思想。 3.1.1無意識統計學家法則 作為一個預備知識,先來介紹一下無意識統計學家法則(Law of the Unconscious Statistician,LOTUS)。在概率論與統計學中,如果知道隨機變量X的概率分布,但是并不顯式地知道函數g(X)的分布,那么LOTUS就是一個可以用來計算關于隨機變量X的函數g(X)之期望的定理。該法則的具體形式依賴于隨機變量X之概率分布的描述形式。 如果隨機變量X的分布是離散的,而且我們知道它的PMF是fX,但不知道fg(X),那么g(X)的期望是 E[g(X)]=∑xg(x)fX(x) 其中和式是在取遍X的所有可能之值x后求得。 如果隨機變量X的分布是連續的,而且我們知道它的PDF是fX,但不知道fg(X),那么g(X)的期望是 E[g(X)]=∫∞-∞g(x)fX(x) 簡而言之,已知隨機變量X的概率分布,但不知道g(X)的分布,此時用LOTUS公式能計算出函數g(X)的數學期望。其實就是在計算期望時,用已知的X的PDF(或PMF)代替未知的g(X)的PDF(或PMF)。 3.1.2投點法 圖31投點法求定積分 投點法是講解蒙特卡洛法基本思想的一個*基礎也*直觀的實例。這個方法也常常被用來求圓周率π。現在我們用它來求函數的定積分。如圖31所示,有一個函數f(x),若要求它從a到b的定積分,其實就是求曲線下方的面積。 可以用一個比較容易算得面積的矩型罩在函數的積分區間上(假設其面積為Area)。然后隨機地向這個矩形框里面投點,其中落在函數f(x)下方的點為菱形,其他點為三角形。然后統計菱形點的數量占所有點(菱形+三角形)數量的比例為r,那么就可以據此估算出函數f(x)從a到b的定積分為Area×r。 注意由蒙特卡洛法得出的值并不是一個精確值,而是一個近似值。而且當投點的數量越來越大時,這個近似值也越接近真實值。 3.1.3期望法 下面來重點介紹利用蒙特卡洛法求定積分的第二種方法——期望法,有時也稱為平均值法。 任取一組相互獨立、同分布的隨機變量{Xi},Xi在[a,b]上服從分布律fX,也就是說fX是隨機變量X的PDF(或PMF)。令g*(x)=g(x)fX(x),則g*(Xi)也是一組獨立同分布的隨機變量,而且因為g*(x)是關于x的函數,所以根據LOTUS可得 E[g*(Xi)]=∫bag*(x)fX(x)dx=∫bag(x)dx=I 由強大數定理 PrlimN→∞1N∑Ni=1g*(Xi)=I=1 若選 =1N∑Ni=1g*(Xi) 則依概率1收斂到I。平均值法就用作為I的近似值。 假設要計算的積分有如下形式 I=∫bag(x)dx 其中,被積函數g(x)在區間[a,b]上可積。任意選擇一個有簡便辦法可以進行抽樣的概率密度函數fX(x),使其滿足下列條件: (1) 當g(x)≠0時,fX(x)≠0,a≤x≤b; (2) ∫bafX(x)dx=1。 如果記 g*(x)=g(x)fX(x) ,fX(x)≠0 0,fX(x)=0 那么原積分式可以寫成 I=∫bag*(x)fX(x)dx 因而求積分的步驟是: (1) 產生服從分布律fX的隨機變量Xi,i=1,2,…,N; (2) 計算均值 =1N∑Ni=1g*(Xi) 并用它作為I的近似值,即I≈。 如果a,b為有限值,那么fX可取作為均勻分布 fX(x)=1b-a,a≤x≤b 0,其他 此時原來的積分式變為 I=(b-a)∫bag(x)1b-adx 因而求積分的步驟是: (1) 產生[a,b]上的均勻分布隨機變量Xi,i=1,2,…,N; (2) 計算均值 =b-aN ∑Ni=1g(Xi) 并用它作為I的近似值,即I≈。 *后來看一下平均值法的直觀解釋。注意積分的幾何意義就是[a,b]區間曲線下方的面積,如圖32所示。 當在[a,b]隨機取一點x時,它對應的函數值就是f(x),然后便可以用f(x)·(b-a)來粗略估計曲線下方的面積(也就是積分),如圖33所示,當然這種估計(或近似)是非常粗略的。 圖32積分的幾何意義 圖33對積分值進行粗略估計 于是我們想到在[a,b]隨機取一系列點xi時(xi滿足均勻分布),然后把估算出來的面積取平均來作為積分估計的一個更好的近似值,如圖34所示。可以想象,如果這樣的采樣點越來越多,那么對于這個積分的估計也就越來越接近。 圖34對積分值進行估計 按照上面這個思路,得到積分公式為 =(b-a)1N ∑N-1i=0f(Xi)=1N ∑N-1i=0f(Xi)1b-a 其中,1b-a 就是均勻分布的PMF。這跟之前推導出來的蒙特卡洛積分公式是一致的。
人工智能科學與技術叢書統計學習理論與方法——R語言版 作者簡介
左飛 博士,技術作家、譯者。著作涉及人工智能、圖像處理和編程語言等多個領域,其中兩部作品的繁體版在中國臺灣地區發行。同時,他還翻譯出版了包括《編碼》在內的多部經典著作。曾榮獲“最受讀者喜愛的IT圖書作譯者獎”。他撰寫的技術博客(https://baimafujinji.blog.csdn.net/)非常受歡迎,累計擁有近500萬的訪問量。
- >
姑媽的寶刀
- >
羅曼·羅蘭讀書隨筆-精裝
- >
朝聞道
- >
唐代進士錄
- >
莉莉和章魚
- >
企鵝口袋書系列·偉大的思想20:論自然選擇(英漢雙語)
- >
伊索寓言-世界文學名著典藏-全譯本
- >
新文學天穹兩巨星--魯迅與胡適/紅燭學術叢書(紅燭學術叢書)