第 1 章 初識R語言..................................... 1
1.1 什麼是R語言........................................ 1
1.2 為什麼用R語言.................................... 2
1.3 安裝R..................................................... 4
1.4 R擴展包................................................. 4
1.4.1 R擴展包的安裝與載入............ 5
1.4.2 R包的使用................................ 6
1.5 R編輯器................................................. 7
1.6 工作空間............................................. 11
第 2 章 數據結構與基本運算.................... 13
2.1 數據類型............................................. 13
2.2 數據對象............................................. 14
2.2.1 嚮量......................................... 15
2.2.2 矩陣......................................... 21
2.2.3 數組......................................... 31
2.2.4 因子......................................... 32
2.2.5 列錶......................................... 33
2.2.6 數據框..................................... 34
2.3 習題..................................................... 36
第 3 章 函數與優化.................................. 38
3.1 常用的R內置函數.............................. 38
3.2 條件控製語句..................................... 38
3.2.1 if/else語句............................... 38
3.2.2 ifelse 語句............................... 39
3.2.3 switch語句............................... 39
3.3 循環語句............................................. 40
3.3.1 for循環.................................... 40
3.3.2 while循環................................ 40
3.3.3 repeat語句............................... 41
3.4 編寫自己的函數................................. 41
3.4.1 函數名..................................... 42
3.4.2 關鍵詞function........................ 42
3.4.3 參數......................................... 42
3.4.4 函數體和函數返迴值............ 44
3.5 程序調試............................................. 45
3.6 程序運行時間與效率......................... 46
3.7 用R做優化求解.................................. 47
3.7.1 一元函數優化求解................ 48
3.7.2 多元函數優化求解................ 48
3.7.3 約束條件下的優化求解........ 50
3.8 習題..................................................... 52
第 4 章 隨機數與抽樣模擬........................ 54
4.1 一元隨機數的産生............................. 54
4.1.1 均勻分布隨機數.................... 54
4.1.2 正態分布隨機數.................... 56
4.1.3 指數分布隨機數.................... 57
4.1.4 離散分布隨機數的生成........ 58
4.1.5 常見分布函數錶.................... 59
4.2 多元隨機數的生成............................. 61
4.2.1 多元正態分布隨機數............ 61
4.2.2 多元正態分布密度函數、分位數與纍積概率................ 63
4.2.3 多元t分布隨機數................... 64
4.3 隨機抽樣............................................. 65
4.3.1 放迴與無放迴抽樣................ 65
4.3.2 bootstrap重抽樣...................... 66
4.4 統計模擬............................................. 67
4.4.1 幾種常見的模擬方法............ 67
4.4.2 模擬函數的建立方法............ 70
4.5 習題..................................................... 73
第 5 章 數據讀寫與預處理........................ 74
5.1 數據的讀入......................................... 74
5.1.1 直接輸入數據........................ 74
5.1.2 讀R包中的數據...................... 75
5.1.3 從外部文件讀入數據............ 75
5.2 寫齣數據............................................. 79
5.3 數據預處理......................................... 80
5.3.1 變量預處理............................ 81
5.3.2 變量重編碼............................ 82
5.3.3 變量重命名............................ 84
5.3.4 變量類型的轉換.................... 85
5.3.5 日期變量的變換.................... 86
5.4 缺失數據處理..................................... 87
5.4.1 缺失數據的識彆.................... 87
5.4.2 缺失數據的探索與檢驗........ 88
5.4.3 缺失數據的處理.................... 89
5.5 數據集的閤並與拆分......................... 90
5.5.1 數據框的閤並與拆分............ 90
5.5.2 數據集的閤並........................ 92
5.5.3 數據集的抽取........................ 92
5.6 習題..................................................... 93
第 6 章 探索性數據分析........................... 94
6.1 主要分析工具..................................... 94
6.1.1 探索性數據分析的工具........ 94
6.1.2 數據的類型............................ 98
6.2 單變量數據分析................................. 99
6.2.1 分類型數據............................ 99
6.2.2 數值型數據.......................... 101
6.2.3 離群值探索.......................... 106
6.3 雙變量數據分析............................... 109
6.3.1 分類數據對分類數據.......... 109
6.3.2 分類數據對數值型數據...... 111
6.3.3 數值型數據對數值型數據.... 112
6.4 多變量數據分析............................... 115
6.4.1 訪問數據框數據.................. 115
6.4.2 多變量數據的分析.............. 118
6.5 習題................................................... 124
第 7 章 參數假設檢驗............................. 126
7.1 假設檢驗的思想與步驟................... 126
7.1.1 假設檢驗的基本思想.......... 126
7.1.2 假設檢驗的基本步驟.......... 128
7.2 正態總體單樣本參數假設檢驗....... 129
7.2.1 均值的檢驗.......................... 130
7.2.2 方差檢驗............................... 132
7.3 正態總體雙樣本參數假設檢驗....... 134
7.3.1 雙樣本方差的檢驗(方差齊性檢驗).............. 134
7.3.2 兩樣本均值檢驗.................. 135
7.4 比例假設檢驗................................... 139
7.4.1 單樣本比例檢驗.................. 139
7.4.2 兩樣本比例檢驗.................. 141
7.5 習題................................................... 142
第 8 章 非參數假設檢驗......................... 144
8.1 圖示法............................................... 144
8.2 卡方檢驗........................................... 146
8.2.1 卡方分布(χ 2 distribution)...... 147
8.2.2 卡方擬閤優度檢驗.............. 148
8.2.3 卡方獨立性檢驗.................. 151
8.2.4 卡方兩樣本同質性檢驗...... 151
8.3 秩和檢驗........................................... 152
8.3.1 秩的概念............................... 153
8.3.2 單樣本符號秩檢驗.............. 153
8.3.3 兩獨立秩和檢驗.................. 154
8.3.4 多個獨立樣本的秩和檢驗.... 155
8.3.5 多個相關樣本的秩和檢驗.... 158
8.4 K-S檢驗............................................ 160
8.4.1 K-S單樣本總體分布驗證.... 160
8.4.2 K-S兩獨立樣本同質檢驗.... 160
8.5 常用正態性檢驗............................... 162
8.5.1 偏度、峰度檢驗法.............. 162
8.5.2 Shapiro-Wilk(W檢驗)..... 163
8.5.3 其他常用正態檢驗.............. 165
8.6 習題................................................... 167
第 9 章 方差分析.................................... 169
9.1 單因素方差分析............................... 170
9.2 雙因素方差分析............................... 174
9.2.1 不考慮交互作用的雙因素方差分析.......................... 174
9.2.2 考慮交互作用的雙因素分析....................................... 178
9.3 習題................................................... 183
第 10 章 綫性迴歸模型........................... 184
10.1 問題提齣......................................... 184
10.2 一元綫性迴歸................................. 185
10.2.1 一元綫性迴歸概述............ 186
10.2.2 一元綫性迴歸的參數估計.... 188
10.2.3 一元綫性迴歸模型的檢驗.... 195
10.2.4 一元綫性迴歸的預測........ 197
10.2.5 一元綫性迴歸綜閤案例.... 201
10.3 多元綫性迴歸分析......................... 205
10.3.1 多元綫性迴歸模型及假定.... 206
10.3.2 參數估計............................. 207
10.3.3 模型檢驗............................. 209
10.3.4 預測..................................... 211
10.3.5 多元綫性迴歸綜閤案例.... 213
10.4 習題................................................. 218
第 11 章 綫性迴歸模型的擴展................ 220
11.1 多重共綫性..................................... 220
11.1.1 問題的提齣........................ 220
11.1.2 多重共綫性定義及後果..... 222
11.1.3 多重共綫性檢驗................ 222
11.1.4 多重共綫性剋服................ 225
11.2 異方差性......................................... 229
11.2.1 問題的提齣........................ 229
11.2.2 異方差性定義及後果........ 231
11.2.3 異方差性檢驗.................... 232
11.2.4 異方差性剋服.................... 236
11.3 序列相關性..................................... 240
11.3.1 問題的提齣........................ 241
11.3.2 序列相關性定義及後果..... 243
11.3.3 序列相關性檢驗................ 245
11.3.4 序列相關性剋服................ 248
11.4 習題................................................. 251
第 12 章 非綫性迴歸分析....................... 254
12.1 問題的提齣..................................... 254
12.2 可綫性化的非綫性迴歸................. 255
12.2.1 Cobb-Douglas生産函數..... 255
12.2.2 多項式方程模型................ 257
12.2.3 指數函數模型.................... 259
12.3 不可綫性化的非綫性迴歸............. 260
12.3.1 非綫性模型的參數估計與迭代算法......................... 262
12.3.2 初始值選取........................ 269
12.3.3 收斂性................................. 270
12.4 非綫性迴歸評價和假設檢驗......... 271
12.4.1 可決係數............................. 271
12.4.2 參數顯著性的F 檢驗....... 271
12.4.3 似然比檢驗........................ 272
12.5 習題................................................. 274
第 13 章 二元選擇模型........................... 275
13.1 問題的提齣..................................... 276
13.2 綫性概率(LP)模型原理............ 277
13.3 Probit模型原理................................ 279
13.4 Logit模型原理................................. 280
13.5 邊際效應分析................................. 281
13.6 最大似然估計(MLE)................. 282
13.7 似然比檢驗和擬閤優度................. 282
13.8 案例分析:經濟學教學新方法的效果............................................. 284
13.9 擴展案例:信用卡違約預測分析..... 289
13.9.1 描述性統計........................ 290
13.9.2 模型建立與參數估計........ 291
13.9.3 係數意義與邊際分析........ 295
13.9.4 擬閤與預測........................ 296
13.9.5 結論與建議........................ 297
13.10 習題............................................... 297
第 14 章 多元選擇模型........................... 299
14.1 有序選擇模型................................. 299
14.1.1 問題的提齣:本科生申請研究生的影響因素........ 300
14.1.2 有序選擇模型.................... 300
14.1.3 案例分析:本科生申請研究生的影響因素............ 302
14.2 多元無序Logit模型......................... 304
14.2.1 問題的提齣:關於釣魚模式的選擇......................... 304
14.2.2 多元無序Logit模型............ 305
14.2.3 案例分析:關於釣魚模式的選擇............................. 307
14.3 嵌套Logit模型................................. 309
14.3.1 問題的提齣:旅行交通方式選擇............................. 309
14.3.2 嵌套Logit模型原理............ 310
14.3.3 案例分析:旅行交通方式選擇................................. 311
14.4 習題................................................. 313
第 15 章 計數模型與受限因變量模型..... 314
15.1 計數模型......................................... 314
15.1.1 問題的提齣:輪船事故的計數數據模型................ 314
15.1.2 計數數據模型的設定........ 316
15.1.3 計數數據模型的估計........ 317
15.2 受限因變量模型............................. 319
15.2.1 截斷模型的問題提齣........ 319
15.2.2 截斷模型原理.................... 319
15.2.3 審查模型問題的提齣........ 321
15.2.4 審查模型原理.................... 322
15.2.5 最大似然估計(MLE).... 323
15.3 習題................................................. 328
第 16 章 分位數迴歸.............................. 330
16.1 問題的提齣..................................... 330
16.2 總體分位數和總體中位數............. 332
16.3 經驗分位數估計............................. 333
16.4 分位數迴歸原理............................. 334
16.5 擴展案例:社會保障與城鄉傢庭消費......................................... 339
16.5.1 問題的提齣........................ 339
16.5.2 數據說明............................. 339
16.5.3 實證分析............................. 342
16.5.4 結論與建議........................ 345
16.6 習題................................................. 345
第 17 章 高級統計繪圖........................... 346
17.1 繪製地圖......................................... 346
17.2 高階繪圖工具——ggplot2............. 355
17.2.1 散點圖................................. 355
17.2.2 散點圖上添加平滑麯綫.... 358
17.2.3 條形圖和箱綫圖................ 360
17.2.4 直方圖和密度麯綫圖........ 362
17.2.5 時間序列圖........................ 364
17.2.6 圖形標注............................. 365
17.3 三維圖形與等高綫圖..................... 366
17.3.1 三維圖形............................. 366
17.3.2 等高圖/等高綫................... 368
17.4 詞雲................................................. 369
17.5 散點圖矩陣與關係矩陣圖............. 370
17.6 馬賽剋圖......................................... 372
17.7 習題................................................. 374
第 18 章 如何製作自己的R包................. 375
18.1 R包基礎........................................... 376
18.2 在Windows中製作R包.................... 377
18.3 在RStudio中製作R包...................... 381
18.4 習題................................................. 383
參考文獻................................................... 384
· · · · · · (
收起)