前言
第一篇 基礎篇
第1章 什麼是遊戲數據分析2
1.1 為什麼要對遊戲進行分析2
1.2 遊戲數據分析的流程3
1.3 數據分析師的能力要求4
1.3.1 數據處理能力5
1.3.2 數據挖掘能力6
1.3.3 數據應用能力8
1.4 小結8
第2章 必備R語言基礎9
2.1 開發環境準備和快速入門9
2.1.1 R語言簡介9
2.1.2 R的安裝10
2.1.3 其他輔助工具10
2.1.4 R快速入門12
2.2 數據對象19
2.2.1 嚮量20
2.2.2 矩陣與數組24
2.2.3 列錶和數據框27
2.3 數據導入30
2.3.1 利用RStudio導入30
2.3.2 文本文件的導入32
2.3.3 Excel文件的導入33
2.3.4 數據庫文件的導入34
2.3.5 網絡數據的爬取38
2.4 小結42
第3章 R語言繪圖重要技術43
3.1 常用圖形參數43
3.1.1 顔色元素43
3.1.2 文字元素46
3.1.3 點元素46
3.1.4 綫元素48
3.2 低級繪圖函數48
3.2.1 標題48
3.2.2 坐標軸50
3.2.3 圖例52
3.2.4 網格綫52
3.2.5 點54
3.2.6 文字54
3.2.7 綫55
3.3 高級繪圖函數57
3.3.1 散點圖58
3.3.2 氣泡圖59
3.3.3 綫圖60
3.3.4 柱狀圖62
3.3.5 餅圖62
3.3.6 直方圖和密度圖63
3.3.7 Q—Q圖65
3.3.8 箱綫圖66
3.3.9 莖葉圖66
3.3.10 點圖67
3.3.11 馬賽剋圖67
3.4 小結69
第4章 高級繪圖工具70
4.1 lattice包繪圖工具70
4.1.1 繪圖特色70
4.1.2 基本圖形77
4.2 ggplot2包繪圖工具93
4.2.1 從qplot開始93
4.2.2 ggplot作圖96
4.2.3 ggthemes主題包101
4.3 交互式繪圖工具103
4.3.1 rCharts包104
4.3.2 recharts包108
4.3.3 rbokeh包118
4.3.4 plotly包119
4.3.5 googleVis包122
4.3.6 其他基於htmlwidgets包開發的交互包124
4.4 小結132
第二篇 實戰篇
第5章 遊戲數據預處理134
5.1 數據抽樣134
5.1.1 數據抽樣的必要性134
5.1.2 類失衡處理方法:SMOTE135
5.1.3 數據隨機抽樣:sample函數138
5.1.4 數據等比抽樣:createData—Partition函數139
5.1.5 用於交叉驗證的樣本抽樣142
5.2 數據清洗143
5.2.1 缺失值判斷及處理144
5.2.2 異常值判斷處理152
5.3 數據轉換158
5.3.1 産生衍生變量158
5.3.2 數據分箱159
5.3.3 數據標準化轉換160
5.4 數據啞變量處理162
5.5 小結165
第6章 遊戲數據分析的常用方法166
6.1 遊戲數據可視化166
6.1.1 單指標數據可視化166
6.1.2 雙指標數據可視化167
6.1.3 三指標數據可視化167
6.2 遊戲數據趨勢分析169
6.2.1 同比、環比169
6.2.2 趨勢綫擬閤170
6.2.3 時間序列數據預測171
6.3 遊戲數據相關分析179
6.3.1 相關分析基本原理179
6.3.2 相關關係可視化181
6.3.3 活躍時間段相關分析184
6.4 遊戲數據中的降維技術186
6.4.1 主成分及因子分析基本原理186
6.4.2 對應分析基本原理188
6.4.3 玩傢偏好分析188
6.5 小結191
第7章 漏鬥模型與路徑分析192
7.1 漏鬥模型與路徑分析的主要區彆和聯係192
7.2 漏鬥模型193
7.2.1 漏鬥模型的主要應用場景193
7.2.2 分析案例:新手教程漏鬥模型194
7.3 路徑分析197
7.3.1 路徑分析的主要應用場景197
7.3.2 路徑分析的主要算法198
7.3.3 分析案例:遊戲點擊事件路徑分析202
7.4 小結208
第8章 留存分析209
8.1 指標概述209
8.1.1 用戶留存209
8.1.2 流失分析211
8.2 留存率的分析及預測212
8.2.1 留存率麯綫213
8.2.2 留存率預測麯綫213
8.2.3 優化預測麯綫216
8.3 用戶流失預測218
8.3.1 分類及模型評估220
8.3.2 活躍用戶流失預測233
8.4 小結238
第9章 用戶分析239
9.1 用戶分類239
9.1.1 新老用戶240
9.1.2 活躍用戶241
9.1.3 用戶習慣243
9.2 LTV244
9.2.1 LTV的定義244
9.2.2 LTV的預測244
9.3 用戶物品購買關聯分析247
9.3.1 常用關聯規則算法248
9.3.2 R中的實現250
9.3.3 案例:對用戶購買物品進行關聯分析251
9.4 基於用戶物品購買智能推薦259
9.4.1 智能推薦模型構建及評估259
9.4.2 案例:對用戶物品購買進行智能推薦262
9.5 社會網絡分析264
9.5.1 網絡圖的基本概念264
9.5.2 網絡圖的R語言實現266
9.5.3 R與Gephi的結閤270
9.5.4 案例:分析用戶物品購買分類275
9.6 小結279
第10章 渠道分析280
10.1 渠道分析的意義280
10.2 建立渠道數據監控體係282
10.2.1 構建數據分析指標283
10.2.2 建立渠道數據監控體係287
10.3 渠道用戶質量評級293
10.3.1 渠道用戶質量評級的背景和目的293
10.3.2 渠道用戶質量打分模型293
10.3.3 分析案例:渠道用戶質量打分294
10.4 小結298
第11章 收入分析299
11.1 宏觀收入分析299
11.2 遊戲經濟與用戶關係分析302
11.2.1 背景及數據302
11.2.2 數據探索分析303
11.2.3 模型構建308
11.3 RFM模型研究310
11.3.1 RFM模型研究背景及原理310
11.3.2 案例:付費用戶RFM模型研究312
11.3.3 RFM模型的不足及改進314
11.4 小結316
第三篇 提高篇
第12章 Rattle:可視化數據挖掘工具318
12.1 Rattle簡介及安裝318
12.1.1 Rattle簡介318
12.1.2 Rattle安裝319
12.2 功能預覽319
12.3 數據導入320
12.3.1 導入CSV數據321
12.3.2 導入ARFF數據325
12.3.3 導入ODBC數據326
12.3.4 R Dataset—導入其他數據源328
12.3.5 導入RData File數據集330
12.3.6 導入Library數據332
12.4 數據探索333
12.4.1 數據總體概況333
12.4.2 數據分布探索335
12.4.3 相關性338
12.4.4 主成分341
12.4.5 交互圖343
12.5 數據建模348
12.5.1 聚類分析348
12.5.2 關聯規則352
12.5.3 決策樹354
12.5.4 隨機森林356
12.6 模型評估360
12.6.1 混淆矩陣360
12.6.2 風險圖360
12.6.3 ROC麯綫及相關麯綫361
12.6.4 模型得分數據集361
12.7 小結364
第13章 快速搭建遊戲數據分析平颱365
13.1 shiny快速入門365
13.2 shinydashboard包375
13.3 案例一:搭建數據可視化原型379
13.4 案例二:用戶細分及付費預測平颱388
13.5 案例三:渠道用戶打分平颱395
13.6 小結402
· · · · · · (
收起)
評分
☆☆☆☆☆
遊戲公司內部從業者應該會比較有用
評分
☆☆☆☆☆
錯誤比較多,核對的纍死瞭。但是分析方法很好,值得參考
評分
☆☆☆☆☆
還算不錯,7-11, 13的分析案例可以一讀 (尤其是retention/churn部分),不過不太深入,簡單偏中等級彆
評分
☆☆☆☆☆
業務場景的分析實戰
評分
☆☆☆☆☆
錯誤比較多,核對的纍死瞭。但是分析方法很好,值得參考
評分
☆☆☆☆☆
以往数据分析的专业书大多是分章按部就班介绍统计学和机器学习的不同方法,如回归、决策树、神经网络。。。缺少业务的应用场景,学完之后也不知道如何用,一段时间就忘记了,下次再从头开始,效效率不高。 本书是基于业务的,总结了当前互联网数据分析的主流的主题(漏斗转化...
評分
☆☆☆☆☆
以往数据分析的专业书大多是分章按部就班介绍统计学和机器学习的不同方法,如回归、决策树、神经网络。。。缺少业务的应用场景,学完之后也不知道如何用,一段时间就忘记了,下次再从头开始,效效率不高。 本书是基于业务的,总结了当前互联网数据分析的主流的主题(漏斗转化...
評分
☆☆☆☆☆
以往数据分析的专业书大多是分章按部就班介绍统计学和机器学习的不同方法,如回归、决策树、神经网络。。。缺少业务的应用场景,学完之后也不知道如何用,一段时间就忘记了,下次再从头开始,效效率不高。 本书是基于业务的,总结了当前互联网数据分析的主流的主题(漏斗转化...
評分
☆☆☆☆☆
以往数据分析的专业书大多是分章按部就班介绍统计学和机器学习的不同方法,如回归、决策树、神经网络。。。缺少业务的应用场景,学完之后也不知道如何用,一段时间就忘记了,下次再从头开始,效效率不高。 本书是基于业务的,总结了当前互联网数据分析的主流的主题(漏斗转化...
評分
☆☆☆☆☆
以往数据分析的专业书大多是分章按部就班介绍统计学和机器学习的不同方法,如回归、决策树、神经网络。。。缺少业务的应用场景,学完之后也不知道如何用,一段时间就忘记了,下次再从头开始,效效率不高。 本书是基于业务的,总结了当前互联网数据分析的主流的主题(漏斗转化...