上 篇
第1章 用戶畫像概述 3
1.1 用戶畫像數據來源 3
1.1.1 用戶屬性 5
1.1.2 用戶觀影行為 5
1.2 用戶畫像特性 5
1.2.1 動態性 5
1.2.2 時空局部性 6
1.3 用戶畫像應用領域 6
1.3.1 搜索引擎 6
1.3.2 推薦係統 7
1.3.3 其他業務定製與優化 7
1.4 大數據給用戶畫像帶來的機遇與挑戰 8
第2章 用戶畫像建模 9
2.1 用戶定量畫像 9
2.2 用戶定性畫像 10
2.2.1 標簽與用戶定性畫像 10
2.2.2 基於知識的用戶定性畫像分析 12
2.2.3 用戶定性畫像的構建 16
2.2.4 定性畫像知識的存儲 22
2.2.5 定性畫像知識的推理 26
2.3 本章參考文獻 29
第3章 群體用戶畫像分析 31
3.1 用戶畫像相似度 32
3.1.1 定量相似度計算 32
3.1.2 定性相似度計算 34
3.1.3 綜閤相似度計算 35
3.2 用戶畫像聚類 36
第4章 用戶畫像管理 41
4.1 存儲機製 41
4.1.1 關係型數據庫 42
4.1.2 NoSQL數據庫 43
4.1.3 數據倉庫 45
4.2 查詢機製 46
4.3 定時更新機製 47
4.3.1 獲取實時用戶信息 47
4.3.2 更新觸發條件 48
4.3.3 更新機製 49
中 篇
第5章 視頻推薦概述 55
5.1 主流推薦方法的分類 56
5.1.1 協同過濾的推薦方法 56
5.1.2 基於內容的推薦方法 57
5.1.3 基於知識的推薦方法 59
5.1.4 混閤推薦方法 60
5.2 推薦係統的評測方法 61
5.3 視頻推薦與用戶畫像的邏輯關係 61
第6章 協同過濾推薦方法 65
6.1 概述 65
6.2 關係矩陣及矩陣計算 67
6.2.1 U-U矩陣 67
6.2.2 V-V矩陣 70
6.2.3 U-V矩陣 72
6.3 基於記憶的協同過濾算法 74
6.3.1 基於用戶的協同過濾算法 75
6.3.2 基於物品的協同過濾算法 78
6.4 基於模型的協同過濾算法 81
6.4.1 基於隱因子模型的推薦算法 82
6.4.2 基於樸素貝葉斯分類的推薦算法 85
6.5 小結 88
6.6 本章參考文獻 88
第7章 基於內容的推薦方法 91
7.1 概述 91
7.2 CB推薦中的特徵嚮量 94
7.2.1 視頻推薦中的物品畫像 94
7.2.2 視頻推薦中的用戶畫像 96
7.3 基礎CB推薦算法 97
7.4 基於TF-IDF的CB推薦算法 99
7.5 基於KNN的CB推薦算法 102
7.6 基於Rocchio的CB推薦算法 104
7.7 基於決策樹的CB推薦算法 106
7.8 基於綫性分類的CB推薦算法 107
7.9 基於樸素貝葉斯的CB推薦算法 109
7.10 小結 111
7.11 本章參考文獻 111
第8章 基於知識的推薦方法 113
8.1 概述 113
8.2 約束知識與約束推薦算法 114
8.2.1 約束知識示例 114
8.2.2 約束滿足問題 115
8.2.3 約束推薦算法流程 117
8.3 關聯知識與關聯推薦算法 118
8.3.1 關聯規則描述 118
8.3.2 關聯規則挖掘 121
8.3.3 關聯推薦算法流程 123
8.4 小結 124
8.5 本章參考文獻 124
第9章 混閤推薦方法 125
9.1 概述 125
9.2 算法設計層麵的混閤方法 126
9.2.1 並行式混閤 126
9.2.2 整體式混閤 129
9.2.3 流水綫式混閤 131
9.2.4 典型混閤應用係統 133
9.3 混閤式視頻推薦實例 136
9.3.1 MoRe係統概覽 136
9.3.2 MoRe算法介紹 137
9.3.3 MoRe算法混閤 139
9.3.4 MoRe實驗分析 140
9.4 小結 142
9.5 本章參考文獻 142
第10章 視頻推薦評測 145
10.1 概述 145
10.2 視頻推薦試驗方法 146
10.2.1 在綫評測 147
10.2.2 離綫評測 149
10.2.3 用戶調查 150
10.3 視頻離綫推薦評測指標 151
10.3.1 準確度指標 151
10.3.2 多樣性指標 159
10.4 小結 161
10.5 本章參考文獻 162
下 篇
第11章 係統層麵的快速推薦構建 165
11.1 概述 165
11.2 本章主要內容 166
11.3 係統部署 166
11.3.1 Hadoop2.2.0係統部署 166
11.3.2 Hadoop運行時環境設置 169
11.3.3 Spark與Mahout部署 175
11.4 Mahout推薦引擎介紹 181
11.4.1 Item-based算法 181
11.4.2 矩陣分解 185
11.4.3 ALS算法 187
11.4.4 Mahout的Spark實現 190
11.5 快速實戰 193
11.5.1 概述 193
11.5.2 日誌數據 194
11.5.3 運行環境 196
11.5.4 基於Mahout Item-based算法實踐 201
11.5.5 基於Mahout ALS算法實踐 205
11.6 小結 208
11.7 本章參考文獻 208
第12章 數據層麵的分析與推薦案例 211
12.1 概述 211
12.2 本章主要內容 212
12.3 競賽內容和意義 212
12.3.1 競賽簡介 212
12.3.2 競賽任務和意義 213
12.4 客戶-商戶數據 215
12.4.1 數據描述 215
12.4.2 數據理解與分析 217
12.5 算法流程設計 219
12.5.1 特徵提取 219
12.5.2 分類器設計 220
12.5.3 算法流程總結 222
12.6 小結 222
12.7 本章參考文獻 223
· · · · · · (
收起)
評分
☆☆☆☆☆
算法分類一部分講的很清晰,但整體結構似乎卡在産品和技術之間,最後兩頭不討好。
評分
☆☆☆☆☆
嗬嗬
評分
☆☆☆☆☆
不要寫那麼大的標題 結果寫的其實就是一個視頻網站推薦算法的實現…
評分
☆☆☆☆☆
事實上是一本基礎的推薦係統理論書,和用戶畫像大概有25%的關係(前50頁)。看推薦係統我乾嘛不看機械工業齣版社的大厚書… 既網文標題黨後又來瞭書名黨,不值得買,前50頁大概有30頁值得看(企業應用沒見過有protege的,介紹瞭大概20頁)
評分
☆☆☆☆☆
泛而說之,感覺就是把東拉西扯在一起,沒有深入下去
評分
☆☆☆☆☆
行文风格更像是一篇多人作者共同撺出来的硕士毕业论文,很多内容拼凑比较生硬,缺少逻辑承接,要么文字表达十分冗余,一堆空洞的大白话,要么突然冒出一节教科书式的学术段落,很突兀,和后面的内容也没啥关系。举一个小例子,作为奔着书名买的读者,他需要这本书详细介绍各类...
評分
☆☆☆☆☆
行文风格更像是一篇多人作者共同撺出来的硕士毕业论文,很多内容拼凑比较生硬,缺少逻辑承接,要么文字表达十分冗余,一堆空洞的大白话,要么突然冒出一节教科书式的学术段落,很突兀,和后面的内容也没啥关系。举一个小例子,作为奔着书名买的读者,他需要这本书详细介绍各类...
評分
☆☆☆☆☆
行文风格更像是一篇多人作者共同撺出来的硕士毕业论文,很多内容拼凑比较生硬,缺少逻辑承接,要么文字表达十分冗余,一堆空洞的大白话,要么突然冒出一节教科书式的学术段落,很突兀,和后面的内容也没啥关系。举一个小例子,作为奔着书名买的读者,他需要这本书详细介绍各类...
評分
☆☆☆☆☆
行文风格更像是一篇多人作者共同撺出来的硕士毕业论文,很多内容拼凑比较生硬,缺少逻辑承接,要么文字表达十分冗余,一堆空洞的大白话,要么突然冒出一节教科书式的学术段落,很突兀,和后面的内容也没啥关系。举一个小例子,作为奔着书名买的读者,他需要这本书详细介绍各类...
評分
☆☆☆☆☆
行文风格更像是一篇多人作者共同撺出来的硕士毕业论文,很多内容拼凑比较生硬,缺少逻辑承接,要么文字表达十分冗余,一堆空洞的大白话,要么突然冒出一节教科书式的学术段落,很突兀,和后面的内容也没啥关系。举一个小例子,作为奔着书名买的读者,他需要这本书详细介绍各类...