目 錄
第1章 好的推薦係統 1
1.1 什麼是推薦係統 1
1.2 個性化推薦係統的應用 4
1.2.1 電子商務 4
1.2.2 電影和視頻網站 8
1.2.3 個性化音樂網絡電颱 10
1.2.4 社交網絡 12
1.2.5 個性化閱讀 15
1.2.6 基於位置的服務 16
1.2.7 個性化郵件 17
1.2.8 個性化廣告 18
1.3 推薦係統評測 19
1.3.1 推薦係統實驗方法 20
1.3.2 評測指標 23
1.3.3 評測維度 34
第2章 利用用戶行為數據 35
2.1 用戶行為數據簡介 36
2.2 用戶行為分析 39
2.2.1 用戶活躍度和物品流行度的分布 39
2.2.2 用戶活躍度和物品流行度的關係 41
2.3 實驗設計和算法評測 41
2.3.1 數據集 42
2.3.2 實驗設計 42
2.3.3 評測指標 42
2.4 基於鄰域的算法 44
2.4.1 基於用戶的協同過濾算法 44
2.4.2 基於物品的協同過濾算法 51
2.4.3 UserCF和ItemCF的綜閤比較 59
2.5 隱語義模型 64
2.5.1 基礎算法 64
2.5.2 基於LFM的實際係統的例子 70
2.5.3 LFM和基於鄰域的方法的比較 72
2.6 基於圖的模型 73
2.6.1 用戶行為數據的二分圖錶示 73
2.6.2 基於圖的推薦算法 73
第3章 推薦係統冷啓動問題 78
3.1 冷啓動問題簡介 78
3.2 利用用戶注冊信息 79
3.3 選擇閤適的物品啓動用戶的興趣 85
3.4 利用物品的內容信息 89
3.5 發揮專傢的作用 94
第4章 利用用戶標簽數據 96
4.1 UGC標簽係統的代錶應用 97
4.1.1 Delicious 97
4.1.2 CiteULike 98
4.1.3 Last.fm 98
4.1.4 豆瓣 99
4.1.5 Hulu 99
4.2 標簽係統中的推薦問題 100
4.2.1 用戶為什麼進行標注 100
4.2.2 用戶如何打標簽 101
4.2.3 用戶打什麼樣的標簽 102
4.3 基於標簽的推薦係統 103
4.3.1 實驗設置 104
4.3.2 一個最簡單的算法 105
4.3.3 算法的改進 107
4.3.4 基於圖的推薦算法 110
4.3.5 基於標簽的推薦解釋 112
4.4 給用戶推薦標簽 115
4.4.1 為什麼要給用戶推薦標簽 115
4.4.2 如何給用戶推薦標簽 115
4.4.3 實驗設置 116
4.4.4 基於圖的標簽推薦算法 119
4.5 擴展閱讀 119
第5章 利用上下文信息 121
5.1 時間上下文信息 122
5.1.1 時間效應簡介 122
5.1.2 時間效應舉例 123
5.1.3 係統時間特性的分析 125
5.1.4 推薦係統的實時性 127
5.1.5 推薦算法的時間多樣性 128
5.1.6 時間上下文推薦算法 130
5.1.7 時間段圖模型 134
5.1.8 離綫實驗 136
5.2 地點上下文信息 139
5.3 擴展閱讀 143
第6章 利用社交網絡數據 144
6.1 獲取社交網絡數據的途徑 144
6.1.1 電子郵件 145
6.1.2 用戶注冊信息 146
6.1.3 用戶的位置數據 146
6.1.4 論壇和討論組 146
6.1.5 即時聊天工具 147
6.1.6 社交網站 147
6.2 社交網絡數據簡介 148社交網絡數據中的長尾分布 149
6.3 基於社交網絡的推薦 150
6.3.1 基於鄰域的社會化推薦算法 151
6.3.2 基於圖的社會化推薦算法 152
6.3.3 實際係統中的社會化推薦算法 153
6.3.4 社會化推薦係統和協同過濾推薦係統 155
6.3.5 信息流推薦 156
6.4 給用戶推薦好友 159
6.4.1 基於內容的匹配 161
6.4.2 基於共同興趣的好友推薦 161
6.4.3 基於社交網絡圖的好友推薦 161
6.4.4 基於用戶調查的好友推薦算法對比 164
6.5 擴展閱讀 165
第7章 推薦係統實例 166
7.1 外圍架構 166
7.2 推薦係統架構 167
7.3 推薦引擎的架構 171
7.3.1 生成用戶特徵嚮量 172
7.3.2 特徵?物品相關推薦 173
7.3.3 過濾模塊 174
7.3.4 排名模塊 174
7.4 擴展閱讀 178
第8章 評分預測問題 179
8.1 離綫實驗方法 180
8.2 評分預測算法 180
8.2.1 平均值 180
8.2.2 基於鄰域的方法 184
8.2.3 隱語義模型與矩陣分解模型 186
8.2.4 加入時間信息 192
8.2.5 模型融閤 193
8.2.6 Netflix Prize的相關實驗結果 195
後記 196
· · · · · · (
收起)
評分
☆☆☆☆☆
这本书是我学习推荐系统以来接触的第一本书,书是好书,作者为了写出像《集体编程智慧》那样实用的手册还是很下了番功夫,值得肯定,特别是作者还是国内的,就更要推荐了。 从入门的角度看,本书页数不多,不会让人望而却步,第一张的引入也写的确实让人很有兴趣,之后每个章节...
評分
☆☆☆☆☆
说实话,这本书是很久以前读过的,在豆瓣的状态一直没有改,一直是在读中,今天把状态改了,顺便写一下书评。这本书是我给刚刚学习推荐系统的朋友们唯一推荐的一本书,书中内容浅显易懂,网上也有很多配套的代码可供参考。不过这本书只适合入门,虽然对目前各大网站的推荐系统...
評分
☆☆☆☆☆
刚看书看到一半的时候我曾经在短评中吐槽说,这书中的python代码可以直接去掉的,事实也确实如此,然后公式中有些变量没有注释的事情也是出现在前半部分,感觉书的后半部分要比前半部分写的严谨多了,不知道前半部分是谁写的= =!。 书的序言里写到作者想要把这本书写成像集体...
評分
☆☆☆☆☆
这本书大约写了10个月的时间,如果一定要自己评价一下这本书,只能说还行。这本书基本达到了写作目标: 1. 帮助刚毕业的学生迅速了解如何将他们学到的理论用于实际 2. 帮助程序员迅速将他们的编程能力应用到推荐系统中来 3. 强调数据分析的重要性,淡化算法 4. 运用多种评测方...
評分
☆☆☆☆☆