目 錄
第1章 好的推薦係統 1
1.1 什麼是推薦係統 1
1.2 個性化推薦係統的應用 4
1.2.1 電子商務 4
1.2.2 電影和視頻網站 8
1.2.3 個性化音樂網絡電颱 10
1.2.4 社交網絡 12
1.2.5 個性化閱讀 15
1.2.6 基於位置的服務 16
1.2.7 個性化郵件 17
1.2.8 個性化廣告 18
1.3 推薦係統評測 19
1.3.1 推薦係統實驗方法 20
1.3.2 評測指標 23
1.3.3 評測維度 34
第2章 利用用戶行為數據 35
2.1 用戶行為數據簡介 36
2.2 用戶行為分析 39
2.2.1 用戶活躍度和物品流行度的分布 39
2.2.2 用戶活躍度和物品流行度的關係 41
2.3 實驗設計和算法評測 41
2.3.1 數據集 42
2.3.2 實驗設計 42
2.3.3 評測指標 42
2.4 基於鄰域的算法 44
2.4.1 基於用戶的協同過濾算法 44
2.4.2 基於物品的協同過濾算法 51
2.4.3 UserCF和ItemCF的綜閤比較 59
2.5 隱語義模型 64
2.5.1 基礎算法 64
2.5.2 基於LFM的實際係統的例子 70
2.5.3 LFM和基於鄰域的方法的比較 72
2.6 基於圖的模型 73
2.6.1 用戶行為數據的二分圖錶示 73
2.6.2 基於圖的推薦算法 73
第3章 推薦係統冷啓動問題 78
3.1 冷啓動問題簡介 78
3.2 利用用戶注冊信息 79
3.3 選擇閤適的物品啓動用戶的興趣 85
3.4 利用物品的內容信息 89
3.5 發揮專傢的作用 94
第4章 利用用戶標簽數據 96
4.1 UGC標簽係統的代錶應用 97
4.1.1 Delicious 97
4.1.2 CiteULike 98
4.1.3 Last.fm 98
4.1.4 豆瓣 99
4.1.5 Hulu 99
4.2 標簽係統中的推薦問題 100
4.2.1 用戶為什麼進行標注 100
4.2.2 用戶如何打標簽 101
4.2.3 用戶打什麼樣的標簽 102
4.3 基於標簽的推薦係統 103
4.3.1 實驗設置 104
4.3.2 一個最簡單的算法 105
4.3.3 算法的改進 107
4.3.4 基於圖的推薦算法 110
4.3.5 基於標簽的推薦解釋 112
4.4 給用戶推薦標簽 115
4.4.1 為什麼要給用戶推薦標簽 115
4.4.2 如何給用戶推薦標簽 115
4.4.3 實驗設置 116
4.4.4 基於圖的標簽推薦算法 119
4.5 擴展閱讀 119
第5章 利用上下文信息 121
5.1 時間上下文信息 122
5.1.1 時間效應簡介 122
5.1.2 時間效應舉例 123
5.1.3 係統時間特性的分析 125
5.1.4 推薦係統的實時性 127
5.1.5 推薦算法的時間多樣性 128
5.1.6 時間上下文推薦算法 130
5.1.7 時間段圖模型 134
5.1.8 離綫實驗 136
5.2 地點上下文信息 139
5.3 擴展閱讀 143
第6章 利用社交網絡數據 144
6.1 獲取社交網絡數據的途徑 144
6.1.1 電子郵件 145
6.1.2 用戶注冊信息 146
6.1.3 用戶的位置數據 146
6.1.4 論壇和討論組 146
6.1.5 即時聊天工具 147
6.1.6 社交網站 147
6.2 社交網絡數據簡介 148社交網絡數據中的長尾分布 149
6.3 基於社交網絡的推薦 150
6.3.1 基於鄰域的社會化推薦算法 151
6.3.2 基於圖的社會化推薦算法 152
6.3.3 實際係統中的社會化推薦算法 153
6.3.4 社會化推薦係統和協同過濾推薦係統 155
6.3.5 信息流推薦 156
6.4 給用戶推薦好友 159
6.4.1 基於內容的匹配 161
6.4.2 基於共同興趣的好友推薦 161
6.4.3 基於社交網絡圖的好友推薦 161
6.4.4 基於用戶調查的好友推薦算法對比 164
6.5 擴展閱讀 165
第7章 推薦係統實例 166
7.1 外圍架構 166
7.2 推薦係統架構 167
7.3 推薦引擎的架構 171
7.3.1 生成用戶特徵嚮量 172
7.3.2 特徵?物品相關推薦 173
7.3.3 過濾模塊 174
7.3.4 排名模塊 174
7.4 擴展閱讀 178
第8章 評分預測問題 179
8.1 離綫實驗方法 180
8.2 評分預測算法 180
8.2.1 平均值 180
8.2.2 基於鄰域的方法 184
8.2.3 隱語義模型與矩陣分解模型 186
8.2.4 加入時間信息 192
8.2.5 模型融閤 193
8.2.6 Netflix Prize的相關實驗結果 195
後記 196
· · · · · · (
收起)
評分
☆☆☆☆☆
很好的科普
評分
☆☆☆☆☆
算法掃盲讀物,介紹瞭互聯網産品中與推薦相關的大部分基礎知識與思路。推薦給工程師和産品經理們
評分
☆☆☆☆☆
像我這種入門級彆的看完還是能理清很多之前見過,但沒有很清晰見解的人,不過還是需要給彆人講 PPT 和討論,纔能發現自己是否真的理解瞭。
評分
☆☆☆☆☆
像我這種入門級彆的看完還是能理清很多之前見過,但沒有很清晰見解的人,不過還是需要給彆人講 PPT 和討論,纔能發現自己是否真的理解瞭。
評分
☆☆☆☆☆
充分照顧瞭我的智商
評分
☆☆☆☆☆
这只是一本197页的书 我想你未必过瘾 但作者附上了诸多好资料 无论是paper, blog文章,wikipedia词条,数据集还是开源项目等 你可以选择拥有 附上我收集的资料链接,格式基本按照‘URL+资料名称+出现在书中的页数’,某些链接可能需要你翻过一道‘墙’,某些重复引用的...
評分
☆☆☆☆☆
最近买了一本,看了几章,感觉就像在看一本加长版的研究生毕业论文,内容还算说的过去吧,介绍基本概念公式,实验对比图表很多,不免有拼凑篇幅之嫌,感觉有点不值这个价钱。 豆瓣上9.2的评分好像在书出版上市前就有了,不知道给高分的有多少是真正买了看过的,给个三星吧。
評分
☆☆☆☆☆
評分
☆☆☆☆☆
细致的读了一遍,内容不错,虽然有些小错误,但是是本不错的入门书籍。对于推荐系统的分类描述的很清楚。还有些代码,可以自己写写实现一下。最近在弄推荐方面的东西,决定再看一遍此书,同时也应该加上别的高深一点的书籍,提高自己对推荐系统的理解
評分
☆☆☆☆☆
2009年8月,我和项亮一起发起了 ResysChina —— 一个面向推荐系统领域的专业社区。建立初衷,是想为业内关注推荐系统领域的朋友提供一个交流讨论的社区。迄今为止,业内朋友给予了 ResysChina 热情的鼓励与支持,我们组织了多次线下分享会,在嘉宾们为大家带来精彩观点的同时...