第1章 社會媒體、社交數據和Python 1
1.1 入門 1
1.2 社會媒體——機遇和挑戰 2
1.2.1 機遇 3
1.2.2 挑戰 4
1.2.3 社會媒體挖掘技術 7
1.3 Python的數據科學工具 10
1.3.1 Python開發環境的安裝 11
1.3.2 高效的數據分析 14
1.3.3 機器學習 17
1.3.4 自然語言處理 21
1.3.5 社會網絡分析 25
1.3.6 數據可視化 26
1.4 Python中的數據處理 28
1.5 創建復雜的數據管道 29
1.6 小結 30
第2章 Twitter數據挖掘——標簽、話題和時間序列 31
2.1 入門 31
2.2 Twitter API 32
2.2.1 接口訪問頻率限製 32
2.2.2 搜索與流 33
2.3 從Twitter收集數據 34
2.3.1 從時間綫獲取推文 35
2.3.2 推文的結構 38
2.3.3 使用流API 42
2.4 分析推文——實體分析 44
2.5 分析推文——文本分析 48
2.6 分析推文——時間序列分析 54
2.7 小結 57
第3章 Twitter用戶、粉絲和社區 58
3.1 用戶、好友和粉絲 58
3.1.1 迴到Twitter API 58
3.1.2 用戶資料的結構 59
3.1.3 下載好友和粉絲的資料 62
3.1.4 分析你的社會網絡 64
3.1.5 度量影響力和參與度 68
3.2 挖掘粉絲 72
3.3 挖掘對話 77
3.4 在地圖上繪製推文 80
3.4.1 將推文轉換為GeoJSON 80
3.4.2 用Folium輕鬆繪製地圖 83
3.5 小結 89
第4章 Facebook帖子、頁麵和用戶互動 90
4.1 Facebook Graph API 90
4.1.1 注冊你的應用 90
4.1.2 鑒權和安全 92
4.1.3 用Python連接Facebook Graph API 93
4.2 挖掘你的帖子 96
4.2.1 帖子的結構 99
4.2.2 時間頻率分析 99
4.3 挖掘Facebook頁麵 101
4.3.1 從頁麵獲取帖子 103
4.3.2 度量參與度 107
4.3.3 用詞雲可視化帖子 112
4.4 小結 114
第5章 Google+話題分析 115
5.1 Google+ API入門 115
5.2 在Web GUI中嵌入搜索結果 120
5.2.1 Python的裝飾器 121
5.2.2 Flask路由和模闆 122
5.3 Google+頁麵的筆記和活動 125
5.4 筆記的文本分析和TF-IDF計算 127
5.5 小結 134
第6章 Stack Exchange提問和迴答 135
6.1 提問和迴答 135
6.2 Stack Exchange API入門 137
6.2.1 搜索帶標簽的問題 139
6.2.2 搜索用戶 142
6.3 處理Stack Exchange的存檔數據 144
6.4 問題標簽的文本分類 149
6.4.1 監督學習和文本分類 149
6.4.2 分類算法 153
6.4.3 評估 155
6.4.4 Stack Exchange數據的文本分類 157
6.4.5 在實時應用中嵌入分類器 161
6.5 小結 165
第7章 博客、RSS、維基百科和自然語言處理 166
7.1 博客和自然語言處理 166
7.2 從博客和網站獲取數據 166
7.2.1 使用WordPress.com API 167
7.2.2 使用Blogger API 170
7.2.3 解析RSS和Atom訂閱 173
7.2.4 從維基百科獲取數據 174
7.2.5 關於網絡爬取的一點建議 176
7.3 自然語言處理基礎 177
7.3.1 文本處理 177
7.3.2 信息抽取 185
7.4 小結 190
第8章 挖掘所有數據 191
8.1 很多社交API 191
8.2 挖掘YouTube上的視頻 191
8.3 挖掘GitHub上的開源軟件 196
8.4 挖掘Yelp上的本地商傢 203
8.5 創建自定義的Python客戶端 208
8.6 小結 210
第9章 關聯數據和語義網 211
9.1 數據網 211
9.1.1 語義網詞匯 212
9.1.2 微格式 215
9.1.3 關聯數據和開放數據 216
9.1.4 RDF 217
9.1.5 JSON-LD格式 218
9.1.6 Schema.org 219
9.2 從DBpedia挖掘關係 220
9.3 挖掘地理坐標 222
9.3.1 從維基百科抽取地理數據 222
9.3.2 在Google Maps上繪製地理數據 225
9.4 小結 229
· · · · · · (
收起)