第一篇 大數據基礎篇
第1章 大數據介紹
1.1 大數據相關概念
1.1.1 大數據的曆史
1.1.2 大數據的定義
1.2 大數據研究內容
1.3 大數據研究現狀
1.3.1 學術界現狀
1.3.2 産業界現狀
1.3.3 政府機構現狀
1.4 大數據的應用領域
1.4.1 大數據在製造業的應用
1.4.2 大數據在服務業的應用
1.4.3 大數據在交通行業的應用
1.4.4 大數據在醫療行業的應用
1.5 本章小結
第2章 數據存儲技術
2.1 數據存儲技術介紹
2.2 數據采集與存儲技術研究現狀
2.2.1 傳統關係型數據庫
2.2.2 新興數據存儲係統
2.3 海量數據存儲的關鍵技術分析
2.3.1 數據劃分
2.3.2 數據一緻性與可用性
2.3.3 負載均衡
2.3.4 容錯機製
2.3.5 海量數據存儲的硬件支持
2.4 數據存儲技術的實現與工具
2.4.1 集中式數據存儲管理係統Bigtable
2.4.2 非集中式的大規模數據管理係統Dynamo
2.4.3 BigTable的開源實現HBase
2.4.4 MongoDB
2.4.5 CouchDB
2.4.6 Redis
2.4.7 Hypertable
2.4.8 其他開源NoSQL數據庫
2.5 本章小結
第3章 數據抽取和清洗
3.1 數據抽取和清洗技術介紹
3.1.1 數據抽取簡介
3.1.2 數據清洗簡介
3.2 數據抽取和清洗研究現狀
3.3 數據抽取技術的實現
3.3.1 Web數據抽取
3.3.2 非結構化數據抽取
3.3.3 基於雲計算的海量數據分析
3.4 數據清洗技術的實現
3.4.1 數據清洗流程
3.4.2 數據清洗框架
3.4.3 數據清洗相關技術
3.4.4 基於Hadoop的數據清洗方案
3.5 ETL現狀與發展
3.5.1 數據ETL簡介
3.5.2 基於MapReduce的ETL框架
3.5.3 ETL工具
3.5.4 ETL展望
3.6 本章小結
第4章 數據集成
4.1 數據集成技術介紹
4.2 數據集成技術研究現狀
4.2.1 Information Manifold:具有統一的查詢接口
4.2.2 數據集成係統的發展建設
4.2.3 企業信息集成
4.2.4 未來的挑戰
4.3 數據集成技術的實現與工具
4.3.1 Oracle Data Integrator(ODI)簡介
4.3.2 ODI的特點
4.3.3 Microsoft SQL Server Integration Services(SSIS)簡介
4.3.4 SSIS的特點
4.3.5 IBM InfoSphere Information Server簡介
4.3.6 Sybase Data Integrator Suite 簡介
4.4 本章小結
第5章 數據查詢、分析與建模技術
5.1 數據查詢、分析與建模技術介紹
5.1.1 數據查詢
5.1.2 數據分析
5.1.3 數據建模
5.2 數據查詢、分析與建模技術研究現狀
5.2.1 並行處理 178
5.2.2 海量數據查詢與搜索
5.2.3 數據分析中的OLAP與數據挖掘技術
5.2.4 數據模型與數據建模方法
5.3 數據查詢、分析與建模技術的實現與工具
5.3.1 數據查詢相關技術實現與工具
5.3.2 數據分析相關技術實現與工具
5.3.3 數據建模相關技術實現與工具
5.4 本章小結
第二篇 大數據深入篇
第6章 采用OSGi框架構建可伸縮的異構數據采集平颱
6.1 應用背景
6.2 需求分析與總體設計
6.2.1 功能需求
6.2.2 非功能需求
6.2.3 總體設計
6.3 相關技術介紹
6.3.1 OSGi 框架介紹
6.3.2 多源異構數據的獲取
6.4 係統設計與實現
6.4.1 異構數據采集平颱的設計
6.4.2 數據采集插件的設計與實現
6.4.3 係統服務框架的設計與實現
6.5 部署與測試
6.5.1 係統部署
6.5.2 係統測試
6.6 本章小結
第7章 采用HBase實現海量小型XML文檔的存儲與檢索
7.1 應用背景
7.2 需求分析與總體設計
7.2.1 需求分析
7.2.2 總體設計
7.3 相關技術介紹
7.3.1 XML相關技術
7.3.2 XQuery語句
7.3.3 XML檢索技術
7.3.4 雲計算和HBase
7.3.5 JavaCC工具介紹
7.4 詳細設計與實現
7.4.1 數據存儲模塊的詳細設計與實現
7.4.2 數據檢索模塊的詳細設計與實現
7.4.3 用戶模塊的詳細設計與實現
7.5 本章小結
第8章 采用Map/Reduce進行大規模社交網絡社團發現
8.1 研究背景
8.2 相關理論和技術
8.2.1 社團結構
8.2.2 相關社團發現算法
8.2.3 Hadoop分布計算框架
8.3 RMS算法的並行化實現
8.3.1 RMS算法
8.3.2 RMS算法在MapReduce上的實現
8.4 AP聚類算法的並行化實現
8.4.1 AP聚類算法
8.4.2 AP聚類算法在MapReduce上的實現
8.5 實驗與分析
8.5.1 實驗環境
8.5.2 實驗與結果分析
8.6 本章小結
第9章 數據統一訪問與轉換平颱
9.1 應用背景介紹
9.2 數據統一訪問需求分析與總體設計
9.2.1 功能性需求分析
9.2.2 非功能性需求分析
9.2.3 總體設計
9.3 數據統一訪問與轉換關鍵技術
9.3.1 SDO編程技術
9.3.2 Hadoop MapReduce框架
9.3.3 HBase數據庫技術
9.3.4 模型驅動數據轉換技術
9.4 數據統一訪問和靈活轉換的詳細設計與實現
9.4.1 數據分析及預處理
9.4.2 基於DAS的數據源統一訪問
9.4.3 映射模式錶示與數據存儲管理模塊
9.4.4 基於MapReduce的數據轉換管理模塊
9.5 本章小結
第三篇 大數據應用篇
第10章 基於微博的股票市場預測係統
10.1 應用背景介紹
10.2 需求分析與總體設計
10.2.1 需求分析
10.2.2 總體設計
10.3 相關技術介紹
10.3.1 社交網絡
10.3.2 社交網絡錶示方法
10.3.3 信息傳播模型
10.4 詳細設計與實現
10.4.1 Twitter數據采集模塊詳細設計
10.4.2 Twitter數據分析模塊詳細設計
10.4.3 用戶行為分析模塊詳細設計
10.4.4 預測股票價格漲跌模塊詳細設計
10.4.5 係統實現
10.5 本章小結
第11章 基於內容的海量視頻檢索係統
11.1 應用背景
11.2 需求分析與總體設計
11.2.1 功能需求
11.2.2 非功能需求
11.2.3 核心業務處理流程
11.2.4 總體設計
11.3 相關技術簡介
11.3.1 MPEG-7與OpenCV簡介
11.3.2 運動對象提取
11.3.3 星形骨架方法
11.4 詳細設計與實現
11.4.1 基於MapReduce的視頻預處理
11.4.2 基於HBase的視頻數據存儲
11.4.3 行為識彆與運動規則的組閤創建
11.5 係統運行時截圖
11.6 本章小結
第12章 基於HDFS的雲文件係統
12.1 應用背景介紹
12.2 需求分析與總體設計
12.2.1 需求分析
12.2.2 總體設計
12.3 相關技術介紹
12.3.1 Hadoop HDFS介紹
12.3.2 主控節點和數據節點
12.3.3 頁麵展現技術
12.3.4 頁麵控製技術
12.4 詳細設計與實現
12.4.1 雲文件係統的操作流程
12.4.2 雲文件係統的模塊設計
12.4.3 雲文件係統實現
12.4.4 雲文件係統主要功能截圖
12.5 本章小結
· · · · · · (
收起)