本書是您縱情享用數據之美的得力助手。作為處理海量數據集的理想工具,Apache Hadoop架構是MapReduce算法的一種開源應用,是Google(榖歌)開創其帝國的重要基石。本書內容豐富,展示瞭如何使用Hadoop構建可靠、可伸縮的分布式係統,程序員可從中探索如何分析海量數據集,管理員可以瞭解如何建立與運行Hadoop集群。.
本書完全通過案例學習來展示如何用Hadoop解決特殊問題,它將幫助您:
使用Hadoop分布式文件係統(HDFS)來存儲海量數據集,通過MapReduce對這些數據集運行分布式計算..
熟悉Hadoop的數據和I/O構件,用於壓縮、數據集成、序列化和持久處理
洞悉編寫MapReduce實際應用程序時常見陷阱和高級特性
設計、構建和管理專用的Hadoop集群或在雲上運行Hadoop
使用Pig這種高級的查詢語言來處理大規模數據
利用HBase這個Hadoop數據庫來處理結構化和半結構化數據
學習Zookeeper,這是一個用於構建分布式係統的協作原語工具箱
如果您擁有海量數據,無論是GB級還是PB級,Hadoop都是完美的選擇。本書是這方麵最全麵的參考。
-- china-pub 赠书活动 -- http://www.douban.com/group/topic/20965935/ 一直比较忙,整本书还没读完,只是粗略翻了个大概,其中有两三章细读了一遍。先做个大体评价吧,有时间全部细读后再评论。 从书的内容上来讲,大致上与网上该书的内容介绍一致。简单点概括:这本书对...
評分Cobub Razor APP数据统计分析工具官网上有篇文章是讲Hadoop Yarn调度器的选择和使用的,我觉得写的挺好的,推荐http://www.cobub.com/the-selection-and-use-of-hadoop-yarn-scheduler/
評分详见:http://www.cnblogs.com/aprilrain/archive/2013/03/07/2947664.html
評分中文版412页: 所以理论上,任何东西都可以表示成二进制形式,然后转化成为长整型的字符串或直接对数据结构进行序列化,来作为键值。 原文460页: ..., so theoretically anything can serve as row key, from strings to binary representations of long or even serialized ...
評分很不上心的翻閱完瞭,有得章節閱讀果然語句有問題,有得章節又不是自己興趣所在。整體很淺顯很囉嗦,比較入門。另外版本的確夠老
评分翻譯 的很爛,隨便翻瞭翻一些。
评分2018-54
评分: TP274/9025
评分沒完全看明白 預習一下
本站所有內容均為互聯網搜索引擎提供的公開搜索信息,本站不存儲任何數據與內容,任何內容與數據均與本站無關,如有需要請聯繫相關搜索引擎包括但不限於百度,google,bing,sogou 等
© 2025 qciss.net All Rights Reserved. 小哈圖書下載中心 版权所有