图书标签: hadoop 分布式 云计算 mapreduce Hadoop权威指南 计算机 大数据 O'Reilly
发表于2024-11-24
Hadoop权威指南(中文版) pdf epub mobi txt 电子书 下载 2024
本书是您纵情享用数据之美的得力助手。作为处理海量数据集的理想工具,Apache Hadoop架构是MapReduce算法的一种开源应用,是Google(谷歌)开创其帝国的重要基石。本书内容丰富,展示了如何使用Hadoop构建可靠、可伸缩的分布式系统,程序员可从中探索如何分析海量数据集,管理员可以了解如何建立与运行Hadoop集群。.
本书完全通过案例学习来展示如何用Hadoop解决特殊问题,它将帮助您:
使用Hadoop分布式文件系统(HDFS)来存储海量数据集,通过MapReduce对这些数据集运行分布式计算..
熟悉Hadoop的数据和I/O构件,用于压缩、数据集成、序列化和持久处理
洞悉编写MapReduce实际应用程序时常见陷阱和高级特性
设计、构建和管理专用的Hadoop集群或在云上运行Hadoop
使用Pig这种高级的查询语言来处理大规模数据
利用HBase这个Hadoop数据库来处理结构化和半结构化数据
学习Zookeeper,这是一个用于构建分布式系统的协作原语工具箱
如果您拥有海量数据,无论是GB级还是PB级,Hadoop都是完美的选择。本书是这方面最全面的参考。
: TP274/9025
评分这版翻译不行,看的第二版,学习中
评分没完全看明白 预习一下
评分没完全看明白 预习一下
评分这版翻译不行,看的第二版,学习中
中文版412页: 所以理论上,任何东西都可以表示成二进制形式,然后转化成为长整型的字符串或直接对数据结构进行序列化,来作为键值。 原文460页: ..., so theoretically anything can serve as row key, from strings to binary representations of long or even serialized ...
评分 评分Cobub Razor APP数据统计分析工具官网上有篇文章是讲Hadoop Yarn调度器的选择和使用的,我觉得写的挺好的,推荐http://www.cobub.com/the-selection-and-use-of-hadoop-yarn-scheduler/
评分书中没有透露太多实现架构方面的细节,更多的是从使用者的角度上介绍了Hadoop的各种知识,包括MapReduce, HDFS, Hive, Pig, HBase, ZooKeeper。几乎涉及了Hadoop的所有关于使用方面的知识,包括安装和使用。 你甚至可以直接在自己的电脑上装上一个Hadoop,对着书中的例子实际演...
评分Cobub Razor APP数据统计分析工具官网上有篇文章是讲Hadoop Yarn调度器的选择和使用的,我觉得写的挺好的,推荐http://www.cobub.com/the-selection-and-use-of-hadoop-yarn-scheduler/
Hadoop权威指南(中文版) pdf epub mobi txt 电子书 下载 2024