图书标签: 网络爬虫 搜索引擎 编程 爬虫 互联网 信息检索 计算机 搜索
发表于2024-12-23
自己动手写网络爬虫 pdf epub mobi txt 电子书 下载 2024
本书介绍了网络爬虫开发中的关键问题与Java实现。主要包括从互联网获取信息与提取信息和对Web信息挖掘等内容。本书在介绍基本原理的同时注重辅以具体代码实现来帮助读者加深理解,书中部分代码甚至可以直接使用。 本书适用于有Java程序设计基础的开发人员。同时也可以作为计算机相关专业本科生或研究生的参考教材。
果然看国人出的技术书要抱着很低的期望
评分我看的是16年9月出版的。写得比较差,看似什么都有,实际一点实质内容没有。到处都是大段的无注释代码,拼凑内容。分布式爬虫到底怎么实现,solr和es一字不提,看完这本书收获几乎没有。
评分初步了解了网络爬虫的概念,了解了Google的PageRank算法的实现,HITS的实现。学到了很多
评分只看了一点
评分废话连篇,各种东西都写上凑篇幅
想了解一下nutch,然后买了这本书,但是作者大量的copy网络资料,而且例子举得也很烂,然后东一点,西一点拼凑了这本书,看了几章,实在看不下去了。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。...
评分虽然是最近才出的一本书,里面涉及到知识大部分可以在网络上找到,如第一章后面列举的爬虫,就有同样的英文文档,而且是很早以前的,作者根本没有自己去做些分析。第二章的bigtable,consistent hash都是现有论文或文章。 书中大段的代码其实也是没必要的,光盘里都有,书的内容...
评分 评分虽然是最近才出的一本书,里面涉及到知识大部分可以在网络上找到,如第一章后面列举的爬虫,就有同样的英文文档,而且是很早以前的,作者根本没有自己去做些分析。第二章的bigtable,consistent hash都是现有论文或文章。 书中大段的代码其实也是没必要的,光盘里都有,书的内容...
自己动手写网络爬虫 pdf epub mobi txt 电子书 下载 2024