图书标签: 计算机 爬虫 金图可借 软件开发 Python
发表于2024-11-08
自己动手写网络爬虫 pdf epub mobi txt 电子书 下载 2024
本书介绍了网络爬虫开发中的关键问题与Java实现。主要包括从互联网获取信息与提取信息和对Web信息挖掘等内容。本书在介绍基本原理的同时注重辅以具体代码实现来帮助读者加深理解,书中部分代码甚至可以直接使用。
本书适用于有Java程序设计基础的开发人员。同时也可以作为计算机相关专业本科生或研究生的参考教程。
罗刚,计算机软件硕士,毕业于吉林工业大学。2005年创立北京盈智星科技发展有限公司,2008年联合创立上海数聚软件公司。猎兔搜索创始人,当前猎兔搜索在北京、上海以及石家庄均设有研发部。他带领猎兔搜索技术开发团队先后开发出猎兔中文分词系统、猎兔文本挖掘系统,智能垂直搜索系统以及网络信息监测系统等,实现互联网信息的采集、过滤、搜索和实时监测,其开发的搜索软件日用户访问量万次以上。
当时我看不懂啊
评分当时我看不懂啊
评分当时我看不懂啊
评分当时我看不懂啊
评分当时我看不懂啊
做技术,心态很重要。见贤思齐,见不贤而内自省 这本书又轻知识点有多,天天在路上看!挺不错的! 这是真实好评吧。你自己对着镜子检查下,肯定发现自己更烂。 在 2012年9月9日 上午10:25,Min Sun <min.sun.2007@gmail.com> 写道: >...
评分 评分http://www.topteam.cc/02-shop-detail.php?cid=47&pid=236 當你在飆網時,是否知道還有一類特殊的網路使用者也再網際網路上默默的工作著,他們就是網路爬蟲。這些網路爬蟲按照設計者預定的方式,在網路中穿梭,同時自動蒐集有用的資訊,進行分類和整理,將整理結果提供給使用...
评分虽然是最近才出的一本书,里面涉及到知识大部分可以在网络上找到,如第一章后面列举的爬虫,就有同样的英文文档,而且是很早以前的,作者根本没有自己去做些分析。第二章的bigtable,consistent hash都是现有论文或文章。 书中大段的代码其实也是没必要的,光盘里都有,书的内容...
评分书中介绍的HttpClient版本旧了,下面是新的4.0版本的例子: import java.io.BufferedInputStream; import java.io.IOException; import java.io.InputStream; import java.util.ArrayList; import java.util.List; import org.apache.http.HttpResponse; import org.apache....
自己动手写网络爬虫 pdf epub mobi txt 电子书 下载 2024