图书标签: 计算机 爬虫 金图可借 软件开发 Python
发表于2025-01-04
自己动手写网络爬虫 pdf epub mobi txt 电子书 下载 2025
本书介绍了网络爬虫开发中的关键问题与Java实现。主要包括从互联网获取信息与提取信息和对Web信息挖掘等内容。本书在介绍基本原理的同时注重辅以具体代码实现来帮助读者加深理解,书中部分代码甚至可以直接使用。
本书适用于有Java程序设计基础的开发人员。同时也可以作为计算机相关专业本科生或研究生的参考教程。
罗刚,计算机软件硕士,毕业于吉林工业大学。2005年创立北京盈智星科技发展有限公司,2008年联合创立上海数聚软件公司。猎兔搜索创始人,当前猎兔搜索在北京、上海以及石家庄均设有研发部。他带领猎兔搜索技术开发团队先后开发出猎兔中文分词系统、猎兔文本挖掘系统,智能垂直搜索系统以及网络信息监测系统等,实现互联网信息的采集、过滤、搜索和实时监测,其开发的搜索软件日用户访问量万次以上。
当时我看不懂啊
评分当时我看不懂啊
评分当时我看不懂啊
评分当时我看不懂啊
评分当时我看不懂啊
猎兔搜索从事企业搜索,自然语言处理等软件开发。产品包括多种语言的自然语言处理和搜索系统,网站搜索和垂直搜索软件,网络信息监测软件等。服务于农业信息化,竞争情报分析等领域。 岗位要求: 1.熟悉数据结构及其实现; 2.熟悉Java或c#; 3.数学基础较好。 开发工作: 中...
评分书中介绍的HttpClient版本旧了,下面是新的4.0版本的例子: import java.io.BufferedInputStream; import java.io.IOException; import java.io.InputStream; import java.util.ArrayList; import java.util.List; import org.apache.http.HttpResponse; import org.apache....
评分 评分书中介绍的HttpClient版本旧了,下面是新的4.0版本的例子: import java.io.BufferedInputStream; import java.io.IOException; import java.io.InputStream; import java.util.ArrayList; import java.util.List; import org.apache.http.HttpResponse; import org.apache....
评分虽然是最近才出的一本书,里面涉及到知识大部分可以在网络上找到,如第一章后面列举的爬虫,就有同样的英文文档,而且是很早以前的,作者根本没有自己去做些分析。第二章的bigtable,consistent hash都是现有论文或文章。 书中大段的代码其实也是没必要的,光盘里都有,书的内容...
自己动手写网络爬虫 pdf epub mobi txt 电子书 下载 2025