圖書標籤: 網絡爬蟲 搜索引擎 編程 爬蟲 互聯網 信息檢索 計算機 搜索
发表于2024-11-25
自己動手寫網絡爬蟲 pdf epub mobi txt 電子書 下載 2024
本書介紹瞭網絡爬蟲開發中的關鍵問題與Java實現。主要包括從互聯網獲取信息與提取信息和對Web信息挖掘等內容。本書在介紹基本原理的同時注重輔以具體代碼實現來幫助讀者加深理解,書中部分代碼甚至可以直接使用。 本書適用於有Java程序設計基礎的開發人員。同時也可以作為計算機相關專業本科生或研究生的參考教材。
2013-12-24 重復
評分廢話連篇,各種東西都寫上湊篇幅
評分初步瞭解瞭網絡爬蟲的概念,瞭解瞭Google的PageRank算法的實現,HITS的實現。學到瞭很多
評分2013-12-24 重復
評分我看的是16年9月齣版的。寫得比較差,看似什麼都有,實際一點實質內容沒有。到處都是大段的無注釋代碼,拼湊內容。分布式爬蟲到底怎麼實現,solr和es一字不提,看完這本書收獲幾乎沒有。
书中介绍的HttpClient版本旧了,下面是新的4.0版本的例子: import java.io.BufferedInputStream; import java.io.IOException; import java.io.InputStream; import java.util.ArrayList; import java.util.List; import org.apache.http.HttpResponse; import org.apache....
評分腾道数据(http://www.tendata.cn/)是一家创业型的外贸咨讯网站,上线于2007年左右。 网站目前年营业额在1000万左右,略有盈利。 目前因发展需要,寻求资金合作,资金量在300-1000万左右。 如果您有兴趣,请致电010-81727660,或联系QQ:270954928 gtalk:luogang@gmail.com 详谈。
評分猎兔搜索从事企业搜索,自然语言处理等软件开发。产品包括多种语言的自然语言处理和搜索系统,网站搜索和垂直搜索软件,网络信息监测软件等。服务于农业信息化,竞争情报分析等领域。 岗位要求: 1.熟悉数据结构及其实现; 2.熟悉Java或c#; 3.数学基础较好。 开发工作: 中...
評分想了解一下nutch,然后买了这本书,但是作者大量的copy网络资料,而且例子举得也很烂,然后东一点,西一点拼凑了这本书,看了几章,实在看不下去了。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。...
自己動手寫網絡爬蟲 pdf epub mobi txt 電子書 下載 2024