圖書標籤: 爬蟲 Python 編程 python scrapy 簡書有翻譯 計算機 計算機
发表于2024-11-05
精通Python爬蟲框架Scrapy pdf epub mobi txt 電子書 下載 2024
Scrapy是使用Python開發的一個快速、高層次的屏幕抓取和Web抓取框架,用於抓Web站點並從頁麵中提取結構化的數據。《精通Python爬蟲框架Scrapy》以Scrapy 1.0版本為基礎,講解瞭Scrapy的基礎知識,以及如何使用Python和三方API提取、整理數據,以滿足自己的需求。
本書共11章,其內容涵蓋瞭Scrapy基礎知識,理解HTML和XPath,安裝Scrapy並爬取一個網站,使用爬蟲填充數據庫並輸齣到移動應用中,爬蟲的強大功能,將爬蟲部署到Scrapinghub雲服務器,Scrapy的配置與管理,Scrapy編程,管道秘訣,理解Scrapy性能,使用Scrapyd與實時分析進行分布式爬取。本書附錄還提供瞭各種軟件的安裝與故障排除等內容。
本書適閤軟件開發人員、數據科學傢,以及對自然語言處理和機器學習感興趣的人閱讀。
作者:[美]迪米特裏奧斯 考奇斯-勞卡斯(Dimitrios Kouzis-Loukas) 譯者:李斌
Dimitrios Kouzis-Loukas作為一位軟件開發人員,已經擁有超過15年的經驗。同時,他還使用自己掌握的知識和技能,嚮廣大讀者講授如何編寫軟件。
他學習並掌握瞭多門學科,包括數學、物理學以及微電子學。他對這些學科的透徹理解,提高瞭自身的標準,而不隻是“實用的解決方案”。他知道真正的解決方案應當是像物理學規律一樣確定,像ECC內存一樣健壯,像數學一樣通用。
Dimitrios目前正在使用新的數據中心技術開發低延遲、高可用的分布式係統。他是語言無關論者,不過對Python、C++和Java略有偏好。他對開源軟硬件有著堅定的信念,他希望他的貢獻能夠造福於各個社區和全人類。
關於譯者
李斌,畢業於北京科技大學計算機科學與技術專業,獲得碩士學位。曾任職於阿裏巴巴,當前供職於凡普金科,負責應用安全工作。熱愛Python編程和Web安全,希望以更加智能和自動化的方式提升網絡安全。
走馬觀花看完的一本書,翻譯不算太好。 可能是我太菜瞭,看著有些費力。
評分這本書總體來說還不錯,xpath基礎講的蠻不錯的。整個邏輯思路還是蠻清晰,但是有一點特彆蛋疼,就是版本太久,有些東西都不能用瞭。比如第三章中的urljoin()現在屬於urllib庫中的一個方法,MapCompose(unicode.strip)方法已經不能使用。我就我就粗略地將後麵給看瞭一遍,後麵難度有點大。發現不怎麼適閤用來入門scrapy框架。不過裏麵的知識點也屬於乾貨,學到不少新東西。總體來說當做一本讀物還是不錯瞭,如果想依靠這本書學習scrapy框架的話,可能會有點遺憾。
評分作者的水平還是很高的。不過不太適閤初學者,比較適閤進階的讀者
評分走馬觀花看完的一本書,翻譯不算太好。 可能是我太菜瞭,看著有些費力。
評分還算實用,最後幾章twisted和性能解釋太難啦
https://www.jianshu.com/c/a3b6e459f76c ==========================================================================================================================================================
評分https://www.jianshu.com/c/a3b6e459f76c ==========================================================================================================================================================
評分书中作者说自己的书不如官方文档,我觉得他太谦虚了,这本书无疑比官方文档要写得好! 最近看了很多技术书籍,很多书可以看出是拼凑而来,没什么干货。 但是这本书完全是一股清流!作者的分享欲望很强烈,写书很认真!一本爬虫框架的书写了10+个数学公式... 第8章以后建议可以...
評分翻译是太不敢恭维,作者翻译水平不高,读着实在别扭! 翻译是太不敢恭维,作者翻译水平不高,读着实在别扭!基本语法都出错,直译太多,怀疑是翻译软件用多了。 翻译是太不敢恭维,作者翻译水平不高,读着实在别扭!基本语法都出错,直译太多,怀疑是翻译软件用多了。 翻译是太...
評分1. packt publishing有一系列书,beginning,master系列等等。光看书名就有一定的定位。这本书还是偏向于实用为主。感觉就是超过beginning低于master。 2. 其他人已经说了,这本书是only scrapy,只讲scrapy不讲其余。 3. 一定要结合官方文档看,这是所有计算机类书的通用守则...
精通Python爬蟲框架Scrapy pdf epub mobi txt 電子書 下載 2024