Web Scraping with Python pdf epub mobi txt 电子书下载 2025

☆☆☆☆☆

Ryan Mitchell

数据科学家、软件工程师，目前在波士顿LinkeDrive公司负责开发公司的API和数据分析工具。此前，曾在Abine公司构建网络爬虫和网络机器人。她经常做网络数据采集项目的咨询工作，主要面向金融和零售业。另著有Instant Web Scraping with Java。

出版者:O'Reilly Media

作者:Ryan Mitchell

出品人:

页数:256

译者:

出版时间:2015-7-24

价格:USD 31.99

装帧:Paperback

isbn号码:9781491910290

丛书系列:

图书标签:

Python
爬虫
scraping
数据挖掘
计算机
编程
Programming
数据处理

下载链接在页面底部

facebook linkedin mastodon messenger pinterest reddit telegram twitter viber vkontakte whatsapp 复制链接

想要找书就要到小哈图书下载中心

qciss.net

立刻按 ctrl+D收藏本页

你会得到大惊喜!!

具体描述

读后感

评分☆☆☆☆☆

第177页的代码从逻辑上就不对啊，import的pytesseract就没用，而是通过subprocess调用，这应该是第一版的思路，不过我也搞不清这是作者还是译者的锅，把代码改成如下更合理 import time from urllib.request import urlretrieve from PIL import Image import pytesseract from...

评分☆☆☆☆☆

作者显然是此行达人，踩坑踩多了都是直接上经验。书里的代码很优美、正规并且很简洁，运用了大量的递归算法和正则表达式。但是有些地方译者翻译的有误，比如第31页，倒数第六行冒号翻译成了分号，显然运行了源码并且对比了wiki网站才会知道这是误翻译。另外，作者源码也有错...

评分☆☆☆☆☆

诚然，这本书里面提到的一些python库不一定是最好的，但是整个爬虫的思路，还是非常值得大家借鉴。其实python的语法，以及爬虫的代码段，都不难，就是写爬虫的过程中，需要注意的事项和有可能踩到的坑，是我比较看中的。书中提到了一点，就是修改浏览器的header，默认貌似...

评分☆☆☆☆☆

最近刚学了python3，看了一些讲语法的书籍和练手的题目，感觉这本书是一个比较好的系统的利用python完成从数据爬取到数据清洗整个流程的实践过程。觉得自己很有必要实践一下。刚刚看了下试读章节，15年出的英文版，难得的用python3进行工程实践而不只是讲语法的书。

评分☆☆☆☆☆