小哈图书下载中心

Python网络数据采集第2版（影印版）

Python网络数据采集第2版（影印版） pdf epub mobi txt 电子书下载 2025

简体网页||繁体网页

☆☆☆☆☆

Ryan Mitchell

数据科学家、软件工程师，目前在波士顿LinkeDrive公司负责开发公司的API和数据分析工具。此前，曾在Abine公司构建网络爬虫和网络机器人。她经常做网络数据采集项目的咨询工作，主要面向金融和零售业。另著有Instant Web Scraping with Java。

出版者:东南大学出版社

作者:Ryan Mitchell

出品人:

页数:0

译者:

出版时间:2018-11

价格:89.00元

装帧:平装

isbn号码:9787564179779

丛书系列:

图书标签:

Python
数据方法
数据分析
tech-network

下载链接在页面底部

facebook linkedin mastodon messenger pinterest reddit telegram twitter viber vkontakte whatsapp 复制链接

想要找书就要到小哈图书下载中心

立刻按 ctrl+D收藏本页

你会得到大惊喜!!

具体描述

读后感

评分☆☆☆☆☆

评分☆☆☆☆☆

第三章有好几个地方出现“分号”，但又实在不明白哪里有分号，只好查了原文。原文是 colons，也就是冒号。写在这里，给其他同学提个醒。：这是冒号；这是分号公平地说，原书中也有一些低级错误，比如第七章开始不久，有个函数里把 input 写成了content，中文版照抄了...

评分☆☆☆☆☆

第三章有好几个地方出现“分号”，但又实在不明白哪里有分号，只好查了原文。原文是 colons，也就是冒号。写在这里，给其他同学提个醒。：这是冒号；这是分号公平地说，原书中也有一些低级错误，比如第七章开始不久，有个函数里把 input 写成了content，中文版照抄了...

评分☆☆☆☆☆

1.可以尝试使用Google API 2.对于容易被封杀的站点使用tor来匿名 3.使用Tesseract识别验证码，可以训练特殊字体提高识别率 4.爬取整个网站的外链链接是件容易的事情 5.使用selenium作为测试网站的框架 6.注意cookie和request header的使用，努力让网站不把你当做爬虫对待

评分☆☆☆☆☆

作者显然是此行达人，踩坑踩多了都是直接上经验。书里的代码很优美、正规并且很简洁，运用了大量的递归算法和正则表达式。但是有些地方译者翻译的有误，比如第31页，倒数第六行冒号翻译成了分号，显然运行了源码并且对比了wiki网站才会知道这是误翻译。另外，作者源码也有错...

用户评价

评分☆☆☆☆☆

评分☆☆☆☆☆

评分☆☆☆☆☆

评分☆☆☆☆☆

评分☆☆☆☆☆

相关图书

本站所有内容均为互联网搜索引擎提供的公开搜索信息，本站不存储任何数据与内容，任何内容与数据均与本站无关，如有需要请联系相关搜索引擎包括但不限于百度，google,bing,sogou 等

© 2025 qciss.net All Rights Reserved. 小哈图书下载中心版权所有

中国国家图书馆

国立台湾图书馆

美国国会图书馆

开放图书馆 openlibrary.org