使用Python编写网络爬虫程序获取互联网上的大数据是当前的热门专题。本书内容包括三部分:基础部分、进阶部分和项目实践。基础部分( ~7章)主要介绍爬虫的三个步骤——获取网页、解析网页和存储数据,并通过诸多示例的讲解,让读者能够从基础内容开始系统性地学习爬虫技术,并在实践中提升Python爬虫水平。进阶部分(第8~13章)包括多线程的并发和并行爬虫、分布式爬虫、 换IP等,帮助读者进一步提升爬虫水平。项目实践部分( 4~17章)使用本书介绍的爬虫技术对几个真实的网站进行抓取,让读者能在读完本书后根据自己的需求写出爬虫程序。
2019年《电子报》“缩印增补式”年度合订本,其主要内容为将全年报纸内容精选、拆补、缩印,并增加大量精华技术文章作为附录进行编辑出版。全书共分上、下两册出版发行,并随书赠送4G数据量的新实用电子技术资料。主要内容分别为:新闻言论类;维修技术类、电子文摘等。