Spark数据处理引擎是一个惊人的分析工厂:输入原始数据,输出洞察。PySpark用基于Python的API封装了Spark的核心引擎。它有助于简化Spark陡峭的学习曲线,并使这个强大的工具可供任何在Python数据生态系统中工作的人使用。 《Python和PySpark数据分析》帮助你使用PySpark解决数据科学的日常挑战。你将学习如何跨多台机器扩展处理能力,同时从任何来源(无论是Hadoop集群、云数据存储还是本地数据文件)获取数据。一旦掌握了基础知识,就可以通过构建机器学习管道,并配合Python、pandas和PySpark代码,探索PySpark的全面多功能特性。 主要内容 组织PySpark代码 管理任何规模的数据 充满信心地扩展你的数据项目 解决常见的数据管道问题 创建可靠的长时间运行的任务
本书提供了23种经过验证的的、可视化、示例驱动的模式,涉及抽象类、多重继承、GUI编程和小部件、图形类、绘图和绘图、数学、数据库、Python装饰器、图像、线程、迭代器、创建可执行代码等,从而编写更加健壮、高效、可维护和优雅的Python代码,生成功能强大、灵活的程序。
本书是一本真正地从零开始讲解Python编程的图书,它旨在让零基础读者较快地掌握编程知识,并能使用程序来满足自己的需要。 本书共有9个部分,除部分外,其余部分都以一个阶段性项目结尾。部分(~2章)介绍了学习编程的意义;第2部分(第3~6章)介绍编程的基本知识;第3部分(第7~12章)讲解了字符串、元组以及与用户交互的代码;第4部分(3~15章)介绍如何编写程序来进行选择;第5部分(6~19章)主要涉及循环的相关知识;第6部分(第20~23章)引入了函数和模块化的相关概念;第7部分(第24~29章)介绍了一些高级对象类型,如可变对象、列表、字典等;第8部分(第30~34章)为面向对象编程的相关知识;第9部分(第35~38章)介绍了一些可供读者使用的现成代表库。
本书教你如何从基于时间的数据(如日志、客户分析和其他事件流)中获得即时、有意义的预测。在这本通俗易懂的书中,作者通过带有注释的Python代码进行全面演示,你将学习用于时间序列预测的统计和深度学习方法。通过跟随书中的实例锻炼你的技能,你很快就会准备好建立自己的准确、有洞察力的预测。
本书从实战角度系统论述了Python 爬虫技术的核心知识,并通过大量的真实项目帮助读者深入掌握Python 爬虫技术及其实现。本书提供了大量实战案例,演绎采用各种技术编写Python 爬虫的方式。读者可以任意组合使用这些技术,完成非常复杂的爬虫应用。本书共20 章,分为五篇。篇:基础知识(~2 章),主要包括Python 编程环境的搭建、IDE 的安装和使用、 的基础知识、网页基础(HTML、CSS、JavaScript)、爬虫的基本原理、Session、Cookie。第二篇:网络库(第3~5 章),主要包括网络库urllib、urllib3 和requests 的核心使用方法,例如,发送 请求、处理超时、设置 请求头、处理中文字符、搭建和使用代理、解析链接、Robots 协议等。第三篇:解析库(第6~9 章),主要包括3 个常用解析库(lxml、Beautiful Soup 和pyquery)的使用方法,同时介绍了多种用于分析HTML 代码的技术,例如,
《细说Python编程:从入门到科学计算》以Python 3.x为平台,由两位博士执笔,详尽细致地阐述Python编程的基础知识和高级技巧,并以大量示例代码进行实践,同时还介绍人工智能领域广泛使用的科学计算工具NumPy。《细说Python编程:从入门到科学计算》分为两篇,共19章。篇(~11章)为基础知识,主要讲解Python的编译环境、入门知识、字符串、容器、函数、循环、条件选择、模块、类、类的特殊成员、文件;第2篇(2~19章)为高级应用,包括异常处理、日期和时间、测试代码、程序打包、使用数据库、网络编程、图形用户界面、科学计算等内容。全书知识点丰富,辅之以示例演示,读者可以边学边练,快速掌握。 《细说Python编程:从入门到科学计算》还提供了16小时共151节微课教学视频,读者扫码即可观看学习,免费提供的示例源码文件可直接调用,方便上机操练
《Python青少年趣味编程108例(全视频微课版)》以Python 3.10版本为基础,通过108个案例,详细、全面地介绍Python的基础知识和使用方法,通过制作多种有趣味的编程作品,让读者在思考中充分发挥想象力和创造力。本书共分为9章,章概述Python下载、安装的方法和编程环境的应用;第2章介绍Python的基础知识;第3章讲解以条件进行判断的选择结构;第4章探究重复执行的循环结构;第5章讲述字符串的应用方法;第6章介绍列表、元组与字典的作用与方法;第7章分析函数进阶应用的方法;第8章阐述turtle画图应用模块的相关知识;第9章探究运用Python编程语言综合解决实际问题的方法。 《Python青少年趣味编程108例(全视频微课版)》可作为中小学生的编程启蒙读物,也可供对Python编程感兴趣的读者学习参考,还可作为学校编程兴趣班及相关培训机构的教材。
这是一本讲解如何使用Python 进行系统化图形引擎开发的图书。本书基于作者长期从事图形引擎开发工作的经验,结合简单易懂的Python 语言和PyOpenGL 模块,通过对引擎开发知识由浅入深的编排和讲解,让广大对图形学感兴趣的"小白”开发者一步步掌握图形引擎的开发流程和实现原理,并在这个过程中熟练掌握OpenGL,进而有能力基于各种开发语言进行图形引擎的开发工作。 本书结构紧凑、内容翔实、由浅入深,是学习、掌握图形引擎开发入门知识的重要参考书。
《Python 网络爬虫与数据可视化应用实战》是一本介绍大数据时代用 Python 进行数据获取、数据清洗 和数据可视化分析的技术图书。全书共分两篇,其中第 1 篇主要介绍了数据获取的相关知识,具体内容包 括 HTML、JSON 与网络爬虫基础,爬取静态网页,使用 CSS 选择器爬取数据,遍历 HTML 网页并获取 数据,使用 XPath 表达式与 Ixml 包创建爬虫程序,使用 Selenium 爬取动态网页,Scrapy 爬虫框架的使用, 数据存储等 ;第 2 篇主要介绍数据分析及可视化相关知识,具体内容包括数据可视化基础知识,Pandsa 数 据处理,使用 Pandas、Matplotlib、Seaborn、Bokeh 等工具进行数据分析和可视化等。每篇均设置特别章 节进行了综合案例演练,提高综合水平。 《Python 网络爬虫与数据可视化应用实战》一书内容丰富,涵盖面广,特别适合作为大中专院校相关 专业的教材,也适合作为大数据分
本书分为上、下两大部分,共计22章。部分(~11章)由浅入深地介绍Python的基础知识,包括变量、数值、条件语句、文本字符串、循环语句、元组、列表、字典、集合、函数、对象、类、模块、库,等等。掌握这些基础知识将为运用Python奠定牢固的基础。第二部分(2~22章)介绍Python的应用,所涉及的领域包括Web应用、数据库、网络和机器学习。你将学会用Python处理时间、进行网络通信、完成数据科学任务等,还会了解并发的相关知识。
本书教你如何从基于时间的数据(如日志、客户分析和其他事件流)中获得即时、有意义的预测。在这本通俗易懂的书中,作者通过带有注释的Python代码进行全面演示,你将学习用于时间序列预测的统计和深度学习方法。通过跟随书中的实例锻炼你的技能,你很快就会准备好建立自己的准确、有洞察力的预测。
《Python金融数据分析》详细阐述了与Python金融数据分析相关的基本解决方案,主要包括获取金融数据、数据预处理、可视化金融时间序列、探索金融时间序列数据、技术分析和构建交互式仪表板、时间序列分析与预测、基于机器学习的时间序列预测、多因素模型、使用GARCH类模型对波动率进行建模、金融领域中的蒙特卡罗模拟、资产配置、回测交易策略、识别信用违约、机器学习项目的高级概念、金融领域的深度学习等内容。此外,本书还提供了相应的示例、代码,以帮助读者进一步理解相关方案的实现过程。