数据预处理的目的是在进行数据分析前,通过技术手段解决集中存在的数据质量问题,并进一步提升数据信息含量的。本书主要围绕着 什么是数据预处理、数据预处理的作用是什么、如何进行数据预处理 展开,主要内容包括缺失值处理、数据纠错、数据格式转化、低频分类数据处理、高偏度数据处理、异常值处理、数据配平、数据特征缩放、数据归约等。通过本书的学习,读者可以充分理解常用数据预处理方法的精髓,并掌握具体技术细节,为数据分析实践打下扎实基础。本书可作为统计学、数据科学与大数据技术、计算机相关专业等本科专业和统计学、应用统计学等专业研究生的教材或教学参考用书。
本书共有四个部分共十二章,*部分基础,包括第1章软件准备、第2章Python基础知识、第3章类和子类简介;第二部分基本模块,包括第4章numpy模块、第5章pandas模块、第6章matplotlib模块、第7章scipy模块;第三部分编程思维训练,包括第8章基本编程训练、第9章若干计算方法的编程训练;第四部分数据科学,包括第10章探索性数据分析及数据准备、第11章有监督学习概论、第12章一些有监督学习模型。
本书是一本系统介绍Python 程序开发与应用的教材, 全书共9 章, 从Python 语言概述开始,逐步介绍Python 的基本语法元素、基本数据类型、程序控制结构、异常处理、函数、 数据类型、文件和数据格式化, 以及面向对象程序设计。每章除了讲解重要的知识点, 还通过示例代码演示如何运用这些知识点; 每章所设计的实例解析和习题, 可使读者 好地理解和巩固所学的内容。 本书概念清晰、内容简练, 是广大读者Python 入门的佳选, 适合作为职业院校计算机相关专业的教材, 也可作为Python 爱好者的参考用书。 本书配有电子课件, 选用本书作为授课教材的教师可登录机械工业出版社教育服务网(www.cmpedu.com) 以教师身份免费注册并下载, 或联系编辑(010 -88379543) 咨询。
本书围绕Python语言的数据结构和算法设计,通过大量实例分析,比照《Python语言程序设计》(ISBN 978-7-5170-9203-2)教材的章节顺序,从Python编程初步、Python语言基础、Python组合数据类型、Python控制结构、Python函数与模块、Python面向对象编程、Python文件操作、Python数据库操作、Python数据分析初步、Python图形界面编程、Python数据可视化11个方面,按照问题场景描述、问题算法分析、自然语言算法描述、流程图算法描述和Python程序算法描述的逻辑顺序展开每一个实践题目,循序渐进地引导读者掌握Python编程的思路、方法和流程。 本书可作为大数据专业学生程序设计学习的教材,也可作为高等院校“Python程序设计”课程的教材,还可作为喜爱程序设计和数据分析的人员的快速入门自学参考书。
全书共11章。第1章介绍Python开发环境的搭建、简单使用和Python代码规范;第2章讲解Python内置对象与运算符的使用;第3章讲解列表、元组、列表推导式与生成器表达式以及切片和序列解包的用法;第4章讲解字典应用;第5章讲解集合应用;第6章讲解字符串应用;第7章讲解选择结构与循环结构语法和应用;第8章讲解函数设计与应用;第9章讲解文本文件操作、Office文档操作以及文件夹操作; 0章讲解NumPy数组运算与矩阵运算; 1章讲解Pandas数据分析与处理。 本书全部代码适用于Python 3.5/3.6/3.7/3.8/3.9/3.10/3.11以及 新的版本。本书可以作为数据科学与大数据技术专业和计算机、电子信息等其他相关专业的Python程序设计课程教材,也可以作为相关的工程技术人员学习Python程序设计时的快速入门参考书。 本书为任课教师提供教学大纲、教案、课件、微课视频、源码、习题
教材内容分为三个部分: 部分为Python基础;第二部分为数据分析、数据处理、数据可视化和数据分析;第三部分为综合案例。 本教材第二部分难度较高,适合专业学生进行学习,并对机器学习、深度学习等人工智能类专业课打下坚实的基础。为了与 接轨,课程中大量 的数据分析竞赛平台Kaggle中的经典案例和数据,并引入了较多国外Python平台的经典内容。为了与 接轨,课程中大量 的数据分析竞赛平台Kaggle中的经典案例和数据,并引入了较多国外Python平台的经典内容。本书的另外一大特点是图文并茂,对于复杂的专业性知识,采用图表的方式进行,非常有利于学生掌握。
全书共11章。第1章介绍Python开发环境的搭建、简单使用和Python代码规范;第2章讲解Python内置对象与运算符的使用;第3章讲解列表、元组、列表推导式与生成器表达式以及切片和序列解包的用法;第4章讲解字典应用;第5章讲解集合应用;第6章讲解字符串应用;第7章讲解选择结构与循环结构语法和应用;第8章讲解函数设计与应用;第9章讲解文本文件操作、Office文档操作以及文件夹操作; 0章讲解NumPy数组运算与矩阵运算; 1章讲解Pandas数据分析与处理。 本书全部代码适用于Python 3.5/3.6/3.7/3.8/3.9/3.10/3.11以及 新的版本。本书可以作为数据科学与大数据技术专业和计算机、电子信息等其他相关专业的Python程序设计课程教材,也可以作为相关的工程技术人员学习Python程序设计时的快速入门参考书。 本书为任课教师提供教学大纲、教案、课件、微课视频、源码、习题
本书以任务为导向,较为全面地介绍了不同场景下Python爬取网络数据的方法,包括静态网页、动态网页、登录后才能访问的网页、PC客户端、App等场景。全书共7章,第1章介绍了爬虫与反爬虫的基本概念,以及Python爬虫环境的配置,第2章介绍了爬取过程中涉及的网页前端基础,第3章介绍了在静态网页中爬取数据的过程,第4章介绍了在动态网页中爬取数据的过程,第5章介绍了对登录后才能访问的网页进行模拟登录的方法,第6章介绍了爬取PC客户端、App的数据的方法,第7章介绍了使用Scrapy爬虫框架爬取数据的过程。本书所有章节都包含了实训与课后习题,通过练习和操作实战,可帮助读者巩固所学的内容。