数据预处理的目的是在进行数据分析前,通过技术手段解决集中存在的数据质量问题,并进一步提升数据信息含量的。本书主要围绕着 什么是数据预处理、数据预处理的作用是什么、如何进行数据预处理 展开,主要内容包括缺失值处理、数据纠错、数据格式转化、低频分类数据处理、高偏度数据处理、异常值处理、数据配平、数据特征缩放、数据归约等。通过本书的学习,读者可以充分理解常用数据预处理方法的精髓,并掌握具体技术细节,为数据分析实践打下扎实基础。本书可作为统计学、数据科学与大数据技术、计算机相关专业等本科专业和统计学、应用统计学等专业研究生的教材或教学参考用书。
本书以 考试中心颁发的《全国计算机等级考试二级Python语言程序设计考试大纲(2018年版)》为基础编写。系统地介绍了Python语言的基础知识和实用技术,全书分为10章,内容主要包括:Python概述、Python语法概述、Python基本数据类型、程序控制结构、函数与模块、组合数据类型、文件操作和数据格式化、面向对象程序设计、异常处理以及Python爬虫程序。本书实例丰富,突出该课程操作性强的特点,每章都附有实例解析和习题,便于学生课后巩固相关知识。 本书既可作为高等院校各专业师生的计算机程序设计课程教材,也可作为程序开发人员的参考用书,还可以作为参加全国计算机等级考试二级Python语言程序设计人员的考 书。
本书采用理论与实践相结合的教学方式,通俗易懂、图文并茂。从项目开发环境搭建入手,主要讲解Python开发环境的安装、Python语法基础、程序控制结构、Python序列类型、字符串、函数、面向对象程序设计、文件处理、异常处理、常用的标准库和第三方库、图形用户界面编程和数据库编程知识,并将项目分解为阶段性任务,便于学生理解和教师教学。 本书适合作为高等职业院校计算机、人工智能、信息管理、电子商务等专业的教学用书,同时也适合作为其他相关专业的选修课程教材。本书提供微课视频,并配套程序源代码、教学课件和习题答案。
本书基于Python 3,针对非计算机专业学生的Python语言课程编写。全书内容覆盖Python 语言基本语法元素、基本数据类型、程序的控制结构、组合数据类型、函数、文件、面向对象程序设计、科学计算与可视化和数据分析。通过各个层次的、有趣的、融入课程思政的例题着重介绍了程序设计的思想以及Python语言的语法格式。 本书适用于本科院校非计算机专业的学生学习Python程序设计课程和程序设计初学者,也可作为程序设计爱好者和各类自学人员的Python语言参考书。
本书围绕Python语言的数据结构和算法设计,通过大量实例分析,比照《Python语言程序设计》(ISBN 978-7-5170-9203-2)教材的章节顺序,从Python编程初步、Python语言基础、Python组合数据类型、Python控制结构、Python函数与模块、Python面向对象编程、Python文件操作、Python数据库操作、Python数据分析初步、Python图形界面编程、Python数据可视化11个方面,按照问题场景描述、问题算法分析、自然语言算法描述、流程图算法描述和Python程序算法描述的逻辑顺序展开每一个实践题目,循序渐进地引导读者掌握Python编程的思路、方法和流程。 本书可作为大数据专业学生程序设计学习的教材,也可作为高等院校“Python程序设计”课程的教材,还可作为喜爱程序设计和数据分析的人员的快速入门自学参考书。
本书是一本为人文社会科学方向的老师和学生量身打造的Python入门书。大数据时代人文社会科学的研究者应该充分利用数据资源,分析数据背后隐藏的一般规律和特征。 本书以解决语言研究中常见的问题为主线,涉及中、英、日三种语言。以具体的问题为导向,讲解快速、高效处理这些问题的方法,对每种方法都配有全部代码及其详细说明。将这些代码与 0章的批处理方法相结合,可以大大提高工作效率及准确性。本书每章都配有习题,便于加深理解和应用拓展。 本书适合作为自学Python的参考书,亦可作为语料库语言学、计量语言学、计量风格学等课程的教材。
本书以任务为导向,较为全面地介绍了不同场景下Python爬取网络数据的方法,包括静态网页、动态网页、登录后才能访问的网页、PC客户端、App等场景。全书共7章,第1章介绍了爬虫与反爬虫的基本概念,以及Python爬虫环境的配置,第2章介绍了爬取过程中涉及的网页前端基础,第3章介绍了在静态网页中爬取数据的过程,第4章介绍了在动态网页中爬取数据的过程,第5章介绍了对登录后才能访问的网页进行模拟登录的方法,第6章介绍了爬取PC客户端、App的数据的方法,第7章介绍了使用Scrapy爬虫框架爬取数据的过程。本书所有章节都包含了实训与课后习题,通过练习和操作实战,可帮助读者巩固所学的内容。
本书以任务为导向,较为全面地介绍了不同场景下Python爬取网络数据的方法,包括静态网页、动态网页、登录后才能访问的网页、PC客户端、App等场景。全书共7章,第1章介绍了爬虫与反爬虫的基本概念,以及Python爬虫环境的配置,第2章介绍了爬取过程中涉及的网页前端基础,第3章介绍了在静态网页中爬取数据的过程,第4章介绍了在动态网页中爬取数据的过程,第5章介绍了对登录后才能访问的网页进行模拟登录的方法,第6章介绍了爬取PC客户端、App的数据的方法,第7章介绍了使用Scrapy爬虫框架爬取数据的过程。本书所有章节都包含了实训与课后习题,通过练习和操作实战,可帮助读者巩固所学的内容。
Django是利用Python语言开发网站时的 Web框架。本书循序渐进地介绍了Django 2.0中各个功能模块的实现与使用方法,并以“在线教育平台”为例,讲解了基于Django 2.0开发应用的实用技能。此外,本书还介绍了Django项目的上线部署方法以及在网站实际开发过程中常用的第三方功能模块。本书内容实用性强,案例丰富,侧重于实战,与新技术结合紧密,可综合提高读者的Python Web编程能力。 本书可作为计算机相关专业的教材,也适合刚接触或即将接触Django的开发者使用,还可供具有Django开发经验但还须进一步提升实战能力的读者学习参考。
本书紧跟数据分析的 发展趋势,基于Python的数据分析平台和工具,全面介绍数据分析的相关知识与技能。本书共7个项目,分为3部分:基础部分、数据分析部分、机器学习实战部分。基础部分包括项目一和项目二,介绍数据分析环境的搭建,以及NumPy的理论和实践知识;数据分析部分包括项目三~项目六,结合案例介绍数据检查、数据呈现、数据多维化等,涵盖真实数据分析工作的完整流程;机器学习实战部分只包括项目七,利用一个神经网络实战案例呈现机器学习的完整过程。本书选用真实度高的实践案例,深入浅出地介绍与数据分析相关的理论和实践知识。本书可作为高校数据分析相关课程的教材,也可供刚进入数据分析领域的人员及具有实践经验的从业者学习、参考使用。