本书的主要内容是作者及其合作者在复杂数据模型这一领域近些年的研究成果, 以及相关的最新进展. 全书共 6 章. 第 1 章简要介绍几类复杂数据模型和 bootstrap 等预备知识和相关研究问题. 第 2~6 章, 系统讨论各种复杂数据统计推断中的 bootstrap 基本理论、方法及其应用, 包括 Behrens-Fisher问题、异方差回归模型、异方差 ANOVA 和 MANOVA 模型、混合效应模型及高维数据分析中的 bootstrap 统计推断.
本书系统讲授数据挖掘的原理、主要方法及其Python实现,共分三部分:第一部分包含第1~2章,介绍数据挖掘的基本概念、流程和数据预处理;第二部分包含第3~11章,介绍经典的分类算法(包括朴素贝叶斯分类器、决策树、k-近邻、支持向量机等)、经典的聚类分析、关联分析、人工神经网络和Web挖掘等方法;第三部包含第12~14章,共有3个综合案例,包括泰坦尼克号生存数据分析、心脏病预测分析和旅游评论倾向性分析。
随着数字新时代的崛起,每个企业都走到了数字化转型的十字路口,企业该如何选择?该如何迈出数字化转型的步?面对多变、不确定、复杂且模糊的市场环境,企业该如何抓住数字时代的创新机会,走上坚定的转型之路? 本书在上一版的基础上,借由笔者亲历的企业数字化转型项目,分析了企业数字化转型失败的原因,并提出企业数字化转型的成功路径,以真实案例助力企业数字化转型成功。 同版的风格一样,本书坚持将数字化转型里晦涩难懂的内容以丰富的图例和生动化的语言进行阐释,一方面深入浅出帮助初入数据行业的数据新人找到快速上手的方法,另一方面入行五年到八年左右的人士可以在本书中找到丰富的行业案例。不仅如此,由于本书秉承从价值出发的定位以及其实用性,非常适合企业管理者阅读,帮助企业管理者了解数据运营如何为业务创造
本书以管理和应用视角解读大数据,以大数据分析全生命周期为主线,从大数据的采集、存储、预处理、分析、可视化、治理等环节切入,对大数据管理与应用的理论、方法、工具和应用进行科学合理的组织。本书包含十六章,分为四篇:概念篇主要介绍大数据管理与应用的基本概念、分析的基本思路;基础篇主要介绍大数据管理与应用的数学基础和机器学习基础;技术篇主要介绍大数据管理应用的数据采集与存储技术、数据预处理技术、数据回归分析技术、数据分类分析技术、数据聚类分析技术、数据关联分析技术、深度学习技术、文本分析技术、Web分析技术、可视化技术、数据治理技术;平台与发展篇介绍大数据计算平台和综述大数据管理与应用的新进展。 本书可作为高等学校大数据管理与应用、信息管理与信息系统、数据科学与大数据技术等管理类、信息