数据清洗是大数据领域不可缺少的环节,用来发现并纠正数据中可能存在的错误,针对数据审查过程中发现的错误值、缺失值、异常值、可疑数据,选用适当方法进行 清理 ,使 脏 数据变为 干净 数据。本书共分为8章:第1章主要介绍数据清洗的概念、任务和流程,数据标准化概念及数据仓库技术等;第2章主要介绍Windows和类UNIX操作系统下的数据常规格式、数据编码及数据类型转换等;第3章介绍ETL概念、数据清洗的技术路线、ETL工具及ETL子系统等;第4章介绍Excel、Kettle、OpenRefine、DataWrangler和Hawk的安装及使用等;第5章介绍Kettle下文本文件抽取、Web数据抽取、数据库数据抽取及增量数据抽取等;第6章介绍数据清洗步骤、数据检验、数据错误处理、数据质量评估及数据加载;第7章介绍网页结构,利用网络爬虫技术进行数据采集,利用JavaScript技术进行行为日志数据采集
本书以数据库应用系统实现为线索,内容除数据库技术外,还涵盖系统分析、设计、开发和部署方法,并引入 互联网 思维和热点技术。全书以一个完整的 e学习 系统实际案例驱动,采用MySQL和ASP.NET为实验环境,帮助读者通过实际应用理解数据库应用系统的相关知识和开发方法,掌握实践技能,综合运用前沿信息技术实现领域创新应用。本书提供丰富的教学资源,可以登录华信教育资源网(www.hxedu.com.cn)免费获取相关资源包,也可以扫描书中的二维码获取相关资源或观看演示视频。本书通俗易懂、实例鲜活、技术先进,可作为各类高等学校数据库技术、信息系统设计的入门教材,或者作为计算机基础教育较高层次课程的教材,也可以作为数据库应用系统开发实践的技术参考书。
中国大数据专家委员会刘鹏教授联合全国上百家高校从事一线教学科研任务的教师,一起编撰高级大数据人才培养从书。本书是丛书之一,其定位是大数据挖掘技术与应用。本书系统地介绍了数据挖掘算法理论与方法、工具和应用,包括经典数据挖掘算法,大数据环境下常用数据挖掘算法的优化,大数据新常态下催生的数据分析方法(如推荐系统、链接分析与网页排序、互联网信息抽取、日志挖掘与查询分析)、工具与应用。本书适合作为相关专业本科和研究生教材。高职高专学校也可以选用部分内容开展教学。本书也很适合作为大数据分析研发人员的自学书籍。
大数据管理与应用主要以信息科学、计算机科学和管理科学等学科为理论基础,其研究内容包括大数据科学基础理论、大数据预处理、大数据计算、大数据管理和分析等。本书力图通过对大数据科学相关数据管理方面内容的综合介绍,面向大数据时代的电子商务智能数据计算领域,从大数据采集、大数据预处理、大数据存储与计算、多源异构大数据分析、大数据知识融合技术和大数据的应用管理等方面说明大数据管理与应用的主要研究内容和应用方向。
本教材依据普通高校信管类专业的培养目标,按学科的课程设置要求,突出应用型、实践性和立体化的特点编写。全书以数据库系统基本概念、关系代数、SQL语言、设计理论与工程设计、实施、维护、、应用发展和系统实例为主线,强调在网络环境、知识经济和信息经济环境下数据库系统所表现出的特点。本书结构新颖,内容详实,案例丰富,实用性较强,既可作为普通高校信息管理与信息系统、管理科学与工程、工商管理等经管类相关专业的教材,也可供企事业单位和信息系统相关人员作为参考书使用。随书配备的光盘包含丰富的习题与案例,电子教案、课程设计、优秀作业展示等资料,便于教学和自学。
本书以SPSS 28.0为平台,由浅入深地全面讲解SPSS软件的相关知识,通过图文并茂的方式讲解各项操作,讲解深入浅出,实例引导,内容翔实,清晰、直观、易学易用。 全书分为三部分共17章,详细介绍SPSS的界面、数据文件的编辑、数据文件的整理、基本统计分析、参数估计与假设检验、非参数检验、方差分析、相关分析、回归分析、聚类分析、判别分析、因子分析、对应分析、信度分析、生存分析、时间序列分析、SPSS的综合应用案例等内容。本书涉及面广,涵盖了一般用户需要使用的各种功能,全书按逻辑顺序编排,自始至终结合实例进行描述,内容完整且每章相对独立,是一本详尽实用的SPSS学习用书。
数据结构教程(第3版) 第3版第2次印刷
本书总结了SMART目标管理法的实施逻辑,拆解了SMART目标管理法的实施步骤,并对每个步骤深入挖掘扩展,借助各类案例,介绍了SMART目标管理法在日常工作、生活和学习中的应用,帮助读者学会应用SMART目标管理法。 《SMART目标管理法:明确目标 找准方向 》共6章,分别介绍了SMART目标管理法的基本应用法则;如何判断和围绕价值设定目标;设定目标的实施方法;将大目标分解成小目标的方法;如何采取行动保证目标落地;如何通过总结改善不断达成 高的目标。 本书适合想帮助孩子养成目标意识的家长、想取得好成绩的各年级学生、期待带领团队实现目标的管理者、期望实现个人目标的职场人、希望事业有成的创业者等大众读者阅读。
随着互联网的高速发展,新媒体行业已成为目前的热门行业之一,无论是个人,还是企业、机关、 ,都离不开新媒体。本书采用“课堂讲解 + 课堂实训 + 课堂小结 + 课后作业”这一结构进行编写,既有基础理论,又有实操进阶,还有实战提高, 适合读者进行学、练、查。本书共 8 章,第 1 章主要介绍新媒体数据分析的基础知识;第 2 章主要介绍各种新媒体数据分析指标;第 3 章主要介绍新媒体数据的采集;第 4 章主要介绍新媒体数据处理;第 5 章主要介绍新媒体数据分析的思维和方法;第 6 章主要介绍新媒体数据可视化;第 7 章主要介绍不同新媒体平台的数据分析方法和实战技能;第 8 章主要介绍新媒体数据分析报告的制作。本书由从事多年新媒体、电子商务数据分析工作的老师参与编写,内容全面、专业性较强,可以有效帮助读者掌握新媒体数据分析的方法和
本书系统介绍了大数据的内涵、特征、技术及应用。全书共10章,其中 ~8章为技术篇,主要从大数据处理流程出发,围绕大数据体系架构,详细阐述大数据采集与预处理、大数据存储、大数据分析挖掘、大数据可视化等关键技术。第9、10两章为应用篇,对大数据在电信、文娱、教育、医疗等行业的具体应用进行了论述,并通过典型案例与Python代码示例,展示如何将大数据原理付诸实践。 本书兼顾专业性和可读性,适合作为高等院校大数据技术的基础教材,也可供大数据技术爱好者学习参考。
本书是高校的大数据导论课程教材,清楚地介绍了大数据相关的概念、理论、术语与基础技术,并使用真实连贯的商业案例以及简单的图表,帮助读者 清晰地理解大数据技术。本书可作为高等院校相关专业“大数据基础”“大数据道路”等课程的教材,也可供有一定实践经验的软件开发人员、管理人员和所有对大数据感兴趣的人士阅读。
随着互联网的高速发展,新媒体行业已成为目前的热门行业之一,无论是个人,还是企业、机关、 ,都离不开新媒体。本书采用“课堂讲解 + 课堂实训 + 课堂小结 + 课后作业”这一结构进行编写,既有基础理论,又有实操进阶,还有实战提高, 适合读者进行学、练、查。 本书共 8 章,第 1 章主要介绍新媒体数据分析的基础知识;第 2 章主要介绍各种新媒体数据分析指标;第 3 章主要介绍新媒体数据的采集;第 4 章主要介绍新媒体数据处理;第 5 章主要介绍新媒体数据分析的思维和方法;第 6 章主要介绍新媒体数据可视化;第 7 章主要介绍不同新媒体平台的数据分析方法和实战技能;第 8 章主要介绍新媒体数据分析报告的制作。 本书由从事多年新媒体、电子商务数据分析工作的老师参与编写,内容全面、专业性较强,可以有效帮助读者掌握新媒体数据分析的