数据清洗是大数据领域不可缺少的环节,用来发现并纠正数据中可能存在的错误,针对数据审查过程中发现的错误值、缺失值、异常值、可疑数据,选用适当方法进行 清理 ,使 脏 数据变为 干净 数据。本书共分为8章:第1章主要介绍数据清洗的概念、任务和流程,数据标准化概念及数据仓库技术等;第2章主要介绍Windows和类UNIX操作系统下的数据常规格式、数据编码及数据类型转换等;第3章介绍ETL概念、数据清洗的技术路线、ETL工具及ETL子系统等;第4章介绍Excel、Kettle、OpenRefine、DataWrangler和Hawk的安装及使用等;第5章介绍Kettle下文本文件抽取、Web数据抽取、数据库数据抽取及增量数据抽取等;第6章介绍数据清洗步骤、数据检验、数据错误处理、数据质量评估及数据加载;第7章介绍网页结构,利用网络爬虫技术进行数据采集,利用JavaScript技术进行行为日志数据采集
本书以数据库应用系统实现为线索,内容除数据库技术外,还涵盖系统分析、设计、开发和部署方法,并引入 互联网 思维和热点技术。全书以一个完整的 e学习 系统实际案例驱动,采用MySQL和ASP.NET为实验环境,帮助读者通过实际应用理解数据库应用系统的相关知识和开发方法,掌握实践技能,综合运用前沿信息技术实现领域创新应用。本书提供丰富的教学资源,可以登录华信教育资源网(www.hxedu.com.cn)免费获取相关资源包,也可以扫描书中的二维码获取相关资源或观看演示视频。本书通俗易懂、实例鲜活、技术先进,可作为各类高等学校数据库技术、信息系统设计的入门教材,或者作为计算机基础教育较高层次课程的教材,也可以作为数据库应用系统开发实践的技术参考书。
中国大数据专家委员会刘鹏教授联合全国上百家高校从事一线教学科研任务的教师,一起编撰高级大数据人才培养从书。本书是丛书之一,其定位是大数据挖掘技术与应用。本书系统地介绍了数据挖掘算法理论与方法、工具和应用,包括经典数据挖掘算法,大数据环境下常用数据挖掘算法的优化,大数据新常态下催生的数据分析方法(如推荐系统、链接分析与网页排序、互联网信息抽取、日志挖掘与查询分析)、工具与应用。本书适合作为相关专业本科和研究生教材。高职高专学校也可以选用部分内容开展教学。本书也很适合作为大数据分析研发人员的自学书籍。
大数据管理与应用主要以信息科学、计算机科学和管理科学等学科为理论基础,其研究内容包括大数据科学基础理论、大数据预处理、大数据计算、大数据管理和分析等。本书力图通过对大数据科学相关数据管理方面内容的综合介绍,面向大数据时代的电子商务智能数据计算领域,从大数据采集、大数据预处理、大数据存储与计算、多源异构大数据分析、大数据知识融合技术和大数据的应用管理等方面说明大数据管理与应用的主要研究内容和应用方向。
本教材依据普通高校信管类专业的培养目标,按学科的课程设置要求,突出应用型、实践性和立体化的特点编写。全书以数据库系统基本概念、关系代数、SQL语言、设计理论与工程设计、实施、维护、、应用发展和系统实例为主线,强调在网络环境、知识经济和信息经济环境下数据库系统所表现出的特点。本书结构新颖,内容详实,案例丰富,实用性较强,既可作为普通高校信息管理与信息系统、管理科学与工程、工商管理等经管类相关专业的教材,也可供企事业单位和信息系统相关人员作为参考书使用。随书配备的光盘包含丰富的习题与案例,电子教案、课程设计、优秀作业展示等资料,便于教学和自学。
本书以SPSS 28.0为平台,由浅入深地全面讲解SPSS软件的相关知识,通过图文并茂的方式讲解各项操作,讲解深入浅出,实例引导,内容翔实,清晰、直观、易学易用。 全书分为三部分共17章,详细介绍SPSS的界面、数据文件的编辑、数据文件的整理、基本统计分析、参数估计与假设检验、非参数检验、方差分析、相关分析、回归分析、聚类分析、判别分析、因子分析、对应分析、信度分析、生存分析、时间序列分析、SPSS的综合应用案例等内容。本书涉及面广,涵盖了一般用户需要使用的各种功能,全书按逻辑顺序编排,自始至终结合实例进行描述,内容完整且每章相对独立,是一本详尽实用的SPSS学习用书。
数据结构教程(第3版) 第3版第2次印刷
本书基于MySQL介绍数据库的基本概念、基本原理和基本设计方法,以面向工作过程的教学方法为导向,合理安排各项目的内容。本书突出实用性,减少理论知识的介绍,并设计大量的项目实训和课外拓展内容,符合高职高专教育的特点。 本书包括三篇,由8个项目组成。 篇知识储备(项目1和项目2)讲述从理论层次设计数据库的方法;第二篇基础应用(项目3~项目5)讲述基于MySQL创建数据库的方法和数据库的基本应用;第三篇 应用(项目6~项目8)讲述数据库的 应用和维护MySQL数据库安全的方法。 本书可作为高职高专院校、成人教育类院校数据库原理及应用课程的教材,也可供参加自学考试的人员、数据库应用系统开发设计人员、工程技术人员及其他相关人员参阅。
本书作为数据科学的入门课程,全书以实例分析为主线,结合SQLServer 2016,系统地阐述了数据库系统的基本原理、基本技术、基本方法及其应用。全书共11章,主要内容包括:概述、关系代数、数据完整性、SQL Server、概念模型和逻辑模型、关系规范化、数据安全、数据并发、数据恢复、数据库设计、数据仓库和大数据等。 本书以SQL Server 2016为DBMS介绍数据库技术的实现技术,以Python和、Java等为主语言介绍数据库系统的设计与实现技术,并提供详细操作和完整程序系统。 本书内容丰富、深入浅出、通俗易懂、结构严谨、注重实用,同时提供取材新颖、实用的例题和习题,便于读者巩固所学知识。 本书适用于高等院校计算机科学与技术、数据科学与大数据技术、信息安全、软件工程、网络工程、信息管理与信息系统和电子商务等相关本科专业的数据库原理课
本书以关系型数据库MySQL和华为云数据库GaussDB为平台,讲解了关系型数据库设计、数据库原理、数据库管理操作、数据库应用系统开发等技术,并拓展介绍了云数据库GaussDB的实践操作和应用。 本书的核心设计理念是工作过程系统化。全书依据新一代信息技术产业岗位来设置章节和任务,以项目为载体、以任务为驱动,引导学生做中学、学中做。全书由“基础篇”“提高篇”“应用篇”和“拓展篇”四篇组成,以学生选课系统、企业新闻发布系统、网上商城系统的数据库分析与数据操纵贯穿全书。知识点由浅入深,由易到难,层层递进,让学生在任务的推进中理解、消化知识点并掌握数据库应用与开发技能。此外,本书内容中还融入了丰富的思政元素,培养学生执着、专注、精益求精的态度和 的职业素养与品质。同时,本书还配备了配套的教学大纲、教学PPT
本书主要介绍非连续Sturm-Liouville算子以及边界条件依赖谱参数的三阶常微分算子谱的定性和定量分析方法。通过引入新的Hilbert空间,在新的空间中定义新的内积,将非经典的常微分算子转化为对称微分算子,利用无界线性算子及函数论的方法和技巧,获得了算子的同构性、可解性、强制性,特征值的依赖性以及特征函数系的完备性和特征函数的振动性,建立了求解特征值的判据,通过数值算例展示了非连续处转移条件对谱的影响,为微分算子的潜在应用奠定了良好的理论基础。本书发展了经典常微分算子的理论和方法,大部分内容是作者多年来的科研成果,具有很高的学术价值。
本书分为数字经济时代的合规监管架构、数据不同来源下的收集合规、 视野下的数据流动、数字经济时代的合规监管架构、数据使用典型场景与合规之路、企业数据存储的合规指引及数据合规的司法保护模式与裁判规则。尽管目前《数据安全法》对于制度性的规定偏多,对于企业所享有的数据权益的范围等内容未进行明确规定,但该法从上位法角度明确肯定了企业在数据处理活动和开发利用中享有合法权益,并为其提供保护,已经弥补了企业数据权益保护上位法空缺的问题,实现了顶层设计和制度统筹,有了 为明确的法律依托。本书通过理论与案例的探讨,以期对保护企业合法权益和促进企业对于数据的 深刻、广泛和高效的开发利用将起到推动作用。
\"本书是根据通信类高职高专教育的培养目标和教学需要编写的。全书从基本网络设备的认知和操作入手,由浅入深地介绍了数据通信网络基础、网络设备的认知与配置、局域网的认知与组建、网络互联技术、网络扩展技术、数据网络应用配置等多方面内容。全书共5个项目,15个任务。每个项目均设有习题与拓展案例,“拓展案例”部分对任务相关知识进行了 深层面的介绍,可以增强学生对任务相关知识的了解,扩展读者的知识面。通过对本课程的学习,使在校学生、工程技术人员和广大社会学习者获得对数据网络设备互联的全面理解,了解数据网络在5G、4G等网络中的地位,对数据网络规划、网络维护有一定的认识;并具备一定的 骨干网络、运营商网络、电信网络、城市骨干网络、企业网络、校园网络等大、中、小型网络的开局规划、网络组建与优化等能力,也
是什么让这本书从数据库设计的相关书籍中脱颖而出?很多讨论设计实践的书籍很少讲解内在理论知识,而讨论设计理论的书籍却又主要针对理论工作者。在戴特(Data,C.J.)所著的《数据库设计与关系理论(影印版)》中, 专家C.J.Date以从业者可以理解的方式来讲解设计理论,弥补了前述的不足。该书以作者四十多年的经验教训总结而成,阐述了为什么恰当的设计在初始阶段如此重要。 《数据库设计与关系理论(影印版)》的每一章都包含一组练习,它或者展示了如何把理论知识应用到实践中,或者提供了 多的信息,或者要求你验证一些简单的理论结果。如果你 熟悉数据库的关系模式,并且你希望深入了解数据库设计,那么这本书就 适合你。
如何证明电子数据与犯罪事实是相关的,裁判者应采用何种认证标准审查判断电子数据相关性的有无与大小,已成为当前电子数据司法实践的重要阻碍。本书通过收集、分析大量的资料,系统梳理了与电子数据相关性紧密相关的基础理论、取证技术、法律规范、实务问题,从理论研究、法律规定与司法实务层面较为全面具体分析了电子数据相关性问题。 在系统归纳司法实务中面临的电子数据相关性难题及层次化电子数据相关性分析后,本书建设性提出了电子数据相关性推理模型和电子数据相关性内容研究的创新内容,从理论层面构筑了电子数据相关性推理框架体系,探讨分析了电子数据相关性内容研究体系,实证分析了这些理论提出的可行性,以期为电子数据相关性审查判断的法律制度研究奠定坚实的理论前提和研究基础。