《从零进阶!数据分析的统计基础(第2版)》 共 6 章,分别讲解了数据分析的步骤和方法、描述性统计分析、抽样估计、假设检验、方差分析、 相关与回归分析,使用简单的语言介绍了这些数据分析基本方法的核心思想和涉及的统计学、概率论等方面 的理论内容,并使用图示的方法详细介绍了使用 Excel 2013 进行简单的描述性统计分析和使用 SPSS 进行相 关的数据分析的过程与结果分析。
大数据是“在多样的或者大量的数据中快速获取信息的能力”。 大数据是一种思维方式,必须融入到企业的每一个毛细血管中。大数据时代已经到来,正在引发一场革命! 大数据正以的速度颠覆人们探索世界的方法,引起社会、经济、学术、科研、国防、军事等领域的深刻变革。 数据成为资产、产业垂直整合、泛互联网化是大数据时代的三大发展趋势。 大数据是“在多样的或者大量的数据中快速获取信息的能力”。 大数据是一种思维方式,必须融入到企业的每一个毛细血管中。大数据时代已经到来,正在引发一场革命! 大数据正以的速度颠覆人们探索世界的方法,引起社会、经济、学术、科研、国防、军事等领域的深刻变革。 数据成为资产、产业垂直整合、泛互联网化是大数据时代的三大发展趋势。 数据资产成为和土地、资本、人力并驾齐驱的关键生产要
本书引入真实的案例, 以提供优质的数据分析服务、 撰写高质量的数据分析报告为目标。在阐述数据分析时, 力求以系统的观念从所研究主题的整体着眼, 综合不同的分析角度、 数据处理方式、 分析方法和分析工具, 以揭示数据更本质的特点和更深层次的规律。书中以实际案例为背景, 说明综合采用统计方法、 数据挖掘方法进行数据分析的主要问题。 本书适合学过数据分析基础知识的读者阅读,也可供大学生、初入数据分析职场人员、参与CDA考试的人员学习使用。
进入大数据时代,让数据开口说话将成为司空见惯的事情,本书将从大数据时代的前因后果讲起,全面分析大数据时代的特征、企业实践的案例、大数据的发展方向、未来的机遇和挑战等内容,展现一个客观立体、自由开放的大数据时代。
本书讲述在流行的大数据分布式存储和计算平台Hadoop上设计实现数据仓库,将传统数据仓库建模与SQL开发的简单性与大数据技术相结合,快速、高效地建立可扩展的数据仓库及其应用系统。 本书内容包括数据仓库、Hadoop及其生态圈的相关概念,使用Sqoop从关系数据库全量或增量抽取数据,使用HIVE进行数据转换和装载处理,使用Oozie调度作业周期性执行,使用Impala进行快速联机数据分析,使用Hue将数据可视化,以及数据仓库中的渐变维(SCD)、代理键、角色扮演维度、层次维度、退化维度、无事实的事实表、迟到的事实、累积的度量等常见问题在Hadoop上的处理等。本书适合数据库管理员、大数据技术人员、Hadoop技术人员、数据仓库技术人员,也适合高等院校和培训机构相关专业的师生教学参考。
数据结构是计算机及其相关专业的重要课程,是计算机软件开发及应用人员的专业基础。本书首先介绍数据结构与算法的基础知识,然后系统地论述线性表、栈、队列、串、数组和广义表、树和二又树、图等基本数据结构,并讨论了常用的查找和排序技术。在用例选择方面充分考虑了电子信息类专业特点,尤其突出信息与通信工程相关专业的特色。在各章最后描述了相应的标准模板库(STL),旨在使读者了解STL与数据结构的关系,并且能够掌握各类STL的应用,提高实际应用能力和程序设计的效率。 本书内容丰富、层次清晰、讲解深入浅出,可作为计算机及相关专业,尤其是电子信息类专业本专科数据结构课程的教材,也可供从事计算机软件开发和应用的工程技术人员阅读和参考。
《数据结构(c语言版)》在选材与编排上,贴近当前普通高等院校“数据结构”课程的现状和发展趋势,符合研究生考试大纲,内容难度适度,突出实用性和应用性。《数据结构(c语言版)》共8章,内容包括绪论,线性表,栈和队列,串、数组和广义表,树和二叉树,图,查找和排序。《数据结构(c语言版)》采用类c语言作为数据结构和算法的描述语言。 《数据结构(c语言版)》可作为普通高等院校计算机和信息技术相关专业“数据结构”课程的教材使用,也可供从事计算机工程与应用工作的科技工作者参考。
本书全面介绍了数据挖掘的理论和方法,旨在为读者提供将数据挖掘应用于实际问题所必需的知识。本书涵盖五个主题:数据、分类、关联分析、聚类和异常检测。除异常检测外,每个主题都包含两章:前面一章讲述基本概念、代表性算法和评估技术,后面一章较深入地讨论高级概念和算法。目的是使读者在透彻地理解数据挖掘基础的同时,还能了解更多重要的高级主题。此外,书中还提供了大量示例、图表和习题。 本书适合作为相关专业高年级本科生和研究生数据挖掘课程的教材,同时也可作为数据挖掘研究和应用开发人员的参考书。
数据结构是计算机及其相关专业的重要课程,是计算机软件开发及应用人员的专业基础。本书首先介绍数据结构与算法的基础知识,然后系统地论述线性表、栈、队列、串、数组和广义表、树和二又树、图等基本数据结构,并讨论了常用的查找和排序技术。在用例选择方面充分考虑了电子信息类专业特点,尤其突出信息与通信工程相关专业的特色。在各章最后描述了相应的标准模板库(STL),旨在使读者了解STL与数据结构的关系,并且能够掌握各类STL的应用,提高实际应用能力和程序设计的效率。 本书内容丰富、层次清晰、讲解深入浅出,可作为计算机及相关专业,尤其是电子信息类专业本专科数据结构课程的教材,也可供从事计算机软件开发和应用的工程技术人员阅读和参考。
本书结合理论和实践,由浅入深,多方面介绍了Hadoop这一高性能的海量数据处理和分析平台。全书5部分24章,第Ⅰ部分介绍Hadoop基础知识,主题涉及Hadoop、MapReduce、Hadoop分布式文件系统、YARN、Hadoop的I/O操作。第Ⅱ部分介绍MapReduce,主题包括MapReduce应用开发;MapReduce的工作机制、MapReduce的类型与格式、MapReduce的特性。第Ⅲ部分介绍Hadoop的运维,主题涉及构建Hadoop集群、管理Hadoop。第Ⅳ部分介绍Hadoop相关开源项目,主题涉及Avro、Parquet、Flume、Sqoop、Pig、Hive、Crunch、Spark、HBase、ZooKeeper。第Ⅴ部分提供了三个案例,分别来自医疗卫生信息技术服务商塞纳(Cerner)、微软的人工智能项目ADAM(一种大规模分布式深度学习框架)和开源项目Cascading(一个新的针对MapReduce的数据处理API)。本书是一本很好不错、全面的Hadoop参考书和工具书,阐述了Hadoop生态圈的很新发展和应用,程序员可以
本书从实例的角度出发,循序渐进地讲解了SQL Server 2005的理论知识和基本操作。主要内容包括:数据库的基本知识、SQL Server概述、数据库和表的创建与管理、表中数据的查询、Transact-SQL语句、索引、视图、游标、事务、存储过程、触发器、SQL Server安全性管理、备份与恢复、SQL Server提供的应用程序接口、应用开发实例等。 本书突出实际技能的培养,每章后都有习题和实验,以加深学生对基本知识的理解。另外,还用一个综合性的实例贯穿全书,逐步实现一个完整数据库系统的设计。参考最后一章的应用实例,学生能够开发自己的数据库管理系统,真正做到学以致用。 本书既可作为高职高专及大专相关专业教材,同时也可供广大初学者和数据库技术人员使用。
本书在简要回顾基本C 程序设计概念的基础上,全面系统地介绍了队列、堆栈、树、图等基本数据结构。本书将C 语言作为数据结构的算法描述语言。一方面对传统的数据结构内容进行了C 语言实现,另一方面将数据结构与面向对象技术结合起来,围绕抽象数据类型的概念来讨论每一种数据结构及算法。书中大量C 语言的程序实例既是数据结构的具体实现,又是面向对象技术的算法基础。本书理论与实践并重,每章都有大量的习题,强调数据结构的应用价值。 本书可作为计算机类及信息类相关专业的核心教材,也可供广大研究开发人员自学参考使用。
10余位数据挖掘领域资深专家和科研人员,10余年大数据挖掘咨询与实施经验结晶。从数据挖掘的应用出发,以电力、航空、医疗、互联网、生产制造以及公共服务等行业真实案例为主线,深入浅出介绍Python数据挖掘建模过程,实践性极强。 本书共15章,分两个部分:基础篇、实战篇。基础篇介绍了数据挖掘的基本原理,实战篇介绍了一个个真实案例,通过对案例深入浅出的剖析,使读者在不知不觉中通过案例实践获得数据挖掘项目经验,同时快速领悟看似难懂的数据挖掘理论。读者在阅读过程中,应充分利用随书配套的案例建模数据,借助相关的数据挖掘建模工具,通过上机实验,以快速理解相关知识与理论。 基础篇(~5章),章的主要内容是数据挖掘概述;第2章对本书所用到的数据挖掘建模工具Python语言进行了简明扼要的说明;第3章、第4章、第5章对数据挖掘
《数据挖掘原理、算法及应用》以各类数据挖掘算法为核心,以智能数据分析技术的发展为主线,结合作者自身的研究和应用经验,阐述数据挖掘研究领域的主要理论和典型算法。全书共分8章:章为绪论;第2-5章分别介绍数据挖掘的主要技术、各类典型算法及其编程实现,包括数据预处理技术,关联规则挖掘技术、分类技术,聚类技术等几大类技术和其中包含的典型算法;第6-8章分别简要介绍一些数据挖掘的应用专题,包括时间序列数据挖掘、Weh挖掘、空间数据挖掘等。
“大数据”一词已成为当下最热门的词汇之一。人们热切期待大数据能给工作、学习和生活等方面带来的变化,而大数据的采集、存储、计算、分析挖掘、呈现和安全等技术正是实现这一变化的关键。《大数据技术全解:基础、设计、开发与实践》的重点不在于对大数据技术的原理性介绍,而是从实战角度出发,系统地阐述如何基于Hadoop开源软件为客户设计、安装和开发一个大数据系统。《大数据技术全解:基础、设计、开发与实践》还着重分享了具体实践中的一些案例,不仅对于从事大数据系统开发的IT技术人员具有珍贵的参考价值,而且对准备实施大数据系统项目的企业级客户也具有指导作用。 《大数据技术全解:基础、设计、开发与实践》可以作为计算机软件专业的本科生和研究生的大数据技术教材,也可作为大数据技术开发培训、大数据系统咨询规划
堪称相关行业的“动向”和“密码”的“大数据”究竟是什么?为什么如此受众人关注?未来大数据将改变什么?本书以图解的方式为大家详细解读众人关注的焦点——大数据。 大数据不仅仅是行业的热门话题,也是各行各业关注的焦点。因为它不仅改变了社会,也改变了我们的生活和工作方式。大数据还可应用于各个领域,比如气象预测、预防犯罪、医疗领域等,其功能无比强大。读完本书,你将读懂什么是大数据!