本书是为广大数据分析师量身定制的入门读物,它旨在帮助读者站在大数据时代的制高点。数据分析处于统计学、计算机信息科学、运筹学、数据库等多个领域的交叉地带,大数据时代的到来大大丰富了数据分析的内涵,数据分析师的职责与以往相比发生了巨大的改变。本书全面介绍了经典数据分析、模式识别、机器学习、深度学习、数据挖掘、商务智能等多个领域的数据分析算法,将大数据时代的数据分析热点技术一网打尽。本书为每个数据分析算法都搭配了一个经典案例,并按照由易到难的原则构建知识框架,充分照顾了不同水平读者的阅读习惯。通过阅读本书,读者将对大数据时代下的数据分析有一个全面的认识。无论是入门级的数据分析员还是有一定基础的数据分析师,都能通过本书完善、加深对数据分析的认识。
在新媒体时代,如果对新闻报道、网上搜索的结果或者所谓的 专家告知 不加思考地完全相信,那你就等着上当受骗吧! 本书围绕当今*受瞩目的大数据科学理论,通过日本政府公布的公开数据,集中针对访日游客的增加、舆论调查的可靠性、 安倍经济学 的成果、东日本大地震后的状况、相对贫困、失业率的下降、年轻人远离ХХ、全球变暖问题、减肥、恩格尔系数的上升等10个主题进行数据解读,帮助读者模拟体验数据读取方法,提高理解和分析数据的能力,挖掘出数据背后隐藏的真相。 作为 大数据分析 的超级入门书,即使不擅长数学、不了解统计学的人,读完本书也可以彻底掌握数据解读方法!
本书主要包括三部分内容,即误差和数据处理基础、试验设计方法与应用和计算机数据处理软件简介。从误差理论入手,分别介绍测量值与误差、偶然误差的分布、误差传递等误差理论中的内容,介绍统计检验、方差分析、回归分析和聚类分析等数据处理方法与应用,介绍提高分析化学准确度的方法及质量控制方法,介绍正交试验设计、多因素序贯试验设计、*化区组和拉丁方设计、析因设计、响应面设计方法与应用,后一章以较大篇幅对现时流行的大型统计软件之一SPSS(Statistical Product and Service Solutions)进行简要介绍,书末附有习题及常用的统计数表。 本书着重介绍基本概念和基本理论,并在此基础上结合专业特点,介绍了各种统计方法在化学化工、医药、环境检测、矿物加工等多方面的应用,本书把误差与数据处理、质量控制和实验设计作为重点。
本书以图书馆信息化为基点,从理论与实际应用角度,介绍了数据仓库与数据挖掘的概念、方法及在图书馆的应用。主要内容包括:以图书馆自动化集成系统日常工作中产生的数据为基础,详细介绍了应用微软SQL Server 2012数据仓库与数据挖掘工具进行图书馆数据仓库开发、数据集成服务、联机分析处理及常见数据挖掘技术挖掘过程。本书注重实践性,可操作性强,可作为企事业单位数据仓库与数据挖掘工作人员、研究人员参考用书
本书不讲具体语法,只是以案例的形式介绍各种查询语句的用法。靠前~4章是基础部分,讲述了常用的各种基础语句,以及常见的错误和正确语句的写法,应熟练掌握这部分内容,因为在日常查询和优化改写中都要用到;第5~12章是提高部分,讲解了正则表达式、分析函数、树形查询及汇总函数的用法,这部分内容常用于一些复杂需求的实现及优化改写;很后两章介绍日常的优化改写案例,这部分内容是前面所学知识的扩展应用。如果您是开发人员,经常与Oracle打交道,那么本书可以帮助您处理复杂的需求,写出高性能的语句。如果您是运维人员,则本书可以帮助您更快地完成慢语句的改写优化。
本书分为部分,分别为大数据基础理论分析、基于海量语意规则的大数据流处理技术及大数据应用。 部分介绍大数据领域的主要基础理论,包括大数据基本概念、可编程数据中心、云文件系统、云数据库系统、大数据并行编程与分析模型、大数据智能计算算法、基于大数据的数据仓库技术、大数据安全与隐私保护,以及基于大数据的语意软件工程方法等。 第二部分介绍基于海量语意规则的大数据流处理技术,包括基于规则的大数据流处理介绍、语意规则描述模型、海量语意规则网及优化、海量语意规则处理算法及海量语意规则并行处理等。 第三部分主要介绍大数据的一些典型应用,包括:文化大数据、医疗健康大数据、互联网金融大数据、教育大数据、电子商务大数据、互联网大数据、能源大数据、交通大数据、宏观经济大数据、进出口食品安全监管大数据、基
集Python、Excel、数据分析为一体是本书的一大特色。本书围绕整个数据分析的常规流程:工具熟悉-获取数据-数据熟悉-数据处理-数据分析-分析结果进行Excel 和Python 对比实现,告诉你每一个过程中都会用到什么?过程与过程之间有什么联系。这样一本书既可以作为系统学习数据分析流程操作的说明书,也可以作为一本数据分析师案头推荐的实操工具书,随时备查。本书通过对比Excel 功能操作去学习Python 的实现代码,而不是直接上来就学习Python代码,大大降低了学习门槛,消除了读者对代码的恐惧心理。适合刚入行的数据分析师,也适合对Excel 比较熟练的数据分析师,或从事其他岗位想提高工作效率的职场人。
本书的知识架构是在培训了多届学员的基础上总结整理得来的,已经经过了实践的考验,证实了其科学性;本书当中的案例都为企业实际开发的案例,通过学习这些大量的实际案例,帮助学生在进入企业后可以很快融入大数据工作岗位。本书包括大数据概论、初识Hadoop、认识HDFS、HDFS的运行机制、访问HDFS、Hadoop I/O 详解、认识MapReduce编程模型、MapReduce应用编程开发、MapReduce的工作机制与YARN平台、MapReduce高级开发、MapReduce实例共11章内容。本书既可作为高等院校学习大数据技术的教材,亦可作为广大大数据技术学习者的入门用书。
本书是与张宏军教授等编著的《作战仿真数据工程》教材配套的实验指导书。本书根据《作战仿真数据工程》教材的组织特点编排了实验内容。紧密配合理论教学.合理安排数据工程的实验教学,使学生能够在有限的实验课时中,加深对所学知识的理解与掌握,熟练使用常用的数据工程相关处理软件,培养和提高学生的实际操作水平。 本书涵盖了作战仿真数据规划、数据建模、数据集成、元数据集拟制、数据分析与数据挖掘、数据可视化、数据管理等方面的实验项目,实验内容饱满、步骤详细,有助于提高学生的实验效果。 本书可作为相关专业研究生和高年级本科生的实验教材,也可作为工程技术人员的参考书。
程朝斌、张水波编著的《MySQL数据库管理与开发实践教程》讲述MySQL数据库的开发技术。全书共分为16章,内容包括MySQL发展历史,与其他数据库的区别,MySQL常用的一些工具,MySQL文件结构、系统架构、存储引擎、数据类型,数据库和表的创建、管理和删除,数据完整性约束,包括主键约束、外键约束、非空约束、默认值约束、 约束和自增约束等,数据的单表查询和多表查询,视图和索引,变量、常量、运算符和表达式、运算符的优先级、流程控制语句、自定义函数,系统函数,存储过程和触发器,事务管理,性能优化,日志文件管理、权限管理以及数据的备份和还原。 一章通过一个综合案例实现网上购物系统的数据库。 本书可作为在校大学生学习使用MySQL的教学资料,也可以作为非计算机专业学生学习MySQL的参考书。
刘电威主编的《网店数据分析》以基于DACUM的职业技能培训和基于BAG的职业行动能力教育为框架结构,详细介绍了*网店的数据分析工具,包括*搜索与*指数、量子恒道、数据魔方等,同时采用真实的*网店作为案例进行数据分析,注重理论与实践相结合,语言简明扼要,通俗易懂。 本书作为网店数据分析的教学企业实训教程,既可用作高职院校电子商务专业的教材,也可供网上创业者阅读参考,以及作为自学或机构培训用书。
本书结合高职高专的教学特点,较系统地介绍了*基础、*必需掌握的数据库原理相关理论知识,在此基础上,通过大量实例着重讲解SQL Server 2014所提供的各种工具对数据库实施的操作与管理,并辅以某公司人事系统后台数据库设计项目作为实训练习贯穿全书,使得数据库原理的阐述与SQL Server 2014的实际应用融为一体,读者可以通过必要的基本理论指导其对数据库操作的实践,同时也能在实践中加深对数据库原理的理解。为方便读者更好掌握SQL Server 2014的使用,书中采用通俗易懂的方式介绍了有关操作步骤和原理,并辅以大量实例和插图。每章均配有相关内容的项目设计,便于读者进行实际操作和练习。本书共计三大部分,其中*部分(*章至第四章),主要介绍数据库基本概念和理论,第二部分(第五章至第七章),主要介绍SQL Server 2014的安装、管理和数据操作等,第
卢辉编著的《数据挖掘与数据化运营实战(思路方法技巧与应用)》是目前有关数据挖掘在数据化运营实践领域比较全面和系统的著作,也是诸多数据挖掘书籍中为数不多的穿插大量真实的实践应用案例和场景的著作, 是创造性地针对数据化运营中不同分析挖掘课题类型,推出一一对应的分析思路集锦和相应的分析技巧集成,为读者提供“菜单化”实战锦囊的著作。作者结合自己数据化运营实践中大量的项目经验,用通俗易懂的“非技术”语言和大量活泼生动的案例,围绕数据分析挖掘中的思路、方法、技巧与应用, 整理、总结、分享,帮助读者深刻领会和掌握“以业务为核心,以思路为重点,以分析技术为辅佐”的数据挖掘实践应用宝典。 《数据挖掘与数据化运营实战(思路方法技巧与应用)》共19章,分为三个部分:基础篇( ~4章)系统介绍了数据分析
本书是面对当前科学可视化、信息可视化、可视分析研究和应用的新形势,专门为计算机、数据处理、视觉设计、统计、数学、航空航天、建筑、遥感影像等专业本科生开设数据可视化课程而编写的一本教材。全书划分为三篇:基础篇、数据篇和应用篇。其中,基础篇从人、数据、可视化流程等三个层面阐述数据可视化的基础理论和概念;数据篇则针对实际应用中遇到的不同类型的数据,包括时空数据、地理信息数据、高维非空间数据、层次和网络数据介绍相应的可视化方法;应用篇着重介绍可视化综合应用及实用系统。为了便于学习,每章后都附有习题和参考文献。 本书的特点是内容完整,叙述简明,重点突出;以数据类型为导向,以行业应用为目标。作者专门收集和整理了相关的课程教案、典型数据、精彩案例、可视化作品、课程附属视频和动画材
《数据结构算法与应用》系统地介绍了各种类型的数据结构、数据结构在计算机存储器中的表示以及相关的C语言描述算法。另外,对各类数据结构在实际中的应用做了较深入的介绍,包含示例分析及典型算法的C语言源程序。本书后对算法设计的基础知识进行了讨论,拓展了知识面。每章后附有习题,便于读者进一步理解和巩固所学的知识。 本书可作为大专院校计算机专业或相关专业的教材,也可供从事计算机软件开发的工程技术人员参考。
《海量点云数据处理理论与技术》共分8章。第1章绪论,简要介绍海量点云处理技术的基础理论、方法以及主要内容。第2章介绍海量点云数据的预处理,包括点云数据的获取方案,点云的去噪、压缩、配准方法,以及点云空洞的插值方法。第3章介绍海量点云数据的重建方法,系统介绍常用的点云重建算法与特点,并详细介绍基于特征和基于切片的点云重建方法。第4章介绍点云数据及模型的质量评价,从理论和实际两方面对点云质量进行分析,总结点云配准过程中的误差传播模型,系统地归纳三维模型的质量评定方法。第5章介绍点云数据处理技术,详细介绍国内外常用的海量点云数据处理软件以及三维图像库。第6章介绍地面三维激光扫描仪在隧道监测领域的应用,系统介绍基于三维激光扫描技术的隧道点云数据获取、处理及变形分析方法。第7章介绍地面三维
本教程中预备知识,介绍项目中实验环境、程序组织方式和管理方法,讲解程序及算法的效率估算方法和分析技巧,描述一般测试技术和调试方法,以及测试数据与测试用例的设计安排技巧;基础实验,首先安排重要的验证性实验,然后设计基于基本数据结构的简单应用实验;综合实验(即课程设计),介绍在一个项目中选择和使用多种基本数据结构的依据和方法,讲解如何有效地将它们融合在一起解决实际的复杂应用问题。 本教程在内容选取及编排顺序上,与严蔚敏老师编著的《数据结构(C 语言版)》(978-7-302-14751-0,清华大学出版社出版)保持一致,可作为高等院校计算机及相关专业数据结构课程的实验教材。
MongoDB是一种面向文档的分布式数据库,可扩展,表结构自由,并且支持丰富的查询语句和数据类型。时至今日,MongoDB以其灵活的数据存储方式逐渐成为IT行业非常流行的一种非关系型数据库(NoSql)。 本书从学习与实践者的视角出发,本着通俗精简、注重实践、突出精髓的原则,精准剖析了MongoDB的诸多概念和要点。全书共分4个部分,分别从基础知识、深入理解MongoDB、监控与管理MongoDB和应用实践几个维度详细地介绍了MongoDB的特点及应用实例。 本书适合有海量数据存储需求的人员、数据库管理开发人员、数据挖掘与分析人员以及各类基于数据库的应用开发人员。读者将从书中获得诸多实用的知识和开发技巧。
全书共分为六章:*章为绪论,介绍了大数据时代隐私内涵的构成要素以及发展变迁历史,并从技术层面、社会层面、个人层面列举了大数据环境下隐私安全的表现形式,总结了当前个人隐私被侵害的类型以及呈现的特征;第二章为隐私泄露风险评估与度量方法,针对常用的隐私保护方法,详细介绍了当前隐私量化模型与度量标准的相关研究,并分析了主流的隐私度量方法的性能优劣以及评价指标;第三章为位置服务中隐私保护技术,并介绍了P2P结构与独立架构两种模式下位置隐私保护技术方案。第四章为深度学习训练数据集隐私保护技术,提出了两种差分?
由宋媚所*的《大数据征信背景下的信息质量度量与提升研究》主要关注大数据背景下的信息质量度量方法,并有针对性地提出了信息质量管理提升策略。《大数据征信背景下的信息质量度量与提升研究》具体包括:大数据征信背景下的信息质量评价与管控;征信信息质量度量模型的构建;征信信息质量度量模型应用;征信系统的信息质量管理与价值提升策略分析。
由周跃南、蔡学军主编的《云计算技术实训教程 (云计算技术与应用课程群高等职业教育十三五规划教材)》根据职业教育的教学特点和培养目标,依托长城云教室和云实训平台,采用 实训任务驱动式教程 方式编写,介绍了云计算基础技能,也补充了一些相关的云计算知识,做到以技能训练为主,理论与实践相结合。全书共分八大任务,包括资源管理、虚拟机管理、网络管理、存储管理、安全管理、用户管理等方面的内容。 本书是中职云计算技术与应用专业及相关专业的云计算技术技能训练教材,也适合高职云计算技术与应用专业使用,还可以作为相关技术人员的培训教材。
大数据为何如此聪明?它是否会chao越人类理性的控制?本书选取人机关系这一切入点作为分析视角,综合以往哲学界做出的相关论述,阐释了新的概念与理论体系下大数据如何在人机交互中构建和涌现智能。 本书以大数据时代作为总的分析背景,进行了 人机关系的内涵分析 人机关系与心物关系问题的关联 大数据的构建与其意向性的负载 大数据的可建构性研究 人机关系视域下的大数据的伦理问题 等方面的论述,在跟随时代热点的同时也对 心物关系 和 他心知 等经典的哲学问题做出了视角较为新颖的回应。本书知识性、系统性较强,可作为科技哲学领域研究的专家学者进一步从事人工智能哲学和技术哲学等领域研究的参考用书。