本书是为广大数据分析师量身定制的入门读物,它旨在帮助读者站在大数据时代的制高点。数据分析处于统计学、计算机信息科学、运筹学、数据库等多个领域的交叉地带,大数据时代的到来大大丰富了数据分析的内涵,数据分析师的职责与以往相比发生了巨大的改变。本书全面介绍了经典数据分析、模式识别、机器学习、深度学习、数据挖掘、商务智能等多个领域的数据分析算法,将大数据时代的数据分析热点技术一网打尽。本书为每个数据分析算法都搭配了一个经典案例,并按照由易到难的原则构建知识框架,充分照顾了不同水平读者的阅读习惯。通过阅读本书,读者将对大数据时代下的数据分析有一个全面的认识。无论是入门级的数据分析员还是有一定基础的数据分析师,都能通过本书完善、加深对数据分析的认识。
在新媒体时代,如果对新闻报道、网上搜索的结果或者所谓的 专家告知 不加思考地完全相信,那你就等着上当受骗吧! 本书围绕当今*受瞩目的大数据科学理论,通过日本政府公布的公开数据,集中针对访日游客的增加、舆论调查的可靠性、 安倍经济学 的成果、东日本大地震后的状况、相对贫困、失业率的下降、年轻人远离ХХ、全球变暖问题、减肥、恩格尔系数的上升等10个主题进行数据解读,帮助读者模拟体验数据读取方法,提高理解和分析数据的能力,挖掘出数据背后隐藏的真相。 作为 大数据分析 的超级入门书,即使不擅长数学、不了解统计学的人,读完本书也可以彻底掌握数据解读方法!
互联网公司里面几乎很少有公司不用MySQL,国内互联网巨头都在大规模使用MySQL。如果把MySQL比喻成数据库界的一条巨龙,则性能优化和高可用架构设计实践就是点睛之笔。本书将详细讲解 MySQL 5.7高可用和性能优化技术,细致梳理思路,并与真实生产案例相结合,通过原理阐述到实战部署,帮助读者将所学知识点运用到实际工作中。 本书分为13章,详解MySQL 5.7数据库体系结构,InnoDB存储引擎,MySQL事务和锁,性能优化,服务器全面优化、性能监控,以及MySQL主从复制、PXC、MHA、MGR、Keepalived 双主复制等高可用集群架构的设计与实践过程,并介绍海量数据分库分表和Mycat中间件的实战操作。 本书既适合有一定基础的 MySQL数据库学习者、MySQL数据库开发人员和 MySQL数据库管理人员阅读,同时也能作为高等院校和培训学校相关专业师生的参考用书。
SQL是使用最广泛的数据库语言,绝大多数重要的DBMS支持SQL。本书由浅入深地讲解了SQL的基本概念和语法,涉及数据的排序、过滤和分组,以及表、视图、联结、子查询、游标、存储过程和触发器等内容,实例丰富,便于查阅。新版对书中的案例进行了全面的更新,并增加了章后挑战题,便于读者巩固所学知识。
本书以图书馆信息化为基点,从理论与实际应用角度,介绍了数据仓库与数据挖掘的概念、方法及在图书馆的应用。主要内容包括:以图书馆自动化集成系统日常工作中产生的数据为基础,详细介绍了应用微软SQL Server 2012数据仓库与数据挖掘工具进行图书馆数据仓库开发、数据集成服务、联机分析处理及常见数据挖掘技术挖掘过程。本书注重实践性,可操作性强,可作为企事业单位数据仓库与数据挖掘工作人员、研究人员参考用书
本书全面介绍了数据挖掘与商业智能的基本概念与原理,包括经典理论与趋势发展,并深入叙述了各种数据挖掘的技术与典型应用。通过本书的学习,读者可以对数据挖掘与商业智能的整体结构、概念、原理、技术和发展有深入的了解和认识。 本书共四部分:部分介绍数据仓库、数据挖掘与商业智能之间的关系;第二部分对Microsoft SQL Sen,er的整体架构进行介绍,并详细阐述直接与数据挖掘相关的两个服务:分析服务和报表服务;第三部分逐一阐述Microsoft SQL Server中包含的九种数据挖掘模型;第四部分提供四个数据挖掘的案例以及数据挖掘模型的评估,通过模仿练习,读者可获得实际的数据挖掘经验,稍加修改就能在自己所处的领域中加以应用。
大数据让我们以一种前所未有的方式,通过对海量数据进行分析,获得有巨大价值的产品和服务,*终形成变革之力。本书围绕Hadoop和Spark这两个主流技术进行讲解,主要内容包括Hadoop环境配置、分布式文件系统HDFS、分布式计算框架MapReduce、资源调度框架YARN与Hadoop新特性、大数据数据仓库Hive、离线处理辅助系统、Spark Core、 Spark SQL、Spark Streaming等知识。 为保证*学习效果,本书紧密结合实际应用,利用大量案例说明和实践,提炼含金量十足的开发经验。本书使用Hadoop和Spark进行大数据开发,并配以完善的学习资源和支持服务,包括视频教程、案例素材下载、学习交流社区、讨论组等终身学习内容,为开发者带来全方位的学习体验,更多技术支持请访问课工场官网:www.kgc.cn。
集Python、Excel、数据分析为一体是本书的一大特色。本书围绕整个数据分析的常规流程:工具熟悉-获取数据-数据熟悉-数据处理-数据分析-分析结果进行Excel 和Python 对比实现,告诉你每一个过程中都会用到什么?过程与过程之间有什么联系。这样一本书既可以作为系统学习数据分析流程操作的说明书,也可以作为一本数据分析师案头推荐的实操工具书,随时备查。本书通过对比Excel 功能操作去学习Python 的实现代码,而不是直接上来就学习Python代码,大大降低了学习门槛,消除了读者对代码的恐惧心理。适合刚入行的数据分析师,也适合对Excel 比较熟练的数据分析师,或从事其他岗位想提高工作效率的职场人。
本书以当前主流的关系数据库为主线,全面阐述了数据库的基本原理、基本技术、基本方法和应用技术,介绍了 数据库技术的研究动态,探讨了数据库领域研究的新进展。本书主要内容包括:关系理论、关系数据库标准语言 SQL.关系规范化理论、关系数据库设计、数据库的实施与调优、数据完整性约束、数据库的安全性、事务管理和锁、数 据库的备份和恢复、现代数据库技术新进展等。 本书注重数据库技术的实际应用,强调理论与实践紧密结合,可供从事数据库技术领域工作的科技人员参考使 用。
《数据库应用技术(高等学校计算机课程规划教材)》编著者喻梅。 全书以SQL Server2005数据库管理系统为基础,介绍数据库系统的基本原理及应用技术。 全书首先介绍了数据库系统的基本概念和关系数据厍的理论,接着简单介绍了SQLServer-2005的性能、安装、配置和使用等基本知识以及所提供的各种常用管理工具,然后讲述了创建和管理数据库的各种操作以及在数据库中创建和管理表的各种操作。讨论了使用选择查询从数据库中检索数据和更新数据库中的数据,使用索引来提高检索效率、管理和使用视图的各种操作,创建及维护数据完整性,使用Transact-SQL语言进行程序设计。使用存储过程和触发器来控制数据库中的数据。介绍了SQL Setver2005的安全性管理和权限设置以及备份和还原数据库的方法。 本书可以作为高等院校相关专业数据库应用技术课程的教材,
卢辉编著的《数据挖掘与数据化运营实战(思路方法技巧与应用)》是目前有关数据挖掘在数据化运营实践领域比较全面和系统的著作,也是诸多数据挖掘书籍中为数不多的穿插大量真实的实践应用案例和场景的著作, 是创造性地针对数据化运营中不同分析挖掘课题类型,推出一一对应的分析思路集锦和相应的分析技巧集成,为读者提供“菜单化”实战锦囊的著作。作者结合自己数据化运营实践中大量的项目经验,用通俗易懂的“非技术”语言和大量活泼生动的案例,围绕数据分析挖掘中的思路、方法、技巧与应用, 整理、总结、分享,帮助读者深刻领会和掌握“以业务为核心,以思路为重点,以分析技术为辅佐”的数据挖掘实践应用宝典。 《数据挖掘与数据化运营实战(思路方法技巧与应用)》共19章,分为三个部分:基础篇( ~4章)系统介绍了数据分析
《海量点云数据处理理论与技术》共分8章。第1章绪论,简要介绍海量点云处理技术的基础理论、方法以及主要内容。第2章介绍海量点云数据的预处理,包括点云数据的获取方案,点云的去噪、压缩、配准方法,以及点云空洞的插值方法。第3章介绍海量点云数据的重建方法,系统介绍常用的点云重建算法与特点,并详细介绍基于特征和基于切片的点云重建方法。第4章介绍点云数据及模型的质量评价,从理论和实际两方面对点云质量进行分析,总结点云配准过程中的误差传播模型,系统地归纳三维模型的质量评定方法。第5章介绍点云数据处理技术,详细介绍国内外常用的海量点云数据处理软件以及三维图像库。第6章介绍地面三维激光扫描仪在隧道监测领域的应用,系统介绍基于三维激光扫描技术的隧道点云数据获取、处理及变形分析方法。第7章介绍地面三维
本书共分6章,通过多源数据汇聚,按照灾害体、承灾体和抗灾体进行数据组织与管理,应用空间分析、机器学习和应急管理的理论与方法,进行多因素关联挖掘分析,力求实现突发事件的状态透明、过程透明和变化透明,服务于应急救援。本书是基于国家重点研发项目计划 国家公共安全应急平台 支持下完成的。全书共六章,shou先通过多源数据汇聚,对灾害体、承灾体和抗灾体进行数据组织和管理,然后应用空间分析、机器学习和应急管理的理论和方法,进行多因素关联挖掘分析。后,以美国纽约市的交通事故、犯罪事件、公共卫生事件数据为例进行分析,得出本研究模型的可行性。
本书分12章重点阐述了数据管理的重要性,数据管理面临的挑战,DAMA的数据管理原则,数据伦理,数据治理,数据生命周期管理的规划及设计,数据赋能和数据维护,使用和增强数据,数据保护、隐私、安全和风险管理,元数据管理,数据质量管理,以及现在应该怎么办,能够帮助企业管理层在了解和执行数据管理的过程中不致迷失在技术术语的迷宫之中。本书可供非数据专业人士、企业管理者、数据行业研究者等读者学习和参考。
本书覆盖了数据仓储构建的所有主要领域,包括数据仓储的定义和环境;数据仓储的4个类型、对数据仓储的5类共15个要求;2个方法论的总结及3个构建方法。本书给出了一个高性能的参照系统结构。基于此参照系统结构,本书系统地讨论了大量设计议题、并包括21个设计建议、8个实践建议、7个设计原则、27个通用算法和技术、12个元数据驱动的通用操作符、7个工作过程、4个范式基础及范式原则。
制定多种匿名化解决方案,覆盖多种应用场景,满足对可识别性的不同要求。 解决方案跟所用数据、数据接收方和分析目标相匹配。 为数据采集模式量身定制匿名化流水线,覆盖不同业务需求。 为原始数据生成匿名化版本或用分析平台生成匿名化输出。 检查匿名数据使用的伦理问题。
Oracle数据库系统是数据库领域*秀的数据库之一,本书以Oracle*版本OracleDatabase l2c Release l(12.1.o.1.0)为蓝本,系统地讲述了Oracle数据库的概念、管理和应用开发等内容。全书结构合理、内容翔实、示例丰富、语言简洁。从实际角度出发,系统地介绍了数据库和Oracle的相关概念和原理、Oracle的数据库管理(如安装与启动,用产权限、备份与恢复等)以及Oracle的应用开发基础,并通过两个案例来介绍基于Java开发包和Oracle数据库进行案例开发的详细过程。 本书面向数据库管理人员和数据库开发人员,对于初学者,本书是一本很好的入门教程,对于Orac]c管理员和应用程序开发员,也有很好的学习和参考价值。不仅适合作为高等院校本/专科计算机软件、信息系统、电子商务等相关专业的数据库课程教材,还适合作为各种数据库技术培训班的教材以及数据库开发人员的
本书十章内容分属上、中、下三篇。上篇为大数据关键技术篇,从数据、信息和知识内在的关联逻辑出发,技术结合实例,从技术体系的基本原理、核心技术的要素组成等方面,对大数据应用的基本原理和关键技术进行了系统的论述。并对大数据体系的技术生态环境进行了分析梳理。中篇为教育大数据应用创新篇,从支持 有效学习 的角度,利用知识图谱对教育大数据进行聚合分析,提出了支持现代教育技术创新的大数据应用方案和技术赋能路径。下篇为大数据应用拓展篇,重点从技术框架出发,理论结合实践,全方位地探讨大数据技术在不同应用领域中的理念方法与技术创新思路。 本书围绕大数据及其相关技术这一主题,采用深入浅出的叙述方式,阐述大数据及其相关*技术的基本理论、关键技术和实际应用,目的是让广大师生以计算机公共基础课程为
《中公版 数据库深度开发指南:MySQL数据库理论与实战》本书共分为十八章,包括基础篇、开发篇、优化篇和运维篇四部分内容,涵盖了MySQL知识体系中,从MySQL安装、SQL语句,到基本数据类型和函数以及数据库基本组件的相关知识点,再到面向开发人员和运维人员的SQL优化和备份恢复等内容。本书以由浅入深、循序渐进为原则,对于较难理解的知识点,通过相关实验的操作与分析,力求让读者对MySQL的基本知识点和相关业务应用能有更加全面的学习和掌握。 ●基础篇(*章至第六章) 介绍数据库基本概念、MySQL的安装与使用、基本数据类型、常用运算符以及常用函数。 ●开发篇(第七章至第十二章) 讲解SQL查询语句在MySQL中的应用,以及开发人员经常用到的数据库基本组件,包括索引、视图、存储过程、存储函数、触发器,*后介绍能保证业务数据完整
本书主要介绍数据库的基本原理,并以MySQL数据库为平台,讲解关系型数据库基本原理在MySQL数据库中的应用,是数据库原理学习和MySQL数据库应用学习的基础教材。本书共16章,第1章介绍数据库基本概念;第2章介绍概念模型设计;第3章介绍逻辑模型设计;第4章介绍MySQL数据库环境;第5章介绍MySQL数据库的创建与管理;第6章介绍数据表的创建与管理;第7章介绍数据输入与维护相关的DML语句及其用法;第8章单独介绍数据查询语句及其用法;第9章介绍Sql编程基础,如MySQL常用函数、游标等;第10章介绍视图的定义与使用;第11章介绍索引的定义与使用;第12章介绍存储过程的定义与使用;第13章介绍触发器的定义与使用;第14章介绍MySQL数据库的安全管理;第15章介绍MySql高级应用分布式部署;第16章使用Java语言开发了个MySQL数据库应用案例,以此介绍Java操作MySQL数据库的
在软件设计和开发过程中,需求分析确定后,在开发软件前就需要先设计数据库,然后再编写代码。 韩立刚主编的这本《跟韩老师学SQL Server数据库设计与开发》讲解的内容是软件开发人员必须要掌握的技术,先讲解如何根据项目的需求按关系型数据库设计规范设计数据库中的表,然后使用自己设计的数据库来学习SQL语句。 本书完整地讲述了SQL语句中使用的变量、数据类型、注释行、运算符、常用函数,以及流程控制语句。从单表查询讲起,讲解使用WHERE筛选行将查询的结果分组、排序,然后讲解多表查询和数据汇总,讲解多表交叉联结、内联结、外联结、自联结,使用 UNION合并查询结果集,使用聚合函数汇总查询结果,接着讲解了子查询、开窗函数和行列转换技术,实现数据完整性,创建和使用索引优化性能,在数据库中创建和使用视图简化查询,使用存储过程