本书是为广大数据分析师量身定制的入门读物,它旨在帮助读者站在大数据时代的制高点。数据分析处于统计学、计算机信息科学、运筹学、数据库等多个领域的交叉地带,大数据时代的到来大大丰富了数据分析的内涵,数据分析师的职责与以往相比发生了巨大的改变。本书全面介绍了经典数据分析、模式识别、机器学习、深度学习、数据挖掘、商务智能等多个领域的数据分析算法,将大数据时代的数据分析热点技术一网打尽。本书为每个数据分析算法都搭配了一个经典案例,并按照由易到难的原则构建知识框架,充分照顾了不同水平读者的阅读习惯。通过阅读本书,读者将对大数据时代下的数据分析有一个全面的认识。无论是入门级的数据分析员还是有一定基础的数据分析师,都能通过本书完善、加深对数据分析的认识。
在新媒体时代,如果对新闻报道、网上搜索的结果或者所谓的 专家告知 不加思考地完全相信,那你就等着上当受骗吧! 本书围绕当今*受瞩目的大数据科学理论,通过日本政府公布的公开数据,集中针对访日游客的增加、舆论调查的可靠性、 安倍经济学 的成果、东日本大地震后的状况、相对贫困、失业率的下降、年轻人远离ХХ、全球变暖问题、减肥、恩格尔系数的上升等10个主题进行数据解读,帮助读者模拟体验数据读取方法,提高理解和分析数据的能力,挖掘出数据背后隐藏的真相。 作为 大数据分析 的超级入门书,即使不擅长数学、不了解统计学的人,读完本书也可以彻底掌握数据解读方法!
互联网公司里面几乎很少有公司不用MySQL,国内互联网巨头都在大规模使用MySQL。如果把MySQL比喻成数据库界的一条巨龙,则性能优化和高可用架构设计实践就是点睛之笔。本书将详细讲解 MySQL 5.7高可用和性能优化技术,细致梳理思路,并与真实生产案例相结合,通过原理阐述到实战部署,帮助读者将所学知识点运用到实际工作中。 本书分为13章,详解MySQL 5.7数据库体系结构,InnoDB存储引擎,MySQL事务和锁,性能优化,服务器全面优化、性能监控,以及MySQL主从复制、PXC、MHA、MGR、Keepalived 双主复制等高可用集群架构的设计与实践过程,并介绍海量数据分库分表和Mycat中间件的实战操作。 本书既适合有一定基础的 MySQL数据库学习者、MySQL数据库开发人员和 MySQL数据库管理人员阅读,同时也能作为高等院校和培训学校相关专业师生的参考用书。
SQL是使用最广泛的数据库语言,绝大多数重要的DBMS支持SQL。本书由浅入深地讲解了SQL的基本概念和语法,涉及数据的排序、过滤和分组,以及表、视图、联结、子查询、游标、存储过程和触发器等内容,实例丰富,便于查阅。新版对书中的案例进行了全面的更新,并增加了章后挑战题,便于读者巩固所学知识。
本书以大数据发展的历史、特征、发展趋势为切入点,介绍了大数据产业的背景、大数据的显著特征、大数据的构成以及大数据带来的机遇与挑战,重点介绍了大数据采集、存储、管理及数据分析与挖掘的前沿技术,并分析了大数据在各行各业及政府机构间的具体应用案例,阐明了大数据对指导实际工作与生活的现实意义与作用。本书系作者根据自己多年的研究教学经验编著而成,结构体系科学,内容全面合理,理论联系实际,案例丰富,有助于广大读者理解大数据的基本内容、核心技术、使用机制等。
本课程的教学内容主要包括聚类、关联、降维、变量选择、分类与预测、集成算法、图模型与推荐系统等。每一部分都是本课程授课的主要内容,都力求深入浅出,精讲细讲,不光讲解各种方法的过程与原理,还要加强学生对各种方法的深入理解。
本书以图书馆信息化为基点,从理论与实际应用角度,介绍了数据仓库与数据挖掘的概念、方法及在图书馆的应用。主要内容包括:以图书馆自动化集成系统日常工作中产生的数据为基础,详细介绍了应用微软SQL Server 2012数据仓库与数据挖掘工具进行图书馆数据仓库开发、数据集成服务、联机分析处理及常见数据挖掘技术挖掘过程。本书注重实践性,可操作性强,可作为企事业单位数据仓库与数据挖掘工作人员、研究人员参考用书
大数据让我们以一种前所未有的方式,通过对海量数据进行分析,获得有巨大价值的产品和服务,*终形成变革之力。本书围绕Hadoop和Spark这两个主流技术进行讲解,主要内容包括Hadoop环境配置、分布式文件系统HDFS、分布式计算框架MapReduce、资源调度框架YARN与Hadoop新特性、大数据数据仓库Hive、离线处理辅助系统、Spark Core、 Spark SQL、Spark Streaming等知识。 为保证*学习效果,本书紧密结合实际应用,利用大量案例说明和实践,提炼含金量十足的开发经验。本书使用Hadoop和Spark进行大数据开发,并配以完善的学习资源和支持服务,包括视频教程、案例素材下载、学习交流社区、讨论组等终身学习内容,为开发者带来全方位的学习体验,更多技术支持请访问课工场官网:www.kgc.cn。
本书围绕SQL Server 2008数据库管理的各种应用特性,详细介绍了SQL Server 2008系统中各功能的实现过程和操作步骤,主要内容包括SQL Server 2008安装与配置,数据库管理,表的创建与管理,表的数据维护,数据查询,视图、索引、存储过程、触发器的创建与管理,安全管理,数据库备份与恢复等。本书在每个实验开始前对该实验的各个知识点进行归纳总结,在此基础上联系具体案例展开实验。 本书内容由浅入深、循序渐进,以实用为主,注重专业知识的讲解、应用能力的训练和动手能力的培养。 本书可作为高等学校,特别是应用型本科院校电子商务、计算机、信息管理与信息系统等相关专业的实验教学用书,也可作为数据库初学者的入门教材。
加速数字化转型,已经成为新时期组织生存和发展的必然选择。针对组织推进数字化转型过程中普遍面临的战略不明确、路径不清晰、过程方法缺失、价值难获取等共性问题和挑战,本书系统提出了数字化转型的体系架构和方法
制定多种匿名化解决方案,覆盖多种应用场景,满足对可识别性的不同要求。 解决方案跟所用数据、数据接收方和分析目标相匹配。 为数据采集模式量身定制匿名化流水线,覆盖不同业务需求。 为原始数据生成匿名化版本或用分析平台生成匿名化输出。 检查匿名数据使用的伦理问题。
如今企业数字化转型和“互联网+”已成为热门话题。那么,如何开展转型工作,让具体工作可以落到实处呢?由于数字化转型工作的复杂性,很多企业管理者感觉无从下手,市面上也十分缺乏相关的指引和资料。本书介绍的企业架构方法以及多个领先企业和行业数字化案例,可以使读者系统地掌握数字化转型的理论和落地方法,帮助企业完成生死攸关的转型变革。本书回答了“什么是数字经济,什么是数字化转型,什么是数字化转型的关键要素”等问题,并在转型方法方面介绍了数字化企业架构的业务架构、流程、组织、IT架构,详细阐述了金融、零售、医疗、物联网、AI、智能制造等方面近期新的商业模式和技术发展。本书打开了一扇新的数字化转型方法之门,是企业管理者、信息化从业者以及管理咨询服务机构、IT服务公司从业人员、大专院校师生很好的参考资
本书以当前主流的关系数据库为主线,全面阐述了数据库的基本原理、基本技术、基本方法和应用技术,介绍了 数据库技术的研究动态,探讨了数据库领域研究的新进展。本书主要内容包括:关系理论、关系数据库标准语言 SQL.关系规范化理论、关系数据库设计、数据库的实施与调优、数据完整性约束、数据库的安全性、事务管理和锁、数 据库的备份和恢复、现代数据库技术新进展等。 本书注重数据库技术的实际应用,强调理论与实践紧密结合,可供从事数据库技术领域工作的科技人员参考使 用。
本书以大数据为研究背景,系统分析了传统数据技术当前存在的问题以及面临的挑战,并对比了当前主流的面向大数据的数据库解决方案,在此基础上阐述了笔者的研究工作:基于MapReduce平台高处处理大数据的OLAP研究。书中反应了当前大规模数据仓库研究的热点和成果,值得大数据研究的人员参考和应用。
本书共分6章,通过多源数据汇聚,按照灾害体、承灾体和抗灾体进行数据组织与管理,应用空间分析、机器学习和应急管理的理论与方法,进行多因素关联挖掘分析,力求实现突发事件的状态透明、过程透明和变化透明,服务于应急救援。本书是基于国家重点研发项目计划 国家公共安全应急平台 支持下完成的。全书共六章,shou先通过多源数据汇聚,对灾害体、承灾体和抗灾体进行数据组织和管理,然后应用空间分析、机器学习和应急管理的理论和方法,进行多因素关联挖掘分析。后,以美国纽约市的交通事故、犯罪事件、公共卫生事件数据为例进行分析,得出本研究模型的可行性。
本书十章内容分属上、中、下三篇。上篇为大数据关键技术篇,从数据、信息和知识内在的关联逻辑出发,技术结合实例,从技术体系的基本原理、核心技术的要素组成等方面,对大数据应用的基本原理和关键技术进行了系统的论述。并对大数据体系的技术生态环境进行了分析梳理。中篇为教育大数据应用创新篇,从支持 有效学习 的角度,利用知识图谱对教育大数据进行聚合分析,提出了支持现代教育技术创新的大数据应用方案和技术赋能路径。下篇为大数据应用拓展篇,重点从技术框架出发,理论结合实践,全方位地探讨大数据技术在不同应用领域中的理念方法与技术创新思路。 本书围绕大数据及其相关技术这一主题,采用深入浅出的叙述方式,阐述大数据及其相关*技术的基本理论、关键技术和实际应用,目的是让广大师生以计算机公共基础课程为
本书详细介绍了数据可视化和数据挖掘技术研究现状,并以煤层气产业为例,介绍了煤层气田数据可视化与挖掘系统的应用与需求分析,详细描述了系统总体架构方案、功能模块设计、主要流程算法,以及系统开发成果等内容。
本书与以往统计学中的概率论略有不同,添加了一些复杂数据类型的概率基础知识和模拟计算中的相关概率知识。具体安排如下所述。本书共分6章。第1章为概率与计数,基本内容是随机事件、概率空间、计数方法、概率的确定方法。第2章为条件概率,基本内容是条件概率与乘法公式、事件的独立性、全概率公式与贝叶斯公式。第3章为随机变量,基本内容是随机变量及其分布函数、随机变量的分类、二维随机向量、随机变量的独立性、随机变量函数的分布。第4章为常用的概率分布,基本内容是常用的离散型随机变量、常用的连续型随机变量、随机数的产生。第5章为随机变量的数字特征,基本内容是数学期望、方差和协方差、矩和矩母函数、条件期望。第6章为不等式和极限定理,基本内容是概率不等式、大数定律及其应用、中心极限定理。
从数据中心机房监控系统的自定制技术、监控系统可信方法等方面,综述国内外研究进展,确定研究内容。第1章,主要讲述智能绿色数据中心机房监控系统的内涵;第2章,主要讲述基于大批量定制的绿色数据中心机房的自定制机理与方法;第3章,主要讲述绿色数据中心机房的用户身份认证、完整性等可信方法;第4章,给出了绿色数据中心机房智能监控技术应用,研制绿色智能机房监控系统,在该绿色智能机房监控系统架构上实施用户自定制技术、可信增强技术模块功能,并测试各项技术及整个系统的应用效果。 本书是作者长期从事数据中心机房监控系统,特别是数据中心机房监控系统自定制、可信性研究工作的方法和应用成果的总结,本书所研究技术应用到实际数据中心机房运行,这些实践工作对本书的形成具有十分重要的意义。
《Oracle11g数据库应用与开发》属于校企协同软件工程应用型专业实训系列丛书,是天津工业大学计算机科学与技术学院和融创软通公司教育培训部的多位教师在近12年的校企协同育人过程中的经验总结和经过不断改进后的成果。 《Oracle11g数据库应用与开发》编写背景 数据库技术是计算机科学技术中发展迅速的领域之一,也是应用广泛的技术之一。信息技术的飞速发展大大地推动了社会的进步,也逐渐改变了人们的生活、工作和学习方式。因此,数据库系统已成为计算机信息系统与应用系统的核心技术和重要基础。Oracle数据库是目前优秀的数据库之一,具有较高的市场占有率,而Oraclellg是Oracle数据库的新版本。Oraclellg为各类用户提供了完整的数据库解决方案,可以帮助用户建立自己的电子商务系统,从而增强用户对外界变化的敏捷反应能力,提升用户
在软件设计和开发过程中,需求分析确定后,在开发软件前就需要先设计数据库,然后再编写代码。 韩立刚主编的这本《跟韩老师学SQL Server数据库设计与开发》讲解的内容是软件开发人员必须要掌握的技术,先讲解如何根据项目的需求按关系型数据库设计规范设计数据库中的表,然后使用自己设计的数据库来学习SQL语句。 本书完整地讲述了SQL语句中使用的变量、数据类型、注释行、运算符、常用函数,以及流程控制语句。从单表查询讲起,讲解使用WHERE筛选行将查询的结果分组、排序,然后讲解多表查询和数据汇总,讲解多表交叉联结、内联结、外联结、自联结,使用 UNION合并查询结果集,使用聚合函数汇总查询结果,接着讲解了子查询、开窗函数和行列转换技术,实现数据完整性,创建和使用索引优化性能,在数据库中创建和使用视图简化查询,使用存储过程
《中公版 数据库深度开发指南:MySQL数据库理论与实战》本书共分为十八章,包括基础篇、开发篇、优化篇和运维篇四部分内容,涵盖了MySQL知识体系中,从MySQL安装、SQL语句,到基本数据类型和函数以及数据库基本组件的相关知识点,再到面向开发人员和运维人员的SQL优化和备份恢复等内容。本书以由浅入深、循序渐进为原则,对于较难理解的知识点,通过相关实验的操作与分析,力求让读者对MySQL的基本知识点和相关业务应用能有更加全面的学习和掌握。 ●基础篇(*章至第六章) 介绍数据库基本概念、MySQL的安装与使用、基本数据类型、常用运算符以及常用函数。 ●开发篇(第七章至第十二章) 讲解SQL查询语句在MySQL中的应用,以及开发人员经常用到的数据库基本组件,包括索引、视图、存储过程、存储函数、触发器,*后介绍能保证业务数据完整