数据分析是现在不仅在互联网行业同时也在基础行业中必不可缺的运营手段,是业务提升效率、增强收益的有效方法。 本书的前8个章节精选提炼了多种数据分析中重要方法,包括ROI分析、数据标签和评分、用户生命周期、因果推断、可解释模型、PSM理论、ABtest、时序分析等,并通过更清晰、简单的方式向读者全方位的展示数据分析在以下诸多原理上的阐释,并且针对每种方法都提供了充足的生活和业务中的前沿案例作为辅助讲解,帮助读者更好的理解数据分析在传统行业、互联网行业及各类新兴行业的实际应用,同时也能更快的运用在实际工作和生活中,所以通过阅读前8个章节,读者可以系统的学习数据分析的理知识,拥有数据化思维,为读者能够在数据分析行业中不断深耕打下良好的理论基础并将数据分析能力逐步应用于实际的工作和生活中,成为一名合格的
本书介绍了柴油发电机组的分类、组成和工作原理,分析了柴油发电机组的功率标定和技术指标, 重点讨论了不同性质负载对柴油发电机组带载能力的影响,详细介绍了柴油发电机组供电方案的电源架 构和运行方式以及柴油发电机组的运维保养方法。此外,还介绍了机房安装的柴油发电机组和集装箱式 柴油发电机组的设计、安装的相关知识。 本书力求理论性和实践性相结合,书中所列的柴油发电机系统的供电方案及运维保养方法对当前主 流的数据中心柴油发电机系统普遍适用。本书是数据中心柴油发电机系统运维工作流程的指导性教材, 相信阅读本书一定会对数据中心柴油发电机系统运维管理从业人员大有裨益。
教材系统地介绍文本数据挖掘的相关概念,利用Python作为工具进行相关试验,其内容主要包括:文本挖掘产生的背景及发展;文本挖掘的概念、文本模型表示、文本内容的预处理,包括分词、去停用词以及特征抽取;文本相似度的概念等。介绍文本分类的概念及常用方法,如KNN算法、SVM算法等,并对分类结果进行评价;在介绍文本聚类聚类的概念时是,同样介绍聚类常用算法,如K均值算法、层次聚类法、密度聚类法等,作为有文本分类、文本聚类的应用,*后给出了信息抽取、社会网络中的实体关系抽取和事件抽取。
本书与以往统计学中的概率论略有不同,添加了一些复杂数据类型的概率基础知识和模拟计算中的相关概率知识。具体安排如下所述。本书共分6章。第1章为概率与计数,基本内容是随机事件、概率空间、计数方法、概率的确定方法。第2章为条件概率,基本内容是条件概率与乘法公式、事件的独立性、全概率公式与贝叶斯公式。第3章为随机变量,基本内容是随机变量及其分布函数、随机变量的分类、二维随机向量、随机变量的独立性、随机变量函数的分布。第4章为常用的概率分布,基本内容是常用的离散型随机变量、常用的连续型随机变量、随机数的产生。第5章为随机变量的数字特征,基本内容是数学期望、方差和协方差、矩和矩母函数、条件期望。第6章为不等式和极限定理,基本内容是概率不等式、大数定律及其应用、中心极限定理。
数据建模指的是对现实世界各类数据的抽象组织,确定数据库需管辖的范围、数据的组织形式等直至转化成现实的数据库。而数据模型是构建应用系统的核心,是尽可能精准地表示业务运转的概念性框架。本书通过平实的语言,对数据模型及建模过程进行了深入浅出的介绍。全书内容分为5个部分,对数据建模简介、数据模型要素,概念、逻辑和物理数据模型、数据模型质量以及数据建模的进阶内容等方面进行讲解,全面细致地为读者解答与数据建模相关的知识点和疑问。除此之外,本书的zui后还对各类专业术语进行了细致的解释,方便读者参考。本书是一本经典的数据建模指南,非常适合对数据建模感兴趣的读者以及从事数据科学等相关工作的专业人士参考阅读。
互联网公司里面几乎很少有公司不用MySQL,国内互联网巨头都在大规模使用MySQL。如果把MySQL比喻成数据库界的一条巨龙,则性能优化和高可用架构设计实践就是点睛之笔。本书将详细讲解 MySQL 5.7高可用和性能优化技术,细致梳理思路,并与真实生产案例相结合,通过原理阐述到实战部署,帮助读者将所学知识点运用到实际工作中。 本书分为13章,详解MySQL 5.7数据库体系结构,InnoDB存储引擎,MySQL事务和锁,性能优化,服务器全面优化、性能监控,以及MySQL主从复制、PXC、MHA、MGR、Keepalived 双主复制等高可用集群架构的设计与实践过程,并介绍海量数据分库分表和Mycat中间件的实战操作。 本书既适合有一定基础的 MySQL数据库学习者、MySQL数据库开发人员和 MySQL数据库管理人员阅读,同时也能作为高等院校和培训学校相关专业师生的参考用书。
本书内容分为八章,基本涵盖了目前较为常用的数据科学建模方法,包括现在热门的深度学习。书中不仅介绍模型的理论基础,还以大量案例结合现实数据为读者展示了数据分析中常见任务的处理流程,如分类、回归、聚类、推荐、图片识别等,帮助读者应用这些模型和方法解决实际问题。 第1章首先对数据科学的任务和重要性进行了概述,接着介绍数据科学的建模流程以及Python语言开发环境与常用库; 第二章介绍了回归模型,包括线性回归和逻辑回归模型; 第三章介绍了聚类模型,包括k-means算法、DBSCAN算法和DIANA算法; 第四章介绍了关联规则分析,包括Apriori算法和FP-Growth算法; 第五章介绍了决策树模型,包括ID3、C4.5和CART算法及树的剪枝方法; 第六章介绍了支持向量机,包括线性和非线性支持向量机以及向量机的求解与多分类问题; 第七章介绍
对数据生产和大数据处理带来的挑战,是当代社会和人工智能时代的重点。大数据的快速发展、信息共享和社交媒体的大众化带来了各方面的风险和挑战。我们需要遵循正确的流程、方法和沟通战略 且手头的数据必须准确,才能推演出高价值的结论。而数据越多,我们面临的陷阱可能就越深。在本书中,杰森?辛克从数据通用和收集的策略、数据分析的准则、数据展示的策略出发,讨论了应对数据挑战、获得和洞察数据的价值和内涵的可行方式。
数据结构教程(第3版) 第3版第2次印刷
对于入门和学习大数据技术的读者来说,大数据技术的生态圈和知识体系过于庞大,可能还没有开始学习就已经陷入众多的陌生名词和泛泛的概念中。本书的切入点明确而清晰,从Hadoop 生态系统的明星 Cloudera 入手,逐步引出各类大数据基础和核心应用框架。本书分为18章,系统介绍Hadoop 生态系统大数据相关的知识,包括大数据概述、Cloudera Hadoop平台的安装部署、HDFS分布式文件系统、MapReduce计算框架、资源管理调度框架YARN 、Hive数据仓库、数据迁移工具Sqoop、分布式数据库HBase、ZooKeeper分布式协调服务、准实时分析系统Impala、日志采集工具Flume、分布式消息系统Kafka、ETL工具Kettle、Spark计算框架等内容,*后给出两个综合实操案例,以巩固前面所学的知识点。本书既适合Hadoop初学者、大数据技术工程师和大数据技术爱好者自学使用,亦可作为高等院校和培训机构大数据
《物联网之云:云平台搭建与大数据处理》为 物联网工程实战丛书 第4卷。《物联网之云:云平台搭建与大数据处理》阐述了云计算的基本概念、工作原理和信息处理流程,详细讲述了云计算的数学基础及大数据处理方法,并给出了云计算和雾计算的项目研发流程,展望了云计算的发展前景。 《物联网之云:云平台搭建与大数据处理》共10章。第1章介绍了物联网数据分析中的一些数学基础、概率论和数理统计方法,以及分布式计算、网格计算和云计算方法,及其在物联网中的应用;第2章给出了云计算的概念和原理,并针对云计算的一些技术和体系架构做了详细介绍;第3、4章阐述了云计算平台的建设,重点阐述了PaaS平台的搭建流程及其针对智慧城市和垂直行业的云平台搭建实战;第5、6章阐述了大数据概念及大数据处理的常见数学方法;第7章阐述了物联网云计算
本书共分为5章,系统全面地介绍了MATLAB的基本知识和用法,包括:MATLAB基础简介、向量与矩阵运算、绘图、符号计算、程序设计。本书将MATLAB软件应用于数学、信息与计算科学专业的学习和研究中,解决相关课程中的科学计算、图形绘制、数值模拟与仿真等问题,提高科学计算与研究的效率,使读者具备利用MATLAB软件进行计算机处理、解决实际问题的能力。 本书读者对象为需要数学建模、学术研究分析、理论验证、图形仿真的各专业大学生、研究生,以及教师和科研人员。
全书内容包括SQL Server 2016的安装和操作、数据库的基本认识、表的定义和操作、数据查询和更新、视图的定义和维护、存储过程的创建、事务和锁、触发器、数据完整性、数据导入和导出、数据库还原技术、用户管理技术、数据库综合设计和实现等。为了使初学者轻松地进行学习和操作,本书在每个章节有针对性地设置了与实际生活相关的示例,帮助读者更好地理解相关概念,同时也帮助其掌握软件的操作方法。介绍了数据库基本概念的理解、SQLServer数据库管理系统的认识,数据库定义、数据操作、数据库管理维护、数据库的综合应用、以及数据库的应用开发。
《数据结构教程(c#语言描述)》系统地介绍了常用的数据结构以及排序、查找的各种算法,阐述了各种数据结构的逻辑关系、存储表示及运算操作,并采用c#语言描述数据组织和算法实现。 《数据结构教程(c#语言描述)》既注重原理,又注重实践,配有大量图表、实践教学项目和习题,内容丰富,概念讲解清楚,表达严谨,逻辑性强,语言精练,可读性好。 《数据结构教程(c#语言描述)》既便于教师课堂讲授,又便于自学者阅读,可作为高等院校计算机相关专业本科生、专科生的教材,也可供广大从事计算机应用的科技人员参考。
本书以单一功能模块和完整系统开发应用为主线,介绍了使用当前流行的网络数据库系统开发技术进行应用程序开发的全过程。所采用的单一功能模块和完整系统开发案例的编排方式是一种新的尝试,这样可满足不同层次读者的需求。单一功能模块可以作为网络数据库系统开发技术应用的子模块,也可以用于综合项目实践。
空间数据技术既是地理信息系统(GIS)的重要组成部分,也是其核心技术之一。建立科学、合理的空间数据库是GIS项目成功的关键,但空间数据库是理论性和实践性都很强的学科,理解起来非常抽象。《规范版高职高专测绘类专业“十二五”规划教材:空间数据库技术应用》结构清晰,难易适中,理论与案例相结合,具有较强的实用性和通用性,可以帮助读者更好地理解和掌握数据库、空间数据库的基本原理、设计及构建方法。全书共分为6章。包括:数据库基础知识,空间数据库理论基础,空间数据库设计,空间数据库的建立与维护,空间数据库技术应用实例,空间数据库发展趋势。
《数据库原理与应用(VFP第2版)》由长期从事“数据库原理与应用”课程一线教学工作的教师编写完成。在编写过程中,主编祝胜林参考了相关的著作、中文VFP的帮助信息和各种与中文VFP有关的等级或水平考试大纲,同时融合了自身的教学经验。因此,《数据库原理与应用(VFP第2版)》具有如下特点:(1)系统性。可以帮助学生系统地学习有关数据库的基本原理与方法。 (2)针对性。本书的举例和习题经过精心挑选,应用分析条理清晰,可以满足学生参加各种考试复习的需求。 (3)新颖性。对传统的章节结构进行了重新编排,使内容更加紧凑,同时也更加突出数据库应用的重点。 (4)实践性。“数据库原理与应用”课程是一门实践性非常强的课程,本书根据应用操作的需要,精心设计了上机操作的题目。
《数据结构教程》是为全国高等院校计算机及相关专业开设数据结构课程而精心组织和编著的一本实用教材,内容覆盖了*计算机科学与技术专业硕士研究生入学统一考试的大纲要求。《数据结构教程》采用C++描述,强调原理阐述与应用结合,避免大段冗长代码,并在每章后增加进阶导读和*研究成果的介绍,引导学有余力的学生进一步自学和本章内容相关的数据结构知识。
本书是一本系统介绍大数据可视化技术的图书。书中首先阐述了大数据的可视化技术的基本概念以及相关的基础理论知识,然后采用理论与实践相结合的方式,针对实际应用中的各种不同类型的数据,包括时间数据,比例数据,关系数据,文本数据,复杂数据,介绍相应的可视化理论和操作方法,*后,介绍了数据可视化在各个领域中的应用。本书实例丰富,图文并茂,叙述简明,重点突出。作者专门收集和整理了相关的课程案例、典型数据和实验指导手册,帮助读者深入学习大数据可视化中的各种技术知识。本书可以作为高校计算机、数据分析、大数据等相关专业学生的教学用书,对于从事数据可视化、数据分析的技术人员也有较大的参考价值。
《数据库原理与实践--SQLServer2005》紧紧围绕数据库的精髓部分,介绍数据库的基本原理和设计方法,并理论联系实际,讲解当前流行的SQLServer2005常用的操作方法。本书可划分为两大部分内容,部分系统介绍了数据库系统的基本原理、关系代数实现的数学基础、关系数据库设计的步骤和方法以及标准的数据库查询语言SQL。第二部分介绍了目前流行的SQLServei2005数据库管理系统的使用、Transact-SQL。语言和数据库的安全等内容。在讲解过程中,案例鲜明,重点突出。 本书既可作为本科院校信息管理与信息系统专业或计算机专业的专业课教材,也可作为相关领域技术人员的参考用书或培训教材。