数据分析是现在不仅在互联网行业同时也在基础行业中必不可缺的运营手段,是业务提升效率、增强收益的有效方法。 本书的前8个章节精选提炼了多种数据分析中重要方法,包括ROI分析、数据标签和评分、用户生命周期、因果推断、可解释模型、PSM理论、ABtest、时序分析等,并通过更清晰、简单的方式向读者全方位的展示数据分析在以下诸多原理上的阐释,并且针对每种方法都提供了充足的生活和业务中的前沿案例作为辅助讲解,帮助读者更好的理解数据分析在传统行业、互联网行业及各类新兴行业的实际应用,同时也能更快的运用在实际工作和生活中,所以通过阅读前8个章节,读者可以系统的学习数据分析的理知识,拥有数据化思维,为读者能够在数据分析行业中不断深耕打下良好的理论基础并将数据分析能力逐步应用于实际的工作和生活中,成为一名合格的
本书介绍了柴油发电机组的分类、组成和工作原理,分析了柴油发电机组的功率标定和技术指标, 重点讨论了不同性质负载对柴油发电机组带载能力的影响,详细介绍了柴油发电机组供电方案的电源架 构和运行方式以及柴油发电机组的运维保养方法。此外,还介绍了机房安装的柴油发电机组和集装箱式 柴油发电机组的设计、安装的相关知识。 本书力求理论性和实践性相结合,书中所列的柴油发电机系统的供电方案及运维保养方法对当前主 流的数据中心柴油发电机系统普遍适用。本书是数据中心柴油发电机系统运维工作流程的指导性教材, 相信阅读本书一定会对数据中心柴油发电机系统运维管理从业人员大有裨益。
《Access数据库创建、使用与管理从新手到高手》详细介绍了使用Access创建和设计数据库的方法和技巧,以及Access数据库在实际中的应用。《Access数据库创建、使用与管理从新手到高手》各章的先后顺序以数据库系统的创建和设计流程进行组织,有助于读者梳理Access知识体系,便于读者学习和理解。《Access数据库创建、使用与管理从新手到高手》包含大量示例,示例文件包括操作前的原始文件和操作后的结果文件,既便于读者上机练习,又方便读者在练习后进行效果对比,从而快速掌握Access的操作方法和技巧。 《Access数据库创建、使用与管理从新手到高手》共15章,内容主要包括Access数据库的基本概念、数据库的基本设计流程、Access的界面结构和常用设置、创建与管理数据库和表、在表中添加和编辑字段、设置字段的数据类型和属性、设置数据的显示方式、设置数据
教材系统地介绍文本数据挖掘的相关概念,利用Python作为工具进行相关试验,其内容主要包括:文本挖掘产生的背景及发展;文本挖掘的概念、文本模型表示、文本内容的预处理,包括分词、去停用词以及特征抽取;文本相似度的概念等。介绍文本分类的概念及常用方法,如KNN算法、SVM算法等,并对分类结果进行评价;在介绍文本聚类聚类的概念时是,同样介绍聚类常用算法,如K均值算法、层次聚类法、密度聚类法等,作为有文本分类、文本聚类的应用,*后给出了信息抽取、社会网络中的实体关系抽取和事件抽取。
本书与以往统计学中的概率论略有不同,添加了一些复杂数据类型的概率基础知识和模拟计算中的相关概率知识。具体安排如下所述。本书共分6章。第1章为概率与计数,基本内容是随机事件、概率空间、计数方法、概率的确定方法。第2章为条件概率,基本内容是条件概率与乘法公式、事件的独立性、全概率公式与贝叶斯公式。第3章为随机变量,基本内容是随机变量及其分布函数、随机变量的分类、二维随机向量、随机变量的独立性、随机变量函数的分布。第4章为常用的概率分布,基本内容是常用的离散型随机变量、常用的连续型随机变量、随机数的产生。第5章为随机变量的数字特征,基本内容是数学期望、方差和协方差、矩和矩母函数、条件期望。第6章为不等式和极限定理,基本内容是概率不等式、大数定律及其应用、中心极限定理。
《SQL即查即用》从实用角度出发,由浅入深地讲解了SQL的基本概念、常用语法和操作技术。全书共24章,包括数据的简单查询、条件查询、模糊查询、过滤数据以及数据排序、分组、统计等内容,还包括子查询、多表连接、数据的增删改查、视图、存储过程、游标、事务处理以及数据库和数据表的管理等高级技术。包括200多个SQL语法,200多个应用示例。有很强的实用性和可操作性,既适合作为SQL初学者的学习用书,又适合作为程序开发人员和数据库管理人员随时查阅的参考工具书。为便于读者对SQL语法的理解,书中所有知识点和语法都结合具体示例进行讲解,并以对比图方式鲜明直观地展示数据变化,帮助读者快速掌握实际操作技巧,学以致用。书中还设置了注意、说明、常见错误、多学两招等贴心栏目,及时指出注意事项并给出相应的解决方案,帮助读者避开学
数据建模指的是对现实世界各类数据的抽象组织,确定数据库需管辖的范围、数据的组织形式等直至转化成现实的数据库。而数据模型是构建应用系统的核心,是尽可能精准地表示业务运转的概念性框架。本书通过平实的语言,对数据模型及建模过程进行了深入浅出的介绍。全书内容分为5个部分,对数据建模简介、数据模型要素,概念、逻辑和物理数据模型、数据模型质量以及数据建模的进阶内容等方面进行讲解,全面细致地为读者解答与数据建模相关的知识点和疑问。除此之外,本书的zui后还对各类专业术语进行了细致的解释,方便读者参考。本书是一本经典的数据建模指南,非常适合对数据建模感兴趣的读者以及从事数据科学等相关工作的专业人士参考阅读。
《基于Python的大数据分析基础及实战》是一本介绍如何用Python 3.6进行数据处理和分析的学习指南。其主要内容包括:Python语言基础、数据处理、数据分析、数据可视化,以及利用Python对数据库的操作、自建Python应用库的共享发布等。 《基于Python的大数据分析基础及实战》分3个部分:第1部分为基础知识,第2部分为实战案例,第3部分为拓展与延伸。本书内容丰富,讲解通俗易懂,非常适合本科生、研究生,以及对Python语言感兴趣或者想要使用Python语言进行数据分析的广大读者。
大数据时代,对数据进行统计、分析和学习变得尤为重要,并被应用在各方各面,如无人驾驶汽车、AlphaGo、机器学习和人工智能等,而统计思维也成为大数据时代的基本思维。不仅这些高科技以统计学为基础理论,大数据时代的每个人都应该懂点统计学,学会读懂并分析数据,学会让数据说话,让数据为自己服务。《大数据时代的统计学思维:让你从众多数据中找到真相》就是大数据时代统计学思维的科普书籍,全书共10章,第1章用几个有趣好玩的例子引导读者进入统计学的世界,并调动读者学习统计学的兴趣。第2~10章结合生活和工作中的例子全面介绍统计学原理和方法,涵盖统计学中的数据收集、数据处理和统计推断等内容,既有抽样调查、概率、相关性分析、回归分析等实用统计方法,也有大数定律和中心极限定理等基本统计学原理。用实例引导理论,通俗
本书从初学者易于理解的角度,以通俗易懂的语言、丰富的实例、简洁的图表、传统和现代数据特征的对比,将大数据这一计算机前沿科学如数家珍地娓娓道来。既介绍了大数据和相关的基础知识,又与具体应用有机结合起来,并借助可视化图表的画面感立体地为读者剖析了大数据的技术和原理,非常便于自学。本书内容包括大数据概论、大数据采集及预处理、大数据分析、大数据可视化、Hadoop概论、HDFS和Common概论、MapReduce概论、NoSQL技术介绍、Spark概论、云计算与大数据、大数据相关案例等内容。本书既可以作为想了解大数据技术和应用的初学者的教材,也适合作为培训中心、IT人员、企业策划和管理人员的参考书。
互联网公司里面几乎很少有公司不用MySQL,国内互联网巨头都在大规模使用MySQL。如果把MySQL比喻成数据库界的一条巨龙,则性能优化和高可用架构设计实践就是点睛之笔。本书将详细讲解 MySQL 5.7高可用和性能优化技术,细致梳理思路,并与真实生产案例相结合,通过原理阐述到实战部署,帮助读者将所学知识点运用到实际工作中。 本书分为13章,详解MySQL 5.7数据库体系结构,InnoDB存储引擎,MySQL事务和锁,性能优化,服务器全面优化、性能监控,以及MySQL主从复制、PXC、MHA、MGR、Keepalived 双主复制等高可用集群架构的设计与实践过程,并介绍海量数据分库分表和Mycat中间件的实战操作。 本书既适合有一定基础的 MySQL数据库学习者、MySQL数据库开发人员和 MySQL数据库管理人员阅读,同时也能作为高等院校和培训学校相关专业师生的参考用书。
本书通过选购笔记本电脑的案例引入数据包络分析(dataenvelopmentanalysis,DEA)的基本概念和模型,并运用简单的EXCEL模型让读者更易理解和运用DEA。本书着重阐述如何将DEA作为一种运营分析工具,进行绩效评估,找出基准标杆。探讨的主题包括:平衡的基准,昀佳实践,相对效率的概念及绩效提升。特别地,本书探讨的数据分析方法能够帮助一个组织重新审视它对生产效率高低的已有观点是否合理,并为组织不断改进提供指导。本书是市面上唯一本不要求读者具备线性规划和线性代数知识,就可以熟练应用DEA方法的DEA方法指导用书。
本书内容分为八章,基本涵盖了目前较为常用的数据科学建模方法,包括现在热门的深度学习。书中不仅介绍模型的理论基础,还以大量案例结合现实数据为读者展示了数据分析中常见任务的处理流程,如分类、回归、聚类、推荐、图片识别等,帮助读者应用这些模型和方法解决实际问题。 第1章首先对数据科学的任务和重要性进行了概述,接着介绍数据科学的建模流程以及Python语言开发环境与常用库; 第二章介绍了回归模型,包括线性回归和逻辑回归模型; 第三章介绍了聚类模型,包括k-means算法、DBSCAN算法和DIANA算法; 第四章介绍了关联规则分析,包括Apriori算法和FP-Growth算法; 第五章介绍了决策树模型,包括ID3、C4.5和CART算法及树的剪枝方法; 第六章介绍了支持向量机,包括线性和非线性支持向量机以及向量机的求解与多分类问题; 第七章介绍
本书以Oracle 19c for Windows10为实践平台,以学生-课程数据库和员工-部门数据库为实践案例,重点介绍数据库的基本原理、设计与实现方法,对传统的数据库理论进行精炼,保留核心与实用部分,采用案例教学的方式撰写,强调知识的层次性和技能培养的渐进性。全书共分为7章,分别介绍数据库系统绪论、关系运算理论、关系数据库标准语言SQL、数据库设计与规范化理论、数据库安全性与完整性、数据库备份与恢复、数据库并发控制等。本书提供PowerPoint电子教案、实验练习参考答案,课后习题参考答案、模拟试卷参考答案、核心知识点微视频讲解,方便教师教学和学生自学自测。本书可作为高等院校计算机及相关专业的教学用书,也可以作为从事相关专业的工程技术人员和科研人员的参考资料。
本书是中山大学重点学科建设成果,获中国矿物岩石地球化学协会大数据与数学地球科学专业委员会推荐,是我国*部地质科学大数据与机器学习教材。本书是中山大学研究生试用研究型教材,对运用大数据挖掘与机器学习算法解决地球科学问题大有裨益。适合地质科学领域研究生和高年级本科生做教材,也可供科研人员研究时参考。它系统地介绍了地球科学大数据挖掘与机器学习的基本框架与原理,重点分析高维数据的降维、分类与预测、大图形社区结构识别、无限流数据处理、机器学习及人工智能地质学的建模过程,对必要的应用场景,使用Python语言给出案例。
在新媒体时代,如果对新闻报道、网上搜索的结果或者所谓的 专家告知 不加思考地完全相信,那你就等着上当受骗吧! 本书围绕当今*受瞩目的大数据科学理论,通过日本政府公布的公开数据,集中针对访日游客的增加、舆论调查的可靠性、 安倍经济学 的成果、东日本大地震后的状况、相对贫困、失业率的下降、年轻人远离ХХ、全球变暖问题、减肥、恩格尔系数的上升等10个主题进行数据解读,帮助读者模拟体验数据读取方法,提高理解和分析数据的能力,挖掘出数据背后隐藏的真相。 作为 大数据分析 的超级入门书,即使不擅长数学、不了解统计学的人,读完本书也可以彻底掌握数据解读方法!