数据分析是现在不仅在互联网行业同时也在基础行业中必不可缺的运营手段,是业务提升效率、增强收益的有效方法。 本书的前8个章节精选提炼了多种数据分析中重要方法,包括ROI分析、数据标签和评分、用户生命周期、因果推断、可解释模型、PSM理论、ABtest、时序分析等,并通过更清晰、简单的方式向读者全方位的展示数据分析在以下诸多原理上的阐释,并且针对每种方法都提供了充足的生活和业务中的前沿案例作为辅助讲解,帮助读者更好的理解数据分析在传统行业、互联网行业及各类新兴行业的实际应用,同时也能更快的运用在实际工作和生活中,所以通过阅读前8个章节,读者可以系统的学习数据分析的理知识,拥有数据化思维,为读者能够在数据分析行业中不断深耕打下良好的理论基础并将数据分析能力逐步应用于实际的工作和生活中,成为一名合格的
本书介绍了柴油发电机组的分类、组成和工作原理,分析了柴油发电机组的功率标定和技术指标, 重点讨论了不同性质负载对柴油发电机组带载能力的影响,详细介绍了柴油发电机组供电方案的电源架 构和运行方式以及柴油发电机组的运维保养方法。此外,还介绍了机房安装的柴油发电机组和集装箱式 柴油发电机组的设计、安装的相关知识。 本书力求理论性和实践性相结合,书中所列的柴油发电机系统的供电方案及运维保养方法对当前主 流的数据中心柴油发电机系统普遍适用。本书是数据中心柴油发电机系统运维工作流程的指导性教材, 相信阅读本书一定会对数据中心柴油发电机系统运维管理从业人员大有裨益。
教材系统地介绍文本数据挖掘的相关概念,利用Python作为工具进行相关试验,其内容主要包括:文本挖掘产生的背景及发展;文本挖掘的概念、文本模型表示、文本内容的预处理,包括分词、去停用词以及特征抽取;文本相似度的概念等。介绍文本分类的概念及常用方法,如KNN算法、SVM算法等,并对分类结果进行评价;在介绍文本聚类聚类的概念时是,同样介绍聚类常用算法,如K均值算法、层次聚类法、密度聚类法等,作为有文本分类、文本聚类的应用,*后给出了信息抽取、社会网络中的实体关系抽取和事件抽取。
数据建模指的是对现实世界各类数据的抽象组织,确定数据库需管辖的范围、数据的组织形式等直至转化成现实的数据库。而数据模型是构建应用系统的核心,是尽可能精准地表示业务运转的概念性框架。本书通过平实的语言,对数据模型及建模过程进行了深入浅出的介绍。全书内容分为5个部分,对数据建模简介、数据模型要素,概念、逻辑和物理数据模型、数据模型质量以及数据建模的进阶内容等方面进行讲解,全面细致地为读者解答与数据建模相关的知识点和疑问。除此之外,本书的zui后还对各类专业术语进行了细致的解释,方便读者参考。本书是一本经典的数据建模指南,非常适合对数据建模感兴趣的读者以及从事数据科学等相关工作的专业人士参考阅读。
互联网公司里面几乎很少有公司不用MySQL,国内互联网巨头都在大规模使用MySQL。如果把MySQL比喻成数据库界的一条巨龙,则性能优化和高可用架构设计实践就是点睛之笔。本书将详细讲解 MySQL 5.7高可用和性能优化技术,细致梳理思路,并与真实生产案例相结合,通过原理阐述到实战部署,帮助读者将所学知识点运用到实际工作中。 本书分为13章,详解MySQL 5.7数据库体系结构,InnoDB存储引擎,MySQL事务和锁,性能优化,服务器全面优化、性能监控,以及MySQL主从复制、PXC、MHA、MGR、Keepalived 双主复制等高可用集群架构的设计与实践过程,并介绍海量数据分库分表和Mycat中间件的实战操作。 本书既适合有一定基础的 MySQL数据库学习者、MySQL数据库开发人员和 MySQL数据库管理人员阅读,同时也能作为高等院校和培训学校相关专业师生的参考用书。
对数据生产和大数据处理带来的挑战,是当代社会和人工智能时代的重点。大数据的快速发展、信息共享和社交媒体的大众化带来了各方面的风险和挑战。我们需要遵循正确的流程、方法和沟通战略 且手头的数据必须准确,才能推演出高价值的结论。而数据越多,我们面临的陷阱可能就越深。在本书中,杰森?辛克从数据通用和收集的策略、数据分析的准则、数据展示的策略出发,讨论了应对数据挑战、获得和洞察数据的价值和内涵的可行方式。
对于入门和学习大数据技术的读者来说,大数据技术的生态圈和知识体系过于庞大,可能还没有开始学习就已经陷入众多的陌生名词和泛泛的概念中。本书的切入点明确而清晰,从Hadoop 生态系统的明星 Cloudera 入手,逐步引出各类大数据基础和核心应用框架。本书分为18章,系统介绍Hadoop 生态系统大数据相关的知识,包括大数据概述、Cloudera Hadoop平台的安装部署、HDFS分布式文件系统、MapReduce计算框架、资源管理调度框架YARN 、Hive数据仓库、数据迁移工具Sqoop、分布式数据库HBase、ZooKeeper分布式协调服务、准实时分析系统Impala、日志采集工具Flume、分布式消息系统Kafka、ETL工具Kettle、Spark计算框架等内容,*后给出两个综合实操案例,以巩固前面所学的知识点。本书既适合Hadoop初学者、大数据技术工程师和大数据技术爱好者自学使用,亦可作为高等院校和培训机构大数据
空间数据技术既是地理信息系统(GIS)的重要组成部分,也是其核心技术之一。建立科学、合理的空间数据库是GIS项目成功的关键,但空间数据库是理论性和实践性都很强的学科,理解起来非常抽象。《规范版高职高专测绘类专业“十二五”规划教材:空间数据库技术应用》结构清晰,难易适中,理论与案例相结合,具有较强的实用性和通用性,可以帮助读者更好地理解和掌握数据库、空间数据库的基本原理、设计及构建方法。全书共分为6章。包括:数据库基础知识,空间数据库理论基础,空间数据库设计,空间数据库的建立与维护,空间数据库技术应用实例,空间数据库发展趋势。
《普通高等教育“十二五”规划教材:数据库技术与应用实践教程(第2版)》是与《数据库技术与应用》(第二版)配套的教学参考书,是根据*高等计算机基础课程教学指导委员会2011年10月出版的《高等学校计算机基础核心课程教学实施方案》(新白皮书)中关于“数据库技术及应用”课程实施方案的精神,结合作者多年教学实践与研发的经验,并考虑到读者的反馈信息,遵循非计算机专业的特点,从新的视角对原来出版的《数据库应用基础实践教程》各个章节的内容和结构等进行了修订、调整、完善和补充。全书分为实验指导篇和课程设计案例篇。实验指导篇共安排20个实验,内容选择恰当,具有启发性和实用性,与教材内容紧密结合,强调对动手能力的培养,达到即学即用的目的。课程设计案例篇共安排5个案例,是分别从文学、法学、医学和工学的角度
本书将现代统计学的重要思想引入数理统计课程中,强调了数据分析、图形工具和计算机技术,并注重统计的实务和应用.本书内容丰富,几乎涵盖了所有经典和前沿的概率论与数理统计理论和方法,主要包括概率、变量、联合分布、期望、极限定理、抽样调查、参数估计、假设检验、数据汇总、两样本比较、方差分析、分类数据分析和线性最小二乘等. 本书用真实数据分析了实际问题,以此增强读者对理论的理解;作者将自助方法与传统的推论性过程结合起来,增加了蒙特卡罗方法.此外,为了使概念更清晰,书中提供了大量的示例,而且还有丰富的习题,以增强读者的计算能力. 本书适合作为统计学、数学、其他理工科专业以及社会科学和经济学专业高年级本科生和低年级研究生的教材,同时也可供相关领域技术人员参考.
本书从新时代商业环境出发,紧随市场热点,如分布式自治组织(distributed autonomous organization,DAO)、非同质化通证(non-fungible token,NFT)、元宇宙、Web 3.0 、资产 数字化、反垄断、要素市场化配置等,以企业数字化转型为核心,以区块链等数字化技术 为基本点,以场景为基本面,勾勒了数字化时代分布式商业演化的新趋势,以及其对企业 经营管理的影响,提出了数字化时代企业数字化转型的新策略和分布式经营管理的低成 本、高效率发展方案。 本书全面分析了分布式商业产生的背景及其本质内涵,认为分布式商业是未来商业演 化的必然趋势。分布式商业生态战略不但是未来企业生存的基本战略,而且是元宇宙商业 生态建设的底层逻辑,并将Web 3.0 、DAO、NFT、元宇宙等新兴事物融入分布式商业生 态体系中,深度解读了数字化时代的新商业逻辑和战略思维。同
如今企业数字化转型和“互联网+”已成为热门话题。那么,如何开展转型工作,让具体工作可以落到实处呢?由于数字化转型工作的复杂性,很多企业管理者感觉无从下手,市面上也十分缺乏相关的指引和资料。本书介绍的企业架构方法以及多个领先企业和行业数字化案例,可以使读者系统地掌握数字化转型的理论和落地方法,帮助企业完成生死攸关的转型变革。本书回答了“什么是数字经济,什么是数字化转型,什么是数字化转型的关键要素”等问题,并在转型方法方面介绍了数字化企业架构的业务架构、流程、组织、IT架构,详细阐述了金融、零售、医疗、物联网、AI、智能制造等方面*的商业模式和技术发展。本书打开了一扇新的数字化转型方法之门,是企业管理者、信息化从业者以及管理咨询服务机构、IT服务公司从业人员、大专院校师生很好的参考资料。
大数据让我们以一种前所未有的方式,通过对海量数据进行分析,获得有巨大价值的产品和服务,*终形成变革之力。本书围绕Hadoop和Spark这两个主流技术进行讲解,主要内容包括Hadoop环境配置、分布式文件系统HDFS、分布式计算框架MapReduce、资源调度框架YARN与Hadoop新特性、大数据数据仓库Hive、离线处理辅助系统、Spark Core、 Spark SQL、Spark Streaming等知识。 为保证*学习效果,本书紧密结合实际应用,利用大量案例说明和实践,提炼含金量十足的开发经验。本书使用Hadoop和Spark进行大数据开发,并配以完善的学习资源和支持服务,包括视频教程、案例素材下载、学习交流社区、讨论组等终身学习内容,为开发者带来全方位的学习体验,更多技术支持请访问课工场官网:www.kgc.cn。
本书是数据库应用系列教材之一,本书全面系统地介绍了Web数据库的体系结构和实现技术,其中包括C/S、B/S模式以及基于中间件多层分布式数据库的应用软件体系结构,重点介绍XMA、ASP、Servlet、JDBC、EJB等各种组件技术以及使用这些技术在开发Web数据库系统和管理信息系统方面的应用。 本书注重概念与实用性的统一,书中配有精选实例,所有实例均已通过调试。读者可根据运行环境略加修改,即可使用。书中每章后面附有习题,以方便读者复习、巩固所学知识。 本书可作为高等院校计算机专业及相关专业高年级学生数据库课程的补充教材,也可供从事基于Web数据库的电子商务、电子政务及相关管理信息系统软件开发的工程技术人员的管理干部学习参考。
《数据分析思维与可视化》以实用为设计理念,并结合数据分析相关理论,系统地介绍了数据分析的相关内容,包括电商数据分析概述、数据分析业务指标、数据准备与处理、数据分析常用方法、常用数据分析工具、数据可视化、数据图表专业化、撰写数据分析报告等,能够帮助读者掌握数据分析的整个流程。 《数据分析思维与可视化》附有配套的教学PPT、题库、教学视频、教学设计等相关资源。同时,为了帮助初学者及时地解决学习过程中遇到的问题,还提供了专业的在线答疑平台。 《数据分析思维与可视化》可作为高等院校本、专科相关专业的数据分析课程的教材,也可作为企业数据分析岗位培训教材。
本书详细介绍了分布式数据库系统涉及的主要技术,包括分布式数据库设计、分布式查询处理和优化、分布式事务管理和恢复、分布式并发控制、分布式数据库的可靠性、分布式数据库的安全性等内容,同时介绍了分布式数据库系统的几个典型应用和发展趋势。本书在第二版的基础上做了一些修改和补充,增加或补充了数据库技术和计算机网络基础知识回顾、分布式数据库系统的主要应用、分布式数据库系统的发展趋势等内容,并结合当前流行的云计算技术增加了一些新的内容,如GFS、HDFS、BigTable、HBase等,以使读者对分布式数据库系统的未来发展有较为清晰的了解。本书对分布式数据库系统的基本内容进行了详实的讲解,对一些有争议的问题进行了开放式的讨论,但对深奥的理论没有采用繁琐的证明方式,而是采用大量的图示和实例做浅显的解释,从而增加
网络数据库是电子商务、网站建设所必需的数据组织方式之一。本书从网络数据库的概念入手,以SQL Server 2005为数据库平台,采用案例的形式详细介绍了网络数据库的基本概念以及数据库、数据表的建立和维护方法,还介绍了与ASP编程相关的HqlML及VBScript等内容,并结合实例说明如何使用ASP技术访问后台数据库。本书主要内容包括网络数据库的基本概念,SQL Server 2005数据库管理,表、视图和查询,HTML语言基础,网络数据库的访问,数据完整性和安全性。另外,本书在后安排了9个完整的实验内容供教学参考。 本书适合作为高职高专计算机网络技术专业、电子商务等专业的教材,也可供计算机及其相关专业的学生以及初学使用ASP编制Web应用程序的用户阅读。