数据分析是现在不仅在互联网行业同时也在基础行业中必不可缺的运营手段,是业务提升效率、增强收益的有效方法。 本书的前8个章节精选提炼了多种数据分析中重要方法,包括ROI分析、数据标签和评分、用户生命周期、因果推断、可解释模型、PSM理论、ABtest、时序分析等,并通过更清晰、简单的方式向读者全方位的展示数据分析在以下诸多原理上的阐释,并且针对每种方法都提供了充足的生活和业务中的前沿案例作为辅助讲解,帮助读者更好的理解数据分析在传统行业、互联网行业及各类新兴行业的实际应用,同时也能更快的运用在实际工作和生活中,所以通过阅读前8个章节,读者可以系统的学习数据分析的理知识,拥有数据化思维,为读者能够在数据分析行业中不断深耕打下良好的理论基础并将数据分析能力逐步应用于实际的工作和生活中,成为一名合格的
本书介绍了柴油发电机组的分类、组成和工作原理,分析了柴油发电机组的功率标定和技术指标, 重点讨论了不同性质负载对柴油发电机组带载能力的影响,详细介绍了柴油发电机组供电方案的电源架 构和运行方式以及柴油发电机组的运维保养方法。此外,还介绍了机房安装的柴油发电机组和集装箱式 柴油发电机组的设计、安装的相关知识。 本书力求理论性和实践性相结合,书中所列的柴油发电机系统的供电方案及运维保养方法对当前主 流的数据中心柴油发电机系统普遍适用。本书是数据中心柴油发电机系统运维工作流程的指导性教材, 相信阅读本书一定会对数据中心柴油发电机系统运维管理从业人员大有裨益。
教材系统地介绍文本数据挖掘的相关概念,利用Python作为工具进行相关试验,其内容主要包括:文本挖掘产生的背景及发展;文本挖掘的概念、文本模型表示、文本内容的预处理,包括分词、去停用词以及特征抽取;文本相似度的概念等。介绍文本分类的概念及常用方法,如KNN算法、SVM算法等,并对分类结果进行评价;在介绍文本聚类聚类的概念时是,同样介绍聚类常用算法,如K均值算法、层次聚类法、密度聚类法等,作为有文本分类、文本聚类的应用,*后给出了信息抽取、社会网络中的实体关系抽取和事件抽取。
互联网公司里面几乎很少有公司不用MySQL,国内互联网巨头都在大规模使用MySQL。如果把MySQL比喻成数据库界的一条巨龙,则性能优化和高可用架构设计实践就是点睛之笔。本书将详细讲解 MySQL 5.7高可用和性能优化技术,细致梳理思路,并与真实生产案例相结合,通过原理阐述到实战部署,帮助读者将所学知识点运用到实际工作中。 本书分为13章,详解MySQL 5.7数据库体系结构,InnoDB存储引擎,MySQL事务和锁,性能优化,服务器全面优化、性能监控,以及MySQL主从复制、PXC、MHA、MGR、Keepalived 双主复制等高可用集群架构的设计与实践过程,并介绍海量数据分库分表和Mycat中间件的实战操作。 本书既适合有一定基础的 MySQL数据库学习者、MySQL数据库开发人员和 MySQL数据库管理人员阅读,同时也能作为高等院校和培训学校相关专业师生的参考用书。
本书以Oracle 19c for Windows10为实践平台,以学生-课程数据库和员工-部门数据库为实践案例,重点介绍数据库的基本原理、设计与实现方法,对传统的数据库理论进行精炼,保留核心与实用部分,采用案例教学的方式撰写,强调知识的层次性和技能培养的渐进性。全书共分为7章,分别介绍数据库系统绪论、关系运算理论、关系数据库标准语言SQL、数据库设计与规范化理论、数据库安全性与完整性、数据库备份与恢复、数据库并发控制等。本书提供PowerPoint电子教案、实验练习参考答案,课后习题参考答案、模拟试卷参考答案、核心知识点微视频讲解,方便教师教学和学生自学自测。本书可作为高等院校计算机及相关专业的教学用书,也可以作为从事相关专业的工程技术人员和科研人员的参考资料。
数据结构教程(第3版) 第3版第2次印刷
本书与以往统计学中的概率论略有不同,添加了一些复杂数据类型的概率基础知识和模拟计算中的相关概率知识。具体安排如下所述。本书共分6章。第1章为概率与计数,基本内容是随机事件、概率空间、计数方法、概率的确定方法。第2章为条件概率,基本内容是条件概率与乘法公式、事件的独立性、全概率公式与贝叶斯公式。第3章为随机变量,基本内容是随机变量及其分布函数、随机变量的分类、二维随机向量、随机变量的独立性、随机变量函数的分布。第4章为常用的概率分布,基本内容是常用的离散型随机变量、常用的连续型随机变量、随机数的产生。第5章为随机变量的数字特征,基本内容是数学期望、方差和协方差、矩和矩母函数、条件期望。第6章为不等式和极限定理,基本内容是概率不等式、大数定律及其应用、中心极限定理。
《数据库原理与应用(VFP第2版)》由长期从事“数据库原理与应用”课程一线教学工作的教师编写完成。在编写过程中,主编祝胜林参考了相关的著作、中文VFP的帮助信息和各种与中文VFP有关的等级或水平考试大纲,同时融合了自身的教学经验。因此,《数据库原理与应用(VFP第2版)》具有如下特点:(1)系统性。可以帮助学生系统地学习有关数据库的基本原理与方法。 (2)针对性。本书的举例和习题经过精心挑选,应用分析条理清晰,可以满足学生参加各种考试复习的需求。 (3)新颖性。对传统的章节结构进行了重新编排,使内容更加紧凑,同时也更加突出数据库应用的重点。 (4)实践性。“数据库原理与应用”课程是一门实践性非常强的课程,本书根据应用操作的需要,精心设计了上机操作的题目。
本书针对大数据、人工智能、信息管理、经济管理和其他相关专业学生的发展需求,系统、全面地介绍了大数据存储与管理的基本知识和技能,介绍了大数据存储基础、数据管理技术的发展、RDBMS与SQL、NoSQL数据模型、键值数据库、文档数据库、列族数据库、图数据库、数据库技术的发展(NewSQL),重点安排了熟悉MongoDB文档数据库和HBase列族数据库两个课程实践。全书具有较强的系统性、可读性和实用性。 本书是为高等院校相关专业 大数据存储 大数据存储与管理 大数据管理 等课程全新设计编写的具有丰富实践特色的主教材,也可供有一定实践经验的软件开发人员、管理人员参考,或作为继续教育的教材。
本书从新时代商业环境出发,紧随市场热点,如分布式自治组织(distributed autonomous organization,DAO)、非同质化通证(non-fungible token,NFT)、元宇宙、Web 3.0 、资产 数字化、反垄断、要素市场化配置等,以企业数字化转型为核心,以区块链等数字化技术 为基本点,以场景为基本面,勾勒了数字化时代分布式商业演化的新趋势,以及其对企业 经营管理的影响,提出了数字化时代企业数字化转型的新策略和分布式经营管理的低成 本、高效率发展方案。 本书全面分析了分布式商业产生的背景及其本质内涵,认为分布式商业是未来商业演 化的必然趋势。分布式商业生态战略不但是未来企业生存的基本战略,而且是元宇宙商业 生态建设的底层逻辑,并将Web 3.0 、DAO、NFT、元宇宙等新兴事物融入分布式商业生 态体系中,深度解读了数字化时代的新商业逻辑和战略思维。同
如今企业数字化转型和“互联网+”已成为热门话题。那么,如何开展转型工作,让具体工作可以落到实处呢?由于数字化转型工作的复杂性,很多企业管理者感觉无从下手,市面上也十分缺乏相关的指引和资料。本书介绍的企业架构方法以及多个领先企业和行业数字化案例,可以使读者系统地掌握数字化转型的理论和落地方法,帮助企业完成生死攸关的转型变革。本书回答了“什么是数字经济,什么是数字化转型,什么是数字化转型的关键要素”等问题,并在转型方法方面介绍了数字化企业架构的业务架构、流程、组织、IT架构,详细阐述了金融、零售、医疗、物联网、AI、智能制造等方面*的商业模式和技术发展。本书打开了一扇新的数字化转型方法之门,是企业管理者、信息化从业者以及管理咨询服务机构、IT服务公司从业人员、大专院校师生很好的参考资料。
本书将现代统计学的重要思想引入数理统计课程中,强调了数据分析、图形工具和计算机技术,并注重统计的实务和应用.本书内容丰富,几乎涵盖了所有经典和前沿的概率论与数理统计理论和方法,主要包括概率、变量、联合分布、期望、极限定理、抽样调查、参数估计、假设检验、数据汇总、两样本比较、方差分析、分类数据分析和线性最小二乘等. 本书用真实数据分析了实际问题,以此增强读者对理论的理解;作者将自助方法与传统的推论性过程结合起来,增加了蒙特卡罗方法.此外,为了使概念更清晰,书中提供了大量的示例,而且还有丰富的习题,以增强读者的计算能力. 本书适合作为统计学、数学、其他理工科专业以及社会科学和经济学专业高年级本科生和低年级研究生的教材,同时也可供相关领域技术人员参考.
大数据让我们以一种前所未有的方式,通过对海量数据进行分析,获得有巨大价值的产品和服务,*终形成变革之力。本书围绕Hadoop和Spark这两个主流技术进行讲解,主要内容包括Hadoop环境配置、分布式文件系统HDFS、分布式计算框架MapReduce、资源调度框架YARN与Hadoop新特性、大数据数据仓库Hive、离线处理辅助系统、Spark Core、 Spark SQL、Spark Streaming等知识。 为保证*学习效果,本书紧密结合实际应用,利用大量案例说明和实践,提炼含金量十足的开发经验。本书使用Hadoop和Spark进行大数据开发,并配以完善的学习资源和支持服务,包括视频教程、案例素材下载、学习交流社区、讨论组等终身学习内容,为开发者带来全方位的学习体验,更多技术支持请访问课工场官网:www.kgc.cn。
喻梅主编的这本《数据库应用技术实验指导与习题及解答》是天津大学出版社出版的《数据库应用技术》一书配套使用的实践教程。全书分为三部分。部分是实验指导,通过涵盖教材主要知识点的十个实验来指导学生掌握SQL Server 2005的应用方法。 第二部分是数据库设计与应用系统开发实例,以实例介绍数据库设计的过程以及数据库应用系统的开发过程。第三部分是习题及解答,该书配有《数据库应用技术》教材中每章的习题和答案。 本书可以作为高等院校相关专业数据库应用技术课程的实验教材,也可供从事数据库研究和使用SQL Server 2005进行数据库系统开发的计算机专业人员参考。
随着大数据的蓬勃发展,不少机构开始将源源不断的数据流导入到一个叫“数据湖”的设备中去。 数据湖架构 是“数据仓库”之父撰写的全新著作,是帮助读者认识数据湖架构,并把数据湖打造成公司资产的指导手册。数据湖架构 共15章,分别涉及数据湖简介、数据池据湖内部结构、数据池及其结构、各种类型的数据池等技术话题,目的在于讲解如何构建有用的数据湖,以便数据科学家和数据分析师能够解决商业挑战并找出新的商业机会。 数据湖架构 适合数据管理者、学生、系统开发人员、架构师、程序员以及zui终用户阅读。
编写高效率的数值计算处理程序,可以大大提高科研水平。《数值计算与数据处理编程及实践》(作者张正秋)共13章,分别介绍数值计算发展史、数据格式和压缩处理方法、自我描述格式的文竹、无微分极值算法、高精度计算程序的设计、等值线制图、正数值汁算中对字符串匹配的方法、从程序代码优化方法上对程序质量进行控制、可复用程序的设计方法、MPI程序的编写方法、数值计算的混合编程技术以及UNIX/Linux系统下计算的辅助编程等知识。《数值计算与数据处理编程及实践》提供了很多有用的、完整的、用于数值处理软件制作的核心代码,如LZSS编码压缩、无微分算法程序、等高线制图等,经过简单的包装,这些程序就可以发展成不同的数值处理软件。 《数值计算与数据处理编程及实践》可供科学计算高年级本科生和研究生学习使用,也可以供科学汁算