《数据分析思维:分析方法和业务知识》分为两大部分: 方法篇 和 实战篇 。 方法篇 介绍了数据分析中常用的业务指标、分析方法以及如何用数据分析解决问题的步骤。 实战篇 讲解了如何应用*篇的方法来解决工作中的问题,分享十二个行业(国内电商、跨境电商、金融信贷、金融第三方支付、家政、旅游、在线教育、运营商、内容、房产、汽车、零售)的业务知识,以及该行业内用数据分析解决问题的实例。每个行业都包括业务模式、业务指标、案例分析三方面的内容。 通过本书的学习,你会熟悉数据分析的方法,并将其灵活应用在自己所处的行业中。
本书第1版于1983年出版,至今已修订至第6版。教材出版近40年来为全国数百所高校采用。本书三次荣获优秀教材奖(1988年、2002年、2021年)。相应课程先后入选北京市精品课程、精品课程、精品资源共享课程、精品在线开放课程和一流本科课程。 本书系统全面地阐述了数据库系统的基础理论、基本技术和基本方法。全书分为4篇18章。篇基础篇,包括绪论、关系数据模型、关系数据库标准语言SQL、数据库安全性和数据库完整性,共5章。第二篇设计与应用开发篇,包括关系数据理论、数据库设计和数据库编程,共3章。第三篇系统篇,包括关系数据库存储管理、关系查询处理和查询优化、数据库恢复技术、并发控制和数据库管理系统概述,共5章。第四篇新技术篇,包括数据库发展概述、大数据管理系统、数据仓库与联机分析处理、内存数据库系统、区块链与数据库,共
伴随人类社会数字化进程的深入,数据正不断渗透于日常的生活、生产、分配、流通、消费等各个环节,对人类社会的影响日益凸显。数据已成为继土地、劳动力、资本、技术之后的第五大生产要素,对其他生产要素的整合能力也使其成为既有要素中比较重要的和难以替代的关键要素,并成为值得重点讨论的时代性议题与理解数字时代的基本入手点。 对数据要素的理解涉及多学科、多视野,本书从与数据要素关系较为密切的信息、权属、价值、安全、交易等五个维度出发,汇聚不同学科背景的既有文献,整合现有观点,对数据要素的多维特性进行探讨,以丰富人们对数据要素的认知,凝聚共识,澄清数字时代的发展与治理迷思,为未来的相关创新提供起点。
数据分析是现在不仅在互联网行业同时也在基础行业中必不可缺的运营手段,是业务提升效率、增强收益的有效方法。 本书的前8个章节精选提炼了多种数据分析中重要方法,包括ROI分析、数据标签和评分、用户生命周期、因果推断、可解释模型、PSM理论、ABtest、时序分析等,并通过更清晰、简单的方式向读者全方位的展示数据分析在以下诸多原理上的阐释,并且针对每种方法都提供了充足的生活和业务中的前沿案例作为辅助讲解,帮助读者更好的理解数据分析在传统行业、互联网行业及各类新兴行业的实际应用,同时也能更快的运用在实际工作和生活中,所以通过阅读前8个章节,读者可以系统的学习数据分析的理知识,拥有数据化思维,为读者能够在数据分析行业中不断深耕打下良好的理论基础并将数据分析能力逐步应用于实际的工作和生活中,成为一名合格的
本书介绍了柴油发电机组的分类、组成和工作原理,分析了柴油发电机组的功率标定和技术指标, 重点讨论了不同性质负载对柴油发电机组带载能力的影响,详细介绍了柴油发电机组供电方案的电源架 构和运行方式以及柴油发电机组的运维保养方法。此外,还介绍了机房安装的柴油发电机组和集装箱式 柴油发电机组的设计、安装的相关知识。 本书力求理论性和实践性相结合,书中所列的柴油发电机系统的供电方案及运维保养方法对当前主 流的数据中心柴油发电机系统普遍适用。本书是数据中心柴油发电机系统运维工作流程的指导性教材, 相信阅读本书一定会对数据中心柴油发电机系统运维管理从业人员大有裨益。
本书以 实战、实用、实效 为原则,充分考虑智慧公安、智慧交通、智慧金融、智慧城市等用户的大数据应用痛点,紧贴大数据实践的业务场景,汇集数据分析模型全生命 周期的关键应用技术,包括数据准备、工作表管理、可视化图表创建、数据大屏制作、数据模型创建和自定义算子设计等内容。 本书内容通俗易懂,案例丰富,图文并茂,同时配有教学视频和建模平台,适合初级、中级数据分析师和广大数据分析爱好者参考学习。通过本书,读者无须具备计算机、 软件开发等专业知识背景,即可熟练掌握大数据分析建模的基本方法和技巧。
在大数据爆发的短短10多年中,NoSQL成为处理大数据必须掌握的热门核心技术之一。《NoSQL数据库入门与实践(基于MongoDB、Redis)(第2版)》正是在这种背景下应运而生的,本书结合MongoDB、Redis和测试工具等全面介绍NoSQL数据库技术,是一本NoSQL数据库入门图书,也是初学者了解NoSQL 技术全貌的图书。全书包括3部分,其中NoSQL基础部分包括初识NoSQL、TRDB与NoSQL的技术比较、NoSQL数据存储模式;NoSQL实践部分(电商大数据)分别介绍了文档数据库MongoDB和键值数据库Redis 入门及提高知识,并通过两个电商平台综合案例详细介绍了MongoDB和Redis在实现不同业务(如日志存储、商品评价、订单信息记录、点击量存储、商品推荐、购物车、记录浏览商品行为等)功能模块开发过程中的具体应用;NoSQL提高部分(电商大数据〉介绍了大数据环境下MongoDB和Redis 在操作速度和数据存储方面的优化方法
教材系统地介绍文本数据挖掘的相关概念,利用Python作为工具进行相关试验,其内容主要包括:文本挖掘产生的背景及发展;文本挖掘的概念、文本模型表示、文本内容的预处理,包括分词、去停用词以及特征抽取;文本相似度的概念等。介绍文本分类的概念及常用方法,如KNN算法、SVM算法等,并对分类结果进行评价;在介绍文本聚类聚类的概念时是,同样介绍聚类常用算法,如K均值算法、层次聚类法、密度聚类法等,作为有文本分类、文本聚类的应用,*后给出了信息抽取、社会网络中的实体关系抽取和事件抽取。
数据建模指的是对现实世界各类数据的抽象组织,确定数据库需管辖的范围、数据的组织形式等直至转化成现实的数据库。而数据模型是构建应用系统的核心,是尽可能精准地表示业务运转的概念性框架。本书通过平实的语言,对数据模型及建模过程进行了深入浅出的介绍。全书内容分为5个部分,对数据建模简介、数据模型要素,概念、逻辑和物理数据模型、数据模型质量以及数据建模的进阶内容等方面进行讲解,全面细致地为读者解答与数据建模相关的知识点和疑问。除此之外,本书的zui后还对各类专业术语进行了细致的解释,方便读者参考。本书是一本经典的数据建模指南,非常适合对数据建模感兴趣的读者以及从事数据科学等相关工作的专业人士参考阅读。
本书系统讲述数据仓库的基本概念、基本原理以及建立数据仓库的方法和过程。主要内容包括:决策支持系统的发展、数据仓库环境结构、数据仓库设计、数据仓库粒度划分、数据仓库技术、分布式数据仓库、ElS系统和数据仓库的关系,外部和非结构化数据与数据仓库的关系、数据装载问题、数据仓库与Web、ERP与数据仓库以及数据仓库设计的复查要目。 本书是数据仓库之父撰写的关于数据仓库的 权威著作,既可作为相关专业的研究生教材,也是数据仓库的研究、开发和管理人员的指南。
Apache Flink项目的资深贡献者Fabian Hueske和Vasiliki Kalavri展示了如何使用Flink DataStream API实现可伸缩的流式应用,以及怎样在业务环境中持续运行和维护这些应用。流处理的理想应用场景有很多,包括低延迟ETL、流式分析、实时仪表盘以及欺诈检测、异常检测和报警。你可以在任意类型的持续数据(包括用户交互、金融交易和物联网等数据)生成后,立即对它们进行处理。本书主要内容包括: 了解有关分布式状态化流处理的概念和挑战。 探索Flink的系统架构,包括事件时间处理模式和容错模型。 理解DataStream API的基础知识和构成要素,包括基于时间和有状态的算子。 以精确一次的一致性读写外部系统。 部署和配置Flink集群。 对持续运行的流式应用进行运维。
本书从新时代商业环境出发,紧随市场热点,如分布式自治组织(distributed autonomous organization,DAO)、非同质化通证(non-fungible token,NFT)、元宇宙、Web 3.0 、资产 数字化、反垄断、要素市场化配置等,以企业数字化转型为核心,以区块链等数字化技术 为基本点,以场景为基本面,勾勒了数字化时代分布式商业演化的新趋势,以及其对企业 经营管理的影响,提出了数字化时代企业数字化转型的新策略和分布式经营管理的低成 本、高效率发展方案。 本书全面分析了分布式商业产生的背景及其本质内涵,认为分布式商业是未来商业演 化的必然趋势。分布式商业生态战略不但是未来企业生存的基本战略,而且是元宇宙商业 生态建设的底层逻辑,并将Web 3.0 、DAO、NFT、元宇宙等新兴事物融入分布式商业生 态体系中,深度解读了数字化时代的新商业逻辑和战略思维。同
在数据湖仓的所有新增要素中,排名的就是可以利于数据分析和机器学习所用的分析基础设施。分析基础设施包括一众大家广为熟悉的东西,当然也包括一些可能对大家还有些陌生或略带新鲜感的概念。比如包括:元数据、数据血缘、 数据体量的度量 、数据创建的历史记录、数据转换描述。 数据湖仓的第二个新增要素,是识别和使用通用连接器。通用连接器允许合并和比较所有不同来源的数据。如果没有通用连接器,就很难(实际上是几乎不可能)将数据湖仓中的不同数据关联起来。但有了这个中西,就可以关联任何类型的数据。 使用数据湖仓,就有可能实现以往任何其它方式都不可行或不可能实现的某种程度的数据分析和机器学习。 但与其它架构一样,我们需要理解数据湖仓的架构以及它的能力,以便于我们基于这种架构创建数据分析蓝图和开展数据分析规
《轻松学 MySQL数据库从入门到实战(案例 视频 彩色版)》是基于编著者三十余年 数据库应用技 术 教学实践和教材编写经验编写的,结合数据库技术和MySQL数据库的发展趋势,从初学者容易上 手、快速学会的角度,采用Python MySQL开发环境,用通俗易懂的语言,深入浅出、循序渐进地讲解 MySQL数据库系统的特点及应用开发技术,实现手把手教你从零基础入门到快速学会开发MySQL数据 库系统应用项目。 《轻松学MySQL数据库从入门到实战(案例 视频 彩色版)》由 数据库基础知识 数据库操作技 术 数据库应用技能 基于Python的数据库应用系统开发 四篇组成,以一个分布式数据库的应用实例 为主线,讲述了数据库应用系统开发的知识。全书共18章,内容包括: MySQL数据库基础知识,数 据库设计和建模,数据库操作,以及索引、表、视图的创建及应用,SQL数据定义及操纵
本书从需求规划、需求实现到可视化展示等,遵循项目开发的主要流程,全景介绍了电商行业Flink实时数据仓库的搭建过程。在整个项目的搭建过程中,介绍了主要组件的安装部署、需求实现的具体思路、问题的解决方案等,并穿插了大数据和数据仓库相关的理论知识,包括数据仓库的概念介绍、电商业务概述、数据仓库理论介绍和数据仓库建模等。最核心的内容是代码中对Flink的灵活应用,为读者展示了Flink处理数据的多种可能性。本书最后还详细讲解了项目的性能调优技巧和实战案例,帮助读者掌握更多的实战经验。 本书适合具有一定编程基础的读者学习或作为参考资料,通过本书,可以使你快速了解实时数据仓库,全面掌握实时数据仓库的相关技术。
Power BI是微软推出的商业智能分析工具,它融合了数据准备、数据分析、数据可视化到报告协作分享的整个数据处理流程,帮助用户上手数据分析。 本书从实用的角度出发,结合作者本人的学习经验,从*基础的Power BI架构和操作界面开始,先通过一个小示例体验Power BI的强大和便捷,然后按照数据处理的流程和难易程度,分别介绍数据准备模块Power Query、数据建模以及Power BI数据分析语言DAX、可视化图表制作、丰富的交互方式和报表设计,*后用一个完整的分析示例带读者全面认识Power BI数据处理流程。 不论读者是学生、职场人士还是自由职业者,不论从事的领域是运营、财务、人力、管理还是电商,只要在平时的学习和工作中需要处理大量信息,分析各种数据,你就适合阅读本书学习Power BI,即使之前没有任何基础,它也可以帮你快速上手,提升自身竞争力。
《专业SCRUM:敏捷要领与项目实践》分为8 章,分别介绍了如何持续改进Scrum 实践,如何打造坚实的团队基础、如何交付 完成 的产品增量、如何提高交付的价值、如何改进计划、如何帮助Scrum 团队改进和成长、组织如何改进以及如何实现业务敏捷。无论是Scrum Master、团队还是产品负责人,都可以借鉴书中提供的大量实用性建议,克服常见的难题,持续改进Scrum 实践。
《Oracle PL/SQL从入门到精通》是一本 覆盖 OCP 认证内容、带有视频讲解、浅显易懂、幽默风趣、实例丰富、 可操作性很强 的Oracle PL/SQL程序设计入门用书,适用于Oracle 12c、Oracle 11g、Oracle 10g、Oracle 9i等多个版本。 《Oracle PL/SQL从入门到精通》主要内容有:Oracle的安装及相关配置,PL/SQL程序设计语言概述,Oracle SQL Developer简介,常用的SQL*Plus命令,PL/SQL变量的声明与使用,编写PL/SQL语言的可执行语句,PL/SQL与Oracle服务器之间的交互,分支(条件)语句,PL/SQL语言的循环语句,PL/SQL中常用的组合数据类型,SQL游标(cursor),显式cursor的高级功能,PL/SQL程序中的异常处理,过程的创建、维护和删除,函数的创建、维护和删除,PL/SQL软件包,PL/SQL软件包的高级特性和功能,数据库触发器,批量绑定及高级触发器特性, PL/SQL程序代码设计上的考虑、Oracle自带软件包及数据库
本书是普通高等教育 十一五 *规划教材。本书全面系统地介绍了数据挖掘和知识发现领域的基本原理、研究方法、部分产品和工业标准。全书共15章,其中,第1章介绍数据分析技术的发展历程,KDD与数据挖掘的概念、对象、过程、方法、相关领域和应用范围。第2章介绍关联规则基本模型和Apriori等经典算法。第3章在介绍距离概念的基础上,讨论包括划分、层次、密度等聚类方法。第4章介绍ID3、CART等决策树算法。第5章介绍图方法实现贝叶斯分类。第6章介绍VC维、支持向量机。第7章介绍人工神经网络。第8章介绍近期热点技术 深度学习。第9章介绍不平衡数据学习。第10章讨论过拟合、模型选择、模型评估等内容。第11、12章是不确定性、模糊性方法,分别介绍粗糙集和模糊集。第13章是Web挖掘,介绍Web链接分析、推荐系统和社交网络挖掘。第14章介绍数据预处理和可视
本书不是一本关于数据管理的 如何做 的书(如规范数据属性或是创建数据库),而是一本关于数据管理 如何思考 的书。本书将心理学和哲学与数据管理巧妙的融合在一起。将心理学和哲学学科与数据管理结合在一起,以创造有关我们如何感知和管理信息的知识。书中阐述了当今数据库系统通过数据来捕获现实世界的方式及缺陷,作者运用非常清晰的逻辑、仔细地描述了信息系统中所表示的现实世界的各个方面。对系统中所使用的数据模型、语言、语义和现实世界描述下的哲学问题进行了深刻的检视,对这些核心概念、其对信息系统的影响,是坊间遍寻不到的。这本书的价值在于批判性地探索解决现实世界的信息系统建模方法,这是一本令读者愉悦并具有启发性的佳作。适合从事数据建模、大数据、数据管理的人士阅读。