本书是国际数据管理协会(DAMA国际)组织众多国际专家对过去30多年数据管理领域知识和实践的总结,是市场上综合了数据管理方方面面的一部具有性的基础工具书。从数据治理、数据架构、数据质量、数据安全、主数据管理、参考数据管理、元数据管理、商务智能和数据参考管理、数据建模设计、数据存储和操作、数据集成和互操作、文档和内容管理、大数据、数据管理人员的道德要求等方面介绍了数据管理的知识体系。
本书围绕精益创业展开讨论,融合了精益创业法、客户开发、商业模式画布和敏捷/持续集成的精华。本书汇聚了100多位创始人、投资人、内部创业者和创新者的成功创业经验,呈现了 30 多个极具价值的案例分析,可以为各阶段的创业者提供行为准则。 如果你是一名创业者,或者你是一名产品开发、产品管理、市场营销、公共关系和投资领域的商务专业人员,那么本书不容错过。
《从零开始学Power BI商业数据分析(视频教学版)》从Power BI的基础知识讲起,然后逐步深入Power BI的进阶提升知识,最后配合项目实战案例,展示如何使用Power BI进行数据清洗、数据统计和数据可视化等相关操作,从而帮助零基础的数据分析人员快速上手。 《从零开始学Power BI商业数据分析(视频教学版)》共10章,分为3篇。第1篇 基础知识 ,主要介绍Power BI的下载和注册方法,以及相关组件的用法和数据导入方法,并详细介绍Power Query的基础知识。第2篇 进阶提升 ,主要介绍数据建模、度量值、常用的度量值应用案例、可视化看板的制作和Power BI在线版等相关知识。第3篇 项目案例实战 ,主要介绍如何用Power BI制作数据大屏、多页面交互式可视化看板和分析报告3个实战案例,展现数据清洗、数据统计和数据可视化的整个流程。 《从零开始学Power BI商业数据分析(
《机器学习数学基础:概率论与数理统计》从基础的概率统计知识讲起,逐步深入到机器学习以及深度学习的分类算法,并在后配合深度学习的实战案例,介绍了softmax回归函数在手写体图像识别中的具体应用。通过手动编辑代码,让读者更深入地了解概率在人工智能领域的重大作用。全书分为16章,涵盖的内容主要有概率统计在人工智能发展过程中的重要影响;随机试验及概率的概念;随机变量的分布及多维随机变量的分布情况;贝叶斯算法;正态分布现象;随机变量的数字特征;机器学习中的损失函数;大数定律;样本及抽样分布的做法;参数估计的概念;马尔科夫链;过拟合与欠拟合问题及解决方法;Tensorflow概述及安装方法;卷积神经网络介绍;实验演练之手写体数字识别等。 《机器学习数学基础:概率论与数理统计》配有大量的插图,以身边的生活现象
数据、模型与决策是应用数学建模和计算机技术帮助决策者解决问题。作为国外一本优秀的数据、模型与决策的教材,本书具有以下特色: 1.对枯燥、复杂和技术化的数学问题用简明易懂的语言予以解释,兼顾严谨的数理逻辑。 2.突出建模分析框架和基础逻辑的讲授和训练,在某种程度上实现了艺术与科学的有机融合。 3.课后习题丰富,并配有网络题库,供自学者加强训练,及时检查对理论模型及其求解方法的掌握程度。 第12版把修订重点放在企业和组织的*技术发展上,增加了商业分析(第1章)、项目风险(第8章)以及数据挖掘(第14章)等内容。
全书分为 8 章, 主要内容如下:第1章介绍学术论文插图绘制的规范性和基本原则以及学术论文插图的配色基础;第2章介绍绘制学术论文插图的主要工具,并重点介绍 Matplotlib、Seaborn、ProPlot 以及 SciencePlots 工具包的语法及其重要特征;第3章介绍学术论文中常见的单变量图及其绘制方法,包括直方图、密度图、Q-Q 图等;第4章介绍学术论文中常见的双变量图及其绘制方法, 具体包括误差线、柱形图、箱线图、相关性散 点图以及矩阵热力图等;第5 章介绍学术论文中常见的多变量图及其绘制方法,包括等高线图、点图系列、 三元相图、 3D 图系列以及 RadViz 图等;第 6 章介绍学术论文中常见的空间数据型图及其绘制方法,包括分 级统计地图、连接线地图、等值线地图以及子地图等;第 7 章介绍学术论文中常见的可视化图及其绘制方法,包括配对图系列、韦恩图、泰勒图
这是一部从技术、流程、管理等多个维度系统讲解华为数据治理和数字化转型的著作。华为是一家超大型企业,华为的数据底座和数据治理方法支撑着华为在全球170多个国家/地区开展多业态、差异化的运营。书中凝聚了大量数据治理和数字化转型方面的有价值的经验、方法论、规范、模型、解决方案和案例,不仅能让读者即学即用,还能让读者了解华为数字化建设的历程。 全书共10章,内容从逻辑上分为四个部分。 第一部分(第1~3章) 第1章以非数字原生企业在数字化转型方面面临的挑战开篇,介绍了华为在数据治理和数字化转型方面的目标、愿景、蓝图和框架;第2章从企业政策和架构协同的角度,介绍了企业级的数据综合治理体系,理顺了数据与变革、运营、IT之间的协同关系,明确了数据管理的责任主体在业务;第3章详细阐述了不同类型的数据的管理方式和
商业分析有用吗?当然有用!商业分析是行走职场、创业启航的一项推荐技能。作者结合自己多年的工作经验,用生动的语言介绍如何用数据分析解决商业问题。本书分为6篇,共17章,其中第1篇是概念篇,讲述商业分析的基本概念;第2篇是基础篇,讲述如何用基础的分析方法评估企业经营状况;第3篇是进阶篇,讲述如何构建分析体系解决较复杂的问题;第4篇是高阶篇,讲述如何应对复杂的商业难题;第5篇是基础实践篇,通过案例讲述如何解决更复杂的商业问题;第6篇是高阶实践篇,通过案例讲述如何解决商业分析中的疑难杂症。本书的讲解思路是层层递进的,从简单场景到复杂场景,从基础的方法到复杂的方法。因此,无论读者是否有数据分析基础和经验,都建议从头开始阅读,这样可以一步步提升认知,更快地掌握商业分析的方法。
本书主要针对电商从业者(运营和店长)和数据分析入门者,以电商业务实战为主线,介绍数据分析相关的知识。本书的上半部分主要介绍*的操作方法,以及探讨未来的电商布局之路。本书的下半部分以实战为主,主要介绍*卖家如何应用Excel 和数据来做决策。数据从来都离不开业务层,数据分析师必不可少的4 个要素是思维、业务、工具和数据,而前两者才是*重要的。
本书在梳理和反思数字化转型和数字治理现状的基础上,以马克思主义政治经济学中有关生产力与生产关系的经典理论为指导,将数字化转型与数字治理之间的互动关系作为切入点,详细解读了数字经济时代的数字化转型和数字治理挑战,提出了数字化转型和数字治理的创新思路,以期走出一条科学思想与人性光辉共同闪耀的数字繁荣之路。其中,在数字化转型方面,基于"技术-社会”互构视角提出了"技术动力”与"结构调适”的数字化转型机制;在数字治理方面,基于当前的治理挑战和治理需求提出了数字治理"三位一体”体系框架。 此外,本书还对数字化转型和数字治理的未来发展进行了展望。
《Python数据分析与大数据处理从入门到精通》主要讲解数据分析与大数据处理所需的技术、基础设施、核心概念、实施流程。从编程语言准备、数据采集与清洗、数据分析与可视化,到大型数据的分布式存储与分布式计算,贯穿了整个大数据项目开发流程。本书轻理论、重实践,目的是让读者快速上手。1篇首先介绍了Python的基本语法、面向对象开发、模块化设计等,掌握Python的编程方式。然后介绍了多线程、多进程及其相互间的通信,让读者对分布式程序有个基本的认识。第2篇介绍了网络数据采集、数据清洗、数据存储等技术。第3篇介绍了Python常用的数据分析工具,扩展了更多的数据清洗、插值方法,为*终的数据可视化奠定基础。第4篇是大数据分析的重点。首先介绍了Hadoop的框架原理、调度原理,MapReduce原理与编程模型、环境搭建,接着介绍了Spark框架原
本书以HadoopHDFS为载体,介绍了构建一款分布式系统(尤其是存储方向)所需的核心技术,所有内容均基于当前较新的3.3.x/3.4.x版本,分别从理论和实践两个维度逐一阐述。本书主要包括两篇:核心原理篇介绍了HDFS的诞生历史、元数据及Block管理、节点间通信机制、读写数据流程和高可用实现原理等;拓展与实践篇从实际出发,充分考虑了用户在应用过程中会遇到的痛点,详细介绍了集群拓展方法、数据分层存储、集群维护与多租户实施等实践经验。本书各章节都配有必要的流程图和原理分析图,便于读者阅读理解,并精选了非常有用的实际案例及拓展知识。阅读本书后,相信会给读者带来“1+1 2”的效果。本书非常适合大数据从业者、云计算领域研发及运维人员、高校研究生和热衷于分布式的技术极客阅读学习。
本书是MySQL领域的经典之作,拥有广泛的影响力。第3版更新了大量的内容,不但涵盖了近期新MySQL 5.5版本的新特性,也讲述了关于固态盘、高可扩展性设计和云计算环境下的数据库相关的新内容,原有的基准测试和性能优化部分也做了大量的扩展和补充。全书共分为16章和6个附录,内容涵盖MySQL架构和历史,基准测试和性能剖析,数据库软硬件性能优化,复制、备份和恢复,高可用与高可扩展性,以及云端的MySQL和MySQL相关工具等方面的内容。每一章都是相对独立的主题,读者可以有选择性地单独阅读。本书不但适合数据库管理员(DBA)阅读,也适合开发人员参考学习。不管是数据库新手还是专家,相信都能从本书有所收获。
从统计学科与计算机科学的性质认知,大数据是指那些超过传统数据系统处理能力、超出经典统计思想研究范围、不借用网络无法用主流软件工具及技术进行单机分析的复杂数据的集合,对于这一数据集合,在一定的条件下和合理的时间内,我们可以通过现代计算机技术和创新的统计方法,有目的地进行设计、获取、管理、分析,揭示隐藏在其中的有价值的模式和知识。 《大数据:统计理论、方法与应用》共分五章,其内容包括大数据下的统计理论体系、大数据下的数据集整合分析、大数据下的高维变量选择方法、大数据下的统计方法并行计算和大数据下的统计方法应用——网络舆情分析。 本书内容新颖,取材国内外资料,同时认真总结了作者近年来的科研成果,重点反映统计学对大数据发展的影响,突出五大特点: (1)充分体现学科融合; (2)
《电力安全作业全媒体培训教材》以安规为蓝本,结合近年来电力行业发生的典型事故案例,集动画、文字、图片等媒体表现形式与一体,将全媒体与电力安全培训的内容结合起来,既有引人入胜的案例,又有对安规的多维度解读,包含《电力安全事故案例动漫集(配电部分)》、《电力安全事故案例动漫集(线路部分)》两部事故案例动漫片及《国家电网公司电力安全工作规程(配电部分)》全媒体释义、《国家电网公司电力安全工作规程(线路部分)》全媒体释义。《国家电网公司电力安全工作规程(配电部分)》全媒体释义是从图片、视频、案例、释义多维度诠释2014年实施的《国家电网公司电力安全工作规程(配电部分)(试行)》,旨在帮助使用人员理解、执行条文规定,主要内容包括总则和配电作业基本条件、保证安全的组织措施、保证安全的技术措施
本书完整全面地讲述数据挖掘的概念、方法、技术和近期新研究进展。本书对前两版做了全面修订,加强和重新组织了全书的技术内容,重点论述了数据预处理、频繁模式挖掘、分类和聚类等的内容,还全面讲述了OLAP和离群点检测,并研讨了挖掘网络、复杂数据类型以及重要应用领域。 本书是数据挖掘和知识发现领域内的所有教师、研究人员、开发人员和用户都推荐阅读的参考书,是一本适用于数据分析、数据挖掘和知识发现课程的优秀教材,可以用做高年级本科生或者一年级研究生的数据挖掘导论教材。
什么是数据中台? 什么样的企业需要建数据中台? 数据中台应该如何架构与设计? 建设数据中台的系统方法论是什么? 一个完整的数据中台有哪些组成部分? 如何从0到1实现一个数据中台? 数据中台应该如何运营? 数据中台的安全如何保障? …… 以上所有问题都能在本书中找到答案! 这是一部系统讲解数据中台建设、管理与运营的著作,旨在帮助企业将数据转化为生产力,顺利实现数字化转型。 本书由 数据中台领域的 企业数澜科技官方出品,几位联合创始人亲自执笔,7位作者都是 的数据人,大部分作者来自原阿里巴巴数据中台团队。他们结合过去帮助百余家各行业头部企业建设数据中台的经验,系统总结了一套可落地的数据中台建设方法论。本书得到了包括阿里巴巴集团联合创始人在内的多位行业专家的高度评价和 。
本书精讲数据结构与算法,对常见的算法及实现代码进行详细讲解,并配合具体的图表和教学视频,使读者轻松掌握数据结构知识并深入理解其中的算法思想。 本书共分8章,内容包括线性表、栈、队列、串、数组和广义表、树、图、查找、排序等。本书知识点涵盖全面,案例典型。本书习题大部分来自各大名校考研和 软件公司的笔试面试题目,是作者多年来的教学实践经验的总结。本书案例代码全部在Visual C++开发环境运行通过,并配套教学视频,方便读者自学。 本书适合C语言数据结构与算法的初学者、数据结构与算法课程考试的学生、考研人员、算法竞赛选手,也可以作为高等院校和培训机构计算机相关专业师生的教学参考书。
这是一部指导信贷业务如何用智能风控、反欺诈的技术和方法实现风险控制的著作。 作者是经验丰富的智能风控算法专家,先后就职于头部的互联网公司的金融部门以及头部的公募基金公司,致力于人工智能算法在信贷风控领域的应用。 本书不仅体系化地讲解了智能风控和反欺诈的体系、算法、模型以及它们在信贷风控领域实践的全流程,而且还从业务和技术两个角度讲解了传统的金融风控体系如何与智能风控方法实现双剑合璧。全书以实战为导向,辅以多个用Python实现的综合案例,便于读者理解和实操。 全书共10章,逻辑上分为四个部分: 第1~3章是风控业务的基础,首先介绍了什么是信用风险和欺诈风险,然后讲解了传统风险管理体系中搭建评分卡的思路,以及智能风控时代数据和模型的技术框架。 第4~6章集中讲述了智能风控中常见的特征工程、算法原理和建
《Oracle Database 12c DBA官方手册(第8版)》在上一版的基础上做了全面更新,涵盖新功能和实用工具,如多租户体系结构、Oracle Database In-Memory选项和更强大的云功能;并列举每种主要配置的示例。你将学习如何成功地管理高度可用、可靠、安全和可扩展的Oracle企业级数据库环境。第Ⅰ部分讲述Oracle 体系结构、Oracle Database 12c 升级问题以及表空间计划,第Ⅱ部分介绍针对单机和网络数据库的适当监控、安全性和调整策略。 可扩展性 和 管理 无疑是Oracle Database 12c *的亮点,使用多租户数据库,可在保持性能不变的前提下在给定服务器上运行更多数据库实例,并更有效地利用服务器资源。第Ⅲ部分全方位描述 高可用性 ,介绍RAC,详述恢复管理器,简述如何管理Oracle Data Guard 环境。第Ⅳ部分详述Oracle Net、网络化配置、物化视图、位置透明性以及其他方面的知识,帮助你成
Oracle数据库是关系型数据库领域重要的产品之一,在市场上赢得了广大用户和技术爱好者的信赖。在使用数据库产品的过程中,如何通过优化提升性能,通过诊断分析解决问题,一直是这个领域重要的议题。随着Oracle12c版本的深入使用和云技术的蓬勃发展,关于12c的版本特性也备受关注。 本书汇聚了Oracle数据库领域的一批技术专家,通过成长历程分享、技术经验讲解、诊断和优化案例分析,将其独特的经验和视角分享给广大读者。作者希望通过这些各具特色的实践分享,让读者找到对自己有益的学习方法和诊断优化思路。 本书适用于对Oracle数据库技术有一定的了解,希望深入学习的数据库从业人员,尤其是希望深入研究Oracle数据库的管理人员。
SQL是最重要的关系数据库操作语言。SQL语句的运行效率,对于数据库的整体性能至关重要。因此,SQL语句的优化就成为数据库专业人员必须掌握的一门技能。很多初学者经常有如何入门、提高SQL语句优化能力的困惑。本书规避了市面上大多关于SQL优化的书籍内容过于深奥问题,以一线开发工程师的言语和视角展开,理论与实践并重,不仅适合初学者,也适合中端技术人员。 本书以大量案例为依托,系统讲解了SQL语句优化的原理、方法及技术要点,尤为注重实践,在章节中引入了大量的案例,便于学习者实践、测试,反复揣摩。
作为数据仓库和商业智能(DW/BI)行业中*有影响力的领军人物,Ralph Kimball、Margy Ross得到了世界范围内的认可和尊重,他们在《数据仓库与商业智能宝典(第1版)》中确立了行业标准。现在,在《数据仓库与商业智能宝典(第2版) 成功设计、部署和维护DW/BI系统》中已经更新了65篇DesignTip和白皮书,从而汇集了DW/BI技术创新前沿的著作。 从项目规划和需求收集,到维度建模、ETL和BI应用,本书涵盖了你在数据仓库和商业智能中将会遇到的所有内容。这些无与伦比的文章提供了成功地设计、部署和维护DW/BI系统的重要建议。主要内容:◆ 启动DW/BI项目和收集需求的注意事项◆ 集成式企业数据仓库的要素,其中包括总线架构和矩阵◆ 事实表的粒度性和三种基本类型◆ 渐变维度技术◆ 星型模式、外支架和桥接表◆ 维度建模高级模式◆ 提取、转换和加载(ETL)子系统与数据质量