本书按照需求规划、需求实现、可视化的流程进行编排,通过项目开发的主要流程,介绍数据仓库的搭建过程。在整个数据仓库的搭建过程中,本书介绍了主要组件的安装部署、需求实现的具体思路,以及各种问题的解决方案等,并在其中穿插了许多与大数据和数据仓库相关的理论知识,包括数据仓库的概念、电商业务概述、数据仓库理论和数据仓库建模等。 本书共14章,其中,第1~3章是项目的前期准备阶段,主要介绍了数据仓库的概念和搭建需求,并初步搭建了本数据仓库项目所需的基本环境;第4~7章是项目的核心部分,详细介绍了数据仓库的建模理论,并完成了数据从采集到分层搭建的全过程,是本书的重点部分;第8~14章是对数据治理各功能模块的实现,针对数据治理的不同功能需求分模块进行实现。 本书适合具有一定编程基础并对大数据感兴趣的读者
本书会告诉你如何为组织设计合适的数据保护系统,以降低组织的成本和出现问题的可能性。系统管理员与网络管理员既要保护数据中心的物理机、虚拟机以及云平台中的设施,还要保护各种移动设备,此外还有Microsoft 365、Google Workspace与Salesforce等SaaS产品,以及由Kubernetes与容器工作负载创建的持久数据,这实在是一个相当繁杂的任务。为了帮助大家解决上述难题,本书提供了几种解决方案,以便你从中选出适合的方案。你将了解每种工作负载的独特要求,然后探索可用于保护这些数据源的各种商用备份硬件、软件与服务,并探讨每种方法的优点与缺点。学完本书,你将:*了解哪些工作负载类型(数据)应该备份。* 探索用于备份数据的软件、硬件与服务。* 能够判断目前的数据保护系统有什么缺陷。* 学会如何将每种数据源分别交给擅长处理这种数据源的备份系统
本书以企业传统数据仓库的改造和全新的大数据平台建设为出发点,讨论了内存计算技术带来的根本性变革及其对企业传统数据仓库架构设计的改变,并详细介绍了在应用Hadoop 等数据湖技术条件下的数据获取、数据建模、数据服务应用及管理方法。全新的大数据平台架构 单个系统的物理界限, 多地采用虚拟建模与逻辑建模的方法,对企业内外、本地云端的全体数据进行统一的管理和应用调度,并使用机器学习技术进行各类创新应用的开发。
本书针对当代社会日益复杂的应急管理挑战,以时空感知大数据为核心,系统探讨一系列模型、技术和应用。本书内容分为模型篇、技术篇和应用篇。模型篇重点研究时空大数据的表示与提取模型,以及时空感知大数据的存储和查询模型,为读者在处理和管理海量时空感知数据方面提供指导。技术篇关注于利用时空感知大数据支持应急管理决策和行动的核心技术,涵盖人群行为计算、突发事件检测与分类、应急疏散路径规划、应急物资调度与应急指挥等领域。应用篇则展示在大型活动安全管理、城市交通疏散和自然灾害救援等实际场景中的应用案例,为读者解决实际问题提供参考和借鉴。 本书适合从事应急管理、数据科学、信息技术以及相关领域研究和实践的专业人士和学生阅读。
数据包络分析(DEA)方法是一种应用广泛的效率评价方法。本书结合作者近年来的研究成果,将数据包络分析方法进行扩展与集成,使之成为一种开展系统综合评价的有效方法。本书重点介绍DEA公共权重配置和DMU 排序方法、DEA中DMU结构分析和效率分解方法、不确定信息条件下的鲁棒DEA方法、径向和非径向DEA集成效率测度方法、基于DEA的资源配置和目标分解方法等DEA领域的前沿建模方法。同时本书还介绍了DEA方法在能源与环境绩效评价、银行和供应链效率分析中的应用。
本书以敏捷分析工具Tableau为基础,部分章节辅以SQL讲解,系统介绍了数据可视化分析的体系和方法,内容涵盖问题分析方法、数据合并和建模、可视化图形的选择和构建、多种交互方式及其组合、仪表板设计与 交互、基本计算和 计算等。 本书以Tableau Desktop的应用为中心,借工具讲解原理,以原理深化工具应用,并由点及面地介绍了业务分析的思考和原理,特别是提出了实践性的\"业务―数据―分析”层次框架,并以三类\"详细级别”的概念贯通数据模型、 筛选和 计算三大主题。 本书重点介绍工具应用背后的思考方式和原理,帮助读者建立\"详细级别”的思考框架,举一反三,从而实现多维、结构化分析。
本书主要介绍大数据分析中需要用到的数学基础知识,全书共分为7章,系统地介绍了函数的极限与连续、函数的微积分、矩阵、函数的插值、概率与数理统计等内容。 本书可供金融、医学、管理、计算机等学科领域从事大数据分析的教学、科研人员和从业者在工作中参考,也可作为数据科学与大数据技术、人工智能等相关专业的本科生、研究生学习时辅助用书。
本书深入探讨了软件数据分析的技术与艺术,来自微软、NASA等的多位软件科学家和数据科学家分享了他们的实践经验。书中内容涵盖安全数据分析、代码审查、日志文档、用户监控等,技术领域涉足共同修改分析、文本分析、主题分析以及概念分析等方面,还包括发布计划和源代码注释分析等高级主题。通过阅读本书,读者将了解如何在工业领域和开源领域应用数据分析,以及如何向利益相关者和决策者呈现数据分析结果。
2020年中央经济工作会议把"做好碳达峰、碳中和工作”作为八大重点任务之一。为落实国家相关法规,节约资源,保护环境,推进可持续发展,聚焦贵阳贵安数据中心集聚的特色优势,聚焦金融行业的发展特点,规范贵州省金融行业绿色数据中心的建设,构建布局合理、规模适度、保障有力、绿色集约的金融数据中心体系,打造全国金融行业数据中心高地。贵安产控集团组织华为、贵州大学等有关单位编写了《金融行业绿色数据中心建设标准指引》,以期为金融行业绿色数据中心的建设、运行以及评定提供明确的技术指导。