本书按照需求规划、需求实现、可视化的流程进行编排,通过项目开发的主要流程,介绍数据仓库的搭建过程。在整个数据仓库的搭建过程中,本书介绍了主要组件的安装部署、需求实现的具体思路,以及各种问题的解决方案等,并在其中穿插了许多与大数据和数据仓库相关的理论知识,包括数据仓库的概念、电商业务概述、数据仓库理论和数据仓库建模等。 本书共14章,其中,第1~3章是项目的前期准备阶段,主要介绍了数据仓库的概念和搭建需求,并初步搭建了本数据仓库项目所需的基本环境;第4~7章是项目的核心部分,详细介绍了数据仓库的建模理论,并完成了数据从采集到分层搭建的全过程,是本书的重点部分;第8~14章是对数据治理各功能模块的实现,针对数据治理的不同功能需求分模块进行实现。 本书适合具有一定编程基础并对大数据感兴趣的读者
本书系统地阐述了移动性数据建模、管理和分析的内容,从移动性数据建模与表达、移动性数据分析、移动性数据应用三个方面深入介绍了移动数据管理技术和应用。本书由四篇组成: 篇涉及移动性数据处理的基本概念和术语、数据采集与存储管理的基本技术;第二篇涉及移动性知识的管理过程,具体包括移动性数据挖掘、知识发现的方法与系统、可视化知识提取的方法与系统等;第三篇展示了移动性数据在城市交通、海事、航空、动物移动、人群移动等各方面的具体应用;第四篇给出了移动性数据的**发展形势和用途。
本书以敏捷分析工具Tableau为基础,部分章节辅以SQL讲解,系统介绍了数据可视化分析的体系和方法,内容涵盖问题分析方法、数据合并和建模、可视化图形的选择和构建、多种交互方式及其组合、仪表板设计与 交互、基本计算和 计算等。 本书以Tableau Desktop的应用为中心,借工具讲解原理,以原理深化工具应用,并由点及面地介绍了业务分析的思考和原理,特别是提出了实践性的\"业务―数据―分析”层次框架,并以三类\"详细级别”的概念贯通数据模型、 筛选和 计算三大主题。 本书重点介绍工具应用背后的思考方式和原理,帮助读者建立\"详细级别”的思考框架,举一反三,从而实现多维、结构化分析。
对象代理数据库系统既具有关系数据库的灵活性,又具有面向对象数据库表现复杂语义的能力, 适合管理结构复杂、语义丰富的数据。 本书根据作者提出的对象代理模型,给出对象代理代数,描述对象代理数据库语言,并围绕对象代理数据库的存储管理、查询处理、事务管理和安全机制等实现技术进行深入介绍,使读者能够全面掌握对象代理数据库系统原理。 本书既可供计算机专业高年级本科和研究生学习,也可作为数据库专业技术人员的参考书籍。
本书是一本区分统计数据挖掘和机器学习数据挖掘的图书。它创造性地汇编了数据挖掘技术,解决了对经典和现代统计方法框架的扩展,用于预测建模和大数据分析。SM-DM为数据挖掘领域新晋的数据科学家所面临的共同问题提供了适当的解决方案。它的展示侧重于数据科学家(通常被称为统计学家、数据采矿者和数据分析师)的需求,提供实用但又强大的、简单而又有洞察力的量化技术,其中大部分使用了新机器学习影响改进的“旧”统计方法。
关于大数据技术的信息非常丰富,但将所有这些技术无缝拼接成端到端的企业数据平台却是一项艰巨的任务,一直以来没有引起广泛的讨论。通过这本实用指南,你将了解如何在企业内部和云计算平台中构建大数据基础设施,并成功地构建出现代数据平台。 对于企业架构师、IT经理、应用程序架构师和数据工程师来说,《现代数据平台架构(影印版英文版)》是一本理想读物,它为你展示了如何克服Hadoop项目中出现的诸多挑战。在深入研究以下内容之前,你还将通过一个透彻的技术入门教程探索Hadoop和大数据领域可用工具的广阔前景。 基础设施:查看现代数据平台的所有组件层,从服务器到数据中心,为企业数据奠定坚实基础。 平台:学习平台部署、操作、安全性、高可用性和灾难恢复的各个方面,了解将平台与企业IT的其他部分集成所需的一切知识。
数据包络分析(DEA)方法是一种应用广泛的效率评价方法。本书结合作者近年来的研究成果,将数据包络分析方法进行扩展与集成,使之成为一种开展系统综合评价的有效方法。本书重点介绍DEA公共权重配置和DMU 排序方法、DEA中DMU结构分析和效率分解方法、不确定信息条件下的鲁棒DEA方法、径向和非径向DEA集成效率测度方法、基于DEA的资源配置和目标分解方法等DEA领域的前沿建模方法。同时本书还介绍了DEA方法在能源与环境绩效评价、银行和供应链效率分析中的应用。
本书主要介绍大数据分析中需要用到的数学基础知识,全书共分为7章,系统地介绍了函数的极限与连续、函数的微积分、矩阵、函数的插值、概率与数理统计等内容。 本书可供金融、医学、管理、计算机等学科领域从事大数据分析的教学、科研人员和从业者在工作中参考,也可作为数据科学与大数据技术、人工智能等相关专业的本科生、研究生学习时辅助用书。