当前不乏大数据具体技术组件的书籍,但却很少有从大数据平台整体建设和产品形态的宏观角度入手来阐释的。本书重点介绍大数据开发平台服务构建的整体思路和解决方案,内容涵盖一个成熟的大数据开发平台必不可少的各类核心组件:工作流调度系统、集成开发环境、元数据管理系统、数据交换服务、数据可视化服务、数据质量管理服务,以及测试环境的建设等。书中还凝结了作者多年平台建设的实践经验,以及对大数据相关从业人员能力建设和职业规划的宝贵建议。本书适合广大志在深入了解大数据平台建设、开发和应用的在职人员及院校师生。
随着大数据研究热潮的兴起,各种数据可视化图表层出不穷,大数据生动呈现就成为了具有挑战性的工作,随之出现了大量的可视化软件。本书是基于行业占有率比较高的Microsoft Power BI近期新版本所编写的,详细介绍Microsoft Power BI的数据可视化功能,包括数据类型和运算符、软件的安装、连接数据源、数据基础操作、可视化设计原则、可视化图表、自定义可视化效果、报表、仪表板、查询编辑器、运行R脚本、数据不错操作、数据分析表达式、网页流量数据分析、超市运营数据分析、Power BI移动应用和Power BI应用开发等内容。
本书全面系统地讲解如何规划、设计、构建和管理数据仓库/商务智能解决方案。本书介绍在数据仓库开发项目中如何激励用户,在整个企业范围内更好地驱动决策制定,从专业的开发人员获取详细的指导和实践经验。本书内容涉及如何选择恰当的组件、构建企业数据模型、配置数据集市和数据仓库、构建数据流并降低风险,还涉及项目开发中变更管理、数据监理和安全方面的问题。
本书是介绍大数据及其应用的著作,全书分为三篇共11章。上篇(1~2章)描述了大数据带来的冲击和它引爆的思维革命、社会变革,以及数据权在政治、经济、军事上的重要意义。中篇(3~6章),介绍了大数据的数理哲学原理和认识论原理,大数据在科学认识中的作用,以及大数据分析的社会意义。下篇(7~11章),是与大数据研究相关的一些应用成果,包括主动智能搜索、数据挖掘与创新、企业信誉与市场满意度调查、中国市场经济信息评估系统和智慧城市的规划与评估。
本书是斯坦福大学计算机科学专业数据库系列课程第二门课的教科书。书中对数据库系统实现原理进行了深入阐述,并具体讨论了数据库管理系统的三个主要成分——存储管理器、查询处理器和事务管理器的实现技术。此外,第2版充分反映了数据管理技术的新进展,对内容进行了扩充,除了在版中原有的“信息集成”一章(0章)中加入了新的内容外,还增加了两个全新的章:“数据挖掘”(1章)和“数据库系统与互联网”(2章)。 本书适合作为高等院校计算机专业研究生的教材或本科生的教学参考书,也适合作为从事相关研究或开发工作的专业技术人员的高级参考资料。
本书是一本从理论到实践的全面且细致的企业数据驱动指南,作者见证并献身百度大数据的建设,毫无保留地将成败摸索实践的真实场景进行完整还原,并对近十年大数据从业经验与心得做了归纳和总结,同时详解大数据本质、理念与现状,并围绕数据驱动四环节——采集、建模、分析、指标,深入浅出地讲述企业如何从零到一将完整的数据驱动方案落地,全面展示大数据在各领域内的应用情况与趋势展望。
本书是一本从理论到实践的全面且细致的企业数据驱动指南,作者见证并献身百度大数据的建设,毫无保留地将成败摸索实践的真实场景进行完整还原,并对近十年大数据从业经验与心得做了归纳和总结,同时详解大数据本质、理念与现状,并围绕数据驱动四环节——采集、建模、分析、指标,深入浅出地讲述企业如何从零到一将完整的数据驱动方案落地,全面展示大数据在各领域内的应用情况与趋势展望。
《洞见数据价值:大数据挖掘要案纪实》是国际知名咨询公司毕马威的大数据团队的集大成之作,内容丰富,观点新颖,贴近大众生活、工作与学习实际场景,内容不拘泥于技术阐释,通过寓教于乐的方式,以丰富翔实的案例来解析大数据挖掘,尽量通过常见的场景来阐述数据的价值与意义。章介绍大数据在银行业、征信业、审计、传统制造业、互联网行业、舆情监控、影视业、环保产业以及体育产业等多个领域的应用方案和前景。第2章重点介绍大数据分析在商业工作和营销推广中的作用。第3章介绍大数据挖掘过程中涉及的数据的前期准备工作,重点介绍数据准备工作的要点和诀窍。第4章结合业务、生活、娱乐,寓教于乐,介绍大数据的实际应用方式。附录部分介绍一位数据工作者的成长之路,向感兴趣的读者介绍从事数据工作应该具备的素质和掌握的技能。《
本书主要内容包括:数据清洗在数据科学领域中的重要作用,文件格式、数据类型、字符编码的基本概念,组织和处理数据的电子表格与文本编辑器,各种格式数据的转换方法,解析和清洗网页上的HTML 文件的三种策略,提取和清洗PDF 文件中数据的方法,检测和清除RDBMS 中的坏数据的解决方案,以及使用书中介绍的方法清洗来自Twitter 和Stack Overflow 的数据。
本书是江苏省高等学校精品教材和“十二五”江苏省高等学校重点教材(编号:2015-1-072)。全书突出基础性、新颖性、实用性、操作性,系统全面、深入浅出、实例丰富,以关系数据库系统为核心,将数据库基本原理、方法和应用技术相结合。本书主要内容包括数据库系统概述、关系数据库、关系数据库标准语言SQL、关系规范化理论、数据库设计、数据库保护技术、SQL Server 2012的应用、数据库应用系统开发和数据库技术新进展等。每章均配有小结并附有适量的习题,便于读者巩固所学知识。书后所附习题答案可以帮助读者检验学习和练习效果。此外,本书配有教学课件及数据库应用系统开发源程序。本书可作为高等院校计算机科学与技术、软件工程、信息管理与信息系统、信息与计算科学以及相关专业的本科生教材,也可作为从事计算机软件工作的科技人员和工程