本书是一本从理论到实践的全面且细致的企业数据驱动指南,作者见证并献身百度大数据的建设,毫无保留地将成败摸索实践的真实场景进行完整还原,并对近十年大数据从业经验与心得做了归纳和总结,同时详解大数据本质、理念与现状,并围绕数据驱动四环节——采集、建模、分析、指标,深入浅出地讲述企业如何从零到一将完整的数据驱动方案落地,全面展示大数据在各领域内的应用情况与趋势展望。
本书瞄准云计算和大数据产业,论述云计算环境下的数据治理成熟度模型规范,为用户提供通用的数据治理模型方法;针对靠前外市场对云端数据治理的迫切需求,给云端数据治理的用户提供很好实践方法;给出云端数据治理成熟度的评估方法和流程,帮助用户开展云端数据治理成熟度评估并实现用户的数据治理成熟度持续改进;进行云端数据治理示例分析,对云端数据治理成熟度应用和评估方法予以说明,并给出实施方法和应用步骤。
在本书中,作者将自己多年形成的编程习惯以及阅读既有代码的体验凝练成了编程中的价值观、原则和77种实现模式。 沟通、简单和灵活的价值观应当被所有开发人员所铭记。局部影响、化重复、将逻辑与数据捆绑等原则同样是通用性的指导思想,比价值观更贴近编程场景,在价值观和模式之间搭建了桥梁。在77种实现模式中,每一种模式都覆盖了编写简洁、清晰、易扩展、易维护的代码这一原则的某个方面。它们为日常的编程提供了丰富翔实的参考依据,并告诉大家这些代码如何为降低沟通成本和提高有效产出提供保障。 本书适用于各个阶段的开发者群体。刚刚涉足软件开发领域的新人能够透过大师的眼睛来看待编程,了解编程的价值观与原则;具有丰富经验的资深工程师则可以通过这些模式进行反思,探究成功实践背后的意义。把价值观、原则和开发
《智慧云数据中心》对现阶段转型大背景下数据中心的部署、运营、管理和演进进行了清晰的阐述,并结合IBM 公司大量的一线实践案例,分析、总结了在数据中心整个生命周期内的常见问题,提出了对应的解决方案,而且在前一本《智慧数据中心》的基础上充实了云数据中心、技术发展趋势、数据中心基础设施可靠运营和管理服务等内容,具有很高的理论和实践价值。 《智慧云数据中心》帮助企业管理人员和技术人员,在资源有限的情况下化地利用好数据中心,引进新技术和新的运营模式,提高效率,灵活支撑业务发展,并帮助他们更透彻地理解数据中心未来的发展趋势,及早做出积极的准备。
如果你是一位在校大学生,对大数据感兴趣,也知道使用的企业越来越多,市场需求更是日新月异,但苦于自己基础不够,心有余而力不足;也看过不少大数据方面的书籍、博客、视频等,但感觉进步不大;如果你是一位在职人员,但目前主要使用传统技术,虽然对大数据很有兴趣,也深知其对未来的影响,但因时间不够,虽有的基础,常常也是打两天鱼、晒三天网,进展不是很理想。如果你有上述疑惑或遇到相似问题,本书正好比较适合你。本书从OpenStack云平台搭建、软件部署、需求开发实现到结果展示,以纵向角度讲解了生产性大数据项目上线的整个流程;以完成一个实际项目需求贯穿各章节,讲述了Hadoop生态圈中互联网爬虫技术、Sqoop、Hive、HBase组件协同工作流程,并展示了Spark计算框架、R制图软件和SparkRHive组件的使用方法。
随着大数据研究热潮的兴起,各种数据可视化图表层出不穷,大数据生动呈现就成为了具有挑战性的工作,随之出现了大量的可视化软件。本书是基于行业占有率比较高的Microsoft Power BI近期新版本所编写的,详细介绍Microsoft Power BI的数据可视化功能,包括数据类型和运算符、软件的安装、连接数据源、数据基础操作、可视化设计原则、可视化图表、自定义可视化效果、报表、仪表板、查询编辑器、运行R脚本、数据不错操作、数据分析表达式、网页流量数据分析、超市运营数据分析、Power BI移动应用和Power BI应用开发等内容。
本手册主要讲解数据备份、恢复和数据加密解密等方面的内容。本手册从各种不同的用户角度出发,从问题本身着手,从数据恢复与加密技术基本知识,到一般数据文化丢失、损坏的拯救、硬盘系统的数据恢复、特殊文件丢失后的拯救、数据的备份、常用软件的备份和恢复、BIOS和注册的备份与恢复,再到具体的数据加密技巧和数据安全防范措施等。全手册贯穿数据安全这一主题,并从数据拯救与数据加密两个层面对其进行具体阐述、剖析与实用操作的介绍,力图让读者在了解相关知识的基础上,全面掌握各种操作实践与技巧经验,轻松搞定数据安全!
本书汇集了作者有关数据库管理的真知灼见,讲述了dba 的方方面面,有技术的,还有生活的。作者本人不仅专业技术过硬,还当过篮球教练,对人生,尤其是dba 的生存之道有很独到的领悟。书中语言浅显易懂,生动 幽默,还配有多个技术审稿人的精彩评注。这些评注与作者的文字相辅相成,和而不同,因此本书可谓是博采众家之长,值得一读。 本书为dba 量身订做。如果你是dba,那么不可错过;如果你有意成为dba,或者想了解dba 的生存之道,本书同样适合你。
《洞见数据价值:大数据挖掘要案纪实》是国际知名咨询公司毕马威的大数据团队的集大成之作,内容丰富,观点新颖,贴近大众生活、工作与学习实际场景,内容不拘泥于技术阐释,通过寓教于乐的方式,以丰富翔实的案例来解析大数据挖掘,尽量通过常见的场景来阐述数据的价值与意义。章介绍大数据在银行业、征信业、审计、传统制造业、互联网行业、舆情监控、影视业、环保产业以及体育产业等多个领域的应用方案和前景。第2章重点介绍大数据分析在商业工作和营销推广中的作用。第3章介绍大数据挖掘过程中涉及的数据的前期准备工作,重点介绍数据准备工作的要点和诀窍。第4章结合业务、生活、娱乐,寓教于乐,介绍大数据的实际应用方式。附录部分介绍一位数据工作者的成长之路,向感兴趣的读者介绍从事数据工作应该具备的素质和掌握的技能。《
本书对常用的数据结构做了系统的介绍,既注重原理又强调实践,配有大量的图表和习题,概念讲解清晰、逻辑性强、可读性好。主要内容包括:数据结构的基本概念;算法描述和算法分析初步;线性表栈、队列、串和广义表、树、图等结构:排序和查找的各种方法。每章均例举了典型应用实例,并配有算法和相应源程序以供教学和实践使用。另外还在附录中设计了上机实验题供读者独立完成,以加深读者对所学知识的理解和应用。 作为“21世纪计算机系列规划教材”之一,本书可作为高等院校应用型本科及高职高专院校计算机专业教材,也可以作为大学非计算机专业学生的选修课教材和广大从事计算机应用的科技人员的参考书。
数据分析实战 由实战经验丰富的两位数据分析师执笔,数据分析实战 首先介绍了商业领域里通用的数据分析框架,然后根据该框架,结合8个真实的案例,详细解说了通过数据分析解决各种商业问题的流程,让读者在解决问题的过程中学习各种数据分析方法,包括柱状图、交叉列表统计、A B测试、多元回归分析、逻辑回归分析、聚类、主成分分析、决策树分析、机器学习等。特别是书中使用的数据都是未经清洗的原始数据,对如何加工数据以用于数据分析也进行了详细的介绍。读者可以使用R语言实际操作数据,体验真实的数据分析流程,避免纸上谈兵。
本书是安徽省高等学校“十一五”省级规划教材。 全书较全面地介绍了数据库系统的基本原理、设计和应用技术。内容包括数据库基础知识、关系数据模型、关系数据库语言SQL、关系数据库理论、关系数据库设计和应用系统开发、数据库的安全性与完整性、并发控制、数据库故障恢复技术和数据库新技术。 本书以学习数据库理论基础、培养数据库应用并发能力为目标,以大型数据库系统Oracle为实例贯穿全书。在重视学习数据库基本原理的基础上,突出了实用技术的学习,各章都备有适量的例题和习题。 本书既可以作为高等院校计算机、软件工程、信息管理与信息系统等工科类相关专业数据库课程的教材,也可供从事计算机软件以及数据库应用、管理和开发的工程技术人员阅读参考。
MongoDB如何帮你管理通过Web应用收集的海量数据呢?通过本书的解读,你会了解面向文档数据库的诸多优点,会发现MongoDB如此稳定、性能优越甚至能够无限水平扩展背后的原因。 本书的两位作者均来自开发并支持开源数据库MongoDB的公司10gen。数据库开发人员可将此书作为参考指南,系统管理员可以从本书中找到配置技巧,其他用户可以了解一些基本概念和用例。你会发现,将数据组织成自包含的JSON风格的文档比组织成关系型数据库中的记录要容易得多。
本书主要介绍了数据库系统的基本概念,包括数据库设计、数据库语言和系统实现。第4版中扩展了ER模型、SQL、数据仓库、OLAP、数据挖掘的内容,新增了XML、数据库管理、应用开发等章节,更新并扩展了信息检索部分。本书可作为三、四年级本科生一年级研究生的数据库课程的教材,同时,可供数据库领域的技术人员参考。涵盖了数据模型、基本对象的系统和XML、数据库存储和检索、事务处理、 数据库系统体系结构等多方面的内容,采用直观的方式描述所有概念,并以结构清晰的图示和例子代替形式化的证明,以银行数据库实例生动地解释重要概念,增强了本书的易读性。
数据库管理已经从一种专门的计算机应用发展为现代计算环境中的一个核心部分,因此,有关数据库系统的知识已成为计算机科学教育的基本部分。《数据库系统概念(第5版)(影印版)》介绍了数据库管理的基本概念,包括数据库设计、数据库语言和数据库系统实现。《数据库系统概念(第5版)(影印版)》可作为本科三年级或四年级的数据库入门教材,也可作为研究生一年级的教材。除了具有可作为入门课程的基本内容外,《数据库系统概念(第5版)(影印版)》还包括可作为课程补充的内容或课程的入门性材料。书中的基本概念和算法通常基于已有的商品化或实验用的数据库系统中的概念和算法。我们的目的是以一种一般化的形式来描述这些概念和算法,而不是与某种特定的数据库联系在一起。特定数据库系统的细节在第9章“实例研究”中讨论。
随着大数据研究热潮的兴起,各种数据可视化图表层出不穷,大数据生动呈现就成为了具有挑战性的工作,随之出现了大量的可视化软件。本书是基于行业占有率比较高的Microsoft Power BI近期新版本所编写的,详细介绍Microsoft Power BI的数据可视化功能,包括数据类型和运算符、软件的安装、连接数据源、数据基础操作、可视化设计原则、可视化图表、自定义可视化效果、报表、仪表板、查询编辑器、运行R脚本、数据不错操作、数据分析表达式、网页流量数据分析、超市运营数据分析、Power BI移动应用和Power BI应用开发等内容。
本书提供了一种简单、高效、通用的关系型数据库索引设计方法。作者通过系统的讲解及大量的案例清晰地阐释了关系型数据库的访问路径选择原理,以及表和索引的扫描方式,详尽地讲解了如何快速地估算SQL运行的CPU时间及执行时间,帮助读者从原理上理解SQL、表及索引结构、访问方式等对关系型数据库造成的影响,并能够运用量化的方法进行判断和优化,指导关系型数据库的索引设计。
在本书中,作者将自己多年形成的编程习惯以及阅读既有代码的体验凝练成了编程中的价值观、原则和77种实现模式。 沟通、简单和灵活的价值观应当被所有开发人员所铭记。局部影响、化重复、将逻辑与数据捆绑等原则同样是通用性的指导思想,比价值观更贴近编程场景,在价值观和模式之间搭建了桥梁。在77种实现模式中,每一种模式都覆盖了编写简洁、清晰、易扩展、易维护的代码这一原则的某个方面。它们为日常的编程提供了丰富翔实的参考依据,并告诉大家这些代码如何为降低沟通成本和提高有效产出提供保障。 本书适用于各个阶段的开发者群体。刚刚涉足软件开发领域的新人能够透过大师的眼睛来看待编程,了解编程的价值观与原则;具有丰富经验的工程师则可以通过这些模式进行反思,探究成功实践背后的意义。把价值观、原则和开发实践
《洞见数据价值:大数据挖掘要案纪实》是国际知名咨询公司毕马威的大数据团队的集大成之作,内容丰富,观点新颖,贴近大众生活、工作与学习实际场景,内容不拘泥于技术阐释,通过寓教于乐的方式,以丰富翔实的案例来解析大数据挖掘,尽量通过常见的场景来阐述数据的价值与意义。章介绍大数据在银行业、征信业、审计、传统制造业、互联网行业、舆情监控、影视业、环保产业以及体育产业等多个领域的应用方案和前景。第2章重点介绍大数据分析在商业工作和营销推广中的作用。第3章介绍大数据挖掘过程中涉及的数据的前期准备工作,重点介绍数据准备工作的要点和诀窍。第4章结合业务、生活、娱乐,寓教于乐,介绍大数据的实际应用方式。附录部分介绍一位数据工作者的成长之路,向感兴趣的读者介绍从事数据工作应该具备的素质和掌握的技能。《