本书以大数据发展的历史、特征、发展趋势为切入点,介绍了大数据产业的背景、大数据的显著特征、大数据的构成以及大数据带来的机遇与挑战,重点介绍了大数据采集、存储、管理及数据分析与挖掘的前沿技术,并分析了大数据在各行各业及政府机构间的具体应用案例,阐明了大数据对指导实际工作与生活的现实意义与作用。本书系作者根据自己多年的研究教学经验编著而成,结构体系科学,内容全面合理,理论联系实际,案例丰富,有助于广大读者理解大数据的基本内容、核心技术、使用机制等。
在全世界不同的文化中,数据的收集与组织都有着悠久的历史,甚至在计算机思想出现之前很久就已存在。但只是到了互联网时代,日常产生的数据量才开始变得 巨大,而且继续呈指数级增长,其中包括我们上传的文件、视频、照片、社交媒体信息、在线购物,甚至我们汽车的GPS导航数据。大数据这一术语所代表的不仅仅是一种量变,而是一种质变;其所指涉的不仅是新的技术,还有企业和政府利用它的方式。霍尔姆斯基于统计学、概率论和计算机科学,对大数据这一主题进行了概要性探讨,并强调指出,大数据不仅改变了商业的运营模式,而且改变了医疗研究的进行方式。与此同时,它也引起了一些重要的伦理问题,作者据此对斯诺登事件、数据安全,以及家庭智能设备可能被黑客挟持等实例进行了讨论。
《洞见数据价值:大数据挖掘要案纪实》是国际知名咨询公司毕马威的大数据团队的集大成之作,内容丰富,观点新颖,贴近大众生活、工作与学习实际场景,内容不拘泥于技术阐释,通过寓教于乐的方式,以丰富翔实的案例来解析大数据挖掘,尽量通过常见的场景来阐述数据的价值与意义。章介绍大数据在银行业、征信业、审计、传统制造业、互联网行业、舆情监控、影视业、环保产业以及体育产业等多个领域的应用方案和前景。第2章重点介绍大数据分析在商业工作和营销推广中的作用。第3章介绍大数据挖掘过程中涉及的数据的前期准备工作,重点介绍数据准备工作的要点和诀窍。第4章结合业务、生活、娱乐,寓教于乐,介绍大数据的实际应用方式。附录部分介绍一位数据工作者的成长之路,向感兴趣的读者介绍从事数据工作应该具备的素质和掌握的技能。《
《洞见数据价值:大数据挖掘要案纪实》是国际知名咨询公司毕马威的大数据团队的集大成之作,内容丰富,观点新颖,贴近大众生活、工作与学习实际场景,内容不拘泥于技术阐释,通过寓教于乐的方式,以丰富翔实的案例来解析大数据挖掘,尽量通过常见的场景来阐述数据的价值与意义。章介绍大数据在银行业、征信业、审计、传统制造业、互联网行业、舆情监控、影视业、环保产业以及体育产业等多个领域的应用方案和前景。第2章重点介绍大数据分析在商业工作和营销推广中的作用。第3章介绍大数据挖掘过程中涉及的数据的前期准备工作,重点介绍数据准备工作的要点和诀窍。第4章结合业务、生活、娱乐,寓教于乐,介绍大数据的实际应用方式。附录部分介绍一位数据工作者的成长之路,向感兴趣的读者介绍从事数据工作应该具备的素质和掌握的技能。《
《数据库设计与关系理论》中,关系数据库领域的泰斗C.ate用超过40年的经验证明了为什么恰当的数据库设计是非常关键的,他用数据库设计者和开发者可以轻松理解的方式介绍了设计理论,弥补了其他图书的空缺。《数据库设计与关系理论》每章都包括一组习题,它们要么展示在实践中如何应用理论,提供更多的信息,要么要求你证明一些简单的理论结果。如果你是一位熟悉关系模型的数据库专业人员,并对数据库设计有非凡的兴趣,那么《数据库设计与关系理论》正是为你准备的。
本书主要内容包括:数据清洗在数据科学领域中的重要作用,文件格式、数据类型、字符编码的基本概念,组织和处理数据的电子表格与文本编辑器,各种格式数据的转换方法,解析和清洗网页上的HTML 文件的三种策略,提取和清洗PDF 文件中数据的方法,检测和清除RDBMS 中的坏数据的解决方案,以及使用书中介绍的方法清洗来自Twitter 和Stack Overflow 的数据。
本书全面阐释了大数据的概念、相关的技术和应用的现状,使读者对大数据的相关技术、应用和产业链能有一个比较清晰的认识。 主要内容包括大数据概论、数据组织存储技术、NoSQL、Hadoop 和 MapRed
互联网的蓬勃发展,业务驱动技术不断升级,在系统越来越庞大,技术越来越复杂,应用部署集群化,所有压力指向数据库,数据量巨大,数据库优化也到极限了,数据库的运维难以为继,在这种情况下,分布式数据库似乎成为的解决方案。为了解决传统数据库的分布式化这个技术难题,各种数据库中间件应运而生,从早期的Amoeba、TDDL、Cobar,到如今的Mycat,技术日新月异,发展迅猛。Mycat已经成为了一个强大的开源分布式数据库中间件产品。面对企业应用的海量数据事务处理,是目前的开源解决方案。支持多种数据库,开发活跃,已有数百个项目使用,预期Mycat的采用将有爆发式增长趋势。所以Mycat开源社区核心开发者共同撰写了本书,帮助企业更好的使用Mycat中间件架构企业分布式数据库系统。