在全世界不同的文化中,数据的收集与组织都有着悠久的历史,甚至在计算机思想出现之前很久就已存在。但只是到了互联网时代,日常产生的数据量才开始变得 巨大,而且继续呈指数级增长,其中包括我们上传的文件、视频、照片、社交媒体信息、在线购物,甚至我们汽车的GPS导航数据。大数据这一术语所代表的不仅仅是一种量变,而是一种质变;其所指涉的不仅是新的技术,还有企业和政府利用它的方式。霍尔姆斯基于统计学、概率论和计算机科学,对大数据这一主题进行了概要性探讨,并强调指出,大数据不仅改变了商业的运营模式,而且改变了医疗研究的进行方式。与此同时,它也引起了一些重要的伦理问题,作者据此对斯诺登事件、数据安全,以及家庭智能设备可能被黑客挟持等实例进行了讨论。
《洞见数据价值:大数据挖掘要案纪实》是国际知名咨询公司毕马威的大数据团队的集大成之作,内容丰富,观点新颖,贴近大众生活、工作与学习实际场景,内容不拘泥于技术阐释,通过寓教于乐的方式,以丰富翔实的案例来解析大数据挖掘,尽量通过常见的场景来阐述数据的价值与意义。章介绍大数据在银行业、征信业、审计、传统制造业、互联网行业、舆情监控、影视业、环保产业以及体育产业等多个领域的应用方案和前景。第2章重点介绍大数据分析在商业工作和营销推广中的作用。第3章介绍大数据挖掘过程中涉及的数据的前期准备工作,重点介绍数据准备工作的要点和诀窍。第4章结合业务、生活、娱乐,寓教于乐,介绍大数据的实际应用方式。附录部分介绍一位数据工作者的成长之路,向感兴趣的读者介绍从事数据工作应该具备的素质和掌握的技能。《
本书全面阐释了大数据的概念、相关的技术和应用的现状,使读者对大数据的相关技术、应用和产业链能有一个比较清晰的认识。 主要内容包括大数据概论、数据组织存储技术、NoSQL、Hadoop 和 MapRed
加速数字化转型,已经成为新时期组织生存和发展的必然选择。针对组织推进数字化转型过程中普遍面临的战略不明确、路径不清晰、过程方法缺失、价值难获取等共性问题和挑战,本书系统提出了数字化转型的体系架构和方法
本书以互联网企业中常见数据运营场景为切入点,以工作中实际面临解决的问题为案例,从方法、技术、业务、实践4个维度讲述数据运营的场景及应用方式。书中从实践出发,结合工作中数据运营经验,以应用案例为主线,通过业务分析 代码实践这种更“接地气”的方式讲述数据的应用。书中对于搭建数据监控指标体系、数据分析、数据挖掘、ABTest、埋点策略、用户画像建模等常见数据运营方式做了详细的介绍。
本书瞄准云计算和大数据产业,论述云计算环境下的数据治理成熟度模型规范,为用户提供通用的数据治理模型方法;针对靠前外市场对云端数据治理的迫切需求,给云端数据治理的用户提供很好实践方法;给出云端数据治理成熟度的评估方法和流程,帮助用户开展云端数据治理成熟度评估并实现用户的数据治理成熟度持续改进;进行云端数据治理示例分析,对云端数据治理成熟度应用和评估方法予以说明,并给出实施方法和应用步骤。
本书主要内容包括:数据清洗在数据科学领域中的重要作用,文件格式、数据类型、字符编码的基本概念,组织和处理数据的电子表格与文本编辑器,各种格式数据的转换方法,解析和清洗网页上的HTML 文件的三种策略,提取和清洗PDF 文件中数据的方法,检测和清除RDBMS 中的坏数据的解决方案,以及使用书中介绍的方法清洗来自Twitter 和Stack Overflow 的数据。
本书提供了在线生产环境的PostgreSQL数据库的常见问题和故障快速解答,这些都基于作者作为PostgreSQL数据库培训师、用户和核心开发人员时的经验积累。每个技术都被拆分为小的方法或建议,先给出包含可工作代码的演示解决方案,然后解释这样做的原因及工作原理。本书意在成为新用户和技术专家的桌面参考手册。本书涵盖了PostgreSQL 9 所有的新功能。
本书从初学者易于理解的角度,以通俗易懂的语言、丰富的实例、简洁的图表、传统和现代数据特征的对比,将大数据这一计算机前沿科学介绍给读者。内容包括大数据概论、大数据采集及预处理、大数据分析、大数据数据可视化、Hadoop概论、HDFS和Common概论、MapReduce概论、NoSQL技术介绍、Spark概论、大数据相关案例等。
什么是“管理大数据”:管理大数据是指企业发展过程中不断出现和积累的,涉及战略、组织、人力资源、企业文化等专业领域的各项管理数据。众多企业的管理数据整合到一起,可以形成多生态跨产业链的垂直整合、横向共享的完整生态体系,具有“海量、人工智能”的特征。中源数聚北京信息科技有限公司著,王吉鹏主编的《管理大数据RBD(从CI\BI到AI)》介绍了管理大数据的优势:丰富性:管理数据覆盖行业范围广,维度丰富,数据量巨大。完整性:管理数据涵盖企业战略描述、组织信息、管理制度、企业文化、管理变革过程记录等,数据完整。连续性:管理数据记录周期长、延续性好。实效性:管理数据为组织变革提供及时有效的支撑。
随着互联网的发展,近年来关于Web数据挖掘的研究方兴未艾,加之多年从事数据挖掘方面的教学工作,笔者一直希望撰写一本这方面的书,以飨读者,其目的就是作为想了解和进人Web数据挖掘研究和实践领域的工作者的“他山之石”,帮助他们把握本领域的全貌,掌握研究和解决Web数据挖掘问题的切入点。 伴随互联网的应用,社区、论坛、微博上留下了浩瀚的数据信息,这些数据蕴藏着巨大的商机和社会价值。与此同时,Web上信息爆炸与知识贫乏的矛盾依然存在,如何在海量的Web数据中发现知识,并用于社会实践,仍然是亟待解决的问题。
现在人们已经意识到数据可以让选举或者商业模 式变得不同,数据科学作为一项职业正在不断发展。 但是你应该如何在这样一个广阔而又错综复杂的交叉 学科领域中开展工作呢?舒特、奥尼尔著的《数据科 学》这本书将会告诉你所需要了解的一切。 它富有深刻见解,是根据哥伦比亚大学的数据科学课 程的讲义整理而成。
世界上的大部分领域实际上都可以建模成图,而软件开发人员或是数据库管理人员却在辛辛苦苦地将这些图转化成关系型数据库中的表。想象一下,假如你再也不用去做这样的转化,假如数据库的迁移可以变得轻松简单,你愿意去接受一个全新的数据库吗?图数据库就是这样一个完全不同于关系型数据库的新型数据库,它处理的是大规模的数据和不断变化的需求,并且拥抱它们。 本书系统地介绍了图数据库的历史由来、建模方法、工作原理和一些真实的用户用例,详细地说明了图数据解决的是什么样的问题,并以Neon4j数据库和Cypher查询语言为例,阐述了图数据库的建模方法和领域用例,还介绍了图数据库的工作原理以及一些实用的图论算法。 本书的三位作者均为Neo4j Technology公司的技术高手,分别为工程师、CTO和CEO。他们对图数据库及其解决方案有丰富的
本书从初学者易于理解的角度,以通俗易懂的语言、丰富的实例、简洁的图表、传统和现代数据特征的对比,将大数据这一计算机前沿科学介绍给读者。内容包括大数据概论、大数据采集及预处理、大数据分析、大数据数据可视化、Hadoop概论、HDFS和Common概论、MapReduce概论、NoSQL技术介绍、Spark概论、大数据相关案例等。
本书以实用的、可操作的视角解释了大数据——采用黑猩猩和大象的隐喻,基于棒球统计数据集,使用Apache Hadoop和Pig等工具展示了如何处理大规模数据。此外,通过处理真实数据、解决现实问题,作者还以实例的形式总结了一些实践分析模式,为有创造力的分析人员提供了大、最有价值的方法。本书特别适合那些需要大数据工具箱来解决实际问题的人们。
WEB DB%26nbsp;PRESS是日本主流的计算机技术杂志,旨在帮助程序员更实时、深入地了解前沿技术,扩大视野,提升技能。内容侧重于Web开发的相关技术。本期的主题分为3%26nbsp;
“这本书对的深度学习方法及应用进行了全面的概述,不仅包括自动语音识别(ASR),还包括计算机视觉、语言建模、文本处理、多模态学习以及信息检索。在深度学习这一领域,这是本,也是最有价值的一本书,能使读者对这一领域进行广泛而深入的学习。深度学习对信息处理的很多方面(尤其对语音识别)都具有重大的影响,甚至对整个科技领域的影响也不容忽视。因此,对于有意了解这一领域的学者,这本书是不容错过的。” —— Sadaoki Furui,芝加哥技术研究院院长,日本东京工业大学教授
当前不乏大数据具体技术组件的书籍,但却很少有从大数据平台整体建设和产品形态的宏观角度入手来阐释的。本书重点介绍大数据开发平台服务构建的整体思路和解决方案,内容涵盖一个成熟的大数据开发平台必不可少的各类核心组件:工作流调度系统、集成开发环境、元数据管理系统、数据交换服务、数据可视化服务、数据质量管理服务,以及测试环境的建设等。书中还凝结了作者多年平台建设的实践经验,以及对大数据相关从业人员能力建设和职业规划的宝贵建议。本书适合广大志在深入了解大数据平台建设、开发和应用的在职人员及院校师生。
本书提供了在线生产环境的PostgreSQL数据库的常见问题和故障快速解答,这些都基于作者作为PostgreSQL数据库培训师、用户和核心开发人员时的经验积累。每个技术都被拆分为小的方法或建议,先给出包含可工作代码的演示解决方案,然后解释这样做的原因及工作原理。本书意在成为新用户和技术专家的桌面参考手册。本书涵盖了PostgreSQL 9 所有的新功能。
世界上的大部分领域实际上都可以建模成图,而软件开发人员或是数据库管理人员却在辛辛苦苦地将这些图转化成关系型数据库中的表。想象一下,假如你再也不用去做这样的转化,假如数据库的迁移可以变得轻松简单,你愿意去接受一个全新的数据库吗?图数据库就是这样一个完全不同于关系型数据库的新型数据库,它处理的是大规模的数据和不断变化的需求,并且拥抱它们。 本书系统地介绍了图数据库的历史由来、建模方法、工作原理和一些真实的用户用例,详细地说明了图数据解决的是什么样的问题,并以Neon4j数据库和Cypher查询语言为例,阐述了图数据库的建模方法和领域用例,最后还介绍了图数据库的工作原理以及一些实用的图论算法。 本书的三位作者均为Neo4j Technology公司的技术高手,分别为工程师、CTO和CEO。他们对图数据库及其解决方案有丰