大数据是当前流行的热点概念之一,其已由技术名词衍生到对很多行业产生颠覆性影响的社会现象,作为明确的技术发展趋势之一,基于大数据的各种新型产品必将会对每个人的日常生活产生日益重要的影响。 张俊林著的这本《大数据日知录:架构与算法》从架构与算法的角度全面梳理了大数据存储与处理的相关技术。大数据技术具有涉及的知识点异常众多且正处于快速演进发展过程中等特点,其技术点包括底层的硬件体系结构、相关的基础理论、大规模数据存储系统、分布式架构设计、各种不同应用场景下的差异化系统设计思路、机器学习与数据挖掘并行算法以及层出不穷的新架构、新系统等。本书对众多纷繁芜杂的相关技术文献和系统进行了择优汰劣并系统性地对相关知识分门别类地进行整理和介绍,将大数据相关技术分为大数据基础理论、大数据系统体系结
10余位数据挖掘领域资深专家和科研人员,10余年大数据挖掘咨询与实施经验结晶。从数据挖掘的应用出发,以电力、航空、医疗、互联网、生产制造以及公共服务等行业真实案例为主线,深入浅出介绍Python数据挖掘建模过程,实践性极强。本书共15章,分两个部分:基础篇、实战篇。基础篇介绍了数据挖掘的基本原理,实战篇介绍了一个个真实案例,通过对案例深入浅出的剖析,使读者在不知不觉中通过案例实践获得数据挖掘项目经验,同时快速领悟看似难懂的数据挖掘理论。读者在阅读过程中,应充分利用随书配套的案例建模数据,借助相关的数据挖掘建模工具,通过上机实验,以快速理解相关知识与理论。基础篇(~5章),章的主要内容是数据挖掘概述;第2章对本书所用到的数据挖掘建模工具Python语言进行了简明扼要的说明;第3章、第4章、第5章对数据挖掘
本书系统介绍以太坊智能合约的开发,对智能合约相关知识进行全面梳理,尤其是对智能合约开发语言Solidity进行了详细解读,智能合约的开发者可以从书中获得一些启发和指导。本书可以作为一本案头手册,方便开发者在开发智能合约时随时查阅。
本书引入真实的案例, 以提供优质的数据分析服务、 撰写高质量的数据分析报告为目标。在阐述数据分析时, 力求以系统的观念从所研究主题的整体着眼, 综合不同的分析角度、 数据处理方式、 分析方法和分析工具, 以揭示数据更本质的特点和更深层次的规律。书中以实际案例为背景, 说明综合采用统计方法、 数据挖掘方法进行数据分析的主要问题。 本书适合学过数据分析基础知识的读者阅读,也可供大学生、初入数据分析职场人员、参与CDA考试的人员学习使用。
该书基于通用的Excel、 SPSS工具, 加上必知必会的数据分析概念, 以图文并茂、 理论与实操相结合的方式, 按照CDA人才培养考核要求进行编写。全书分为6章, 分别为数据分析概述、 数据收集与导入、 数据的清洗与预处理、 数据可视化呈现、 基础数据分析、 综合分析。本书适合数据分析零基础群体读者阅读, 也可供大学生、 初入数据分析职场人员、 参与CDA考试的人员学习使用。
本书主要讨论数据挖掘技术的基本原理与应用,可以解决企业运营中遇到的各种问题,并介绍了SQLServer 2005处理这些问题的方法。内容主要包括数据仓库、数据挖掘中的主要方法,SQLServer2005中的商业智能与数据挖掘功能、决策树模型、聚类分析、神经网络模型和时间序列模型等,并配有相关的范例分析与实例练习。 本书内容翔实,示例丰富,结构合理,可作为各类开发人员及企业管理人员的参考用书。
在信息技术革命之后,我们将迎来数据革命。在大数据的概念、性质和价值已得到政府和社会的认可之后,大家关注的是数据如何获取,以及有了数据以后如何挖掘数据的价值。仅适合特定行业、满足特定需求的技术不足以应对一场革命,大数据不但是超出计算机软硬件处理的能力,更是超出人类的认知能力。只有实现对数据的认知,利用数据辅助决策,才是适合不同行业数据价值实现的通用手段。本书描述了数据革命的起源、实现的思路、所用的技术和要达到的目标,针对当今社会热点描述了在数据时代的应对之策。本书宏观和微观、人文和技术、启迪思想和关注实用并举,既适合宏观层面的领导启迪思维,提出工作目标,又适合微观层次的执行人员找到实现的方法和路径。本书介绍的理论和技术均可在智慧城市、智能制造领域实际使用。本书适合政府、企业决
本书共分为三部分。理论篇重点介绍大数据时代下数据处理的基本理论及相关处理技术,并引入NoSQL数据库;系统篇主要介绍了各种类型NoSQL数据库基本知识;应用篇对外知名公司在利用NoSQL数据库在处理海量数据方面的应用做了阐述。本书对大数据时代面临的挑战,以及NoSQL数据库的基本知识做了清晰的阐述,有助于帮助读者整理思路,了解需求,并更有针对性、有选择的深入学习相关知识。