全书分为三大部分: 主要讨论有关增强数据密集型应用系统所需的若干基本原则。首先开篇第1章即瞄准目标:可靠性、可扩展性与可维护性,如何认识这些问题以及如何达成目标。第2章我们比较了多种不同的数据模型和查询语言,讨论各自的适用场景。接下来第3章主要针对存储引擎,即数据库是如何安排磁盘结构从而提高检索效率。第4章转向数据编码(序列化)方面,包括常见模式的演化历程。 我们将从单机的数据存储转向跨机器的分布式系统,这是扩展性的重要一步,但随之而来的是各种挑战。所以将依次讨论数据远程复制(第5章)、数据分区(第6章)以及事务(第7章)。接下来的第8章包括分布式系统的更多细节,以及分布式环境如何达成一致性与共识(第9章)。 主要针对产生派生数据的系统,所谓派生数据主要指在异构系统中,如果无法用一个数
《Hadoop海量数据处理》从Hadoop的基础知识讲起,逐步深入Hadoop分布式文件系统(HDFS)和MapReduce分布式编程框架的核心技术,帮助读者全面、系统、深入地理解Hadoop海量数据处理技术的精髓。本书在讲解技术原理时穿插大量的典型示例,并详解两个典型项目实战案例,帮助读者提高实际项目开发水平。 《Hadoop海量数据处理》共15章,分为4篇。第1篇Hadoop基础知识,包括大数据概述、Hadoop概述、Hadoop环境搭建与配置;第2篇Hadoop分布式存储技术,包括HDFS概述、HDFS基础操作、HDFS的读写原理和工作机制、Hadoop 3.x的新特性;第3篇MapReduce分布式编程框架,包括MapReduce概述、MapReduce开发基础、MapReduce框架的原理、MapReduce数据压缩、YARN资源调度器、Hadoop企业级优化;第4篇项目实战,包括Hadoop高可用集群搭建实战和统计TopN经典项目案例实战。 《Hadoop海量数据处理》通俗易懂、案
本书针对MySQL中高级用户,详细讲解MySQL高级使用技术。书中详解了每一个知识点以及数据库操作的方法和技巧。本书注重实战操作,帮助读者循序渐进地掌握MySQL中的各项高级技术。本书主要包括MySQL架构介绍、MySQL权限与安全、MySQL备份与还原、MySQL的高级特性、MySQL锁定机制、使用MySQLWorkbench管理数据库、SQL性能优化、MySQL服务器性能优化、MySQL性能监控、MySQLReplication、MySQLCluster实战、企业中MySQL的高可用架构实战。同时,本书还提供了所有示例的源码,读者可以直接查看和调用。本书适合有基础的MySQL数据库学习者,MySQL数据库开发人员和MySQL数据库管理人员,同时也能作为高等院校和培训学校相关专业师生的教学参考用书。
本书是《Oracle . Edwards技术与应用丛书》系列丛书的基础篇,全书共分五章,通过介绍信息化的概念和内容,从而引出企业信息化的ERP的概念,及在企业实现ERP的软件应用系统Oracle . Edwards EnterpriseOne系统。进而以企业应用. Edwards EnterpriseOne为主线,通过一些模拟企业的使用场景,让读者学习. Edwards EnterpriseOne的基本应用功能、财务、分销和生产管理的使用方法、. Edwards的项目实施方法学和. Edwards OBA(Oracle Business Accelerated )(Oracle业务加速器)。本书兼顾需要Oracle . Edwards EnterpriseOne知识的各类相关读者,它是Oracle . Edwards EnterpriseOne系统的入门指南,通过阅读本书,读者可以对E有一个直观和感性的认识。
米特尼克被称为“世界头号黑客”,传奇的人生成为业内和各大媒体津津乐道的话题。1995年联邦法院以25宗罪名起诉米特尼克,而且未经审判就将米特尼克关押了4年半,这是美国司法史上对一名高智商罪犯所采取的最严厉措施。 出狱之后米特尼克改邪归正,目前已经成为世界著名的白帽子黑客,用自己的经验来指导知名企业与组织增强他们的安全防护措施。 在《线上幽灵:世界头号黑客米特尼克自传》中,米特尼克回顾了自己的心路历程,令人眼花缭乱的各类大案要案,以及与警察和特工的“斗智斗勇”……跌宕起伏的情节,将读者带入一个完全不同的惊险世界!
本书通过详细的示例、样本数据集、代码和图形教程,说明了如何:1为每个问题使用合适类型的图2快速、高效且正确地收集、清洗和组织数据3为高可读性设置可视化格式,而不损失精确性4掌握允许更深入地探索和解释数据的工具5使用少量轻量级编程创建自定义可视化6选择有效的图分析技术来从数据中提取出多信息7使用高级的可视化技术,包括动态图、大数据工具和查询。
当代商业和科学领域大量激增的数据量要求我们采用更加复杂和精细的工具来进行数据分析、处理和挖掘。尽管近年来数据挖掘技术取得的长足进展使得我们广泛收集数据越来越容易,但技术的发展依然难以匹配爆炸性的数据增长以及随之而来的大量数据处理需求,因此我们比以往更加迫切地需要新技术和自动化工具来帮助我们将这些数据转换为有用的信息和知识。 本书前版曾被KDnuggets的读者评选为欢迎的数据挖掘专著,是一本可读性的。它从数据库角度全面系统地介绍数据挖掘的概念、方法和技术以及技术研究进展,并重点关注近年来该领域重要和的课题数据仓库和数据立方体技术,流数据挖掘,社会化网络挖掘,空间、多媒体和其他复杂数据挖掘。每章都针对关键专题有单独的指导,提供算法,并对怎样将技术运用到实际工作中给出了经过实践检验的实
数据科学家是指采用科学方法、运用数据挖掘工具寻找新的数据洞察的工程师,他们往往集技术专家和数据分析师的角色于一身。在IT行业中,数据科学家将在创造力、沟通能力以及与商业世界的联系方面得到更多的锻炼机会,是当前非常有发展潜力的新兴职位。本书全面介绍了成为数据科学家应当了解的各类知识。全书共分18章,首先介绍了数据科学与大数据、数据科学的重要性,接着介绍了数据科学家的类型、思维体系、技术资质、经验、社交圈、所用的软件、学习新知和解决问题,另外还介绍了机器学习与R语言平台、数据科学的处理流程、所需的具体技能,介绍了数据科学求职、自我展示并提供了一些有关职业数据科学家和数据科学家的案例学习。本书内容全面、轻松易读,非常适合从事数据科学相关工作的读者阅读,是一本可以住读者应聘数据科学家职位