如果你是一位在校大学生,对大数据感兴趣,也知道使用的企业越来越多,市场需求更是日新月异,但苦于自己基础不够,心有余而力不足;也看过不少大数据方面的书籍、博客、视频等,但感觉进步不大;如果你是一位在职人员,但目前主要使用传统技术,虽然对大数据很有兴趣,也深知其对未来的影响,但因时间不够,虽有的基础,常常也是打两天鱼、晒三天网,进展不是很理想。如果你有上述疑惑或遇到相似问题,本书正好比较适合你。本书从OpenStack云平台搭建、软件部署、需求开发实现到结果展示,以纵向角度讲解了生产性大数据项目上线的整个流程;以完成一个实际项目需求贯穿各章节,讲述了Hadoop生态圈中互联网爬虫技术、Sqoop、Hive、HBase组件协同工作流程,并展示了Spark计算框架、R制图软件和SparkRHive组件的使用方法。
本书重点介绍了基础设施运维概念以及如何进行规范操作,实用性高,可操作性强。主要内容如下。章总则部分,定义了规程中用到的术语、编写原则、适用范围。第2章对数据中心运维组织、人员、基本制度、运维流程进行了描述。第3~9章重点描述了高低压变配电系统、发电机组、UPS、直流系统、蓄电池组、冷水型制冷系统、直接膨胀式空调、新风自然冷系统、普通空调、制冷自控系统BA、动力环境监控系统、防雷接地系统、综合布线、安防系统和消防系统的维护技术和维护周期要求。本书旨在指导、规范和帮助数据中心的业主和用户提升运营维护的质量和效率,降低运营维护成本,提高经济效益。本书适用于政府、公共事业、金融、互联网企业基础电信运营企业等数据中心基础设施的运维管理人员阅读。
本书以“PHP与MySQL高性能应用开发”为主题,选取了其中最为核心的实践进行讲解,是一个有十余年PHP开发经验的老程序员的经验总结。首先从语言层面总结了PHP编程中的一些疑点和难点,然后重点讲解了PHP的缓冲、网络编程、缓存技术、命令行、调试、测试、用户验证策略、代码重构等知识;然后重点讲解了MySQL的驱动、存储引擎、性能优化、memcached、Sphinx全文搜索引擎等重要主题。
数据分析实战 由实战经验丰富的两位数据分析师执笔,数据分析实战 首先介绍了商业领域里通用的数据分析框架,然后根据该框架,结合8个真实的案例,详细解说了通过数据分析解决各种商业问题的流程,让读者在解决问题的过程中学习各种数据分析方法,包括柱状图、交叉列表统计、A B测试、多元回归分析、逻辑回归分析、聚类、主成分分析、决策树分析、机器学习等。特别是书中使用的数据都是未经清洗的原始数据,对如何加工数据以用于数据分析也进行了详细的介绍。读者可以使用R语言实际操作数据,体验真实的数据分析流程,避免纸上谈兵。
本书以“PHP与MySQL高性能应用开发”为主题,选取了其中最为核心的实践进行讲解,是一个有十余年PHP开发经验的老程序员的经验总结。首先从语言层面总结了PHP编程中的一些疑点和难点,然后重点讲解了PHP的缓冲、网络编程、缓存技术、命令行、调试、测试、用户验证策略、代码重构等知识;然后重点讲解了MySQL的驱动、存储引擎、性能优化、memcached、Sphinx全文搜索引擎等重要主题。
数据分析实战 由实战经验丰富的两位数据分析师执笔,数据分析实战 首先介绍了商业领域里通用的数据分析框架,然后根据该框架,结合8个真实的案例,详细解说了通过数据分析解决各种商业问题的流程,让读者在解决问题的过程中学习各种数据分析方法,包括柱状图、交叉列表统计、A B测试、多元回归分析、逻辑回归分析、聚类、主成分分析、决策树分析、机器学习等。特别是书中使用的数据都是未经清洗的原始数据,对如何加工数据以用于数据分析也进行了详细的介绍。读者可以使用R语言实际操作数据,体验真实的数据分析流程,避免纸上谈兵。
《SQL即查即用》从实用角度出发,由浅入深地讲解了SQL的基本概念、常用语法和操作技术。全书共24章,包括数据的简单查询、条件查询、模糊查询、过滤数据以及数据排序、分组、统计等内容,还包括子查询、多表连接、数据的增删改查、视图、存储过程、游标、事务处理以及数据库和数据表的管理等高级技术。包括200多个SQL语法,200多个应用示例。有很强的实用性和可操作性,既适合作为SQL初学者的学习用书,又适合作为程序开发人员和数据库管理人员随时查阅的参考工具书。 为便于读者对SQL语法的理解,书中所有知识点和语法都结合具体示例进行讲解,并以对比图方式鲜明直观地展示数据变化,帮助读者快速掌握实际操作技巧,学以致用。书中还设置了注意、说明、常见错误、多学两招等贴心栏目,及时指出注意事项并给出相应的解决方案,帮助读者避开学
本书紧扣“大数据”这一时代主题,着眼于侦查领域大数据运用在法律研究方面的空白,构建起包括思维、模式、方法等全方位的大数据侦查体系,同时对大数据侦查可能产生的法律问题进行探讨,为侦查实务中大数据的运用提供方法、法律理论及程序上的指导。
本书结合理论和实践,由浅入深,多方面介绍了Hadoop这一高性能的海量数据处理和分析平台。全书5部分24章,第Ⅰ部分介绍Hadoop基础知识,主题涉及Hadoop、MapReduce、Hadoop分布式文件系统、YARN、Hadoop的I/O操作。第Ⅱ部分介绍MapReduce,主题包括MapReduce应用开发;MapReduce的工作机制、MapReduce的类型与格式、MapReduce的特性。第Ⅲ部分介绍Hadoop的运维,主题涉及构建Hadoop集群、管理Hadoop。第Ⅳ部分介绍Hadoop相关开源项目,主题涉及Avro、Parquet、Flume、Sqoop、Pig、Hive、Crunch、Spark、HBase、ZooKeeper。第Ⅴ部分提供了三个案例,分别来自医疗卫生信息技术服务商塞纳(Cerner)、微软的人工智能项目ADAM(一种大规模分布式深度学习框架)和开源项目Cascading(一个新的针对MapReduce的数据处理API)。本书是一本很好不错、全面的Hadoop参考书和工具书,阐述了Hadoop生态圈的很新发展和应用,程序员可以
本书瞄准云计算和大数据产业,论述云计算环境下的数据治理成熟度模型规范,为用户提供通用的数据治理模型方法;针对靠前外市场对云端数据治理的迫切需求,给云端数据治理的用户提供很好实践方法;给出云端数据治理成熟度的评估方法和流程,帮助用户开展云端数据治理成熟度评估并实现用户的数据治理成熟度持续改进;进行云端数据治理示例分析,对云端数据治理成熟度应用和评估方法予以说明,并给出实施方法和应用步骤。
本书用最轻松的图解方式来讲解数据结构,全书采用丰富的图例阐述数据结构的基本概念及应用,并将重要理论、演算方法做最详细的诠释与举例,是一本兼具内容及专业的数据结构的教学用书。由于作者长期从事信息教育及写作,在文字的表达上简洁明了、逻辑清晰,并安排了大量的习题,供读者检验学习成果。
数据分析实战 由实战经验丰富的两位数据分析师执笔,数据分析实战 首先介绍了商业领域里通用的数据分析框架,然后根据该框架,结合8个真实的案例,详细解说了通过数据分析解决各种商业问题的流程,让读者在解决问题的过程中学习各种数据分析方法,包括柱状图、交叉列表统计、A B测试、多元回归分析、逻辑回归分析、聚类、主成分分析、决策树分析、机器学习等。特别是书中使用的数据都是未经清洗的原始数据,对如何加工数据以用于数据分析也进行了详细的介绍。读者可以使用R语言实际操作数据,体验真实的数据分析流程,避免纸上谈兵。
在信息技术革命之后,我们将迎来数据革命。在大数据的概念、性质和价值已得到政府和社会的认可之后,大家关注的是数据如何获取,以及有了数据以后如何挖掘数据的价值。仅适合特定行业、满足特定需求的技术不足以应对一场革命,大数据不但是超出计算机软硬件处理的能力,更是超出人类的认知能力。只有实现对数据的认知,利用数据辅助决策,才是适合不同行业数据价值实现的通用手段。本书描述了数据革命的起源、实现的思路、所用的技术和要达到的目标,针对当今社会热点描述了在数据时代的应对之策。本书宏观和微观、人文和技术、启迪思想和关注实用并举,既适合宏观层面的领导启迪思维,提出工作目标,又适合微观层次的执行人员找到实现的方法和路径。本书介绍的理论和技术均可在智慧城市、智能制造领域实际使用。本书适合政府、企业决