你是否在寻找一本完整介绍Python操纵、处理、提取和压缩结构化数据的指南?本书包含了许多实例分析,通过若干个Python库——包括NumPy,pandas,matplotlib和IPython——为你展示了如何高效地解决大量数据分析的问题。《Python数据分析()》由麦金尼撰写,他是pandas库的主要作者。本书也是一本具有实践性的指南,指导那些使用Python进行科学计算的数据密集型应用。它适用于刚刚开始使用Python的分析师,或者是进入科学计算领域的Python程序员。使用IPyth1on交互式shell作为你的主要开发环境学习NumPy(NumericalPython)的基础和高级特性接触patldas库中的数据分析工具。《Python数据分析()》内容:使用高性能工具来加载、抽取、转换、合并和改造数据使用matplotlib来创建散点图和静态或者交互式可视化数据运用pandas的groupby功能来对数据集进行切片、切块和汇总通过具体实例来学
空间数据库是近年的热点研究领域,是一门前沿的交叉学科。本书全面介绍了空间数据库的概念、应用领域、查询语言、空间数据的索引和存储机制、空间查询处理和优化等内容,对空间数据挖掘和空间数据仓库也有精彩的论述。本书条理清晰,叙述严谨,实例丰富,曾得到业内权威人士的赞誉。本书的每章之后都附有习题,帮助读者检验学习效果。本书既适合作为计算机及相关专业的本科生、研究生的,也适合IT业的研究人员、技术人员阅读。对于想了解空间数据库的初学者来说,本书也是一本极有价值的参考书。
本书是《SAP HANA实战》的兄弟篇,也是其进一步的延续和深入。本书是一本面向应用开发的纯技术书,瞄准基于SAP HANA原生应用开发的所有细节内容,囊括所有与SAP HANA、XS、UI5、HANA原生应用开发相关的内容。 本书逻辑上可分成五个部分,读者可以根据下面的简介来选择性阅读。 部分:包含~2章,主要讲解SAP HANA应用服务器的各个组件、原生项目的开发架构、SAP HANA工作台的主要操作、创建用户、创建表、赋予权限等。 第二部分:包含第3~4章,主要介绍信息建模的基础和高级特性、以及SQLScript,和存储过程的相关知识。这部分内容相对独立而且好上手,已经熟悉这些内容的读者可跳过本章节,但是在后续的XS项目示例中,我们会应用到这部分所介绍的知识。 第三部分:包含第5~8章,讲解了HANA原生应用开发过程涉及的绝大部分内容,包含XS项目的
随着用户对国产数据库了解的加深,信息化和工业化融合加深,用户软件知识产权保护意识和信息化成本意识的加强,国产数据库市场机遇越来越大。发展国产数据库体现了国家战略,国家自主创新、正版化和国家信息安全等政策将为国产数据库带来发展机遇。何清法、王澍丰、顾云苏、冯柯、刘峰主编的《国产神通数据库教程》帮助读者了解神通数据库,介绍数据库基础与神通数据库体系结构以及数据库管理。
《Hive编程指南》是一本Apache Hive的编程指南,旨在介绍如何使用Hive的SQL方法HiveQL来汇总、查询和分析存储在Hadoop分布式文件系统上的大数据集合。全书通过大量的实例,首先介绍如何在用户环境下安装和配置Hive,并对Hadoop和MapReduce进行详尽阐述,最终演示Hive如何在Hadoop生态系统进行工作。 《Hive编程指南》适合对大数据感兴趣的爱好者以及正在使用Hadoop系统的数据库管理员阅读使用。
本书分为三个主要部分。部分介绍了数据湖的概念、企业中数据湖泊的重要性,以及Lambda架构的*新进展。第二部分将深入研究使用Lambda架构构建数据湖的主要组件,介绍了一些流行的大数据技术,如Apache Hadoop、Spark、Sqoop、Flume和弹性搜索。第三部分以实际操作的方式展示如何实现一个企业数据湖,并介绍了几个实际的用例,而且展示了如何将其他外围组件添加到湖中以提高效率。在本书的*后,读者将能够选择正确的大数据技术,使用lambda架构模式来构建企业数据湖。