你是否在寻找一本完整介绍Python操纵、处理、提取和压缩结构化数据的指南?本书包含了许多实例分析,通过若干个Python库——包括NumPy,pandas,matplotlib和IPython——为你展示了如何高效地解决大量数据分析的问题。《Python数据分析()》由麦金尼撰写,他是pandas库的主要作者。本书也是一本具有实践性的指南,指导那些使用Python进行科学计算的数据密集型应用。它适用于刚刚开始使用Python的分析师,或者是进入科学计算领域的Python程序员。使用IPyth1on交互式shell作为你的主要开发环境学习NumPy(NumericalPython)的基础和高级特性接触patldas库中的数据分析工具。《Python数据分析()》内容:使用高性能工具来加载、抽取、转换、合并和改造数据使用matplotlib来创建散点图和静态或者交互式可视化数据运用pandas的groupby功能来对数据集进行切片、切块和汇总通过具体实例来学
空间数据库是近年的热点研究领域,是一门前沿的交叉学科。本书全面介绍了空间数据库的概念、应用领域、查询语言、空间数据的索引和存储机制、空间查询处理和优化等内容,对空间数据挖掘和空间数据仓库也有精彩的论述。本书条理清晰,叙述严谨,实例丰富,曾得到业内权威人士的赞誉。本书的每章之后都附有习题,帮助读者检验学习效果。本书既适合作为计算机及相关专业的本科生、研究生的,也适合IT业的研究人员、技术人员阅读。对于想了解空间数据库的初学者来说,本书也是一本极有价值的参考书。
本书从大数据发展现状、面临的挑战和机遇以及需要突破的关键问题入手,深入研究了大数据技术发展的现状和技术体系,并从电子政务、医疗卫生、智慧交通、公共安全、科技服务五个领域叙述了大数据的行业应用,从数据租售模式、数据交易模式、数据产品租售模式、行业大数据服务模式、行业价值链重构模式、跨行业数据协同模式、租赁存储空间模式、基础技术服务模式八个方面介绍了大数据的商业模式,并进一步探讨了大数据产业生态及创新模式、大数据背景下的数据权保障制度、大数据人才培养,以及大数据背景下的智能城镇化发展,*后提出了大数据产业发展战略思路与对策。
随着用户对国产数据库了解的加深,信息化和工业化融合加深,用户软件知识产权保护意识和信息化成本意识的加强,国产数据库市场机遇越来越大。发展国产数据库体现了国家战略,国家自主创新、正版化和国家信息安全等政策将为国产数据库带来发展机遇。何清法、王澍丰、顾云苏、冯柯、刘峰主编的《国产神通数据库教程》帮助读者了解神通数据库,介绍数据库基础与神通数据库体系结构以及数据库管理。
《Hive编程指南》是一本Apache Hive的编程指南,旨在介绍如何使用Hive的SQL方法HiveQL来汇总、查询和分析存储在Hadoop分布式文件系统上的大数据集合。全书通过大量的实例,首先介绍如何在用户环境下安装和配置Hive,并对Hadoop和MapReduce进行详尽阐述,最终演示Hive如何在Hadoop生态系统进行工作。 《Hive编程指南》适合对大数据感兴趣的爱好者以及正在使用Hadoop系统的数据库管理员阅读使用。
Stata是一种功能全面的统计分析软件包,具有易操作、运行速度快、功能强大的特点,主要针对经济、管理、医学、农学、教育、市场研究、社会调查等行业和领域,是大数据时代为流行的计量软件之一。 全书内容共分17章。第1、2章介绍Stata操作入门及数据处理基础知识、描述性统计与图形绘制基础。第3~5章介绍假设检验、方差分析、相关分析等基础分析方法。第6~10章通过相关案例介绍经典及放松各种假定条件的回归分析,包括基本线性回归分析、线性回归分析诊断与处理、非线性回归分析、因变量离散回归分析、因变量受限回归分析等应用。第11~16章以典型案例讲解主成分分析与因子分析、聚类分析、时间序列数据分析、面板数据分析、生存分析、多方程模型等高级分析方法。第17章介绍如何使用Stata进行高质量的综合性研究,讲解研究方案设计、调查问卷的制