你是否在寻找一本完整介绍Python操纵、处理、提取和压缩结构化数据的指南?本书包含了许多实例分析,通过若干个Python库——包括NumPy,pandas,matplotlib和IPython——为你展示了如何高效地解决大量数据分析的问题。《Python数据分析()》由麦金尼撰写,他是pandas库的主要作者。本书也是一本具有实践性的指南,指导那些使用Python进行科学计算的数据密集型应用。它适用于刚刚开始使用Python的分析师,或者是进入科学计算领域的Python程序员。使用IPyth1on交互式shell作为你的主要开发环境学习NumPy(NumericalPython)的基础和高级特性接触patldas库中的数据分析工具。《Python数据分析()》内容:使用高性能工具来加载、抽取、转换、合并和改造数据使用matplotlib来创建散点图和静态或者交互式可视化数据运用pandas的groupby功能来对数据集进行切片、切块和汇总通过具体实例来学
在集团内,数据人员面临的现实情况是:集团数据存储已经达到EB级别,部分单张表每天的数据记录数高达几千亿条;在2016年“购物狂欢节”的24小时中,支付金额达到了1207亿元人民币,支付峰值高达12万笔/秒,下单峰值达17.5万笔/秒,媒体直播大屏处理的总数据量高达百亿级别且所有数据都需要做到实时、准确地对外披露……巨大的信息量给数据采集、存储和计算都带来了极大的挑战。《大数据之路——大数据实践》就是在此背景下完成的。本书中讲到的大数据系统架构,就是为了满足不断变化的业务需求,同时实现系统的高度扩展性、灵活性以及数据展现的高性能而设计的。本书由数据技术及产品部组织并完成写作,是分享对大数据的认知,与生态伙伴共创数据智能的重要基石。相信本书中的实践和思考对同行会有很大的启发和借鉴意义。
在这本书里,读者将会跟随作者一同对Oracle数据库的相关知识进行梳理,很终共同提炼出必须很先掌握的那部分知识,无论你是数据库开发、管理、优化、设计人员,还是从事Java、C的开发人员。接下来作者再将这部分知识中很实用的内容进一步提炼,浓缩出很精华的部分,分享给大家。这是“二八现象”的一次经典应用。这部分知识就是Oracle的物理体系结构、逻辑体系结构、表、索引以及表连接五大部分。通过阅读本书中的这些章节,读者将会在短时间内以一种有史以来很轻松的方式,完成对Oracle数据库的整体认识,不仅能解决工作中的常规问题,还能具备的设计和调优能力。通过对这些章节的学习,读者在Oracle的学习中会有极大的收获。然而,作者更希望看到的是:让读者的收获,不止Oracle。为达到此目的,作者精心将全书分成上下两篇,刚才所描述的具体知
随着用户对国产数据库了解的加深,信息化和工业化融合加深,用户软件知识产权保护意识和信息化成本意识的加强,国产数据库市场机遇越来越大。发展国产数据库体现了国家战略,国家自主创新、正版化和国家信息安全等政策将为国产数据库带来发展机遇。何清法、王澍丰、顾云苏、冯柯、刘峰主编的《国产神通数据库教程》帮助读者了解神通数据库,介绍数据库基础与神通数据库体系结构以及数据库管理。
本书详细介绍了可用于数据处理的表格格式、云产品、框架、存储层,以及如何将这些内容组合在一起,以获得适合自己需求的高性能解决方案。作者在书中提供的决策框架将帮助你明智地决定选择哪种数据湖。本书是大数据领域每个人的书。阅读本书后,你将了解构建云数据湖所需的所有基础知识,并能够以多种方式应用这些知识。本书主要面向数据架构师、数据开发人员和数据运维专业人员,他们希望广泛地了解设置和运营云数据湖的各个方面。
《SQL指南(第4版)》为SQL名著中文版,兼顾技术与实践,全面细致介绍高级技术,致力于打造SQL编程专家。《SQL指南(第4版)》阐释了数据库设计、优化和操作的各方面内容,提供了成为SQL编程专业人士所需的技术与技巧、针对新旧挑战性难题的解决方案、专业的思考方式(以保证程序的正确性与高效性),并涉及了数据库设计与规范化、SQL数据类型、查询、分组、集合操作、优化等主题。另外,JoeCelko以通俗易懂的语言叙述了一些关键问题,比如避免使用过多NULL的原因及查询优化方式等。《SQL指南(第4版)》适合中高级SQL编程人员学习参考。
《数据分析方法与案例详解(双色)》是一本语言和数据分析的入门教材,循序渐进、深入浅出,每个知识点尽量从实际的应用案例出发,以问题为导向,在解决问题中学习统计方法、语言的基本使用以及编程技巧。 《数据分析方法与案例详解(双色)》内容涵盖数据结构、函数与优化、抽样模拟、统计分析、假设检验、回归分析、统计绘图和包制作等内容。 《数据分析方法与案例详解(双色)》的定位是为业界数据分析人员、经济管理类、医学的学生提供方法和程序上的参考,在写作过程中尽量删去比较理论的数学原理,这样能够帮助读者轻松上手学习。
现代数据服务面临的两大问题是数据保障和不间断服务,即数据服务的高可用性(HighAvailability)。本书论述Oracle在此方面的两类解决方案:数据卫士(Data Guard)和数据集群(Real Application Cluster,RAC)。数据卫士将主数据库的数据变更通过异步或同步的方式传播到网络(局域网或广域网)上的另一台或多台主机上,从而实现对主数据库的数据保护。不仅如此,这些跟随主数据库数据变化的主机(备用数据库)还可以实现联机的只读访问或暂时的数据读/写,这就大大增强了数据卫士的应用价值。RAC数据集群则是将数据库同时运行在高速局域网的多个不同的主机上,这种处理方式不仅可以将应用系统的访问负荷分散到不同的服务器上,还可以通过多台主机服务之间的冗余来防范单节点故障,从而为用户提供不间断的数据访问。RAC和Data Guard的联合应用,可以实现当前IT业
内容简介这是一本能指导数据分析师和数据挖掘工程师在AIGC时代快速实现能力跃迁的著作,教会他们使用ChatGPT等AIGC工具,大幅提升数据分析与挖掘的能力和效率。全书围绕Excel、SQL和Python这3大常用的数据分析和挖掘工具展开,从方法和实践2个维度系统讲解了如何使用ChatGPT和Bing Copilot等AIGC工具来辅助提升效率。全书一共8章,内容可以分为四个部分:1.AIGC工具使用和Prompt撰写首先详细介绍了数据分析与挖掘能用到的各种AIGC工具的使用方法和注意事项,然后全面讲解了如何面向数据分析与挖掘场景构建高质量的Prompt,包括大量的方法和实践。2.AIGC辅助Excel数据分析与挖掘方法角度,详细阐述了AIGC工具如何辅助Excel数据分析与挖掘,包括数据集生成、数据管理、数据处理、数据分析和数据展示等;实践角度,通过RFM分析、时间序列分析和相关性分析等3个方面的案例讲
《时空大数据计算分析与应用》~5章从地理信息科学发展到大数据时代面临的挑战入手,介绍了大规模时空数据的高效管理、高性能计算、深度分析挖掘、科学可视化等内容,主要包括:时空数据存储与管理、时空数据索引,高性能时空大数据计算策略、空间数据与空间计算任务划分方法,时空聚类、地理回归等时空数据挖掘方法,大规模空间数据加载和渲染策略、三维可视化等。第6章和第7章详述了时空大数据分析在智慧城市、土地利用演变、城市功能区划分、城市交通脆弱性分析、公共交通模式挖掘等热点研究中的应用。