你是否在寻找一本完整介绍Python操纵、处理、提取和压缩结构化数据的指南?本书包含了许多实例分析,通过若干个Python库——包括NumPy,pandas,matplotlib和IPython——为你展示了如何高效地解决大量数据分析的问题。《Python数据分析()》由麦金尼撰写,他是pandas库的主要作者。本书也是一本具有实践性的指南,指导那些使用Python进行科学计算的数据密集型应用。它适用于刚刚开始使用Python的分析师,或者是进入科学计算领域的Python程序员。使用IPyth1on交互式shell作为你的主要开发环境学习NumPy(NumericalPython)的基础和高级特性接触patldas库中的数据分析工具。《Python数据分析()》内容:使用高性能工具来加载、抽取、转换、合并和改造数据使用matplotlib来创建散点图和静态或者交互式可视化数据运用pandas的groupby功能来对数据集进行切片、切块和汇总通过具体实例来学
空间数据库是近年的热点研究领域,是一门前沿的交叉学科。本书全面介绍了空间数据库的概念、应用领域、查询语言、空间数据的索引和存储机制、空间查询处理和优化等内容,对空间数据挖掘和空间数据仓库也有精彩的论述。本书条理清晰,叙述严谨,实例丰富,曾得到业内权威人士的赞誉。本书的每章之后都附有习题,帮助读者检验学习效果。本书既适合作为计算机及相关专业的本科生、研究生的,也适合IT业的研究人员、技术人员阅读。对于想了解空间数据库的初学者来说,本书也是一本极有价值的参考书。
本书以DAPP的原理和具体实现为主线索,通过对这些知识的讲解,使读者对DAPP系统开发有更全面的认识,同时把区块链公链的相关知识融合进来,使得读者不仅能够设计和实现DAPP系统,还能大体理解DAPP的相关知识。 本书分为7章。章简单介绍了区块链的基础知识,通过一个简单的智能合约的代码,让读者对区块链有更直观的认识;第2章讲解了各类集成开发环境的搭建,尤其是MetaMask插件,用户需要通过此插件连接以太坊主网后才能使用DAPP系统;第3章讲解了Solidity编译及部署到公链之后的数据表达和函数调用方式;第4章介绍了ABI接口的技术细节;第5章和第6章以案例的方式介绍了DAPP开发的细节;第7章讲解了DAPP潜在的风险。 希望本书能为广大系统开发者和投资者提供一些帮助。
本教材基于Microsoft SQL Server和Neo4j环境,介绍了如何利用SQL(Structure Query Language)和CQL(Cyber Query Language)语言开展对同源库、表和数据对象进行增、删、改、查等数据库管理和应用工作,并综合应用Python下的相关功能库,对SQL数据进行处理,进而利用Neo4j接口将SQL数据高效转换为NoSQL,实现了SQL与NoSQL融合管理,为学习者更深层次了解和掌握SQL与NoSQL数据对象的联系与差别,强化学习者的数据管理意识、方法和能力提供了有力帮助,是为学习和掌握基于图数据库背景下的知识图谱理论和实践技能提供帮助,为进一步开展数据挖掘构建良好的数据库支撑和理论、技能准备。全书内容共分为四部分:部分主要是章,讲解关系型数据库和非关系型数据库的概念、类别和特征等;第二部分主要是第2章至第6章,基于SQL Server讲解关系型数据库环境下的CRUD操作;第三部分主要是第7章至
本书对统称为NoSQL的分布式非关系数据库的原理和使用方法进行介绍。 章,首先介绍NoSQL的起源背景和设计理念,以及相关技术概念。然后介绍大数据技术体系,以及NoSQL在云计算和容器化趋势下的发展。 第2章,首先回顾关系型数据库的主要机制,然后介绍NoSQL数据库的常见技术原理,以及NoSQL的常见数据模型等。 第3章,对MongoDB进行介绍,重点介绍基本使用方法和编程方法。 第4章,对MongoDB的集群部署、安全运维等原理和方法进行介绍。 第5章,对Neo4J的基本原理、使用方法等进行介绍。 第6章,对Redis的基本原理、使用方法和集群部署方法等进行介绍。 第7章,介绍Cassandra的基本原理和使用方法。首先介绍Amazon Dynamo的相关原理,然后介绍Cassandra的安装、配置与CQL。 第8章,对Hadoop大数据体系和HBase进行简要介绍。 第9章,介绍其他一些知名的NoSQL数据库技术与工具。
大数据时代,掌握必要的数据分析能力,将大大提升工作效率和自身竞争力。Tableau是一款数据分析及可视化工具,本书将详细讲解利用Tableau进行数据分析及展示的相关知识。书中主要内容包括:Tableau数据分析概述、连接数据源、Tableau基础操作、数据可视化、统计分析、仪表板和故事;Tableau Prep数据清洗、处理、角色和参数,Tableau Prep的应用,数据清洗和分析案例,以及Tableau在线服务器等。本书内容丰富,采用全彩印刷,配套视频讲解,结合随书附赠的素材边看边学边练,能够大大提高学习效率,迅速掌握Tableau数据分析技能并用于实践。本书适合数据分析初学者、初级数据分析师、数据库技术人员、市场营销人员、产品经理等自学使用。同时,本书也可用作职业院校、培训机构相关专业的教材及参考书。
内容简介这是一本能指导数据分析师和数据挖掘工程师在AIGC时代快速实现能力跃迁的著作,教会他们使用ChatGPT等AIGC工具,大幅提升数据分析与挖掘的能力和效率。全书围绕Excel、SQL和Python这3大常用的数据分析和挖掘工具展开,从方法和实践2个维度系统讲解了如何使用ChatGPT和Bing Copilot等AIGC工具来辅助提升效率。全书一共8章,内容可以分为四个部分:1.AIGC工具使用和Prompt撰写首先详细介绍了数据分析与挖掘能用到的各种AIGC工具的使用方法和注意事项,然后全面讲解了如何面向数据分析与挖掘场景构建高质量的Prompt,包括大量的方法和实践。2.AIGC辅助Excel数据分析与挖掘方法角度,详细阐述了AIGC工具如何辅助Excel数据分析与挖掘,包括数据集生成、数据管理、数据处理、数据分析和数据展示等;实践角度,通过RFM分析、时间序列分析和相关性分析等3个方面的案例讲
本书紧密结合当前边缘计算领域的发展趋势与研究成果,本着务实具体、详略得当、启发创新的指导思想,系统、全面地介绍了边缘计算的原理与应用,包括基本概念、架构原理、核心技术、主要研究方向与挑战,以及多个应用的研究进展。本书从计算卸载、服务部署、视频分析、模型推断、联邦学习等应用视角来阐述边缘计算,可为物联网、人工智能、工业互联网、智慧城市、智能制造等领域相关的科研人员和IT从业者提供创新的应用视角,也可作为相关专业高年级本科生和研究生课程的教材。
内容简介本书按照“基本入门→数据清洗实操→技能提升”的顺序安排内容,首先介绍新手入门要掌握的基本操作,然后讲解利用PowerQuery对数据进行清洗的实战技能,以及查询表的结构化与分组合并操作,讲解认识M语言并学会使用M语言对查询表及表数据进行处理的实用操作。全书内容实用,实战性强,适合有Excel使用基础,想要提升数据清洗和处理能力的PowerQuery初学者。此外,对PowerQuery工具有使用经验的数据处理人员,也可从本书中找到借鉴思路。
本书是基于作者多年的教学与实践撰写的,重点介绍PostgreSQL的核心原理与体系架构,涉及开发、运维、管理与架构等内容。 本书共12章,涉及以下几方面内容:PostgreSQL基础,安装与配置PostgreSQL,管理数据库与数据库实例,管理数据库对象,并行查询,事务与并发控制,应用程序开发,管理数据库安全,备份与恢复,监控、诊断与优化数据库,PostgreSQL的高可用架构,以及从Oracle迁移到PostgreSQL。
随着用户对国产数据库了解的加深,信息化和工业化融合加深,用户软件知识产权保护意识和信息化成本意识的加强,国产数据库市场机遇越来越大。发展国产数据库体现了国家战略,国家自主创新、正版化和国家信息安全等政策将为国产数据库带来发展机遇。何清法、王澍丰、顾云苏、冯柯、刘峰主编的《国产神通数据库教程》帮助读者了解神通数据库,介绍数据库基础与神通数据库体系结构以及数据库管理。
本书分为4个部分,部分为数据库技术概述,第2部分介绍关系型数据库(包括MySQL、Oracle、SQL Server和PostgreSQL)技术应用,第3部分介绍NoSQL数据库(包括Redis、MongoDB、HBase、Hive、Cassandra和Elasticsearch)技术应用,第4部分介绍其他类型数据库(包括SQLite、Neo4j和TDengine)技术应用。本书按照统一的目录结构对每种数据库进行介绍:先介绍数据库的业务应用场景,再介绍安装配置步骤,接着讲解架构设计和业务应用开发,最后介绍Python操作示例。由于4种关系型数据库中的一些数据对象在使用上有类似之处,因此本书只在一种数据库中进行介绍。例如,触发器和自定义函数只在Oracle中介绍,存储过程和游标只在SQL Server中介绍。各种非关系型数据库之间没有横向可比性,因此主要介绍其独特用法。
本书是一本介绍分布式数据库基础内容与应用的大数据专业类图书,力求培养读者对分布式数据库的应用技能。 本书共11章,采用原理+代码实例 综合案例的编写形式,清晰明了地介绍分布式数据库的原理、基础应用、进阶应用及主流工具的使用方法、应用场景,以理实结合为编写要求,让读者能够轻松学习和掌握分布式数据库的内容。 本书可以作为高等院校计算机、网络技术等相关专业的教材,也可以作为数据库相关工作的从业人员的参考用书,亦可作零基础人员学习分布式数据库技术的入门图书。
实时数据库系统是作者三十多年来从事数据库理论与实现技术研究,尤其是现代(非传统)DBMS开发成果的总结,其特点是内容全面、视野开阔、系统完整、理论结合实践。全书共14章,主要内容有:①实时应用特征、实时数据库的概念与发展;②实时数据库的特征、实时数据模型、系统结构及RTDBMS;③实时事务的概念、模型、特性,事务优先级分派与调度策略、并发控制理论与技术及其正确性;④实时数据库的存储结构与存取方法,实时内存数据库及内外存数据交换技术,实时数据库故障恢复;⑤主动实时数据库系统的原理、组织结构与实现技术;⑥主动实时内存数据库系统实例ARTs-DB的设计与实现。实时数据库系统适合作为大专院校计算机、软件、自动控制、电子信息、电气工程及相关专业的学生尤其是研究生的教材,亦可供从事工程实现、过程控制、实时处理等