SQL是使用*广泛的数据库语言,绝大多数重要的 DBMS 支持 SQL。本书由浅入深地讲解了SQL的基本概念和语法,涉及数据的排序、过滤和分组,以及表、视图、联结、子查询、游标、存储过程和触发器等内容,实例丰富,便于查阅。新版对书中的案例进行了全面的更新,并增加了章后挑战题,便于读者巩固所学知识。
本书是国际数据管理协会(DAMA国际)组织众多国际专家对过去30多年数据管理领域知识和实践的总结,是市场上综合了数据管理方方面面的一部具有性的基础工具书。从数据治理、数据架构、数据质量、数据安全、主数据管理、参考数据管理、元数据管理、商务智能和数据参考管理、数据建模设计、数据存储和操作、数据集成和互操作、文档和内容管理、大数据、数据管理人员的道德要求等方面介绍了数据管理的知识体系。
《谁说菜鸟不会数据分析》(入门篇)是一本有趣的数据分析书!本书基于通用的Excel工具,加上必知必会的数据分析概念,以小说般通俗易懂的方式讲解。本书基于职场三人行来构建内容,完全按照数据分析工作的完整流程来讲解。全书共8章,依次讲解数据分析必知必会知识、数据分析的结构化思维、数据处理技巧、数据展现的技术、提升图表之美的专业化视角,以及专业分析报告的撰写方法等内容。本书有足够的魅力让你一口气读下去,在无形之中掌握数据分析的技能,提升职场竞争能力。本书能有效帮助职场新人提升职场竞争力,也能帮助市场营销、金融、财务、人力资源管理人员及产品经理解决实际问题,还能帮助从事咨询、研究、分析行业的人士及各级管理人士提高专业水平。
《问卷数据分析:破解SPSS软件的六类分析思路(第2版)》系统介绍了使用SPSS软件进行问卷数据分析的思路及方法,分为四部分,分别是问卷设计、六类问卷分析思路、数据分析方法在SPSS软件中的操作和答疑解惑。其中问卷设计部分适用于所有读者,建议读者在设计问卷前详细阅读这部分内容。读者可以结合实际情况选读六类问卷分析思路部分的内容。数据分析方法在SPSS软件中的操作部分详细讲解了各类数据分析方法在SPSS软件中的操作细节,并且对输出结果进行说明。答疑解惑部分罗列了使用各类分析方法时常见的疑难杂症,并且提供了解决方法。本书侧重于问卷分析的应用性,力求让读者在*短的时间内掌握使用SPSS软件分析问卷数据的方法并完成高质量的问卷数据分析报告。 使用SPSS软件分析调查问卷数据常见于各类学术研究、论文写作、企业市场调研和各类
本书是为广大数据分析师量身定制的入门读物,它旨在帮助读者站在大数据时代的制高点。数据分析处于统计学、计算机信息科学、运筹学、数据库等多个领域的交叉地带,大数据时代的到来大大丰富了数据分析的内涵,数据分析师的职责与以往相比发生了巨大的改变。本书全面介绍了经典数据分析、模式识别、机器学习、深度学习、数据挖掘、商务智能等多个领域的数据分析算法,将大数据时代的数据分析热点技术一网打尽。本书为每个数据分析算法都搭配了一个经典案例,并按照由易到难的原则构建知识框架,充分照顾了不同水平读者的阅读习惯。通过阅读本书,读者将对大数据时代下的数据分析有一个全面的认识。无论是入门级的数据分析员还是有一定基础的数据分析师,都能通过本书完善、加深对数据分析的认识。
《商业智能工具应用及数据可视化》一书聚焦商业智能与数据可视化主题,从概念、价值、方法、工具等理论基础出发,以实际场景为参考,分入门、进阶两大阶段,以帆软FineBI为例从商业智能工具的基本知识,商业应用场景,数据可视化优秀案例等方面,介绍了商业智能工具和各种常规和高级可视化图形的使用方法,重点介绍了商业智能工具FineBI的数据分析与可视化应用实践。本书内容层层递进,体系完善,可使读者对商业智能工具的运用有一个全面、系统、深入的了解。
本书以达梦数据库管理系统(DM8)为平台,全面、系统地介绍了达梦数据库常用操作和应用方法,包括达梦数据库安装与卸载、常用对象管理、数据查询、数据操作、高级对象管理、安全管理、备份还原、作业管理等。本书突出对操作实践的指导,为了使读者更容易理解书中所介绍的内容,列举了大量详细的例子,既介绍了SQL命令方式的管理方法,又介绍了可视化图形界面的管理方法,便于读者进行操作练习,使读者轻松入门、快速提高,并能在较短时间内基本掌握达梦数据库管理系统及其应用技术。 本书内容全面、举例丰富、操作性强、语言通俗、格式规范,可作为相关专业本科生的教材,也可作为如大专、高职学生,以及广大数据库应用开发人员的参考用书。
本书从需求规划、需求实现到可视化展示等,遵循项目开发的主要流程,全景介绍了电商行业Flink实时数据仓库的搭建过程。在整个项目的搭建过程中,介绍了主要组件的安装部署、需求实现的具体思路、问题的解决方案等,并穿插了大数据和数据仓库相关的理论知识,包括数据仓库的概念介绍、电商业务概述、数据仓库理论介绍和数据仓库建模等。最核心的内容是代码中对Flink的灵活应用,为读者展示了Flink处理数据的多种可能性。本书最后还详细讲解了项目的性能调优技巧和实战案例,帮助读者掌握更多的实战经验。 本书适合具有一定编程基础的读者学习或作为参考资料,通过本书,可以使你快速了解实时数据仓库,全面掌握实时数据仓库的相关技术。
本书基于Flink的稳定版本1.13,从Flink数据处理思想开始讲解,带领读者深入理解Flink的基本架构,进而由浅入深,结合具体案例,详细剖析了Flink中DataStream API的使用,并对Flink中的时间语义、状态、容错机制等重要概念进行了详尽的阐述。另外,本书还对实际开发中常用的Flink SQL、CEP等高层级API进行了细致的讲解,以电商网站中的实际应用为场景,提供了大量的代码实现。本书分为三大部分:第1~5章,带领读者初步认识Flink并编写基本的Flink程序;第6~10章,深入探讨了Flink内部的高级应用;第11~12章,讲解了Flink提供的扩展功能。本书广泛适用于大数据的学习者与从业人员,以及院校大数据相关专业的学生,也可作为大数据学习的参考书。
本书以DM8 为对象,系统地介绍了DM8 数据库的安装和维护,以及达梦数据库主流的两大解决方案:达梦DW数据守护和DMDSC 高可用集群方案。本书演示了基于中标麒麟Linux 平台的大量实战操作。通过本书的学习,读者可以掌握达梦数据库的安装和基础操作,如用户、表空间、普通标、分区表、索引、参数、统计信息的管理操作,也可以系统地掌握达梦数据库的备份和恢复技能,如逻辑备份与恢复、联机备份与恢复、脱机备份与恢复。另外,本书还介绍了达梦DW 数据守护和 DMDSC 高可用集群方案,完善了达梦数据库的运维体系。
nbsp nbsp《Power BI 商业数据分析完全自学教程》是一本系统地讲解利用 Power BI 软件进行商业数据智能分析的自学宝典。《Power BI商业数据分析完全自学教程》以 完全精通 Power BI 为出发点,以 用好 Power BI 为目标来安排内容,全书共 5 篇,分为 14 章,循序渐进地介绍了 Power BI 的基本操作、数据导入、数据整理、数据建模、数据可视化分析、数据发布等相关技能。 第 1 篇为基础入门篇(第 1 章 ~ 第 3 章),主要针对初学者,从零开始,系统且全面地讲解了 Power BI 的入门知识点、基本操作及数据的输入和连接操作。 第 2 篇为数据处理篇(第 4 章 ~ 第 6 章),介绍了 Power BI 数据的整理操作、表格中行 / 列数据的管理,以及 Power BI 数据的高级处理、M 函数的使用等。 第 3 篇为数据分析篇(第 7 章 ~ 第 9 章),介绍了 Power BI 数据的建模操作及 DAX 语言的入门和进阶操作等。
Access数据库是微软Office软件中的一个组件,和Word、Excel、PPT等一样,都是Office软件中的成员,Access数据库主要有三大用途:一是存储数据;二是处理数据;三是开发软件。 Access的特点:容易学会,从而开发出实用管理软件!学员一般都有Excel的应用经历,而Access数据库与Excel均为Office组件,有一定的相似性,上手很快。本书共分为7章,展示了终软件开发的效果并按功能模块由浅入深将知识点贯穿于其中,涉及的知识点有:快速开发平台、表设计、创建表操作、查询的各个类型、自动生成和手工创建窗体、VBA编程语言。本书有配套学习视频,详细讲解了具体开发过程,并提供了练习素材下载,方便读者学习。学好本教程,读者将能开发出和本案例展示效果一样的实用管理软件。
本书是一本以数据挖掘应用为主导,以SPSS Modeler为实践框架的应用指南,内容涵盖数据挖掘方法论、数据读取、数据处理、数据可视化、统计分析与检验、数据挖掘算法、自动建模、集成与扩展、模型部署以及性能优化等,力求帮助读者全面掌握数据挖掘项目的主要内容以及实践细节。 除了操作层面,本书也尽可能地把专业晦涩的数据挖掘知识及商业应用内容以通俗易懂的方式传递给读者,同时所有场景会结合IBM SPSS工具进行实现并提供样例学习,方便读者在学习的同时加深巩固和理解。 如果你是在校学生、刚刚从事数据分析的大学毕业生、数据分析爱好者、市场营销人员、产品运营人员或者数据分析师,如果你希望提升自己的数据挖掘技术,那么就适合阅读本书。
本书按照需求规划、需求实现、需求可视化的流程进行编排,遵循项目开发的实际流程,全面介绍了数据仓库的搭建过程。在整个数据仓库的搭建过程中,本书介绍了主要组件的安装部署过程、需求实现的具体思路、部分问题的解决方案等,并在其中穿插了许多与大数据和数据仓库相关的理论知识,包括大数据概论、数据仓库概论、电商业务概述、数据仓库理论准备、数据仓库建模等。 本书从逻辑上可以分为三部分:一是大数据与数据仓库概论及项目需求描述,主要介绍了数据仓库的概念、应用场景和搭建需求;二是项目部署的环境准备,介绍了如何从零开始搭建一个完整的数据仓库环境;三是需求模块实现,针对不同需求分模块进行实现,是本书的重点部分。 本书适合具有一定的编程基础并对大数据感兴趣的读者阅读。通过阅读本书,读者可以快速了解数据
《机器学习数学基础:概率论与数理统计》从基础的概率统计知识讲起,逐步深入到机器学习以及深度学习的分类算法,并在后配合深度学习的实战案例,介绍了softmax回归函数在手写体图像识别中的具体应用。通过手动编辑代码,让读者更深入地了解概率在人工智能领域的重大作用。全书分为16章,涵盖的内容主要有概率统计在人工智能发展过程中的重要影响;随机试验及概率的概念;随机变量的分布及多维随机变量的分布情况;贝叶斯算法;正态分布现象;随机变量的数字特征;机器学习中的损失函数;大数定律;样本及抽样分布的做法;参数估计的概念;马尔科夫链;过拟合与欠拟合问题及解决方法;Tensorflow概述及安装方法;卷积神经网络介绍;实验演练之手写体数字识别等。 《机器学习数学基础:概率论与数理统计》配有大量的插图,以身边的生活现象
本书是MySQL领域的经典之作,拥有广泛的影响力。第3版更新了大量的内容,不但涵盖了*MySQL 5.5版本的新特性,也讲述了关于固态盘、高可扩展性设计和云计算环境下的数据库相关的新内容,原有的基准测试和性能优化部分也做了大量的扩展和补充。全书共分为16章和6个附录,内容涵盖MySQL架构和历史,基准测试和性能剖析,数据库软硬件性能优化,复制、备份和恢复,高可用与高可扩展性,以及云端的MySQL和MySQL相关工具等方面的内容。每一章都是相对独立的主题,读者可以有选择性地单独阅读。 本书不但适合数据库管理员(DBA)阅读,也适合开发人员参考学习。不管是数据库新手还是专家,相信都能从本书有所收获。
数据清洗是大数据领域不可缺少的环节,用来发现并纠正数据中可能存在的错误,针对数据审查过程中发现的错误值、缺失值、异常值、可疑数据,选用适当方法进行 清理 ,使 脏 数据变为 干净 数据。本书共分为8章:第1章主要介绍数据清洗的概念、任务和流程,数据标准化概念及数据仓库技术等;第2章主要介绍Windows和类UNIX操作系统下的数据常规格式、数据编码及数据类型转换等;第3章介绍ETL概念、数据清洗的技术路线、ETL工具及ETL子系统等;第4章介绍Excel、Kettle、OpenRefine、DataWrangler和Hawk的安装及使用等;第5章介绍Kettle下文本文件抽取、Web数据抽取、数据库数据抽取及增量数据抽取等;第6章介绍数据清洗步骤、数据检验、数据错误处理、数据质量评估及数据加载;第7章介绍网页结构,利用网络爬虫技术进行数据采集,利用JavaScript技术进行行为日志数据采集
《Python数据分析与大数据处理从入门到精通》主要讲解数据分析与大数据处理所需的技术、基础设施、核心概念、实施流程。从编程语言准备、数据采集与清洗、数据分析与可视化,到大型数据的分布式存储与分布式计算,贯穿了整个大数据项目开发流程。本书轻理论、重实践,目的是让读者快速上手。1篇首先介绍了Python的基本语法、面向对象开发、模块化设计等,掌握Python的编程方式。然后介绍了多线程、多进程及其相互间的通信,让读者对分布式程序有个基本的认识。第2篇介绍了网络数据采集、数据清洗、数据存储等技术。第3篇介绍了Python常用的数据分析工具,扩展了更多的数据清洗、插值方法,为*终的数据可视化奠定基础。第4篇是大数据分析的重点。首先介绍了Hadoop的框架原理、调度原理,MapReduce原理与编程模型、环境搭建,接着介绍了Spark框架原
本书以达梦数据库DM8为蓝本,介绍达梦数据库的存储过程、存储函数、触发器等服务器端程序,以及Java、C、Python、PHP等高级语言基于达梦数据库的应用程序设计方法。本书主要包括:DM SQL程序结构、基本语法;存储过程、存储函数、触发器、包等高级对象的基本语法及应用方法;嵌入式SQL程序Pro *c组成、基本语法及应用方法;基于ODBC、JDBC、.NET Data Provider数据库访问接口标准的应用程序设计方法;PHP、Python、Go等高级语言访问达梦数据库的程序设计方法;达梦数据库数据装载及日志分析接口的程序设计方法。本书内容实用、示例丰富、语言通俗、格式规范,可作为相关专业的教材,也可作为工程技术人员的参考书。
本书以数据库应用系统实现为线索,内容除数据库技术外,还涵盖系统分析、设计、开发和部署方法,并引入 互联网 思维和热点技术。全书以一个完整的 e学习 系统实际案例驱动,采用MySQL和ASP.NET为实验环境,帮助读者通过实际应用理解数据库应用系统的相关知识和开发方法,掌握实践技能,综合运用前沿信息技术实现领域创新应用。本书提供丰富的教学资源,可以登录华信教育资源网(www.hxedu.com.cn)免费获取相关资源包,也可以扫描书中的二维码获取相关资源或观看演示视频。本书通俗易懂、实例鲜活、技术先进,可作为各类高等学校数据库技术、信息系统设计的入门教材,或者作为计算机基础教育较高层次课程的教材,也可以作为数据库应用系统开发实践的技术参考书。
当下,大数据是一个热门的话题,很多领域的学者,从不同的角度进行了深入的讨论。本书从大数据的历史、内涵、哲学和技术四个角度,全面解析大数据,让读者对大数据有更深入的了解。 《品味大数据》共11章,大致分为4块:第1-3章主要漫谈了大数据的有趣的历史,包括数据的启蒙、信息载体的演变和数据管理的发展脉络。第4-6章主要聊聊大数据的内涵,包括大数据与哲学及第四科学范式的关联。第7-9张是大数据的杂谈,包括大数据的用途、可能面临的陷阱以及通过小故事对大数据进行一些烦死,第10-11章主要涉及大数据的技术,包括100余篇大数据论文的漫读及Hadoop的初级实战篇。 图书结构完整,行文幽默,并以图文并茂、通俗易懂的方式力图让读者心有余地品味大数据。图书援引了数以百计大家牛人的观点,或褒或贬,高手过招,精彩纷呈,是一
《PHP MySQL开发实战》从初学者的角度讲述使用PHP语言结合MySQL数据库进行程序开发应该掌握的各项技术,内容突出 基础 、 全面 、 深入 的特点,同时强调 实战 效果。书中在介绍技术的同时提供实例,同时在各章的结尾安排有实战,通过实战来综合应用本章所讲解的知识,做到理论联系实际;每篇的*后一章有一个综合实例,通过一个模块综合讲解本篇所讲解的知识内容;在本书的*后两章中提供了两个完整的项目实例,讲述从前期规划、设计流程到项目*终实施的整个实现过程。 全书共分28章,主要内容包括初识PHP环境搭建、PHP语言基础、PHP流程控制语句、字符串操作与正则表达式、初探数组、日期和时间的管理、程序调试与异常处理、综合实例(一) 在线论坛、MySQL数据库、MySQL存储引擎与运算符、MySQL函数之选、MySQL基本操作、MySQL数据查询、综合实例
本书以达梦数据库DM8 为蓝本,围绕DM8 性能为什么优化、谁来优化、优化什么、何时优化、优化到什么程度等问题进行详细介绍,从DM8 体系架构入手,分析了DM8 的运行机制,从DM8 的实例优化、I/O 优化、SQL 语句优化3 个方面详细地介绍了影响DM8 性能的核心问题。全书共6 章,内容包括DM8 性能优化概述、DM8体系架构、DM8 调优诊断工具、DM8 实例优化、DM8 I/O 优化和DM8 SQL 语句优化等。同时,本书还将DM8 参数配置文件相关参数、DM8 系统数据字典和DM8 常用动态性能视图作为附录,便于广大读者查阅。本书内容实用、示例丰富、语言通俗、格式规范,可以作为计算机、数据库等专业的教材,也可以作为工程技术人员的参考用书。