本书站在大数据落地应用的角度,系统阐述大数据从数据收集,到数据存储、分布式协调及资源管理、计算引擎、分析工具,再到数据可视化这一完整流程,本书既包含主要技术的实现原理及其框架,也包含了具体落地指导,是帮助企业和个人整体了解大数据框架的参考书。本章主要包括6个部分共16章的内容,其中:第壹部分介绍了大数据体系架构,以及Google和Hadoop技术栈;第二部分介绍大数据分析相关技术,主要涉及关系型数据收集工具Sqoop与Canel、非关系型数据收集系统Flume以及分布式消息队列Kafka;第三部分介绍大数据存储相关技术,涉及数据存储格式、分布式文件系统以及分布式数据库;第四部分介绍资源管理和服务协调相关技术,涉及资源管理和调度系统YARN以及资源协调系统ZooKeeper;第五部分介绍计算引擎相关技术,涉及批处理、交互式处理以及流式实时
商业分析有用吗?当然有用!商业分析是行走职场、创业启航的一项推荐技能。作者结合自己多年的工作经验,用生动的语言介绍如何用数据分析解决商业问题。本书分为6篇,共17章,其中第1篇是概念篇,讲述商业分析的基本概念;第2篇是基础篇,讲述如何用基础的分析方法评估企业经营状况;第3篇是进阶篇,讲述如何构建分析体系解决较复杂的问题;第4篇是高阶篇,讲述如何应对复杂的商业难题;第5篇是基础实践篇,通过案例讲述如何解决更复杂的商业问题;第6篇是高阶实践篇,通过案例讲述如何解决商业分析中的疑难杂症。本书的讲解思路是层层递进的,从简单场景到复杂场景,从基础的方法到复杂的方法。因此,无论读者是否有数据分析基础和经验,都建议从头开始阅读,这样可以一步步提升认知,更快地掌握商业分析的方法。
这是一部可以帮助读者从0开始理解、建设并深度实践数据血缘及其系统的专业指导手册。全书所有内容均来自两位作者长期在世界500强企业从事数据相关工作的经验总结,书中不仅从原理层面带领读者深挖数据血缘本质,还有从实践层面对数据血缘的建设方法、核心技术、主流工具、在数据治理中的应用、典型行业应用案例进行了全方位剖析。 本书得到了美国南卡罗来纳大学教授、DAMA大中华区主席、中国大数据技术标准推进委员会专家、招商蛇口数字化管理及运营负责人、PowerData社区主理人等多位业界专家的鼎力推荐。 本书包括4篇14章,具体内容如下。 概念篇从企业面临的主要数据问题入手,逐渐延伸到对数据血缘的相关定义、特征、价值,以及数据组成的深度解读。这部分是真正落地数据血缘项目的基础,只有充分理解了这部分内容,才知道如何与上下游沟
本书图文并茂、示例丰富,结合136段代码和213幅图表,直观易懂地介绍了算法与数据结构的基础知识,包括数组、查找、栈和队列、递归算法、排序、字符串查找、线性列表、树结构和二分查找树等。本书并非单纯地对算法与数据结构进行介绍,而是致力于让读者掌握编写实用程序的技术。为此,本书提供的示例代码都是实际可运行的程序,理解这些示例程序之后,相信读者的Python编程能力也会有很大的提升。本书各章节末设置有练习题,并在书末给出了答案,据此读者可检测自己对知识的掌握情况,加深理解。
本书是热销书《SQL基础教程》的作者MICK为志在向中级进阶的数据库工程师编写的一本SQL技能提升指南。全书可分为两大部分。第一部分介绍了SQL语言不同寻常的使用技巧,带领读者重新认识CASE表达式、窗口函数、自连接、EXISTS谓词、HAVING子句、外连接、行间比较、集合运算、数列处理等SQL常用技术,发掘它们的新用法。这部分不仅穿插讲解了这些技巧背后的逻辑和相关知识,而且辅以丰富的示例程序,旨在帮助读者从面向过程的思维方式转换为面向集合的思维方式。第二部分介绍了关系数据库的发展史,并从集合论和逻辑学的角度讲述了SQL和关系模型的理论基础,旨在帮助读者加深对SQL语言和关系数据库的理解。此外,本书很多节的末尾设置有练习题,并在书末提供了解答,方便读者检验自己对书中知识点的掌握程度。本书适合具有半年以上SQL使用经验、已掌握S
全书分为 8 章, 主要内容如下:第1章介绍学术论文插图绘制的规范性和基本原则以及学术论文插图的配色基础;第2章介绍绘制学术论文插图的主要工具,并重点介绍 Matplotlib、Seaborn、ProPlot 以及 SciencePlots 工具包的语法及其重要特征;第3章介绍学术论文中常见的单变量图及其绘制方法,包括直方图、密度图、Q-Q 图等;第4章介绍学术论文中常见的双变量图及其绘制方法, 具体包括误差线、柱形图、箱线图、相关性散 点图以及矩阵热力图等;第5 章介绍学术论文中常见的多变量图及其绘制方法,包括等高线图、点图系列、 三元相图、 3D 图系列以及 RadViz 图等;第 6 章介绍学术论文中常见的空间数据型图及其绘制方法,包括分 级统计地图、连接线地图、等值线地图以及子地图等;第 7 章介绍学术论文中常见的可视化图及其绘制方法,包括配对图系列、韦恩图、泰勒图
本书在介绍5G时代边缘计算内涵和核心技术的基础上,分析了边缘计算产业链的基本情况,涵盖上游云服务商和硬件设备厂商、中游电信运营商及边缘计算运营和管理服务提供商、下游OTT厂商及智能终端和应用开发商等。本书重点聚焦5G时代边缘计算可重点应用的行业,包括交通行业(涵盖自动驾驶、智能网联、智能交通、智慧道路)、安防行业、云游戏行业、工业互联网、能源互联网、智慧城市和智能家居等,结合这些行业的发展趋势,深入阐述边缘计算在其中的实践进展和案例。本书适合通信行业、边缘计算相关行业的人员阅读,也适合相关专业在校本科生、硕士生阅读,以及对边缘计算感兴趣的读者阅读。
本书共分为九章。*章介绍了Oracle体系结构,即数据库实例的结构;第二章介绍数据库的物理结构和逻辑结构;第三章介绍Oracle的自动存储技术;第四章深入介绍了事务这个核心概念;第五章介绍数据迁移的常用方法;第六章介绍FLASHBACK技术;第七章介绍常规的备份/恢复方法;第八章介绍如何利用RMAN对数据库进行备份与恢复;第九章介绍RMAN工具的高级用法,如块介质恢复、数据库的跨平台迁移、数据库的复制等。
本书以HadoopHDFS为载体,介绍了构建一款分布式系统(尤其是存储方向)所需的核心技术,所有内容均基于当前较新的3.3.x/3.4.x版本,分别从理论和实践两个维度逐一阐述。本书主要包括两篇:核心原理篇介绍了HDFS的诞生历史、元数据及Block管理、节点间通信机制、读写数据流程和高可用实现原理等;拓展与实践篇从实际出发,充分考虑了用户在应用过程中会遇到的痛点,详细介绍了集群拓展方法、数据分层存储、集群维护与多租户实施等实践经验。本书各章节都配有必要的流程图和原理分析图,便于读者阅读理解,并精选了非常有用的实际案例及拓展知识。阅读本书后,相信会给读者带来“1+1 2”的效果。本书非常适合大数据从业者、云计算领域研发及运维人员、高校研究生和热衷于分布式的技术极客阅读学习。
在这本书里,读者将会跟随作者一同对Oracle数据库的相关知识进行梳理,*终共同提炼出必须*先掌握的那部分知识,无论你是数据库开发、管理、优化、设计人员,还是从事Java、C的开发人员。接下来作者再将这部分知识中*实用的内容进一步提炼,浓缩出*精华的部分,分享给大家。这是 二八现象 的一次经典应用。这部分知识就是Oracle的物理体系结构、逻辑体系结构、表、索引以及表连接五大部分。通过阅读本书中的这些章节,读者将会在短时间内以一种有史以来*轻松的方式,完成对Oracle数据库的整体认识,不仅能解决工作中的常规问题,还能具备一定的设计和调优能力。通过对这些章节的学习,读者在Oracle的学习中一定会有极大的收获。然而,作者更希望看到的是:让读者的收获,不止Oracle。为达到此目的,作者精心将全书分成上下两篇,刚才所描述的具体知识
本书以当前流行的Oracle 11g(中文版)为平台,主要介绍Oracle基础以及如何在流行平台上开发Oracle数据库应用系统。Oracle基础部分首先介绍数据库基础,然后系统介绍Oracle 11g的主要功能。本书采用DBCA创建数据库、SQL Developer界面操作工具和SQL*Plus命令。实验和练习与教程紧密结合完成本书的部分实例,并给出思考和练习,基本上包含了Oracle 11g的主要内容。在上述基础上介绍如何在流行平台上开发Oracle数据库应用系统,流行平台包括Visual Basic.NET、Visual C#、ASP.NET、PHP和Java EE。综合应用实践数据准备不但简单总结了Oracle的主要命令,而且为后面的数据库应用开发打下了基础。不同平台操作同样的数据库,实现同样的功能,这给读者带来了极大的方便。本书可作为大学本科、高职高专有关课程的教材,也可供广大数据库应用开发人员使用或参考。
本书主要介绍使用Oracle?12c数据库对数据进行管理和应用的知识。本书共分为18章,介绍了Oracle数据库概述,Oracle的体系结构,实现数据库,SQL基础,SQL函数,PL/SQL编程,SQL*Plus数据库环境,设置表和表空间,管理表和表空间,存储过程、函数和程序包,索引,其他模式对象,管理控制与日志文件,视图、同义词和序列,数据安全管理,导入与导出,备份与恢复,数据库的高级应用等内容。书中每章都提供了实例练习,帮助读者掌握面向实际的应用知识。本书图文并茂,秉承了基础知识与实例相结合的特点,内容精练易懂、结构清晰,案例经典,实用性强,适合数据库初学者、高职高专院校师生及计算机培训人员阅读,同时也是数据库应用与开发爱好者的有价值的参考书。
本书是来自一线Oracle DBA的实践工作笔记,凝结作者多年数据库管理运维心得;全书从运维、数据迁移和优化三个层面娓娓道来,精心筛选作者在实际工作中总结的技巧、对常见问题的高效处理方法,以及大量融入完善解决方案的诊断案例;尤其对数据库的宕机、容灾、监控管理、外部表迁移方案、系统调优、SQL优化等重点内容的讲解更是细致入微。
这本书主要面向计算机科学和工程专业的本科生。同时,这本书也可供IT专业数据分析师、企业决策人员和业务分析人员参考。本书由Acharya编著,介绍了R语言作为非稳态数据分析和可视化工具的强大功能,并向学习者介绍了几种数据挖掘算法和可视化方法。
本书提供了全面、实用的建议,以保证在复杂的生产环境中,能可靠且高效地运行Oracle 数据库。七位主要的Oracle 专家对Oracle 12c、11g 和其他*近版本的Oracle 数据库汇集了一系列经过验证的解决方案、实践的例子以及循序渐进的技巧。每一个解决方案都是精心设计的,以帮助有经验的Oracle DBA和DMA 尽可能快地理解和修复严重的问题。本书不仅涵盖了LOB 段、undo 表空间、高GC 缓冲区等待事件、糟糕的查询响应时间、闩锁争用、索引、XA 分布式事务、RMAN 备份/ 恢复等内容,还深入地讲解了DDL 优化、VLDB 调优、数据库取证、自适应游标共享、数据泵、数据迁移、SSD、索引等内容,并介绍了如何解决Oracle RAC 问题。
本书以零基础讲解为宗旨,用实例引导的方法,深入浅出地介绍了Oracle的相关知识和实战技能。本书第1 篇【基础知识】主要讲解Oracle的安装与配置、SQL的基础知识、高级SQL限定查询、Oracle的单行函数、多表查询、分组统计查询、子查询、Oracle数据的基本操作、Oracle的表创建与管理以及Oracle的数据完整性等;第2篇【核心技术】主要讲解Oracle数据库对象的使用、PL/SQL编程、游标、存储过程与函数、触发器和程序包、表空间管理、控制文件及日志文件的管理、Oracle的安全管理以及数据库备份与恢复等;第3篇【高级应用】主要介绍PowerDesigner设计工具及数据库设计、在ASP中访问Oracle、 在Java中访问Oracle、在JSP中访问Oracle、在PHP中访问Oracle 等;第4篇【项目实战】主要讲解基于B/S结构的求职网的设计与实现以及闲置品交易网站的设计与实现。本书提供了与图书内容全程同步的
"防止数据库遭受硬件、软件及其他操作故障的损害 《Oracle Database 12c Oracle RMAN备份与恢复(第4版)》详细讲解了如何*限度地利用Oracle RMAN(Oracle Recovery Manager)的功能,阐释如何配置Oracle数据库以满足简单或复杂的备份和恢复需求。本书是讲解Oracle数据库备份和恢复操作的综合性指南,全面介绍了传统的Oracle数据库体系结构以及Oracle新引入的多租户体系结构。与仅讨论Oracle RMAN基本操作的书籍不同,本书是一本快速入门指南,并且涵盖更高级的主题,如数据库复制以及创建Oracle备用数据库。*后,这本权威指南还讲述如何创建报告,优化性能,以及实现第三方管理工具。主要内容● 设置、配置和维护Oracle RMAN● 在传统Oracle数据库体系结构和令人激动的新多租户体系结构中使用Oracle RMAN● 执行完整和部分Oracle RMAN数据库还原● 创建联机、脱机和增量系统备份● 使用O
本书针对当前各大典型IT企业面试笔试中的考点与侧重点,精心挑选了3年以来近百家IT企业的数据库面试笔试真题,这些企业涉及业务包括系统软件、搜索引擎、电子商务、手机APP、安全软件等,非常具有代表性与参考性。同时,本书对这些题目进行了合理的划分与归类,并且对其进行了庖丁解牛式的分析与讲解,针对试题中涉及的部分重点难点问题,本书都进行了适当地扩展与延伸,力求对知识点的讲解清晰而不紊乱,全面而不啰嗦。此外,本书除了对数据库的基础知识进行深度剖析以外,还针对Oracle的笔试面试做了非常详细的介绍。读者通过学习本书不仅能够获取到求职的知识,同时还能更有针对性地进行求职准备,终收获一份满意的工作。 本书是一本计算机相关专业毕业生面试、笔试的求职用书,同时也适合期望在计算机软、硬件行业大显身手的计算机爱好
7大数据陷阱的干货总结与避坑锦囊,教会数据工作者如何在数据陷阱中迅速恢复,避免踩雷。 数据陷阱无处不在,任何处理过数据的人都会在不知不觉中多次陷入其中。我们大多数人都还没有学会如何使用现代工具和所掌握的数据类型,从而导致了一些本可以轻易避免的常见的错误。 在本书中,作者为我们展示了以下七种在数据处理过程中常见的数据陷阱: 陷阱 1:认知误差——我们如何看待数据; 陷阱 2:技术陷阱——我们如何对数据进行处理; 陷阱 3:数学失误——我们如何对数据进行计算; 陷阱 4:统计疏忽——我们如何对数据进行比较; 陷阱 5:分析偏差——我们如何对数据进行分析; 陷阱 6:绘图乌龙——我们如何对数据进行可视化; 陷阱 7:设计风险——我们如何对数据进行修饰。 同时也向我们展示了这些数据陷阱是如何产生、如何变得如此常见的
本书源于众多实践案例的总结,我们将大量的数据安全事件、数据库安全漏洞、Oracle数据库灾难恢复案例融合于一体,进行了详细的阐述和分析,并总结形成了指导企业规范运维、强化管理、规避灾难的指导原则。本书通过概括总结形成的数据库运维原则,希望能够给企业运维管理者以警示,通过提前预防措施和规范化管理避免遭遇到书中描述的种种情形;此外,本书还通过复杂的Oracle数据库灾难恢复案例,深入阐述了数据库运行和工作的内部原理,希望能为读者的深入技术探索提供帮助。本书既适合企业自动化和智能化运维的管理者参考,也适合深入学习数据库技术的读者学习探索。
本书不讲具体语法,只是以案例的形式介绍各种查询语句的用法。第1~4章是基础部分,讲述了常用的各种基础语句,以及常见的错误和正确语句的写法,应熟练掌握这部分内容,因为在日常查询和优化改写中都要用到;第5~12章是提高部分,讲解了正则表达式、分析函数、树形查询及汇总函数的用法,这部分内容常用于一些复杂需求的实现及优化改写;*后两章介绍日常的优化改写案例,这部分内容是前面所学知识的扩展应用。 如果您是开发人员,经常与Oracle打交道,那么本书可以帮助您处理复杂的需求,写出高性能的语句。如果您是运维人员,则本书可以帮助您更快地完成慢语句的改写优化。
本书由世界知名的、实战经验丰富的Oracle ACE/ACE总监组成的作者团队编写,他们都写过多本畅销书籍,并且活跃在全球的Oracle巡回演讲现场。本书是为Exadata 数据库一体机管理员(DMA,Database Machine Administrators)精心准备的一本真实环境的实践操作指南和专家手册。本书内容涵盖Exadata数据库一体机的11g和12c两个软件版本。针对Oracle数据库管理员和Exadata 数据库一体机管理员,这本专家手册提供了完成Oracle Exadata数据库一体机管理操作和任务的实用技术参考。 本书适合中、高级的Exadata数据库一体机管理员阅读,也供专家级的Exadata数据库一体机用户参考。
本书在前四版畅销书的基础上,根据SPSS 26.0软件升级的市场应用需求进行第5次升级修订。 本书结合具体的SPSS统计分析实例,图文并茂地介绍了近期新版本SPSS 26.0的各种统计分析方法,包括基本统计分析、参数与非参数检验、方美分析、相关分析、同归分析、名重响应分析、聚类分析、判别分析、因子分析、主成分分析、对应分析、时间序列模型、信度分析、生存分析和缺失值分析的原理和使用方法。全书注重内容的实用性,在译细介绍SPSS常用的提作功能基础上,通过一些综合应用案例(在医学、经济管理、自然科学和社会科学中的应用)来演示实际统计分析中SPSS的使用。 本书适用于SPSS软件17.0~26.0版本,作者录制了96个视频教学文件,读者可通过扫描各章节二维码阅读学习。本书可作为高校经济学、管理学、统计学、公共管理、社会学和卫生统计等专业学生学
本书教你如何从基于时间的数据(如日志、客户分析和其他事件流)中获得即时、有意义的预测。在这本通俗易懂的书中,作者通过带有注释的Python代码进行全面演示,你将学习用于时间序列预测的统计和深度学习方法。通过跟随书中的实例锻炼你的技能,你很快就会准备好建立自己的准确、有洞察力的预测。