对于企业而言,大数据的重要性不言而喻,如何构建、实施和应用大数据系统是很复杂的。 本书将为大家全面而深入地介绍Hadoop、Spark和NoSQL平台的构建,深入浅出地讲解Hadoop、Spark和NoSQL的基础知识、架构方案与实战技巧等。通过阅读本书,读者可以对大数据平台架构有一个明确、清晰的认识,掌握Hadoop、Spark、NoSQL平台的使用技巧,从而搭建一个安全可靠的大数据集群平台,来满足企业的实际需求。 本书共15章,可分为五大部分。第一部分(第1章)为大数据平台架构概述,讲述大数据平台的基本概念与实际应用;第二部分(第2章?第6章)主要讲解Hadoop的基本使用方法,以及Hadoop生态圈的其他组件;第三部分(第7章)主要介绍NoSQL;第四部分(第8章?第10章)主要介绍Spark生态圈与Spark实战案例;第五部分(第11章?第15章)讲解如何构建大数据平台,阐述大数据平台的
无论是审计师还是会计师,在工作中都会遇到如何获取数据、分析数据的问题,甚至有时想制作一些自动化的工具或利用编程技巧来辅助完成重复性的工作。本书正是从审计师、会计师的实际工作场景出发,讲解IT审计的学习技巧、SQL基础与实战技巧、Python基础与Python实战技巧,以及数据可视化技巧等。
《数据库系统概念》是数据库系统方面的经典教材之一,本书基于该书第7版进行改编,保留其中的基本内容,压缩或删除了一些高级内容,使其体系更符合国内本科数据库课程教学要求。本书第1章概述数据库系统,第一部分(包括第2~6章)讲述关系语言的基本概念,第二部分(包括第7~9章)介绍数据库设计与应用程序开发技术,第三部分(包括第10~14章)介绍数据库管理系统实现的核心技术,第四部分(包括第15~17章)介绍大数据分析、区块链数据库、高级应用开发等高级话题。 本书既可作为高等院校计算机及相关专业本科生的数据库课程教材,也可供数据库领域的技术人员参考。
信息系统监理师考试是全国计算机技术与软件专业技术资格(水平)考试(简称“软考”)中的中级资格考试,通过信息系统监理师考试可获得中级工程师职称。 软考目前已经变为机考,本书在全面分析知识点的基础之上,结合第2版考试大纲对机考的要求,对整个内容架构进行了科学重构,可以极大地提高考生的学习效率。尤其是针对单选题、案例分析题的核心考点,分别从理论与实践方面进行了重点梳理。通过学习本书,考生可掌握考试的重点,熟悉试题形式及解答问题的方法和技巧等。 本书可供备考信息系统监理师考试的考生学习参考,也可供各类培训班使用。
随着大数据时代的来临,各种数据分析和可视化软件层出不穷,如何处理并直观展示大数据,成为了很多人都关心的一个话题。虽然应运而生了多个数据可视化工具,但随着微软Power BI软件的推出,并在行业的占有率越来越高,Power BI成为了众多大型企业青睐的数据分析对象。本书是基于Powe BI软件编写的书籍,由浅入深地讲解了Power BI的基础技术知识,就算是零基础的读者也能够快速上手操作。本书还对快速实现数据的智能分析与可视化进行了详细的介绍,并利用多个案例让读者融会贯通。通过本书的学习,您将从过去繁琐的数据处理、报表编制中解脱出来,瞬间做出美观、动态的交互式商业报告,实现公司企业内部数据可视化分析与分享,从而洞察数据的意义,实现管理的价值,大幅提升管理能力、管理水平。
本书是一本系统、全面地介绍Oracle数据库原理、操作与管理技术的教材。全书共分为10章,涵盖了数据库基础理论、Oracle系统详解、环境搭建、基础操作、编程设计、事务控制、安全管理、存储管理、备份恢复、闪回与分区技术,以及设计实例等内容,通过理论讲解与实践操作相结合的方式,引导读者从零开始,逐步掌握Oracle数据库的安装、管理、编程、优化及安全防护等核心技能。全书结构严谨、内容编排循序渐进,且注重数字资源配套的完善,以适应现代教育多元化、个性化的需求。本书可作为普通高等院校及高等职业院校计算机类各专业数据库课程的教材,也可作为数据库应用系统开发设计工作人员的实用参考书,还可作为相关计算机等级考试的学习指导资料。
本书是根据全国工科院校硕士研究生《数理统计》课程的教学基本要求而编写的。全书共分五章,系统地介绍了数理统计的基本理论与基本方法,内容包括数理统计的基本概念、参数估计、假设检验、方差分析和回归分析以及典型案例的分析与软件实现。本书注重统计思想和方法的介绍,强调统计的实际应用,用不同的软件对案例进行计算与求解。 本书可供高等院校有关专业作为本科生和研究生的教材或参考书,也可供教师、科技工作者和工程技术人员参考。
本书是Python数据分析与挖掘领域的公认的事实标准,第1版销售超过10万册,销售势头依然强劲,被国内100余所高等院校采用为教材,同时也被广大数据科学工作者奉为经典。作者在大数据挖掘与分析等领域有10余年的工程实践、教学和创办企业的经验,不仅掌握行业的近期新技术和实践方法,而且洞悉学生和老师的需求与痛点,这为本书的内容和形式提供了强有力的保障,这是本书第1版能大获成功的关键因素。全书共13章,分为三个部分,从技术理论、工程实践和进阶提升三个维度对数据分析与挖掘进行了详细的讲解。第一部分 基础篇(第1~5章)主要讲解了Python数据分析与挖掘的工具和技术理论,包括数据挖掘的基础知识、Python数据挖掘与建模工具、数据挖掘的建模过程,以及挖掘建模的常用算法和原理等内容。第二部分 实战篇(第6~12章)通过工程实践案例讲
本书示范应用的SPSS软件和R软件,是当前量化研究中的主流。 本书将研究方法、统计分析和软件操作三方面的主要知识进行了的融合,对20多种统计分析技术的讲解都配有图示清晰、步骤详细的范例,十分便于读者学习领会、照猫画虎。 本书的内容组织方式相对于将统计学和软件应用分别成书的做法,更能帮助读者在整体上对量化研究融会贯通。在难度的把握上,立足于为量化研究的初学者服务,材料选择、内容设计都比较基础,因此,完全可以作为社会学、心理学、管理学、教育学等学科的本科生和研究生的量化研究方法课程的教材。
这是一本作者亲历SQL Server 2005数据库管理及应用开发所有实践细节记录的图书。 本书共分15章,内容包括SQL Server 2005的开发模式,数据建模,全文检索,事务、锁和分布式查询,视图,约束,脚本和批处理,存储过程,用户自定义函数,触发器,SQL游标,XML开发,不错查询以及数据仓库等。系统、全面地介绍了SQL Server 2005数据库管理及应用开发技术的所有细节。讲练结合,实用性强。 本书很好适用于已经具备SQL Server数据库管理技术和数据库应用开发的中、不错用户,同时也是Web数据库设计人员以及项目开发人员必须熟悉的后台数据库管理技能,能够帮助他们快速完成大型系统开发与应用设计。另外,也可作为普通高校、社会各行业技术人才的培训教材。
本书面向数据库管理人员和数据库开发人员,从实用角度出发,系统地介绍了数据库的相关概念和原理、Oracle数据库管理及Oracle数据库应用开发基础。对于Oracle数据库初学者,本书是一本很好的入门教程,对Oracle的管理员和应用程序开发员,也有很好的学习和参考价值。 本书可作为数据库管理与应用课程的教材,也可作为Oracle数据库管理和开发人员的参考用书。
内容简介:本书共有8章,面向的对象是Excel初学者,从Excel的基本理念开始,用3章的篇幅介绍Excel的基本规则和基础表单的标准化和规范化,这是极其重要的,任何一个Excel小白都不能跨过这一步!即使已经有了所谓Excel基础的人,最后还是要从头来重新打基础。然后是Excel常用工具、函数和透视表的基本应用的介绍,以及如何利用这些工具技能来解决实际问题。
随着中台概念被广泛讨论,其中数据中台又被赋予担任企业智能化任务的重任。当前,不仅是大企业,很多企业都在开始打造或者引入中台,用来解决企业面临的系统重复建设与数据孤岛的问题,在这个过程中,中台产品经理需要做什么事,解决什么问题,又会遇到怎样的困难与挑战? 本书第1~2章讲解了中台起源与数据中台产品需要什么样的能力;第3~6章主要讲解中台中的数据中台的建设与规划、数据分析的方法与策略、数据体系建设方法与应用和企业数据的价值等;第7~9章主要讲解数据平台的需求分析与数据知识、系统平台的建设实战和用户画像体系的建设等内容。
本书详细介绍数值分析的理论和方法,并用Julia编程语言给出了算法实现。第1章除了复习数值分析要用到的微积分知识外,还介绍了Julia基础,以及实数的计算机表达与由此产生的误差;第2~5章涵盖数值分析课程的四部分内容:方程求根、插值、数值积分和数值微分、逼近理论。本书通过直观图示或简单例子引入方法,然后透彻讲解方法的思路并给出几何解释。线性代数与微积分基础较好的学生可以用本书进行自学,教师则可以从中开阔眼界,学到与众不同的思维方式与教学方法。
Access是Office办公软件系列中的重要组件,是桌面型关系数据库的一个典范。它让原本复杂的操作变得方便、快捷,使一些非专业人员也可以熟练地操作和应用数据库。全书共12章,介绍了Access数据库概述、Access数据库学习方法、表与字段属性、创建“人力资源管理系统”基础表、编辑各表之间的关系、创建查询、不错查询、创建窗体、创建报表、使用宏和VBA、导入与导出数据、数据库安全与优化等内容。本书以创建“人力资源管理系统”为例,由浅入深、结构清晰、实例丰富、图文并茂、实用性强、内容简单、通俗易懂,适合Access初学者、数据库应用从业人员、大专院校师生、计算机培训人员、办公人员等使用,同时也是Access爱好者的推荐参考书。
这是一套数据指标体系全流程构建(从规划、框架设计、数据采集加工到应用)方法论与实践指南。它不仅深入浅出地分享了通用的数据指标体系构建策略,还通过多个行业实例展示了具体操作方法。书中从数据采集入手,借助BI工具Superset实践构建过程。 本着“一切技术都是为业务服务的”这一宗旨,本书除了包含数据指标体系构建相关内容外,还结合统计学原理及Excel、Python等工具,深入剖析数据指标波动对业务的影响,旨在帮助读者深入理解数据指标与实际业务的底层关联,把数据指标体系落地到业务中。
随着中台概念被广泛讨论,其中数据中台又被赋予担任企业智能化任务的重任。当前,不仅是大企业,很多企业都在开始打造或者引入中台,用来解决企业面临的系统重复建设与数据孤岛的问题,在这个过程中,中台产品经理需要做什么事,解决什么问题,又会遇到怎样的困难与挑战? 本书第1~2章讲解了中台起源与数据中台产品需要什么样的能力;第3~6章主要讲解中台中的数据中台的建设与规划、数据分析的方法与策略、数据体系建设方法与应用和企业数据的价值等;第7~9章主要讲解数据平台的需求分析与数据知识、系统平台的建设实战和用户画像体系的建设等内容。
本书全面介绍了预测性分析相关方法,不仅直观地阐述了相关概念,还给出了现实的示例问题和真实的案例研究—包括从失败项目获得的经验教训。本书理论和实践内容相对平衡,便于读者加深理解。全书共9章,外加一个附录。第1章为分析导论,第2章为预测性分析和数据挖掘导论,第3章介绍预测性分析的标准流程,第4章介绍预测性分析的数据和方法,第5章介绍预测性分析算法,第6章探讨预测性建模中的高阶主题,第7章介绍文本分析、主题建模和情感分析,第8章介绍预测性分析使用的大数据,第9章介绍深度学习和认知计算,附录展望了商业分析和数据科学工具的前景。本书适合计算机科学、数据科学和商业分析领域的相关从业人员阅读。
《分布式智能算法及在大数据中的应用》主要包括智能算法技术与大数据概述;基于Hadoop的分布式杂交水稻算法;基于Hadoop的随机奇异值分解算法;基于Hadoop的分布式水波优化算法;基于Spark的分布式关联规则挖掘算法;基于Spark的分布式飞蛾扑火优化算法;基于Spark的分布式蚁狮算法等内容。本书可作为计算机科学与技术相关专业研究生及高年级本科生的教材,也可作为科研人员的参考书,同时可作为研究生、博士生及教师论文写作的参考书。