这是一套数据指标体系全流程构建(从规划、框架设计、数据采集加工到应用)方法论与实践指南。它不仅深入浅出地分享了通用的数据指标体系构建策略,还通过多个行业实例展示了具体操作方法。书中从数据采集入手,借助BI工具Superset实践构建过程。 本着“一切技术都是为业务服务的”这一宗旨,本书除了包含数据指标体系构建相关内容外,还结合统计学原理及Excel、Python等工具,深入剖析数据指标波动对业务的影响,旨在帮助读者深入理解数据指标与实际业务的底层关联,把数据指标体系落地到业务中。
信息系统监理师考试是全国计算机技术与软件专业技术资格(水平)考试(简称“软考”)中的中级资格考试,通过信息系统监理师考试可获得中级工程师职称。 软考目前已经变为机考,本书在全面分析知识点的基础之上,结合第2版考试大纲对机考的要求,对整个内容架构进行了科学重构,可以极大地提高考生的学习效率。尤其是针对单选题、案例分析题的核心考点,分别从理论与实践方面进行了重点梳理。通过学习本书,考生可掌握考试的重点,熟悉试题形式及解答问题的方法和技巧等。 本书可供备考信息系统监理师考试的考生学习参考,也可供各类培训班使用。
信息系统监理师考试是全国计算机技术与软件专业技术资格(水平)考试(简称“软考”)中的中级资格考试,通过信息系统监理师考试可获得中级工程师职称。 软考目前已经变为机考,本书在全面分析知识点的基础之上,结合第2版考试大纲对机考的要求,对整个内容架构进行了科学重构,可以极大地提高考生的学习效率。尤其是针对单选题、案例分析题的核心考点,分别从理论与实践方面进行了重点梳理。通过学习本书,考生可掌握考试的重点,熟悉试题形式及解答问题的方法和技巧等。 本书可供备考信息系统监理师考试的考生学习参考,也可供各类培训班使用。
《大数据工程技术人员:大数据基础技术》由人力资源社会保障部专业技术人员管理司组织编写
信息系统监理师考试是全国计算机技术与软件专业技术资格(水平)考试(简称“软考”)中的中级资格考试,通过信息系统监理师考试可获得中级工程师职称。 软考目前已经变为机考,本书在全面分析知识点的基础之上,结合第2版考试大纲对机考的要求,对整个内容架构进行了科学重构,可以极大地提高考生的学习效率。尤其是针对单选题、案例分析题的核心考点,分别从理论与实践方面进行了重点梳理。通过学习本书,考生可掌握考试的重点,熟悉试题形式及解答问题的方法和技巧等。 本书可供备考信息系统监理师考试的考生学习参考,也可供各类培训班使用。
信息系统监理师考试是全国计算机技术与软件专业技术资格(水平)考试(简称“软考”)中的中级资格考试,通过信息系统监理师考试可获得中级工程师职称。 软考目前已经变为机考,本书在全面分析知识点的基础之上,结合第2版考试大纲对机考的要求,对整个内容架构进行了科学重构,可以极大地提高考生的学习效率。尤其是针对单选题、案例分析题的核心考点,分别从理论与实践方面进行了重点梳理。通过学习本书,考生可掌握考试的重点,熟悉试题形式及解答问题的方法和技巧等。 本书可供备考信息系统监理师考试的考生学习参考,也可供各类培训班使用。
信息系统监理师考试是全国计算机技术与软件专业技术资格(水平)考试(简称“软考”)中的中级资格考试,通过信息系统监理师考试可获得中级工程师职称。 软考目前已经变为机考,本书在全面分析知识点的基础之上,结合第2版考试大纲对机考的要求,对整个内容架构进行了科学重构,可以极大地提高考生的学习效率。尤其是针对单选题、案例分析题的核心考点,分别从理论与实践方面进行了重点梳理。通过学习本书,考生可掌握考试的重点,熟悉试题形式及解答问题的方法和技巧等。 本书可供备考信息系统监理师考试的考生学习参考,也可供各类培训班使用。
随着数字化的发展,数据逐渐融入生产、分配、流通、消费和社会服务管理等环节,为数据的拥有者或使用者带来经济效益,成为一种新型的生产要素,给生产方式、生活方式和社会治理方式带来了深刻的变革。本书主要介绍数据要素化时代的数据治理。本书分为5篇。第一篇“数据治理新趋势”介绍DataOps的发展及实践,产业级数据治理新趋势,数据治理的场景化、工程化和智能化,以及数据资产的安全运营。第二篇“新理论、新方法和新技术”介绍数业的逻辑及路径、数据治理的闭环管理方法、数据资产价值的呈现、数据治理的共治共享、精益数据治理,以及数据治理的“新四化”。第三篇“新型数据基础设施”详细介绍来自平安人寿、和镜舟科技3家企业的数据中台产品的创新情况。第四篇“行业数据治理与数据安全治理”首先介绍高校是如何进行数据治理的,
随着数字化的发展,数据逐渐融入生产、分配、流通、消费和社会服务管理等环节,为数据的拥有者或使用者带来经济效益,成为一种新型的生产要素,给生产方式、生活方式和社会治理方式带来了深刻的变革。本书主要介绍数据要素化时代的数据治理。本书分为5篇。第一篇“数据治理新趋势”介绍DataOps的发展及实践,产业级数据治理新趋势,数据治理的场景化、工程化和智能化,以及数据资产的安全运营。第二篇“新理论、新方法和新技术”介绍数业的逻辑及路径、数据治理的闭环管理方法、数据资产价值的呈现、数据治理的共治共享、精益数据治理,以及数据治理的“新四化”。第三篇“新型数据基础设施”详细介绍来自平安人寿、和镜舟科技3家企业的数据中台产品的创新情况。第四篇“行业数据治理与数据安全治理”首先介绍高校是如何进行数据治理的,
随着数字化的发展,数据逐渐融入生产、分配、流通、消费和社会服务管理等环节,为数据的拥有者或使用者带来经济效益,成为一种新型的生产要素,给生产方式、生活方式和社会治理方式带来了深刻的变革。本书主要介绍数据要素化时代的数据治理。本书分为5篇。第一篇“数据治理新趋势”介绍DataOps的发展及实践,产业级数据治理新趋势,数据治理的场景化、工程化和智能化,以及数据资产的安全运营。第二篇“新理论、新方法和新技术”介绍数业的逻辑及路径、数据治理的闭环管理方法、数据资产价值的呈现、数据治理的共治共享、精益数据治理,以及数据治理的“新四化”。第三篇“新型数据基础设施”详细介绍来自平安人寿、和镜舟科技3家企业的数据中台产品的创新情况。第四篇“行业数据治理与数据安全治理”首先介绍高校是如何进行数据治理的,
随着数字化的发展,数据逐渐融入生产、分配、流通、消费和社会服务管理等环节,为数据的拥有者或使用者带来经济效益,成为一种新型的生产要素,给生产方式、生活方式和社会治理方式带来了深刻的变革。本书主要介绍数据要素化时代的数据治理。本书分为5篇。第一篇“数据治理新趋势”介绍DataOps的发展及实践,产业级数据治理新趋势,数据治理的场景化、工程化和智能化,以及数据资产的安全运营。第二篇“新理论、新方法和新技术”介绍数业的逻辑及路径、数据治理的闭环管理方法、数据资产价值的呈现、数据治理的共治共享、精益数据治理,以及数据治理的“新四化”。第三篇“新型数据基础设施”详细介绍来自平安人寿、和镜舟科技3家企业的数据中台产品的创新情况。第四篇“行业数据治理与数据安全治理”首先介绍高校是如何进行数据治理的,
数据科学是在动态世界中不断发展变化的。本书旨在让读者掌握数据科学基础知识与技能,尽快进入理论与实践,奠定进一步发展的基础。 本书精选了5章内容。第1章为数据初等描述;第2章介绍传统统计基本思维方式,可作为参考;第3章系统深入地介绍有监督学习基础,包括回归及分类概念方法,重点介绍决策树;第4章介绍机器学习组合算法及模型;第5章详细介绍神经网络的基本概念。内容聚焦于决策树、神经网络等既基础又具扩展功能的方法,未罗列扩展性不强的方法。 本书支持R和Python两种编程语言,R代码穿插于正文,Python代码及说明性R代码附于每章之后。建议读者在学习数据科学的过程中通过处理数据自学编程,培养自己的编程能力。 本书与教学契合度高,无论经验丰富的教师,还是没器学习和数理统计教学经验的教师,都能轻松上手。其独特的数据驱
本书是一部异构制造大数据智能融合技术的学术专著。本书以制造业大数据为背景,围绕旋转设备的运行状态展开,系统介绍了在多源异构制造大数据的基础上利用多源数据融合的方法实现旋转设备的运行状态监测和智能诊断。 本书的优选亮点和特色是遵循理论性与实践性相结合、先进性与实用性相结合、专业性与通用性相结合的原则。 本书适合以下读者: 对人工智能、机器学习、数据融合感兴趣的读者;希望用计算机的算法解决机械相关领域问题的研究者、工程设计人员和应用人员。本书可以作为计算机专业和机械专业的本科毕业设计和研究生学术论文的参考资料,尤其是可供研究多源数据融合和机械设备故障诊断方向的学生、研究人员参考;还可以作为相关工程技术人员的辅助参考。
本书主要内容包括数据结构绪论,线性表,栈与队列,串、数组和广义表,树,图,查找,排序,以及课程设计指导。在每章开始给出了本章导读和教学目标,使学生在学习之前就能明白要重点掌握的内容;部分章后附有习题及实训,以便学生巩固所学知识。“课程设计指导”一章给出了几种设计题目及设计思路供学生选择,有助于教师指导学生完成小型项目的设计任务。 全书采用C语言作为数据结构和算法的描述语言,C语言具有灵活的数据类型和丰富的运算符,能够支持各种复杂数据结构的实现。此外,C语言编写的程序通常具有较高的执行效率,因为C语言接近硬件,能够生成高效的机器码,这对于需要处理大量数据和复杂计算的数据结构应用来说非常重要。书中的全部程序学生上机就可以按照操作步骤运行,全代码实现是考虑到程序设计语言学习环节相对薄弱
在数据湖仓的所有新增要素中,排名第一的就是可以利于数据分析和机器学习所用的分析基础设施。分析基础设施包括一众大家广为熟悉的东西,当然也包括一些可能对大家还有些陌生或略带新鲜感的概念。比如包括:元数据、数据血缘、数据体量的度量、数据创建的历史记录、数据转换描述。数据湖仓的第二个新增要素,是识别和使用通用连接器。通用连接器允许合并和比较所有不同来源的数据。如果没有通用连接器,就很难(实际上是几乎不可能)将数据湖仓中的不同数据关联起来。但有了这个中西,就可以关联任何类型的数据。使用数据湖仓,就有可能实现以往任何其它方式都不可行或不可能实现的某种程度的数据分析和机器学习。但与其它架构一样,我们需要理解数据湖仓的架构以及它的能力,以便于我们基于这种架构创建数据分析蓝图和开展数据分析规
本书以某上市电商企业的客户数据、订单数据、股价数据为基础,由浅入深、循序渐进地介绍Python可视化技术,重点介绍Matplotlib与Pyecharts在数据可视化应用中的基本功能和使用技巧。全书以案例为主线,既包括软件的操作与应用,又融入了数据可视化的基础知识,绘图案例大多选自工作实践,可使读者真正掌握专业的可视化方法与技巧,提升数据分析的整体能力。本书配套资源包含案例采用的数据源文件、源代码和教学视频,供读者在阅读本书时进行操作练习和参考。本书可作为管理、经济、社会人文等领域的人员学习Python软件进行大数据可视化分析的参考书,也可以作为大中专院校相关专业的教学用书或参考书。
本书是一本全面介绍数据挖掘技术的专业书籍,系统地阐述了数据挖掘的相关概念、原理、算法思想和算法的Python代码实现。全书共分13章,各章相对独立成篇,以利于读者选择性学习。13章内容分别为绪论、pandas数据处理、认识数据、数据预处理、决策树分类、贝叶斯分类、支持向量机分类、感知器分类、回归、聚类、关联规则挖掘、推荐系统、电商评论网络爬取与情感分析。本书可作为高等院校计算机科学与技术、数据科学与大数据及相关专业的数据挖掘、数据分析课程教材,亦可作为数据挖掘、数据分析人员的参考书。
通过大数据手段搜集挖掘情报信息,已成为国际上专业情报领域的重要手段。本书选取网络舆论、社会事件、开源人物、用户行为、科技动态、视频图像、公共卫生等多个具有代表性的情报大数据领域,围绕大数据背景下情报的采集、存储、管理和分析等方面,从技术实现途径进行全方位详解,以帮助读者学习掌握在海量数据中提炼出髙价值情报的方法。 本书适合高等学校数据科学与大数据、计算机、软件工程、人工智能等本专科教学使用,也适合作为对情报大数据感兴趣的研究生、工程师和研究人员的学习资料。
本书在基本数据结构的基础上,围绕一些常用的高级数据结构,结合大量实战例题,深入分析“数据结构是如何服务于算法的”,这也是本书编写的一个核心理念:学习数据结构是为了“用好”数据结构。本次修订除了改错,主要是更换全书的程序代码为(C++)。本书的适用对象包括:中学信息学竞赛选手及辅导老师、大学ACM比赛选手及教练、高等院校计算机专业的师生、程序设计爱好者等。
大数据技术涵盖面广、体系庞大,涉及不同层面及其相关技术。本书主要介绍大数据应用中的两大关键技术,即数据存储和数据处理与分析。首先介绍大数据的基本概念,然后基于Hadoop架构简要讲解HDFS大数据存储原理,剖析MapReduce和Spark分布式计算模型,重点通过Python语言详细介绍大数据处理、数据可视化和数据分析的方法及相关技术,同时详细介绍PySpark大数据分析的方法,最后通过综合案例演示大数据处理和分析过程。 本书力求较全面地介绍大数据的理论以及Python数据处理和分析的实践,使读者轻松学会利用Python进行大数据分析及应用的技术。本书适合信息类专业开设大数据技术课程时作为教材使用,也适合大数据相关技术人员作为入门参考书使用。
本书从数据与算法的相互关系入手,内容涵盖了传统的数据结构和数值分析,并增加了数学模型和算法设计思想的介绍。 全书分四部分,靠前部分,介绍数据、数学模型和算法的基本概念,是全书的基础;数据结构部分从数学模型和问题的角度介绍线性结构、树结构、图结构,以及查找和排序这两种很常见的非数值问题;数值分析部分从问题的角度介绍误差分析、实数的表示和运算、一元非线性方程、线性方程组、拟合与插值、很优化问题;第四部分,从算法设计思想的角度介绍蛮力法、分治法、贪心法、动态规划、搜索算法和随机算法,以及求解具体问题时的应用实例。
《Python数据挖掘与机器学习》主要介绍数据挖掘与机器学习的基本概念和方法,包括数据预处理、Python数据挖掘与可视化基础、关联规则挖掘、回归分析、分类、聚类、神经网络和离群点检测等内容。各章力求原理叙述清晰,易于理解,突出理论联系实际,辅以Python代码实践与指导,带领读者更好地理解与应用算法,快速迈进数据挖掘领域,掌握机器学习算法的理论和应用。 《Python数据挖掘与机器学习》可作为高等学校计算机科学与技术、数据科学与大数据技术等相关专业的教材,也可作为科研人员、工程师和大数据爱好者的参考书。
本书基于Hadoop3.3.0,覆盖Hadoop、HBase、Hive的核心概念、实践应用、程序开发等方面的内容,帮你快速解决大数据是什么和怎么用的问题,书中还利用Docker来部署Hadoop分布式集群,让你同时学会4种流行的技术。本书共9章,主要内容包括Hadoop概述、HDFS原理详解、Yarn原理详解、Hadoop系统配置、高可用Hadoop配置、HDFS编程、MapReduce编程、Hive实战、HBase实战。本书从案例入手、通俗易懂,能使读者在最短时间内迅速掌握Hadoop大数据技术。本书既适合Hadoop大数据初学者、大数据应用开发人员、大数据处理人员使用,也适合高等院校和培训机构大数据相关专业的师生教学参考。
这是一本大数据技术入门的简明教材。全书理论和实践相结合,以应用实战为主,深入浅出地讲解每个知识点,对每个应用实验按学习习惯,分步骤讲解,每个步骤都有文字说明和效果截图,使读者能清晰地知晓动手实操的效果和错误之处。全书分为9章,全面介绍了大数据技术的相关基础知识、HDFS和数据库、采集传输工具、挖掘分析算法、Spark计算框架、可视化、大数据安全、大数据应用等内容,着重介绍了HDFS分布式文件系统、NoSQL等各种数据库、数据仓库Hive,以及数据采集分析技术,并配套了详细的实验教程以及练习题。本书适合作为高等院校计算机、软件工程、大数据专业高职、本科生的教材,同时可供企业中从事大数据开发的工程师和科技工作者参考。