本书主要介绍大数据可视化的基本概念和相应的技术应用。全书内容共10章,分别为大数据可视化概述、大数据可视化原理、大数据可视化方法、数据可视化工具、Excel数据可视化、Tableau数据可视化、ECharts与pyecharts数据可视化、Python数据可视化、大数据可视化行业分析以及大数据可视化综合实训。 本书将理论与实践操作相结合,通过大量的案例帮助读者快速了解和应用大数据分析的相关技术,并且对于书中重要的、核心的知识点加大练习的比例,以使读者达到熟练应用的目的。 本书可作为大数据、云计算、软件技术、信息管理、计算机网络等专业的教材,可也作为大数据爱好者的自学参考书。
《数据挖掘(概念与技术原书第3版)》完整全面地讲述数据挖掘的概念、方法、技术和 研究进展。本书对前两版做了全面修订,加强和重新组织了全书的技术内容,重点论述了数据预处理、频繁模式挖掘、分类和聚类等的内容,还全面讲述了OLAP和离群点检测,并研讨了挖掘网络、复杂数据类型以及重要应用领域。 《数据挖掘(概念与技术原书第3版)》是数据挖掘和知识发现领域内的所有教师、研究人员、开发人员和用户都 的参考书,是一本适用于数据分析、数据挖掘和知识发现课程的 教材,可以用做高年级本科生或者一年级研究生的数据挖掘导论教材。本书由韩家炜等著。
这是一部从技术、流程、管理等多个维度系统讲解华为数据治理和数字化转型的著作。华为是一家超大型企业,华为的数据底座和数据治理方法支撑着华为在全球170多个国家/地区开展多业态、差异化的运营。书中凝聚了大量数据治理和数字化转型方面的有价值的经验、方法论、规范、模型、解决方案和案例,不仅能让读者即学即用,还能让读者了解华为数字化建设的历程。 全书共10章,内容从逻辑上分为四个部分。 第一部分(第1~3章) 第1章以非数字原生企业在数字化转型方面面临的挑战开篇,介绍了华为在数据治理和数字化转型方面的目标、愿景、蓝图和框架;第2章从企业政策和架构协同的角度,介绍了企业级的数据综合治理体系,理顺了数据与变革、运营、IT之间的协同关系,明确了数据管理的责任主体在业务;第3章详细阐述了不同类型的数据的管理方式和
本书以图书馆信息化为基点,从理论与实际应用角度,介绍了数据仓库与数据挖掘的概念、方法及在图书馆的应用。主要内容包括:以图书馆自动化集成系统日常工作中产生的数据为基础,详细介绍了应用微软SQL Server 2012数据仓库与数据挖掘工具进行图书馆数据仓库开发、数据集成服务、联机分析处理及常见数据挖掘技术挖掘过程。本书注重实践性,可操作性强,可作为企事业单位数据仓库与数据挖掘工作人员、研究人员参考用书
当前,全国首批已有38所高校开设“大数据”本科专业,预计在未来5年中开设“大数据”专业的本科和高职高专院校数量将超过500所,社会对大数据人才需求将达到100万人/年。案例教学是大数据人才培养的重要内容。 《大数据案例精析》以分析大数据在各个行业领域中的典型应用为主线,选取国际国内有代表性的近30个案例进行重点分析,行业包括政府大数据、金融大数据、医疗大数据、交通大数据、教育大数据、旅游大数据、通信大数据、电商大数据、工业大数据以及物流大数据等,每个行业平均选取3个案例进行分析,形成相对统一的案例分析体系,同时还提供相应的教学课件配套资源。
本书以实际数据的分析处理为例,介绍相应统计方法的运用,以及在EViews10.0中的实现。本书涉及处理以时间序列为主的多种类型的数据,包括描述统计、回归分析、传统时间序列等基本的数据分析以及建立条件异方差、向量自回归(包括非结构化和结构化模型)、向量误差修正模型、Panel Data模型、状态空间模型、混频数据模型等复杂的计量经济模型.本书为运用各种统计方法和经济计量方法处理数据的读者,提供了一个简便易学、易操作的工具。读者可以省去许多时间,很快就能够学习掌握该软件的运用。
本书按照简明、易读、突出实用的原则编写,书中所选案例均来自企业PDM项目实际,并在Siemens PLM Software Teamcenter 10平台上加以实现,同时由编者反复论证,全书图文并茂,并配以详尽准确的讲解步骤,使读者能够快速理解并掌握本书案例中所阐述的PDM实施方法和技巧。另外,本书每章都附有相应的练习题,供读者进行练习。读者通过学习本书,可以由浅入深、循序渐进地理解PDM的基本知识和原理,掌握企业PDM实施技能,逐步具有借助PDM平台提高企业研发核心能力,提升产品质量的工程素养。
本书是从大数据和云计算相结合的视角,系统地介绍大数据云架构技术与实践的专业图书,全书分为五篇19章,分别介绍大数据云计算的概论、关键技术、体系架构、云架构实践与编程和安全。本书层次清晰,结构合理,主要内容包括大数据云计算关系、大数据应用价值、分布式计算、NoSQL数据库、机器学习、虚拟化、Docker容器、Web 2.0、绿色数据中心、基础设计即服务(IaaS)、平台即服务(PaaS)、软件即服务(SaaS)、容器即服务(CaaS)、大数据云架构搭建、Spark大数据编程、大数据和云计算面临的安全威胁、保障大数据安全、应用大数据保障安全等。本书可作为高年级本科生和研究生教材,也可作为广大科学技术人员和计算机爱好者的参考书。
本书内容涵盖了目前使用*为广泛的大数据处理系统Hadoop生态圈中的几大核心软件系统:分布式大数据处理系统Hadoop、数据库HBase、数据仓库工具Hive、内存大数据计算框架Spark和Spark SQL,详细介绍了它们的架构、工作原理、部署方法、常用配置、常用操作命令、SQL引擎等内容。本书对上述几大系统的各种安装部署方式给出了详细步骤,常用命令也都有具体示例介绍,是一本实操性很强的工具书,能帮助初学者快速掌握这几款常用的大数据处理系统。 本书以浅显易懂的语言风格和图文并茂的操作示例引领读者迈入大数据实践之门,可以作为培养应用型人才的课程教材,也可作为开发人员的自学教材和参考手册。
本书介绍了数据挖掘的基本概念,包括数据挖掘的常用算法、常用工具、用途和应用场景及应用状况,讲述了常用数据挖掘方法,如分类、聚类、关联规则的概念、思想、典型算法、应用场景等。此外,本书还从实际应用出发,讲解了基于日志的大数据挖掘技术的原理、工具、应用场景和成功案例。日志挖掘技术现在已得到了广泛的运用。通过以上内容的学习,读者将了解数据挖掘的基本概念、思想和算法,并掌握其应用要领。本书可以作为培养应用型人才的课程教材,也可作为相关开发人员的自学教材和参考手册。
本书分为部分,分别为大数据基础理论分析、基于海量语意规则的大数据流处理技术及大数据应用。 部分介绍大数据领域的主要基础理论,包括大数据基本概念、可编程数据中心、云文件系统、云数据库系统、大数据并行编程与分析模型、大数据智能计算算法、基于大数据的数据仓库技术、大数据安全与隐私保护,以及基于大数据的语意软件工程方法等。 第二部分介绍基于海量语意规则的大数据流处理技术,包括基于规则的大数据流处理介绍、语意规则描述模型、海量语意规则网及优化、海量语意规则处理算法及海量语意规则并行处理等。 第三部分主要介绍大数据的一些典型应用,包括:文化大数据、医疗健康大数据、互联网金融大数据、教育大数据、电子商务大数据、互联网大数据、能源大数据、交通大数据、宏观经济大数据、进出口食品安全监管大数据、基
本书讲述MySQL数据库的开发技术。全书共分为16章,内容包括MySQL发展历史,与其他数据库的区别,MySQL常用的一些工具,MySQL文件结构、系统架构、存储引擎、数据类型,数据库和表的创建、管理和删除,数据完整性约束,包括主键约束、外键约束、非空约束、默认值约束、约束和自增约束等,数据的单表查询和多表查询,视图和索引,变量、常量、运算符和表达式、运算符的优先级、流程控制语句、自定义函数,系统函数,存储过程和触发器,事务管理,性能优化,日志文件管理、权限管理以及数据的备份和还原。后一章通过一个综合案例实现网上购物系统的数据库。 本书可作为在校大学生学习使用MySQL的教学资料,也可以作为非计算机专业学生学习MySQL的参考书。
数据挖掘,继承和发展经典统计分析的理论成果,结合现代机器学习方法,借助大规模高性能计算不断逼近大数据规律真相,突破了传统数据分析方法的大数据应用局限;R语言,以其开源性、易用性、全面性、前沿性和可扩充性,是实现大数据分析实践的有效工具。《R语言数据挖掘》努力坚持:讲明白理论原理,讲明白案例问题,讲明白实现步骤,讲明白结果含义的写作风格,围绕大数据分析的四大核心问题:建立数据预测模型,揭示数据内在结构,探究数据关联性,诊断异常数据,以应用案例为线索,深入浅出地讨论了众多经典数据挖掘方法原理,完整详细地讲解了R语言实现过程。本书可作为高等院校统计学、数据科学和大数据技术、大数据管理等相关专业本科生和研究生数据挖掘、机器学习和其他数据分析课程的教材,也可作为科研机构、政府和企业经营管
本教材简明扼要地介绍了各种典型数据结构的逻辑特性、存储表示和基本运算。主要内容包括:线性表与特殊线性表、栈与队列、树与二叉树、图与网络、查找与内排序、文件与外排序等。存储结构分别采用具有丰富数据类型与良好结构的类PASCAL语言和较流行的C语言进行描述;算法采用结构化流程图(N-S图)进行描述;主要算法以C语言实现;给出算法执行示例。书中配有大量的实例和图示,每章都有丰富的练习题和课程设计,旨在提高读者的算法设计能力和培养读者计算思维能力。
掌握数据可视化技术是未来工作和学习的能力,是展示理念和成果的重要手段。阅读并完成本书的实践,你将快速地学会数据获取、清洗、分析、可视化及发布的完整流程。本书以丰富的实践案例解析数据可视化的制作理念和具体方法,紧密围绕当前数据可视化领域的实际需求,全面介绍数据可视化的概念和技巧。本书包含基础知识、数据获取、数据清洗、数据分析、可视化基础和原则、数据可视化工具和可视化作品发布等内容,基于具体案例多角度启发和引导读者的创新思维,增强读者对抽象数据的把握及综合可视化能力的提升。本书内容通俗易懂,简明实用,配套的教学辅助资料可免费下载。本书适合零编程基础的数据可视化从业者和高校师生阅读,有一定工作经验的数据可视化工程师也可以从本书中学到大量实用的技能。
进入大数据时代,让数据开口说话将成为司空见惯的事情,本书将从大数据时代的前因后果讲起,全面分析大数据时代的特征、企业实践的案例、大数据的发展方向、未来的机遇和挑战等内容,展现一个客观立体、自由开放的大数据时代。
本书紧扣“大数据”这一时代主题,着眼于侦查领域大数据运用在法律研究方面的空白,构建起包括思维、模式、方法等全方位的大数据侦查体系,同时对大数据侦查可能产生的法律问题进行探讨,为侦查实务中大数据的运用提供方法、法律理论及程序上的指导。
本书注重数据挖掘理论,将理论与实践相结合、知识理论与具体实现方法相结合,由浅入深地介绍了数据分析与挖掘的相关知识。全书分为3部分。第1部分介绍了数据挖掘理论(第1~3章),第2部分介绍了Excel 2010数据分析与挖掘、SQL Server 2012数据挖掘、SPSS数据分析与挖掘的实践过程(第4~9章),第3部分介绍了SQL Server和SPSS数据挖掘的实验内容(第10章)。 本书为教师提供了配套的教学资源,可以作为计算机、智能科学类专业本科生的数据挖掘课程教材,也可以作为专业技术人员的自学参考书及数据挖掘爱好者的自学用书。
《电力安全作业全媒体培训教材》以安规为蓝本,结合近年来电力行业发生的典型事故案例,集动画、文字、图片等媒体表现形式与一体,将全媒体与电力安全培训的内容结合起来,既有引人入胜的案例,又有对安规的多维度解读,包含《电力安全事故案例动漫集(配电部分)》、《电力安全事故案例动漫集(线路部分)》两部事故案例动漫片及《国家电网公司电力安全工作规程(配电部分)》全媒体释义、《国家电网公司电力安全工作规程(线路部分)》全媒体释义。《国家电网公司电力安全工作规程(配电部分)》全媒体释义是从图片、视频、案例、释义多维度诠释2014年实施的《国家电网公司电力安全工作规程(配电部分)(试行)》,旨在帮助使用人员理解、执行条文规定,主要内容包括总则和配电作业基本条件、保证安全的组织措施、保证安全的技术措施
本书十章内容分属上、中、下三篇。上篇为大数据关键技术篇,从数据、信息和知识内在的关联逻辑出发,技术结合实例,从技术体系的基本原理、核心技术的要素组成等方面,对大数据应用的基本原理和关键技术进行了系统的论述。并对大数据体系的技术生态环境进行了分析梳理。中篇为教育大数据应用创新篇,从支持 有效学习 的角度,利用知识图谱对教育大数据进行聚合分析,提出了支持现代教育技术创新的大数据应用方案和技术赋能路径。下篇为大数据应用拓展篇,重点从技术框架出发,理论结合实践,全方位地探讨大数据技术在不同应用领域中的理念方法与技术创新思路。 本书围绕大数据及其相关技术这一主题,采用深入浅出的叙述方式,阐述大数据及其相关*技术的基本理论、关键技术和实际应用,目的是让广大师生以计算机公共基础课程为
本书完整全面地讲述数据挖掘的概念、方法、技术和近期新研究进展。本书对前两版做了全面修订,加强和重新组织了全书的技术内容,重点论述了数据预处理、频繁模式挖掘、分类和聚类等的内容,还全面讲述了OLAP和离群点检测,并研讨了挖掘网络、复杂数据类型以及重要应用领域。 本书是数据挖掘和知识发现领域内的所有教师、研究人员、开发人员和用户都推荐阅读的参考书,是一本适用于数据分析、数据挖掘和知识发现课程的优秀教材,可以用做高年级本科生或者一年级研究生的数据挖掘导论教材。
本书在介绍R软件基本功能的基础上,介绍了数据挖掘十大经典算法的基本原理及相应的R语言实现范例,旨在使读者能够仿照范例快速掌握大数据分析的方法,从高维海量数据中挖掘有用的信息,使用合适的数据挖掘算法,解决实际问题。全书内容共12章,分别介绍R软件的使用方法、C4.5算法、k-means算法、CART算法、Apriori算法、EM算法、PageRank算法、AdaBoost算法、kNN算法、Naive Bayes算法、SVM算法及各算法的案例分析。本书理论部分简单明了,所有程序均经过R软件实际运行。本书各章自成体系,读者既可从头逐章学习,也可随意挑选自己需要的章节学习。读者可登录华信教育资源网www.hxedu.com.cn免费下载算法实例代码。本书既可作为高年级本科生、研究生相关课程的教材,也可作为不同领域数据分析人员的工具书,还可作为零基础读者的自学教材。