《Spark大数据技术与应用/大数据应用型人才培养规划教材》共分为10章,~8章阐述了spark核心组件的用法,以及使用相应组件进行大数据分析应用的方法,通过综合性实践案例将理论和实践相结合;第9~10章通过两个综合实例让读者从理论阶段上升到实际应用层面,可以帮助读者更深入理解Spark的使用方法。 《Spark大数据技术与应用/大数据应用型人才培养规划教材》作为大数据分析与内存计算的入门教材,希望能够帮助读者打开大数据分析与应用的大门。《Spark大数据技术与应用/大数据应用型人才培养规划教材》采用理论结合实践的方式,循序渐进地介绍了Spark的运行原理,并引入综合性的实践案例,以引导读者运用所学知识解决现实中的问题。
本书从工业测控的实际应用出发,系统地讲述了虚拟仪器软件LabVIEW的测控应用技术。首先介绍了虚拟仪器的含义、功能、结构、特点和常用开发平台,接着系统地讲述了LabVIEW程序设计基本知识,然后通过基于板卡的测控系统、串口通信测控系统等19个典型应用实例,详细地讲解了利用LabVIEW设计测控程序的方法,帮助读者完整地掌握LabVIEW测控应用实战技术。 书中提供的测控应用实例都有详细的操作步骤,读者可以按步骤用LabVIEW实现各种测控功能,因此实践操作性强是本书的一大特色。 本书内容丰富,论述深入浅出,有较强的实用性和可操作性,可供自动化、计算机应用、电子信息、机电一体化、测控仪器等专业的高等院校师生阅读,还可供从事计算机测控系统研发的工程技术人员参考。
继煤炭、钢铁和石油之后,数据正在成为重要的国家战略资源和国家间竞争的战略工具。数据主权是国家主权在网络空间的逻辑延伸和核心表现,关乎数据安全、个人隐私和数字经济发展,是国家安全和发展的核心利益所在。
《Druid实时大数据分析原理与实践》内容提要 Druid 作为一款开源的实时大数据分析软件,最近几年快速全球互联网公司,特别是对于海量数据和实时性要求高的场景,包括广告数据分析、用户行为分析、数据统计分析、运维监控分析等,在腾讯、阿里、优酷、小米等公司都有大量成功应用的案例。《Druid实时大数据分析原理与实践》的目的就是帮助技术人员更好地深入理解Druid 技术、大数据分析技术选型、Druid 的安装和使用、高级特性的使用,也包括一些源代码的解析,以及一些常见问题的快速回答。 Druid 的生态系统正在不断扩大和成熟,Druid 也正在解决越来越多的业务场景。希望本书能帮助技术人员做出更好的技术选型,深度了解Druid 的功能和原理,更好地解决大数据分析问题。《Druid实时大数据分析原理与实践》适合大数据分析的从业人员、IT 人员、互联网从
针对交通运输物流领域的大数据环境特点,对大数据存储以及大数据分析方法进行分析研究,主要内容如下:大数据环境下交通运输物流领域数据资源存储、计算和资源调度管理、离线数据并行计算和在线数据实时计算等方法进行剖析,实现了实时热力分析、车货信息资源实时匹配、热点词分析、物流企业信用评价等典型的交通运输物流领域大数据应用。主要章节包括:绪 论;大数据分析平台软件技术基础架构;交通运输物流大数据的数据组织与描述;交通运输物流领域流式数据实时分析与应;交通运输物流领域离线数据并行计算与应用。
DB2数据库是IBM公司关系型数据库核心产品,在以及全球有着广泛的应用。针对DB2初学者,《循序渐进DB2:DBA系统管理、运维与应用案例》循序渐进地把DB2涉及的众多概念和知识介绍给大家。客户端连通性、实例、数据库、表空间和缓冲池、数据移动、备份恢复、SQL基础知识、DB2基本监控方法、运行数据库必须考虑的设置、DBA日常维护以及数据库常用工具都是本书关注的重点。在介绍这些数据库对象和概念的同时,作者尽可能从DBA日常工作的角度探究DB2数据库常规维护工作。本书同时还就表、索引、序列、触发器等数据库对象从应用设计的角度进行了介绍。本书适合DB2的初学者、DB2开发人员、准备参加DB2认证考试的读者以及DB2数据库管理人员学习和阅读。
廉启国编著的《Stata数据统计分析教程》定位为Stata入门级的书籍,以Windows平台下Stata13.1MP版本为基准,围绕数据访问、数据管理、数据呈现和数据分析4个核心问题进行了详细阐述(并介绍了大量实用且的第三方命令)。此外,本书还介绍了Stata编程以便提高用户日常科研工作效率并介绍了工作流程以有助于用户更好地实施项目管理(含数据的加密和恢复)。,本书通过两章对近年来比较热门的Meta分析和日常科研中频繁使用的样本量估计进行了介绍。
本书对数据挖掘的基本算法进行了系统介绍,不仅介绍了每种算法的基本原理,而且配有大量例题以及源代码,并对源代码进行了分析。这种理论与实践相结合的方式有助于读者较好地理解和掌握抽象的数据挖掘算法。 全书共11章,内容涵盖了数据预处理、关联规则挖掘算法、分类算法和聚类算法,具体章节包括绪论、数据预处理、关联规则挖掘、决策树分类算法、贝叶斯分类算法、人工神经网络算法、支持向量机、K means聚类算法、K 中心点聚类算法、神经网络聚类算法:SOM,以及数据挖掘的发展等内容。 本书可作为高等院校数据挖掘课程的教材,也可作为从事数据挖掘工作以及其他相关工程技术工作人员的参考书。
本书由一线数据分析师精心编写,通过大量案例介绍了数据分析工作中常用的数据分析方法与工具。本书包括5章内容,分别是数据分析入门、数据分析——从玩转Excel开始、海量数据管理——拿MySQL说事儿、数据
随着国家大数据相关政策、规划的密集出台,大数据、人工智能商业落地速度加快,其在各个领域的应用也越来越广泛,其中面向企业服务、金融、医疗健康、电子政务、电子商务等细分领域的大数据应用展现出巨大的潜力。 大数据是需要新处理模式才能适应的海量、高增长率和多样化的信息资产,被誉为“未来的新石油”,以至于数据的获取、存储、搜索、共享、分析以及可视化呈现都成为当前重要的研究课题。 本书重点讲述数据采集与预处理的相关内容,并以真实案例介绍不同数据源的采集方式及基本的数据预处理方法。全书共lO章。其中,章为概述,第2~5章介绍静态网页数据爬取,第6章介绍动态网页数据爬取,第7、8章介绍爬虫(Scrapy)框架应用,第9章介绍数据预处理,0章给出了一个综合项目实训。 本书可作为高校数据科学与大数据技术专业相
本书完整全面地讲述数据挖掘的概念、方法、技术和近期新研究进展。本书对前两版做了全面修订,加强和重新组织了全书的技术内容,重点论述了数据预处理、频繁模式挖掘、分类和聚类等的内容,还全面讲述了OLAP和离