当今社会,大数据技术已广泛应用于各行各业,大数据相关的存储和分布式计算等基本知识也成为了时下大学生尤其是计算机相关专业学生应具备的常识。本书在内容上去繁就简,重点介绍大数据的相关基本概念和原理,包括存储原理和分布式处理的原理。本书主要围绕Hadoop大数据处理平台(第2章),介绍其中涉及的HDFS(第3章)、HBase(第4章)等存储技术和Hadoop MapReduce分布式处理技术(第6章);介绍了大数据相关的存储技术NoSQL数据库(第5章)以及数据仓库技术Hive(第7章);并对新兴的大数据平台Spark(第8章)以及其他流行的大数据技术(第9章)进行了介绍。 本书适合计算机专业的低年级学生作为大数据入门课程的教材或者其他专业学生的大数据课程教材。
本书借助大数据技术、统计学方法、人工智能技术对社会热点事件展开情感实证分析。以技术为主、分析为此、情感为辅。通过先进的技术分析情感的发展。本研究以微博平台作为切入口获取情感挖掘的大数据来源,通过构建一个较为全面的社会性事件情感分类词典,对社交网络中微博用户情感进行挖掘与可视化。通过对公众情感类型的多维度解析,从情感传播环境、情感传播方式、社会网络结构和用户行为模式四个方面探索社交网络中的舆情传播特征,由此提出合理引导网络舆情的相关对策建议。
本书是《实用数据结构基础(第四版)》(陈元春、王中华、张亮、王勇编著,中国铁道出版社出版) 的配套学习指导书。全书内容分为5部分:教学内容指导(包括对主教材第1~10章的知识点分析、典型 习题分析和各章习题解答);自主设计实验指导(对10个自主设计实验的设计思想、算法分析进行了详细 指导);模拟试卷;模拟试卷参考答案;数据结构课程设计报告样例。 本书对数据结构的概念和原理的阐述通俗易懂,例子翔实;习题难易适中,题型丰富;对数据结构 基本运算的分析注重实现的过程。本书以C/C++语言作为算法的描述语言,对于书中的实验和一些重要 的算法均给出了完整的C/C++语言源程序,并全部在Visual C++ 6.0环境下运行通过。 本书适合作为普通高等院校计算机类专业数据结构课程的教学辅导书,也可作为成
ODPS(OpenDataProcessingService)是阿里巴巴自主研发的海量数据处理和分析的服务平台,主要应用于数据分析、海量数据统计、数据挖掘、机器学习和商业智能等领域。目前,ODPS不仅在阿里内部得到广泛应用,享有很好的口碑,正逐步走向第三方开放市场。 本书是学习和掌握ODPS的专业指南,作者来自阿里ODPS团队。全书共13章,主要内容包括:ODPS入门、整体架构、数据通道、MapReduce编程、SQL查询分析、安全,以及基于真实数据的各种场景分析实战。本书基于很多范例解析,通过在各种应用场景下的示例来说明如何通过ODPS完成各种需求,以期引导读者从零开始轻松掌握和使用ODPS。同时,本书不局限于示例分析,也致力于提供更多关于大数据处理的编程思想和经验分享。书中所有示例代码都可以在作者提供的网站上免费下载。 本书适合想要了解和使用ODPS的读者
大数据是互联网、移动应用、社交网络和物联网等技术发展的必然趋势,大数据应用成为当前*为热门的信息技术应用领域。本书由浅入深,首先概述性地分析了大数据的发展背景、基本概念,从业务的角度分析了大数据应用的主要业务价值和业务需求,在此基础上介绍大数据的技术架构和关键技术,结合应用实践,详细阐述了传统信息系统与大数据平台的整合策略,大数据应用实践的流程和方法,并介绍了主要的大数据应用产品和解决方案。*后,对大数据面临的挑战和未来的趋势进行了展望。第2版,对于这几年的发展做一个补充。
本书介绍了大数据分析的多种模型、所涉及的算法和技术、实现大数据分析系统所需的工具以及大数据分析的具体应用。本书共16章。第1章为绪论,就大数据、大数据分析等概念进行了阐释,并对本书内容进行了概述;第2~7章介绍了关联分析模型、分类分析模型、聚类分析模型、结构分析模型和文本分析模型;第8章介绍大数据分析的数据预处理问题;第9章介绍降维方法;第10章介绍了数据仓库的概念、内涵、组成、体系结构和建立方法,还介绍了分布式数据仓库系统和内存数据仓库系统。第11章介绍大数据分析算法中的回归算法、关联规则挖掘算法、分类算法以及聚类算法的实现。第12~14章介绍了三种用于实现大数据分析算法的平台,即并行计算平台、流式计算平台和大图分析平台。第15章和第16章介绍两类大数据分析的具体应用,分别讲述了社会网络分析和推荐系
大数据技术作为处理海量数据的关键工具,在数据分析、数据计算、资源管理等领域得到广泛应用。本书从初学者的角度出发,全面系统地介绍了Python大数据分析、数据存储、离线计算与实时计算等基本概念与方法,并以大量案例帮助读者理解大数据技术的方方面面。此外,本书还介绍了Kafka、图数据处理、OLAP数据分析、分布式资源管理和大数据处理架构等知识,以帮助读者快速熟悉大数据技术,并应用大数据技术解决现实生活中的问题。 本书内容新颖,案例丰富,既可作为高等院校计算机、数据分析等相关专业的教学用书,也可供对大数据技术感兴趣的初学者,以及从事数据科学、大数据技术研究和应用开发的人员参考。
本书系统地介绍了AutoCAD 2018中文版绘图软件二维绘图的操作方法。全书主要内容包括AutoCAD 2018中文版的软件安装和软件操作界面及AutoCAD文件的保存方法,基本绘图环境的设置方法及样板图形文件的创建,简单二维图形的绘制方法, 绘图工具的使用方法,二维图形的编辑方法,复杂二维图形的绘制技巧,块、组和设计中心的使用,图形输出方法和图形的信息查询方法等。 本书按照工程中AutoCAD绘图的操作流程加以编排,内容简洁易懂,条理清晰,每章内容后均配置针对性很强的训练图形,本书 还提供了机械零件的整套图纸供训练提高。 本书既可作为高职高专工程类相关专业的教材,又可作为计算机图形处理人员的参考书。
本书介绍了当下流行的实时数据处理引擎Flink,讲解了流处理API、批处理API、机器学习引擎FlinkML、关系型API、复杂事件处理FLinkCEP,以及指标度量与部署模式。此外,本书展开分析了流式数据处理理论中时间、窗口、水印、触发器、迟到生存期之间的关联关系;深入分析了多项式曲线拟合、分类算法SVM、推荐算法ALS-WR的理论和FlinkML实现。希望快速上手Flink以开展实时大数据处理与在线机器学习应用的从业者,本书是不二的选择:本书首先介绍相关概念引入的原因、解决方案的演进过程、Flink的对应架构、编程案例以及开放式的思考问题。
。。。
本书是作者近十年研究工作的总结,包含众多原创性的科研成果。特别是针对三维曲线数据的构造与处理,开展了许多探索性的研究工作。围绕特征识别和形状重构这两个主题,提出一些比较好的算法,用于解决数据拟合、特征识别、光顺曲线构造和曲线降阶等问题。