本书以R语言为实现工具,以数据可视化分析为导向,结合实际数据和案例介绍数据的可视化方法。对于一些常用的绘图函数,书中以表格形式列出了函数参数的详细注释。所有图形均给出了详细的绘图代码。全书包括3个部分和10章内容。部分包括章和第2章。章介绍R语言的初步使用技能,内容包括R的基本操作、创建R数据、生成频数分布表等。第2章介绍R绘图基础,内容包括R传统绘图包graphics中的绘图函数及基本使用方法。第2部分包括第3章~第9章。分别介绍数据分析中常用的可视化方法。第3章介绍类别数据可视化方法;第4章~第7章介绍数值数据及按因子分类的数值数据的可视化方法,包括分布特征、变量间关系、样本相似性及时间序列等;第8章介绍线性回归模型和方差分析模型的可视化方法;第9章介绍常用概率分布的可视化方法。第3部分即0章,介绍R中两个重要
数据是什么?如何应用数据?如何把数据变成 有价值的东西?本书主要适合刚开始使用数据的读者,能让他们对数据的含义、价值及用途有清晰的认识和了解,本书目的是介绍数据的相关知识,同时鼓励人们参与到日益增多的与数据有关的对话中。 本书通过介绍简单数据相关知识,即从一个总体目标、两种思维系统、三大应用领域、四种数据尺度、五种数据分析方法、六种数据展现方式、七种数据活动、八个提前问的问题分别展开阐释数据和分析的方法和思维方式。
《大数据相似查询关键技术研究》由清华大学计算机科学与技术系博士、华为数据库专家孙佶撰写。全书首先介绍了相似查询问题的现实应用和价值,以及面临的技术挑战;然后提出一个相似查询系统,并且介绍了高效相似查询索引、相似查询代价估算及人在回路实体相似匹配的核心技术和创新思考。全书提供了丰富的实验数据和结果,分析了各种技术的优劣,也为实际产品的技术选型提供了重要参考。 《大数据相似查询关键技术研究》共五章: 第1章绪论,介绍了全书的研究背景、研究内容及主要贡献,并概述了全书的结构安排。 第2章分布式内存相似查询系统Dima,介绍了分布式内存相似查询系统Dima。 第3章基于学习的相似查询基数估计,提出了一种基于学习的相似查询技术估计技术,使用这种基数可以帮助相似查询系统进行查询执行计划优化。 第4章基于相似