《大数据相似查询关键技术研究》由清华大学计算机科学与技术系博士、华为数据库专家孙佶撰写。全书首先介绍了相似查询问题的现实应用和价值,以及面临的技术挑战;然后提出一个相似查询系统,并且介绍了高效相似查询索引、相似查询代价估算及人在回路实体相似匹配的核心技术和创新思考。全书提供了丰富的实验数据和结果,分析了各种技术的优劣,也为实际产品的技术选型提供了重要参考。 《大数据相似查询关键技术研究》共五章: 第1章绪论,介绍了全书的研究背景、研究内容及主要贡献,并概述了全书的结构安排。 第2章分布式内存相似查询系统Dima,介绍了分布式内存相似查询系统Dima。 第3章基于学习的相似查询基数估计,提出了一种基于学习的相似查询技术估计技术,使用这种基数可以帮助相似查询系统进行查询执行计划优化。 第4章基于相似
本书是“十四五”职业教育国家规划教材。本书分为理论篇、工具篇和实训篇。理论篇主要介绍数据挖掘的基础知识、基本任务和常用方法,侧重培养学生对于数据挖掘基本概念等理论知识的正确理解;工具篇主要介绍PMT这
李翠平主编的《非结构化大数据分析》介绍了四种典型非结构化数据的分析和挖掘技术,分别是文本数据、社交网络数据、数据流数据和多媒体数据(包括图像、音频和视频),共12章。~5章,主要介绍了文本挖掘的时代