本书系统讲授数据挖掘的原理、主要方法及其Python实现,共分三部分:第一部分包含第1~2章,介绍数据挖掘的基本概念、流程和数据预处理;第二部分包含第3~11章,介绍经典的分类算法(包括朴素贝叶斯分类器、决策树、k-近邻、支持向量机等)、经典的聚类分析、关联分析、人工神经网络和Web挖掘等方法;第三部包含第12~14章,共有3个综合案例,包括泰坦尼克号生存数据分析、心脏病预测分析和旅游评论倾向性分析。
机器学习是计算机科学和人工智能中 重要的一个研究领域,近年来,机器学习不但在计算机科学的众多领域中大显身手,而且成为一些交叉学科的重要支撑技术。Drew Conway编著的《机器学习(实用案例解析)》比较全面系统地介绍了机器学习的方法和技术,不仅详细阐述了许多经典的学习方法,而且讨论了一些有生命力的新理论、新方法。 全书案例既有分类问题,也有回归问题;既包含监督学习,也涵盖无监督学习。《机器学习(实用案例解析)》讨论的案例涉及分类、回归、聚类、降维、 化问题等。这些案例包括:垃圾邮件识别、智能收件箱、预测网页访问量、文本回归、密码破译、构建股票市场指数、用投票记录对美国参议员聚类、给用户 r语言包、分析社交图谱、给问题找到 算法等。各章对原理的叙述力求概念清晰、表达准确,突出理论联系实际,富有
这是一本没有编程基础也能学习的企业数据分析书。本书以解决企业中常见的数据分析问题为主线,通过实例,采用“思路―方法―具体实现过程”的结构进行通俗易懂的讲解。本书共分为3篇。篇,带领读者了解数据分析并熟
本书内容涵盖了目前使用很为广泛的大数据处理系统Hadoop生态圈中的几大核心软件系统:分布式大数据处理系统Hadoop、数据库HBase、数据仓库工具Hive、内存大数据计算框架Spark和Spark
冯丹、曾令仿编著的这本《信息存储技术专利数据分析》基于 973和863相关项目成果,采用汤森路透德温特世界专利创新索引数据库作为统计数据来源,对信息存储领域的专利文献进行检索分析,从存储器件、设备、系统等层面,选取了目前信息存储领域中的多项重要技术,利用专利统计分析的方法对其发展态势进行了研究,特别是对信息存储领域相关专利进行宏观统计分析以及核心专利的具体分析,可以 了解信息存储技术的发展历程、专利的 或地区分布、重要专利权人的竞争态势,为制定相关战略提供决策参考。本书结合华为、中兴、联想、浪潮、IBM、EMC、三星、美光等 外知名企业的实际案例,从中国本土和 的布局两个角度分别分析了专利产出、主要竞争者、热点技术和研发重点以及竞争态势,力求找到信息存储技术专利申请对技术产业化与企业发展的作用
本书系统地介绍了利用R 语言进行数据分析和挖掘的相关技术,采用由浅入深的框架体 系:开篇伊始介绍R 语言的基础操作,进而介绍回归分析、方差分析等数据分析的方法,以 好地探索数据内部结构,获取数据所包含的信息; 重要的是为后续的数据挖掘提供理论 依据; 介绍典型数据挖掘工具和方法,采用理论基础到算法介绍到案例实战的布局,让 读者深刻感知数据挖掘的精髓,在了解算法的同时 好地学以致用。
《问卷数据分析:破解SPSS软件的六类分析思路(第2版)》系统介绍了使用SPSS软件进行问卷数据分析的思路及方法,分为四部分,分别是问卷设计、六类问卷分析思路、数据分析方法在SPSS软件中的操作和答疑