《从零进阶!数据分析的统计基础(第2版)》 共 6 章,分别讲解了数据分析的步骤和方法、描述性统计分析、抽样估计、假设检验、方差分析、 相关与回归分析,使用简单的语言介绍了这些数据分析基本方法的核心思想和涉及的统计学、概率论等方面 的理论内容,并使用图示的方法详细介绍了使用 Excel 2013 进行简单的描述性统计分析和使用 SPSS 进行相 关的数据分析的过程与结果分析。
《数据挖掘(概念与技术)》论述数据挖掘的基本概念、基本技术和进展。《数据挖掘(概念与技术)》分10章,全面而深入地介绍数据库技术的发展和数据挖掘的应用,数据仓库和联机分析技术,数据预处理技术(数据清理、数据集成和转换、数据归约),数据挖掘技术(数据的分类、预测、关联和聚类),先进数据库系统中的数据挖掘方法,以及数据挖掘的应用和一些具有挑战性的问题。《数据挖掘(概念与技术)》注重实效,在讨论概念与技术时辅以实例,并提供代表性算法。《数据挖掘(概念与技术)》可作为高年级本科生和研究生的教材,也可供相关技术人员作参考读物。
本书是机器学习和数据挖掘领域的经典教材,被众多国外名校选为教材。书中详细介绍用于数据挖掘领域的机器学习技术和工具以及实践方法,并且提供了一个公开的数据挖掘工作平台Weka。本书主要内容包括:数据输入/输出、知识表示、数据挖掘技术(决策树、关联规则、基于实例的学习、线性模型、聚类、多实例学习等)以及在实践中的运用。本版对上一版内容进行了全面更新,以反映自第2版出版以来数据挖掘领域的技术变革和新方法,包括数据转换、集成学习、大规模数据集、多实例学习等,以及新版的Weka机器学习软件。
为了适应数据库技术的发展需要,满足广大读者和教师的建议和需求,本书是在《数据库原理及开发应用》的基础上修订而成,本版深入浅出地讲解了数据库原理及其应用。相对版,本版对原书各章节增加了大量的例题,本版更系统全面、例题更丰富、实用性更强、注重培养学生的应用技能和能力,既能更方便教师的讲授,又便于学生掌握和理解数据库知识。 《数据库原理及开发应用(第二版)》的主要内容为数据库概述、数据模型、关系数据库的基本理论、transact?sql语言、结构化查询语言sql、存储过程和触发器、关系模式的规范化设计、数据库设计、数据库的安全与保护、数据库应用系统设计实例、web数据库应用系统、数据库技术新进展。 《数据库原理及开发应用(第二版)》注重教材内容循序渐进、由浅入深、理论与实践相结合,书中有大量的图形
《教学成果奖配套教材:数据结构》的主要任务是介绍并探讨有关数据组织、算法设计、时间和空间效率的概念和通用分析方法,帮助读者理解数据的组织方法和现实世界问题在计算机内部的表示方法,针对问题的具体应用背景进行分析,进而选择合适的数据结构,从而培养程序设计技能。 本书章介绍了数据结构与算法的基本概念;第2章基本上是对C语言关键内容的复习,为后续章节理解数据结构的实现作准备;第3章至第7章分别介绍了线性表、树、散列表、图、排序算法等经典数据结构与算法;在第8章通过对两个实际生活中提炼出的问题的解答,帮助读者更深刻体会数据结构的应用。 本书可作为高等学校计算机类专业的专业基础课“数据结构”的教材。
数据可视化是展示数据的重要手段,广泛适用于数据分析、计量统计、演讲展示和各种网站应用。而通过浏览器来呈现数据不受平台限制,任何计算机只要能上网就可以看到漂亮的交互式图表。《数据可视化实战:使用D3设计交互式图表》将带领读者学习当前最热门的基于浏览器的数据可视化库——D3。作者通过风趣幽默的语言、简单易懂的示例,由浅入深地介绍了使用D3所需的基本技术,以及基于数据绘图、比例尺、数轴、数据更新、过渡和动画等构建交互式在线图表的核心概念,还介绍了D3中常用的布局方法和创建地图等流行应用的技巧。 《数据可视化实战:使用D3设计交互式图表》需要读者具有一定的Web开发经验,特别要了解一些DOM编程。除此之外,只要对数据可视化感兴趣,均可阅读学习。
10余位数据挖掘领域专家和科研人员,10余年大数据挖掘咨询与实施经验结晶。从数据挖掘的应用出发,以电力、航空、医疗、互联网、生产制造以及公共服务等行业真实案例为主线,深入浅出介绍Python数据挖掘建模过程,实践性极强。 本书共15章,分两个部分:基础篇、实战篇。基础篇介绍了数据挖掘的基本原理,实战篇介绍了一个个真实案例,通过对案例深入浅出的剖析,使读者在不知不觉中通过案例实践获得数据挖掘项目经验,同时快速领悟看似难懂的数据挖掘理论。读者在阅读过程中,应充分利用随书配套的案例建模数据,借助相关的数据挖掘建模工具,通过上机实验,以快速理解相关知识与理论。 基础篇(~5章),章的主要内容是数据挖掘概述;第2章对本书所用到的数据挖掘建模工具Python语言进行了简明扼要的说明;第3章、第4章、第5章对数据挖掘的建
《大数据搜索与日志挖掘及可视化方案(第2版)》提出的分布式大数据搜索与日志挖掘及可视化方案是基于ELK Stack而提出的,它能有效应对海量大数据所带来的分布式存储与处理、全文检索、日志挖掘、可视化等问题。构建在全文检索开源软件Lucene之上的Elasticsearch,不仅能对海量规模的数据完成分布式索引与检索,还能提供数据聚合分析。据国际的数据库产品评测机构DB Engines的统计,在2016年1月,Elasticsearch已超过Solr等,成为排名的搜索引擎类应用;Logstash能有效处理来源于各种数据源的日志信息;Kibana能得出可视化分析结果。了解基于ELK Stack的大数据搜索与日志挖掘及可视化方案,掌握Elasticsearch、Logstash、Kibana的基本使用方法和技巧,很有必要。
《数据挖掘(概念与技术)》论述数据挖掘的基本概念、基本技术和进展。《数据挖掘(概念与技术)》分10章,全面而深入地介绍数据库技术的发展和数据挖掘的应用,数据仓库和联机分析技术,数据预处理技术(数据清理、数据集成和转换、数据归约),数据挖掘技术(数据的分类、预测、关联和聚类),先进数据库系统中的数据挖掘方法,以及数据挖掘的应用和一些具有挑战性的问题。《数据挖掘(概念与技术)》注重实效,在讨论概念与技术时辅以实例,并提供代表性算法。《数据挖掘(概念与技术)》可作为高年级本科生和研究生的教材,也可供相关技术人员作参考读物。
《数据库系统概念(原书第6版)》是经典的数据库系统教科书《Database System Concepts》的新修订版,全面介绍数据库系统的各种知识,透彻阐释数据库管理的基本概念。本书内容丰富,不仅讨论了关系数据模型和关系语言、数据库设计过程、关系数据库理论、数据库应用设计和开发、数据存储结构、数据存取技术、查询优化方法、事务处理系统和并发控制、故障恢复技术、数据仓库和数据挖掘,而且对性能调整、性能评测标准、数据库应用测试和标准化、空间和地理数据、时间数据、多媒体数据、移动和个人数据库管理以及事务处理监控器、事务工作流、电子商务、高性能事务系统、实时事务系统和持续长时间的事务等应用主题进行了广泛讨论。 《数据库系统概念(原书第6版)》既可作为高年级本科生或低年级研究生的数据库课程教材,也可供数据库领域的技
你是否有过这样的经历:在项目的一刻突然被要求在图中修改或添加某个数据点?这时为了完成项目,你将不得不冒着降低准确性的风险,然而,在Tableau中不会发生这种情况。Tableau是一个革命性的工具包,利用它可以简单、高效地创建高质量的数据可视化图形。本书通过大量的具体案例,详细讲解了如何利用Tableau软件进行数据可视化分析,包括基本使用方法、具体操作步骤、实现原理及一些实用技巧等,为快速掌握Tableau软件提供了翔实指导。 本书共9章,章讲解如何连接不同数据源,包括文本、Excel、Access数据库文件及服务器上的数据;第2~5章循序渐进讲解各种图形的创建方法,包括单变量图、双变量图、多变量图和地图;第7~8章详细讲解了如何自定义图中各个元素以及如何将做好的可视化图形打包分享;第6章和第9章主要介绍Tableau的功能,包括自定义字段、自
大数据的统计计算是进行数据探索和分析挖掘的基础,在实际应用中会遇到两个问题:一个是需要使用多少资源;另一个是计算时间,它关系到数据探索分析的效率和效果。人们都希望花更少的钱,并且希望计算时间更短,但对于某个确定的计算过程,它们是成反比的。《重构大数据统计》作者就是从统计计算的算法入手,重构其计算过程,从而同时降低资源使用量和计算时间。《重构大数据统计》提出了一套完整的关于大数据统计的计算理论,包括常用的各种统计量和统计方法。基于《重构大数据统计》内容开发的数据分析工具已经在集团内部的多个部门使用,并取得显著效果。另外,《重构大数据统计》还提供大量的示例程序代码帮助读者进一步了解算法细节,便于将书中的方法运用于实际计算。 《重构大数据统计》适合对大数据分析感兴趣的读者阅读,
本书以EMBA班的“数据挖掘技术及其应用”教学为场景,带领读者步入数据挖掘的神秘殿堂,领略数据挖掘的神奇魅力。全书分为9章:章从三个真实故事开始数据挖掘之旅;第2章以某企业生产中遇到的质量控制难题的解决过程为线索,展现数据挖掘的实施过程;第3章到第9章以典型案例的形式分别介绍了数据挖掘技术在电力行业、交通航空领域、冶金行业、税务与金融行业、电信行业、故障诊断以及互联网行业的应用。 数据挖掘是一种专业性极强的技术,本书避开大量晦涩的概念和令人生畏的数学公式,以师生互动讨论的形式让读者走进数据挖掘殿堂,进而深入浅出、循序渐进地感知数据挖掘。随着阅读,读者会自然而然地身临课堂,“让数据说话,从数据中发现规律,科学决策”等新的理念会使读者对实际工作中面临的复杂问题浮想联翩、另辟新径。 本书适合企
本书系统地介绍了大数据挖掘的基本概念、经典挖掘算法、挖掘工具和企业智慧运营应用案例。全书分为9章,内容包括:大数据挖掘与智慧运营的概念,数据预处理,数据挖掘中的四种主流算法:聚类分析、分类分析、回归分析、关联分析,增强型数据挖掘算法,数据挖掘在运营商智慧运营中的应用案例,未来大数据挖掘的发展趋势等。全书以运用大数据挖掘方法提升企业运营业绩与效率为主线,从运营商实际工作中选取了大量运营和销售案例,详细讲述了数据采集、挖掘建模、模型落地与精准营销的全部过程。书中大部分案例的代码、软件操作流程和微课视频可以通过扫描本书封底的下载。本书主要面向运营商及其他高科技企业员工、高等院校相关专业本科生和研究生,以及其他对数据挖掘与精准营销感兴趣的读者。