本书从初学者易于理解的角度,以通俗易懂的语言、丰富的实例、简洁的图表、传统和现代数据特征的对比,将大数据这一计算机前沿科学如数家珍地娓娓道来。既介绍了大数据和相关的基础知识,又与具体应用有机结合起来,并借助可视化图表的画面感立体地为读者剖析了大数据的技术和原理,非常便于自学。本书内容包括大数据概论、大数据采集及预处理、大数据分析、大数据可视化、Hadoop概论、HDFS和Common概论、MapReduce概论、NoSQL技术介绍、Spark概论、云计算与大数据、大数据相关案例等内容。本书既可以作为想了解大数据技术和应用的初学者的教材,也适合作为培训中心、IT人员、企业策划和管理人员的参考书。
本书是中山大学重点学科建设成果,获中国矿物岩石地球化学协会大数据与数学地球科学专业委员会推荐,是我国*部地质科学大数据与机器学习教材。本书是中山大学研究生试用研究型教材,对运用大数据挖掘与机器学习算法解决地球科学问题大有裨益。适合地质科学领域研究生和高年级本科生做教材,也可供科研人员研究时参考。它系统地介绍了地球科学大数据挖掘与机器学习的基本框架与原理,重点分析高维数据的降维、分类与预测、大图形社区结构识别、无限流数据处理、机器学习及人工智能地质学的建模过程,对必要的应用场景,使用Python语言给出案例。
部分(第1~4章)为基础和背景部分,主要介绍数据分析挖掘和数据化运营的相关背景、数据化运营中“协调配合”的本质,以及实践中常见分析项目类型的介绍。第二部分(第6~13章)是数据分析挖掘中的具体技巧和案例分享部分,主要介绍实践中常见的分析挖掘技术的实用技巧,并对大量的实践案例进行了全程分享展示。第三部分(第5章,第14~19章)是有关数据分析师的责任、意识、思维的培养和提升的总结和探索,以及一些有效的项目质控制度和经典的方法论介绍。
数据库的性能优化一直是DBA日常工作中非常重要的组成部分,然而很多DBA在学习了大量技术,参加了大量培训后,仍然会在实际工作中遇到难以下手的问题。实际上,在数据库优化工作中,方法和思路远比技术实现重要得多。 《DBA的思想天空:感悟Oracle数据库本质》重在介绍Oracle数据库的性能调优方法及相应的工作思路,但并不拘泥于技术细节。作者通过大量真实案例,深度剖析了相关技术原理,同时还阐述了理论知识在实践中的应用方法。优化工作的本质其实就是透过表象探寻根源,解决问题实现调优,正所谓 思路是道,操作方法是技 ,得道是极大的提升,也是DBA的思想精髓。
《数据分析方法与案例详解(双色)》是一本语言和数据分析的入门教材,循序渐进、深入浅出,每个知识点尽量从实际的应用案例出发,以问题为导向,在解决问题中学习统计方法、语言的基本使用以及编程技巧。 《数据分析方法与案例详解(双色)》内容涵盖数据结构、函数与优化、抽样模拟、统计分析、假设检验、回归分析、统计绘图和包制作等内容。 《数据分析方法与案例详解(双色)》的定位是为业界数据分析人员、经济管理类、医学的学生提供方法和程序上的参考,在写作过程中尽量删去比较理论的数学原理,这样能够帮助读者轻松上手学习。
数据分析已经成为数据时代各行各业突破各自行业发展瓶颈的有效手段,无论是公司职员还是个体商户或大公司管理者,都需要有数据分析的能力。 n本书系统地介绍了数据分析的统计理论基础内容,共5章。章阐述了数据分析在当今生活中的重要性,以及人们成为各自领域的数据分析师的必要性和学习路径;第2章从数据描述的三个维度展开,详细介绍了如何从集中趋势、离散程度和分布形态对数据进行描述,从而使分析者充分了解自己手头的数据;第3章介绍了推断性数据统计分析的内容,介绍了如何通过样本数据特性推断出总体数据特征;第4章是关于预测分析的,介绍了变量之间的相关分析,以及如何使用容易获取的数据信息预测难以获取的数据信息,用过去的历史数据信息预测未来可能出现的数据信息;第5章介绍了数据结果可视化的内容,包括各种统计图形
《MySQL从入门到精通》从初学者角度出发,通过通俗易懂的语言以及丰富多彩的实例,详细介绍了MySQL开发应该掌握的各方面技术。《MySQL从入门到精通》共分为4篇23章,包括数据库基础,初识MySQL,使用MySQL图形化管理工具,数据库操作,存储引擎及数据类型,操作数据表,MySQL基础,表数据的增、删、改操作,数据查询,常用函数,索引,视图,数据完整性约束,存储过程与存储函数,触发器,事务的应用,事件,备份与恢复,MySQL性能优化,权限管理及安全控制,PHP管理MySQL数据库中的数据,Apache+PHP+MySQL实现网上社区,Struts 2+Spring+Hibernate+ MySQL实现网络商城等内容。所有知识都结合具体实例进行介绍,涉及的程序代码也给出了详细的注释,可以使读者轻松领会MySQL的精髓,快速提高开发技能。 《MySQL从入门到精通》内容详尽,实例丰富,非常适合作为编程初学
本书借助大数据技术、统计学方法、人工智能技术对社会热点事件展开情感实证分析。以技术为主、分析为此、情感为辅。通过先进的技术分析情感的发展。本研究以微博平台作为切入口获取情感挖掘的大数据来源,通过构建一个较为全面的社会性事件情感分类词典,对社交网络中微博用户情感进行挖掘与可视化。通过对公众情感类型的多维度解析,从情感传播环境、情感传播方式、社会网络结构和用户行为模式四个方面探索社交网络中的舆情传播特征,由此提出合理引导网络舆情的相关对策建议。