本书是中山大学重点学科建设成果,获中国矿物岩石地球化学协会大数据与数学地球科学专业委员会推荐,是我国*部地质科学大数据与机器学习教材。本书是中山大学研究生试用研究型教材,对运用大数据挖掘与机器学习算法解决地球科学问题大有裨益。适合地质科学领域研究生和高年级本科生做教材,也可供科研人员研究时参考。它系统地介绍了地球科学大数据挖掘与机器学习的基本框架与原理,重点分析高维数据的降维、分类与预测、大图形社区结构识别、无限流数据处理、机器学习及人工智能地质学的建模过程,对必要的应用场景,使用Python语言给出案例。
本书是数据挖掘精髓的浓缩。第1章用通俗易懂的语言回答五个基本问题,包括什么是数据,什么是大数据,什么是数据挖掘,以及数据挖掘能挖掘出哪些东西和会产生什么价值。然后用6章的篇幅介绍k-均值、k-近邻、朴素贝叶斯、决策树、回归分析和关联规则挖掘等6种方法。第8章介绍一些实际的应用,演示简单的数据挖掘方法如何产生巨大的价值。本书可供高校的数据科学与大数据、智能科学与技术、人工智能、计算机科学与技术和统计类、应用数学等相关专业的学生作为教材使用,也可供高校的商科大数据、金融等专业的学生、优秀的中学生、科技企业的管理者和相关行业的投资人学习参考。
本书根据教育.部高等学校计算机基础教学指导委员会编制的《普通高等学校计算机基础教学基本要求》,为满足高等教育对数据库技术和程序设计方面的基本要求进行编写。本书共11章,包括数据库基础知识、Access