本书是中山大学重点学科建设成果,获中国矿物岩石地球化学协会大数据与数学地球科学专业委员会推荐,是我国*部地质科学大数据与机器学习教材。本书是中山大学研究生试用研究型教材,对运用大数据挖掘与机器学习算法解决地球科学问题大有裨益。适合地质科学领域研究生和高年级本科生做教材,也可供科研人员研究时参考。它系统地介绍了地球科学大数据挖掘与机器学习的基本框架与原理,重点分析高维数据的降维、分类与预测、大图形社区结构识别、无限流数据处理、机器学习及人工智能地质学的建模过程,对必要的应用场景,使用Python语言给出案例。
本书从初学者易于理解的角度,以通俗易懂的语言、丰富的实例、简洁的图表、传统和现代数据特征的对比,将大数据这一计算机前沿科学如数家珍地娓娓道来。既介绍了大数据和相关的基础知识,又与具体应用有机结合起来,并借助可视化图表的画面感立体地为读者剖析了大数据的技术和原理,非常便于自学。本书内容包括大数据概论、大数据采集及预处理、大数据分析、大数据可视化、Hadoop概论、HDFS和Common概论、MapReduce概论、NoSQL技术介绍、Spark概论、云计算与大数据、大数据相关案例等内容。本书既可以作为想了解大数据技术和应用的初学者的教材,也适合作为培训中心、IT人员、企业策划和管理人员的参考书。
在新媒体时代,如果对新闻报道、网上搜索的结果或者所谓的 专家告知 不加思考地完全相信,那你就等着上当受骗吧! 本书围绕当今*受瞩目的大数据科学理论,通过日本政府公布的公开数据,集中针对访日游客的增加、舆论调查的可靠性、 安倍经济学 的成果、东日本大地震后的状况、相对贫困、失业率的下降、年轻人远离ХХ、全球变暖问题、减肥、恩格尔系数的上升等10个主题进行数据解读,帮助读者模拟体验数据读取方法,提高理解和分析数据的能力,挖掘出数据背后隐藏的真相。 作为 大数据分析 的超级入门书,即使不擅长数学、不了解统计学的人,读完本书也可以彻底掌握数据解读方法!
本书的主要内容包括金融工程导论、金融工程定价方法及其R语言函数计算、远期合约及其R语言函数计算、期货合约及其R语言函数计算、期货套期保值及其R语言函数计算、互换合约及其R语言函数计算、期权合约及其策略、Black Scholes期权定价方法及其R语言函数计算、蒙特卡罗模拟法期权定价及其R语言函数计算、二叉树法期权定价及其R语言函数计算、有限差分法期权定价及其R语言函数计算、利率衍生证券及其R语言函数计算以及奇异期权及其R语言函数计算,本书的后提供了关于R语言的两个附录。本书内容新颖、全面,实用性强,融理论、方法、应用于一体,是一本供金融工程、金融数学、计算金融、量化金融、投资学、金融学、保险学、金融专业硕士、经济学、统计学、数量经济学、管理科学与工程、应用数学、计算数学、概率论与数理统计等专业的本科高年级
本书不讲具体语法,只是以案例的形式介绍各种查询语句的用法。靠前~4章是基础部分,讲述了常用的各种基础语句,以及常见的错误和正确语句的写法,应熟练掌握这部分内容,因为在日常查询和优化改写中都要用到;第5~12章是提高部分,讲解了正则表达式、分析函数、树形查询及汇总函数的用法,这部分内容常用于一些复杂需求的实现及优化改写;很后两章介绍日常的优化改写案例,这部分内容是前面所学知识的扩展应用。如果您是开发人员,经常与Oracle打交道,那么本书可以帮助您处理复杂的需求,写出高性能的语句。如果您是运维人员,则本书可以帮助您更快地完成慢语句的改写优化。
数据新闻作为一种新型的新闻报道形式,弥补了传统新闻或叙事性新闻无法呈现的效果。数据新闻采用可视化的方法将单调的数据用一种直观、便于理解、更具说服力的方法呈献给读者。大量的数据比采访几十个对象获取的信息更多,做出的结论更客观易懂,也更容易阐明观点。 本书介绍在大数据环境下数据新闻的制作流程。以丰富的实践案例解析数据新闻的制作理念和方法。紧密围绕新闻人在制作数据新闻中的实际需求,全面介绍了数据新闻概述,获取数据的工具和方法,使用Openrefine清理和分析数据,数据质量分析,使用Tableau实现数据分析及可视化,以及标签云、关系图制作、Echarts和HTML5等其他数据新闻制作工具。 本书理论与实践结合,偏重数据新闻的具体制作方法。不仅包含的理论知识,而且包含具体的实践案例,多角度启发和引导读者的创新思维,增
本书分为部分,分别为大数据基础理论分析、基于海量语意规则的大数据流处理技术及大数据应用。 部分介绍大数据领域的主要基础理论,包括大数据基本概念、可编程数据中心、云文件系统、云数据库系统、大数据并行编程与分析模型、大数据智能计算算法、基于大数据的数据仓库技术、大数据安全与隐私保护,以及基于大数据的语意软件工程方法等。 第二部分介绍基于海量语意规则的大数据流处理技术,包括基于规则的大数据流处理介绍、语意规则描述模型、海量语意规则网及优化、海量语意规则处理算法及海量语意规则并行处理等。 第三部分主要介绍大数据的一些典型应用,包括:文化大数据、医疗健康大数据、互联网金融大数据、教育大数据、电子商务大数据、互联网大数据、能源大数据、交通大数据、宏观经济大数据、进出口食品安全监管大数据、基
这是一部从技术、流程、管理等多个维度系统讲解华为数据治理和数字化转型的著作。华为是一家超大型企业,华为的数据底座和数据治理方法支撑着华为在全球170多个国家/地区开展多业态、差异化的运营。书中凝聚了大量数据治理和数字化转型方面的有价值的经验、方法论、规范、模型、解决方案和案例,不仅能让读者即学即用,还能让读者了解华为数字化建设的历程。 全书共10章,内容从逻辑上分为四个部分。 部分(~3章) 章以非数字原生企业在数字化转型方面面临的挑战开篇,介绍了华为在数据治理和数字化转型方面的目标、愿景、蓝图和框架;第2章从企业政策和架构协同的角度,介绍了企业级的数据综合治理体系,理顺了数据与变革、运营、IT之间的协同关系,明确了数据管理的责任主体在业务;第3章详细阐述了不同类型的数据的管理方式和要点。 第二
基于知识的聚类展示的是如何设计一个导航平台,以使信息探寻者能理解和较好的应用种类繁多的数据集。比模糊聚类走得更远,作者展示了基于知识的聚类这一有前景的新范例是如何揭示更有意义的数据结构,并使社会更好地处理日益增长的数据和信息流。通过这《基于知识的聚类—从数据到信息粒》,读着能理解基于知识聚类的基础和与其相关联的算法,学会将他们自己的知识应用到系统建模和设计中去。 《基于知识的聚类—从数据到信息粒》首先对模糊聚类和粒计算这一领域进行介绍和讨论。然后,作者深入研究了基于逻辑的神经元和神经网络。《基于知识的聚类—从数据到信息粒》的核心部分包括9章,在其中呈现和分析了众多不同的基于知识的聚类的方法。《基于知识的聚类—从数据到信息粒》的第三部分致力于模型的研究,首先讨论超盒结构,然
本书在介绍了数据挖掘原理的基础上,从实用的角度出发,详细地介绍了数据挖掘的经典算法。本书是国内本对数据挖掘技术基础算法进行详细描述的实用性教材。 第1章从不同的角度对数据挖掘进行了介绍,第2章介绍了数据仓库技术的概念并给出了数据立方体的理论基础。第3章讲述了数据挖掘的数据预处理所涉及到的概念及算法。第4章-第8章详细介绍了数据挖掘的经典领域的算法,其中第6章简单介绍了数据可视化的内容。第9章介绍了开放的数据挖掘平台。 本书的使用对象是在校高年级的本科生、研究生及各个领域的高级软件开发人员。
这是一本讨论时下热门话题 大数据的书,生动活泼地阐释了晦涩艰深的统计学原理,条理清晰地告诉读者如何从数据中获取智慧。 全书分为8章,第1章概述了大数据时代统计学面临的机遇和挑战。第2、3章讲述了统计学在思想方法及数据表述上和大数据处理方法的异同;第4章介绍了对统计学影响深远的正态分布;第5章探讨了大数据时代统计推断是否失效;第6章重点从统计学视角讲述了大数据时代*热门的变量间的 相关性 问题;第7章以一种比较开放的态度讨论统计学中一些有意思又实用的话题;第8章探讨大数据能够给企业、用户及整个产业和社会带来什么价值。 拥有本书,不仅可以使读者感受数字的美感和哲学的智慧,还能够使读者掌握思辨的洞察力。更重要的是,拥有本书就相当于拥有了一种武器,数据驱动的思维模式将会使读者在生活、工作中受益匪浅。
本书主要介绍如何应用SAS软件系统进行数据分析。全书内容分为两部分,部分介绍SAS系统的一些基本操作、数据库管理、统计报表输出、绘制各种统计图形和简单编程。第二部分结合具体数据实例,介绍数据分析中常用的几种统计分析方法:回归分析、主成分分析、因子分析、典型相关分析、判别分析、聚类分析和时间序列分析。? 本书主要是面向电子商务专业的本科生,也可作为MBA、研究生的教材,同时也可作为经济类各专业学生学习数据处理课程的参考书。
本书是与张宏军教授等编著的《作战仿真数据工程》教材配套的实验指导书。本书根据《作战仿真数据工程》教材的组织特点编排了实验内容。紧密配合理论教学.合理安排数据工程的实验教学,使学生能够在有限的实验课时中,加深对所学知识的理解与掌握,熟练使用常用的数据工程相关处理软件,培养和提高学生的实际操作水平。 本书涵盖了作战仿真数据规划、数据建模、数据集成、元数据集拟制、数据分析与数据挖掘、数据可视化、数据管理等方面的实验项目,实验内容饱满、步骤详细,有助于提高学生的实验效果。 本书可作为相关专业研究生和高年级本科生的实验教材,也可作为工程技术人员的参考书。
本书是中国人民大学出版社出版的教材《统计数据分析基础教程(第二版)——基于SPSS 20和Excel 2010的调查数据分析》的配套辅导书。 由于本次修订对教材内容进行了更加适当的筛选,同时对例题和上机实验题进行了大幅更新,于是本同步配套辅导书也做了相应的修订。 本书以习题和上机实验指导的方式给出了教材中“思考题与上机实验题”的解答,以便帮助读者消化教材内容。本书包含10章的上机实验指导共32个。包括:*抽样、调查问卷制作、问卷数据的录入与清理、单选题的一维频率分析、两个单选题的交叉表分析、多选题的一维频率分析和交叉表分析、描述统计分析、假设检验、单因素方差分析、线性相关分 析与线性回归分析等。 本书可作为各级各类高等院校本科生统计数据分析的入门书,也可以作为MBA学生、研究生以及从事统计数据分析工作的人士
本书第1版列为*“面向21世纪课程教材”。第2版作了较大的修改和补充,增加了关系逻辑、递归SQL、对象联系图、UML的类图、ODMG标准、ODBC和XML等内容。这次第3版被*列为普通高等教育“十一五”*规划教材,对内容又作了修订和充实。 本书详细介绍数据库系统的基本原理、方法和发展趋势。全书分为上、下两篇。上篇为基础篇,介绍传统的数据库技术,内容包括:数据库概论、关系模型和关系运算理论、关系数据库语言SQL、关系数据库的规范化设计、数据库设计与ER模型、数据库的存储结构和系统实现技术。下篇为发展篇,介绍数据库技术的发展,内容包括:对象数据库系统、分布式数据库系统、ODBC技术、XML技术和现代信息集成技术。 本书是作者长期从事数据库教学和科研活动所获成果的结晶。全书内容丰富,叙述清楚、严谨,每章后面均有适量的习题,适
本书是一本Oracle数据库管理的入门教材,适合于初中级的读者,是作者二十多年IT工作和教学实践的总结与升华。 本着“把Oracle数据从高雅的象牙塔中带出来,使它的贵族身份贫民化,为普通人提供一套能买得起,而且容易读懂的Oracle数据库实用教材”的写作理念,本书使用生动而简单的生活例子来解释复杂的计算机和数据库概念,避免用计算机的例子来解释计算机和数据库的概念。本书是自封闭的,除了的SQL知识之外,读者可以在没有任何计算机专业知识的情况下从头开始阅读此书,而且也不需要其他的参考书。为了消除读者对IT教材常有的畏惧感,书中使用的语言轻松而幽默。 本书是一本Oracle数据库管理的实用教材。虽然它覆盖了OCP(Oracle认证专家)或OCA考试的几乎全部的内容,但重点放在实际工作能力的训练。因此本书中的每章附有大量的例题,而且
商业智能利用已有的数据资源进行各种有效的业务决策。因此该领域不仅是数据管理、信息处理活跃的研究领域之一,而且在各行各业中得到了广泛的应用。本书共分12章,全面介绍了商业智能系统的设计、部署、数据处理及系统管理等相关知识,包括数据仓库的架构和模型设计、数据仓库的构建、数据仓库项目的开发和实施、数据仓库的应用、在线分析技术、数据挖掘技术、智能挖掘器、知识管理、数据仓库的运行和管理,以及OLAP服务器的运行和管理等技术内容。此外,本书对商业智能系统所涉及的主流产品技术进行了深入浅出的介绍。通过本书的学习,读者可对商业智能的整体结构、技术和产品等有深入的了解和认识。
数据挖掘将数据转化为知识,是数据管理、信息处理领域研究、开发和应用的活跃的分支之一。本书全面地论述了数据挖掘领域的基本概念、基本原理和基本方法,内容包括数据挖掘领域的经典理论和前沿发展。全书共分14章,并含有1个附录。全面系统地介绍了数据挖掘的概念和过程、数据预处理技术;深入地叙述了各种数据挖掘技术,包括关联规则、决策树、聚类、基于样例的学习、贝叶斯学习、粗糙集、神经网络、遗传算法、统计分析;并讨论了数据挖掘的典型应用,如分类、文本和Web挖掘,以及数据挖掘的应用和发展趋势;并在第14章中给出了一个具体的商业智能解决方案实例。 通过本书的学习,读者可以对数据挖掘的整体结构、概念、原理、技术和发展有深入的了解和认识。 本书既可以作为相关专业的高年级本科生和研究生教材,也可作为数据挖掘领