本书是中山大学重点学科建设成果,获中国矿物岩石地球化学协会大数据与数学地球科学专业委员会推荐,是我国*部地质科学大数据与机器学习教材。本书是中山大学研究生试用研究型教材,对运用大数据挖掘与机器学习算法解决地球科学问题大有裨益。适合地质科学领域研究生和高年级本科生做教材,也可供科研人员研究时参考。它系统地介绍了地球科学大数据挖掘与机器学习的基本框架与原理,重点分析高维数据的降维、分类与预测、大图形社区结构识别、无限流数据处理、机器学习及人工智能地质学的建模过程,对必要的应用场景,使用Python语言给出案例。
本书从初学者易于理解的角度,以通俗易懂的语言、丰富的实例、简洁的图表、传统和现代数据特征的对比,将大数据这一计算机前沿科学如数家珍地娓娓道来。既介绍了大数据和相关的基础知识,又与具体应用有机结合起来,并借助可视化图表的画面感立体地为读者剖析了大数据的技术和原理,非常便于自学。本书内容包括大数据概论、大数据采集及预处理、大数据分析、大数据可视化、Hadoop概论、HDFS和Common概论、MapReduce概论、NoSQL技术介绍、Spark概论、云计算与大数据、大数据相关案例等内容。本书既可以作为想了解大数据技术和应用的初学者的教材,也适合作为培训中心、IT人员、企业策划和管理人员的参考书。
在新媒体时代,如果对新闻报道、网上搜索的结果或者所谓的 专家告知 不加思考地完全相信,那你就等着上当受骗吧! 本书围绕当今*受瞩目的大数据科学理论,通过日本政府公布的公开数据,集中针对访日游客的增加、舆论调查的可靠性、 安倍经济学 的成果、东日本大地震后的状况、相对贫困、失业率的下降、年轻人远离ХХ、全球变暖问题、减肥、恩格尔系数的上升等10个主题进行数据解读,帮助读者模拟体验数据读取方法,提高理解和分析数据的能力,挖掘出数据背后隐藏的真相。 作为 大数据分析 的超级入门书,即使不擅长数学、不了解统计学的人,读完本书也可以彻底掌握数据解读方法!
本书的主要内容包括金融工程导论、金融工程定价方法及其R语言函数计算、远期合约及其R语言函数计算、期货合约及其R语言函数计算、期货套期保值及其R语言函数计算、互换合约及其R语言函数计算、期权合约及其策略、Black Scholes期权定价方法及其R语言函数计算、蒙特卡罗模拟法期权定价及其R语言函数计算、二叉树法期权定价及其R语言函数计算、有限差分法期权定价及其R语言函数计算、利率衍生证券及其R语言函数计算以及奇异期权及其R语言函数计算,本书的后提供了关于R语言的两个附录。本书内容新颖、全面,实用性强,融理论、方法、应用于一体,是一本供金融工程、金融数学、计算金融、量化金融、投资学、金融学、保险学、金融专业硕士、经济学、统计学、数量经济学、管理科学与工程、应用数学、计算数学、概率论与数理统计等专业的本科高年级
《数据库系统实现(英文版)(第2版)》是关于数据库系统实现方面内容最为全面的著作之一,是美国斯坦福大学计算机科学专业数据库系列课程第二门课程的指定教材。书中从数据库实现者的角度对数据库系统实现原理进行了深入阐述。并具体讨论了数据库管理系统的三个主要成分 存储管理器、查询处理器和事务管理器的实现技术。斯坦福大学计算机科学专业数据库系列课程门课程的内容包括数据库设计和数据库编程。《数据库系统实现(英文版)(第2版)》的后两位作者Jeffrey D.UIIman和Jennifer Widom为该课程编写的教材《数据库系统基础教程》(A First Course iDatabase Systems)第3版的中文翻译版和英文影印版已由机械工业出版社出版。 《数据库系统实现(英文版)(第2版)》内容深入且全面,技术实用且先进,叙述深入浅出,是一本难得的高层次的教材,适合作
本书不讲具体语法,只是以案例的形式介绍各种查询语句的用法。靠前~4章是基础部分,讲述了常用的各种基础语句,以及常见的错误和正确语句的写法,应熟练掌握这部分内容,因为在日常查询和优化改写中都要用到;第5~12章是提高部分,讲解了正则表达式、分析函数、树形查询及汇总函数的用法,这部分内容常用于一些复杂需求的实现及优化改写;很后两章介绍日常的优化改写案例,这部分内容是前面所学知识的扩展应用。如果您是开发人员,经常与Oracle打交道,那么本书可以帮助您处理复杂的需求,写出高性能的语句。如果您是运维人员,则本书可以帮助您更快地完成慢语句的改写优化。
数据新闻作为一种新型的新闻报道形式,弥补了传统新闻或叙事性新闻无法呈现的效果。数据新闻采用可视化的方法将单调的数据用一种直观、便于理解、更具说服力的方法呈献给读者。大量的数据比采访几十个对象获取的信息更多,做出的结论更客观易懂,也更容易阐明观点。 本书介绍在大数据环境下数据新闻的制作流程。以丰富的实践案例解析数据新闻的制作理念和方法。紧密围绕新闻人在制作数据新闻中的实际需求,全面介绍了数据新闻概述,获取数据的工具和方法,使用Openrefine清理和分析数据,数据质量分析,使用Tableau实现数据分析及可视化,以及标签云、关系图制作、Echarts和HTML5等其他数据新闻制作工具。 本书理论与实践结合,偏重数据新闻的具体制作方法。不仅包含的理论知识,而且包含具体的实践案例,多角度启发和引导读者的创新思维,增
本书分为部分,分别为大数据基础理论分析、基于海量语意规则的大数据流处理技术及大数据应用。 部分介绍大数据领域的主要基础理论,包括大数据基本概念、可编程数据中心、云文件系统、云数据库系统、大数据并行编程与分析模型、大数据智能计算算法、基于大数据的数据仓库技术、大数据安全与隐私保护,以及基于大数据的语意软件工程方法等。 第二部分介绍基于海量语意规则的大数据流处理技术,包括基于规则的大数据流处理介绍、语意规则描述模型、海量语意规则网及优化、海量语意规则处理算法及海量语意规则并行处理等。 第三部分主要介绍大数据的一些典型应用,包括:文化大数据、医疗健康大数据、互联网金融大数据、教育大数据、电子商务大数据、互联网大数据、能源大数据、交通大数据、宏观经济大数据、进出口食品安全监管大数据、基
数据仓库与数据挖掘是决策支持的两项重要技术,它们共同的特点是都需要利用大量的数据资源,并从数据资源中提取信息和知识。由于数据资源丰富,因此数据仓库与数据挖掘的决策支持效果显著。 本书系统介绍数据仓库原理,联机分析处理,数据仓库设计与开发,数据仓库的决策支持,数据挖掘原理,基于信息论的决策树方法,基于集合论的粗糙集方法、k—均值聚类、关联规则挖掘,仿生物技术的神经网络,遗传算法,公式发现,知识挖掘,文本挖掘与web挖掘。 本书从数据仓库的兴起来说明决策支持的特点,从数据挖掘的理论基础来说明数据挖掘的方法,并通过实例来详细讲解。希望读者在学习之后,亲自在计算机上去实践,这样才能更有效地掌握数据挖掘的方法。
数据仓库与数据挖掘是计算机专业和其他一些与计算机技术关系密切专业必修的核心课程。《数据仓库与数据挖掘技术》系统地介绍了数据仓库和数据挖掘的基本概念、相关知识和基本方法,每种数据挖掘方法都有详尽的实例描述和具体实现步骤。《数据仓库与数据挖掘技术》结构严谨,条理清晰,语言浅显易懂,循序渐进地表达了知识内容;《数据仓库与数据挖掘技术》坚持理论与实际相结合,概念和具体方法相结合,使知识具体化,生动化;实例实现的过程建立在sql2005数据挖掘软件的基础上,以帮助读者在学习后达到学以致用的目的。 本书可以作为计算机类、信息类等相关专业本科生数据挖掘课程的教材,也可以作为其他专业技术人员的自学参考书。
本书针对计算机、信息管理和其他相关专业学生的发展需求,系统、全面地介绍了大数据技术与应用的基本知识和技能,详细介绍了大数据基础、大数据的行业应用、大数据的基础设施、大数据技术基础、Hadoop分布式架构、大数据管理、大数据分析、人工智能与机器学习、数据科学与数据科学家、开放数据的时代,以及大数据发展与展望等内容,具有较强的系统性、可读性和实用性。本书是为高等院校 大数据 相关课程全新设计编写、具有丰富实践特色的主教材,也可供有一定实践经验的软件开发人员和管理人员参考,或作为继续教育的教材。 本书配套授课电子课件,需要的教师可登录www.cmpedu.com免费注册、审核通过后下载,或联系编辑索取(微信:15910938545,QQ:2850823885,email:2308140194@qq.com,电话:010-88379739)另外,为方便任课教师进行交流,提供本科计算机
本书在介绍大数据发展背景、特点及主要技术层面的基础上,对大数据的数据采集、数据存储、常见计算模式和典型系统工具进行了分析介绍。本书同时对各种典型系统工具进行了讲解,包括大数据查询分析计算及典型工具(HBase、Hive)、批处理计算及典型工具(MapReduce、Spark)、流式计算及典型工具(Storm、Apex、Flink)、事件流及典型工具(Druid)等。本书提供了大量的实例和源代码供读者参考,指导读者快速、无障碍地了解和掌握常见大数据分析工具的使用。本书适合作为计算机及相关专业的教学用书,也可以作为大数据初学者的自学教材和参考手册。
传统客户/服务器的分布式计算模式主要解决的是部门或企业内部的应用,关注的是局部应用,建立的应用系统多数是为完成某种需求而建立,因此是孤立封闭的。即使在同一个部门或者企业内部,应用系统相互之间也常常因为没有通信而导致信息无法共享,使得各个IT资源成为一个个信息孤岛。随着互联网软件技术及其应用的迅速发展,如何提供一个统一开放的交互环境,使得各个应用实体之间能够相互发现、了解各自所提供的服务,并将这些应用低代价、方便地连接在一起,实现开放式网络环境中的互联、互通、互操作的目标,是当前互联网环境下所面临的一个重要问题。 想要有效地整合现有的应用系统并实现信息共享,关键在于实现这些应用系统间的数据交换。数据交换是网络环境下分布式应用的共性、基础性和关键性的需求,它用于解决信息化过
张霞的这本《粒度计算在数据挖掘中的应用研究》对模糊粒度计算在文本软聚类中的应用进行了深入研究,提出了一种基于模糊粒度计算的聚类方法,并且利用该聚类方法对K-means算法进行了优化。基于模糊粒度计算的聚类是通过归一化的距离函数将聚类问题映射到距离空间,调节粒度产生对文本集合D的动态聚类划分。 动态聚类既可以作为一个单独的聚类结果,也可以作为其他算法的一个预处理步骤。K-means算法是一种经典的聚类算法,速度快、消耗资源小,但是算法对初始聚类中心点敏感,容易陷入局部小值。《粒度计算在数据挖掘中的应用研究》将基于模糊粒度计算的聚类方法作为K-means算法的预处理步骤,实验结果证明,这种预处理有效地消除了K-means算法的初始值敏感问题,优化了K-means算法。
本书主要介绍数据仓库和数据挖掘技术的基本原理和应用方法,全书共分为12章,主要内容包括数据仓库的概念和体系结构、数据仓库的数据存储和处理、数据仓库系统的设计与开发、关联规则、数据分类、数据聚类、贝叶斯网络、粗糙集、神经网络、遗传算法、统计分析、文本和Web挖掘。 本书既重视理论知识的讲解,又强调应用技能的培养。每章首先介绍算法的主要思想和理论基础,之后利用算法去解决实例中给出的任务,而且对于数据仓库的组建方法和多数章节中的数据挖掘算法,本书都使用Microsoft SQL Server 2005进行了操作实现。本书通过对具体实例的学习和实践,使读者掌握数据仓库和数据挖掘中必要的知识点,达到学以致用的目的。 本书每章均配有习题,习题形式为选择题、简答题和操作题,可以帮助读者进一步巩固和掌握所学知识。此外,本书提供多媒
《数据仓库与数据挖掘技术》主要介绍数据仓库和数据挖掘技术的基本概念、相关技术和应用案例及方法。全书共分为9章,主要内容包括:数据仓库与数据挖掘的概念和体系结构、数据仓库开发模型、etl技术、olap技术、商务智能系统、数据预处理技术、数据挖掘技术、数据仓库开发实例、报表设计等内容。本书各章节的案例均使用microsoftsql server2005进行操作实践讲解。通过对具体实例的学习和实践,使读者掌握数据仓库和数据挖掘中必要的知识点,达到学以致用的目的。 《数据仓库与数据挖掘技术》适合作为高等院校本科学生的教材,也可供企业信息化管理人员、技术人员以及软件开发人员阅读参考。
本书详细阐述了数据仓库与数据挖掘的基本原理,系统而全面地介绍了数据仓库与数据挖掘的概念、作用、算法和应用举例,并且给出了信息分析所涉及到的若干问题及框架。本书介绍了*的信息分析技术研究成果,如小波分析、Rough分析、蚁群分析、分形技术、Agent、数据挖掘的进化算法、聚类分析、非结构数据的挖掘、离群数据挖掘,但并未详细描述,而将介绍重点放在其应用上,起到抛砖引玉的作用。 本书既可以作为信息管理与信息系统、计算机应用、经济管理等专业的高年级本科生和研究生的教材,又可以作为有关在经济管理领域中应用信息分析技术提高决策人员的参考。
本书根据高等院校培养综合型交叉学科本科人才的发展目标编写,介绍空间数据分析的原理与方法。全书共分17章,主要内容包括绪论、空间数据的性质、空间数据的完备化、空间数据的标准化、探索性空间数据分析、空间点模式分析、地统计数据插值、格数据统计、格数据回归分析、空间回归分析、面状数据空间模式分析、空间连续数据分析方法、非参数统计、空间抽样方法、空间度量算法、空间分析算法和空间统计分析算法。 本书可作为地理信息系统、计算机科学与技术、遥感科学与技术、测绘工程、地理科学等相关专业学生的教科书,同时也适合于从事空间数据分析、地理信息系统应用的人员参考。
本书以大数据为研究背景,系统分析了传统数据技术当前存在的问题以及面临的挑战,并对比了当前主流的面向大数据的数据库解决方案,在此基础上阐述了笔者的研究工作:基于MapReduce平台高处处理大数据的OLAP研究。书中反应了当前大规模数据仓库研究的热点和成果,值得大数据研究的人员参考和应用。
近年来,大数据成为学术界和工业界的热点,其 本质就是海量数据分析。海量数据的来源包括互联网 、传感器、生产生活、科学观测、科学实验等。海量 数据分析不仅可以帮助人们取得新的科学发现,也可 以推动技术的适应性、个性化和健壮性方面的进步。 海量数据分析是一个跨学科的研究领域,理解本书的 内容需要具备计算机科学、统计学和优化理论的基础 知识。美国国家学术院国家研究委员会编著的《海量 数据分析前沿》从计算和推理的角度分析了与海量数 据分析相关的前沿问题,重点介绍海量数据挖掘分析 以及流数据挖掘的进展,讨论了并行和分布式系统架 构方面的*发展,具体内容包括数据建模、任务建 模、计算复杂性问题分析、数据采样以及人工参与的 数据分析方法等。