本书是中山大学重点学科建设成果,获中国矿物岩石地球化学协会大数据与数学地球科学专业委员会推荐,是我国*部地质科学大数据与机器学习教材。本书是中山大学研究生试用研究型教材,对运用大数据挖掘与机器学习算法解决地球科学问题大有裨益。适合地质科学领域研究生和高年级本科生做教材,也可供科研人员研究时参考。它系统地介绍了地球科学大数据挖掘与机器学习的基本框架与原理,重点分析高维数据的降维、分类与预测、大图形社区结构识别、无限流数据处理、机器学习及人工智能地质学的建模过程,对必要的应用场景,使用Python语言给出案例。
技术是把双刃剑,当我们在积极拥抱新技术的同时,也不能忽视其所带来的风险,比如当今大数据时代个人隐私和安全问题。本书是两位作者结合各自出色的专业知识和丰富的从业经验为大众倾力奉献的一本大数据时代隐私问题的普及读物。书中展示了我们在家庭和工作中的日常活动是如何成为大数据收集的一部分的。同时,列举大量的大数据应用以及安全和隐私相关案例,包括企业如何利用大数据进行营销、执法机构如何利用大数据执法等,也包括不法分子如何利用非法或合法的手段获取数据,如何利用社交网络进行犯罪。针对上述问题,本书也列出了一些工具、技巧用来检查和防范,这在当前很有现实意义。
过去几十年里,Web的迅速发展使其成为世界上规模zui大的公共数据源。Web挖掘的目标是从Web超链接、网页内容和使用日志中探寻有用的信息。 《世界计算机教材精选:Web数据挖掘(第2版)》旨在阐述Web数据挖掘的概念及其核心算法,使读者获得相对完整的关于Web数据挖掘的算法和技术知识。本书不仅介绍了搜索、页面爬取和资源探索以及链接分析等传统的Web挖掘主题,而且还介绍了结构化数据的抽取、信息整合、观点挖掘和Web使用挖掘等内容,这些内容在已有书籍中没有提及过,但它们在Web数据挖掘中却占有非常重要的地位。全书分为两大部分:部分包括第2章到第5章,介绍数据挖掘的基础,第二部分包括第6章到2章,介绍Web相关的挖掘任务。从本书自版出版之后,很多领域已经有了重大的进展。新版大部分的章节都已经添加了新的材料来反应这些进展,主要
在新媒体时代,如果对新闻报道、网上搜索的结果或者所谓的 专家告知 不加思考地完全相信,那你就等着上当受骗吧! 本书围绕当今*受瞩目的大数据科学理论,通过日本政府公布的公开数据,集中针对访日游客的增加、舆论调查的可靠性、 安倍经济学 的成果、东日本大地震后的状况、相对贫困、失业率的下降、年轻人远离ХХ、全球变暖问题、减肥、恩格尔系数的上升等10个主题进行数据解读,帮助读者模拟体验数据读取方法,提高理解和分析数据的能力,挖掘出数据背后隐藏的真相。 作为 大数据分析 的超级入门书,即使不擅长数学、不了解统计学的人,读完本书也可以彻底掌握数据解读方法!
数据分析已经成为数据时代各行各业突破各自行业发展瓶颈的有效手段,无论是公司职员还是个体商户或大公司管理者,都需要有数据分析的能力。 n本书系统地介绍了数据分析的统计理论基础内容,共5章。章阐述了数据分析在当今生活中的重要性,以及人们成为各自领域的数据分析师的必要性和学习路径;第2章从数据描述的三个维度展开,详细介绍了如何从集中趋势、离散程度和分布形态对数据进行描述,从而使分析者充分了解自己手头的数据;第3章介绍了推断性数据统计分析的内容,介绍了如何通过样本数据特性推断出总体数据特征;第4章是关于预测分析的,介绍了变量之间的相关分析,以及如何使用容易获取的数据信息预测难以获取的数据信息,用过去的历史数据信息预测未来可能出现的数据信息;第5章介绍了数据结果可视化的内容,包括各种统计图形
本书主要以OpenTSDB的很新版本(2.3.1版本)为基础进行介绍。章从OpenTSDB的入门开始,介绍市面上多种时序数据库和云端时序数据库,OpenTSDB的基础概念、源码环境搭建及Grafana的基本使用等。第2章主要介绍OpenTSDB的网络层,涉及Java NIO基础、Netty基本使用,分析了OpenTSDB网络层的架构和实现。第3章介绍OpenTSDB中UniqueId组件的原理,主要讲解如何实现UID与字符串之间的映射。第4章介绍OpenTSDB如何实现时序数据的存储及相关优化。第5章介绍OpenTSDB如何实现时序数据的查询,其中分析了OpenTSDB查询中每个步骤的实现。第6章和第7章主要介绍OpenTSDB中的元数据及Tree结构的实现和功能。第8章主要分析OpenTSDB中的插件及工具类实现原理。
本书以大数据为研究背景,系统分析了传统数据技术当前存在的问题以及面临的挑战,并对比了当前主流的面向大数据的数据库解决方案,在此基础上阐述了笔者的研究工作:基于MapReduce平台高处处理大数据的OLAP研究。书中反应了当前大规模数据仓库研究的热点和成果,值得大数据研究的人员参考和应用。
部分(第1~4章)为基础和背景部分,主要介绍数据分析挖掘和数据化运营的相关背景、数据化运营中“协调配合”的本质,以及实践中常见分析项目类型的介绍。第二部分(第6~13章)是数据分析挖掘中的具体技巧和案例分享部分,主要介绍实践中常见的分析挖掘技术的实用技巧,并对大量的实践案例进行了全程分享展示。第三部分(第5章,第14~19章)是有关数据分析师的责任、意识、思维的培养和提升的总结和探索,以及一些有效的项目质控制度和经典的方法论介绍。
《MySQL从入门到精通》从初学者角度出发,通过通俗易懂的语言以及丰富多彩的实例,详细介绍了MySQL开发应该掌握的各方面技术。《MySQL从入门到精通》共分为4篇23章,包括数据库基础,初识MySQL,使用MySQL图形化管理工具,数据库操作,存储引擎及数据类型,操作数据表,MySQL基础,表数据的增、删、改操作,数据查询,常用函数,索引,视图,数据完整性约束,存储过程与存储函数,触发器,事务的应用,事件,备份与恢复,MySQL性能优化,权限管理及安全控制,PHP管理MySQL数据库中的数据,Apache+PHP+MySQL实现网上社区,Struts 2+Spring+Hibernate+ MySQL实现网络商城等内容。所有知识都结合具体实例进行介绍,涉及的程序代码也给出了详细的注释,可以使读者轻松领会MySQL的精髓,快速提高开发技能。 《MySQL从入门到精通》内容详尽,实例丰富,非常适合作为编程初学
《MySQL数据库实用教程》是作者在多年的数据库开发实践与教学经验的基础上,根据计算机相关专业的职业岗位能力需求及学生的认知规律倾心组织编写的。该书使用“员工管理信息系统”“小型图书系统”作为理论知识讲解的载体;使用“学生管理信息系统”作为实训练习的载体。主要内容包括:了解MySQL数据库,MySQL的安装与配置,创建与管理数据库和表,数据表的基本操作,视图、索引和事务的使用,数据库编程,数据库管理。 该书内容系统性强,知识体系新颖,理论与实践结合,突出实训部分,具有先进性和实用性。该书可以作为计算机相关专业数据库课程的教材,也可以作为相关从业人员的参考用书。
本书用轻松的图解方式来讲解数据结构,全书采用丰富的图例阐述数据结构的基本概念及应用,并将重要理论、演算方法做详细的诠释与举例,是一本兼具内容及专业的数据结构的教学用书。 由于作者长期从事信息教育及写作,在文字的表达上简洁明了、逻辑清晰,并安排了大量的习题,供读者检验学习成果。
本书分为部分,共九章。第壹部分(章)主要介绍了企业大数据系统的前期准备工作,包括如何构建企业大数据处理系统的软件环境和集群环境。第二部分(第2~7章)首先介绍了Spark的基本原理,Spark2.0版本的SparkSQL、StructuredStreaming原理和使用方法,以及Spark的多种优化方式;然后,介绍了Druid的基本原理、集群的搭建过程、数据摄入过程,以及在查询过程中如何实现Druid查询API;接着介绍了日志收集系统Flume的基本架构和关键组件,以及分层日志收集架构的设计与实践;后介绍了分布式消息队列Kafka的基本架构和集群搭建过程,以及使用Java语言实现客户端API的详细过程。第三部分(第8~9章)主要介绍了企业大数据处理的两个实际应用案例,分别是基于Druid构建多维数据分析平台和基于JMX指标的监控系统。
数据分析已经成为数据时代各行各业突破各自行业发展瓶颈的有效手段,无论是公司职员还是个体商户或大公司管理者,都需要有数据分析的能力。 n本书系统地介绍了数据分析的统计理论基础内容,共5章。章阐述了数据分析在当今生活中的重要性,以及人们成为各自领域的数据分析师的必要性和学习路径;第2章从数据描述的三个维度展开,详细介绍了如何从集中趋势、离散程度和分布形态对数据进行描述,从而使分析者充分了解自己手头的数据;第3章介绍了推断性数据统计分析的内容,介绍了如何通过样本数据特性推断出总体数据特征;第4章是关于预测分析的,介绍了变量之间的相关分析,以及如何使用容易获取的数据信息预测难以获取的数据信息,用过去的历史数据信息预测未来可能出现的数据信息;第5章介绍了数据结果可视化的内容,包括各种统计图形
本书从Power BI的基础功能讲起,逐步深入到Power BI进阶实战,以业务案例为导向,以Power BI桌面版操作为基础进行讲解,深入讲述Power BI在各个业务部门的应用。本书包括7篇共21章内容,分业务场景进行讲解。篇用1章内容讲述Power BI基础操作,方便读者快速入门;第2篇用4章内容讲述如何用Power BI爬取天气、电影、销售、股票等数据;第3篇用4章内容讲述销售部门如何用Power BI分解销售目标,分析业绩达成、会员RFM和业绩构成;第4篇用5章内容讲述产品相关应用,包括存货分析、帕累托分析、关联分析、款分析和数据化陈列;第5篇用2章内容讲述在财务方面的应用,包括盈亏平衡分析和上市公司利润表分析;第6篇用3章内容讲述人力资源应用,包括人员结构及离职率分析、新员工分析和考勤分析;第7篇用2章内容讲述简化报告的技巧。
本书的主要内容包括金融工程导论、金融工程定价方法及其R语言函数计算、远期合约及其R语言函数计算、期货合约及其R语言函数计算、期货套期保值及其R语言函数计算、互换合约及其R语言函数计算、期权合约及其策略、Black Scholes期权定价方法及其R语言函数计算、蒙特卡罗模拟法期权定价及其R语言函数计算、二叉树法期权定价及其R语言函数计算、有限差分法期权定价及其R语言函数计算、利率衍生证券及其R语言函数计算以及奇异期权及其R语言函数计算,本书的最后提供了关于R语言的两个附录。本书内容新颖、全面,实用性强,融理论、方法、应用于一体,是一本供金融工程、金融数学、计算金融、量化金融、投资学、金融学、保险学、金融专业硕士、经济学、统计学、数量经济学、管理科学与工程、应用数学、计算数学、概率论与数理统计等专业的本科高年
《数据科学导引》是博雅大数据学院针对新开设的“数据科学与大数据技术”专业编写的数据科学导论课程教材。 《数据科学导引》内容共分十五章,包括绪论、数据预处理、回归模型、分类模型、集成模型、聚类模型、关联规则挖掘、降维、特征选择、EM算法、概率图模型、文本分析、图与网络分析、深度学习、分布式计算。附录部分对相关的基础知识做了简要介绍。 《数据科学导引》还提供了大量的数据分析实践案例,有助于加深读者对理论知识的理解,及培养其实际应用能力。 《数据科学导引》可作为全国高等学校数据科学相关专业的本科生和研究生教材,也可供从事相关工作的技术人员参考使用。
本书详细地介绍使用 Access 开发数据库系统的知识、技术与实际应用。全书共 13 章,每一章都是一个独立的主题,以数据库系统的开发流程来组织各章内容和排列顺序,有助于梳理 Access 知识体系和数据库开发流程。本书内容包括 Access 数据库术语、数据库对象及其视图、Access 界面环境的使用与定制、数据库的整体设计流程、创建数据库和表、设计表结构、设置表的主键和索引、创建表之间的关系、在数据表视图中操作数据、使用查询操作数据、使用窗体显示和编辑数据、使用报表呈现与打印数据、使用表达式和 SQL 语句、使用宏让操作自动化、管理和维护数据库等内容,最后一章介绍了开发一个数据库管理系统的具体方法和步骤。 为了帮助读者更好地理解在开发数据库的过程中涉及的 Access 知识和技术,本书提供了 72 个案例,读者可以在学习过程中多加练习,不
《MySQL从入门到精通》从初学者角度出发,通过通俗易懂的语言以及丰富多彩的实例,详细介绍了MySQL开发应该掌握的各方面技术。《MySQL从入门到精通》共分为4篇23章,包括数据库基础,初识MySQL,使用MySQL图形化管理工具,数据库操作,存储引擎及数据类型,操作数据表,MySQL基础,表数据的增、删、改操作,数据查询,常用函数,索引,视图,数据完整性约束,存储过程与存储函数,触发器,事务的应用,事件,备份与恢复,MySQL性能优化,权限管理及安全控制,PHP管理MySQL数据库中的数据,Apache PHP MySQL实现网上社区,Struts 2 Spring Hibernate MySQL实现网络商城等内容。所有知识都结合具体实例进行介绍,涉及的程序代码也给出了详细的注释,可以使读者轻松领会MySQL的精髓,快速提高开发技能。 《MySQL从入门到精通》内容详尽,实例丰富,非常适合作为编程初学