数据是什么?如何应用数据?如何把数据变成更有价值的东西?本书主要适合刚开始使用数据的读者,能让他们对数据的含义、价值及用途有清晰的认识和了解,本书目的是介绍数据的相关知识,同时鼓励人们参与到日益增多的与数据有关的对话中。 本书通过介绍简单数据相关知识,即从一个总体目标、两种思维系统、三大应用领域、四种数据尺度、五种数据分析方法、六种数据展现方式、七种数据活动、八个提前问的问题分别展开阐释数据和分析的方法和思维方式。
互联网公司里面几乎很少有公司不用MySQL,国内互联网巨头都在大规模使用MySQL。如果把MySQL比喻成数据库界的一条巨龙,则性能优化和高可用架构设计实践就是点睛之笔。本书将详细讲解 MySQL 5.7高可用和性能优化技术,细致梳理思路,并与真实生产案例相结合,通过原理阐述到实战部署,帮助读者将所学知识点运用到实际工作中。 本书分为13章,详解MySQL 5.7数据库体系结构,InnoDB存储引擎,MySQL事务和锁,性能优化,服务器全面优化、性能监控,以及MySQL主从复制、PXC、MHA、MGR、Keepalived 双主复制等高可用集群架构的设计与实践过程,并介绍海量数据分库分表和Mycat中间件的实战操作。 本书既适合有一定基础的 MySQL数据库学习者、MySQL数据库开发人员和 MySQL数据库管理人员阅读,同时也能作为高等院校和培训学校相关专业师生的参考用书。
本书与以往统计学中的概率论略有不同,添加了一些复杂数据类型的概率基础知识和模拟计算中的相关概率知识。具体安排如下所述。本书共分6章。第1章为概率与计数,基本内容是随机事件、概率空间、计数方法、概率的确定方法。第2章为条件概率,基本内容是条件概率与乘法公式、事件的独立性、全概率公式与贝叶斯公式。第3章为随机变量,基本内容是随机变量及其分布函数、随机变量的分类、二维随机向量、随机变量的独立性、随机变量函数的分布。第4章为常用的概率分布,基本内容是常用的离散型随机变量、常用的连续型随机变量、随机数的产生。第5章为随机变量的数字特征,基本内容是数学期望、方差和协方差、矩和矩母函数、条件期望。第6章为不等式和极限定理,基本内容是概率不等式、大数定律及其应用、中心极限定理。
本书详细介绍了意大利那不勒斯菲里德里克第二大学Massimo Aria和Corrado Cuccurullo基于R语言开发的BIBLIOMETRIX工具包。该R工具包基本上涵盖了进行科学计量和知识可视化的功能,可以满足爱好R软件,并试图使用R进行科学计量和知识图谱分析的读者。在此基础上,本书对于科学计量与知识图谱相关的一些R工具包,包括rAltmetric、wordcloud2、gender以及tidytext等工具包进行了简要介绍。
本书主要介绍了数据可视化的基础知识、可视化工具的入门和应用、使用Python流行的库创建美观的数据可视化效果,并总结了了7大类40种不同的可视化图形,从基本信息、构成与视觉通道、适用数据、使用场景、注意事项、变体等多方面详细介绍了每种可视化图形的使用权方法,可作为常用可视化图形的使用手册。本书还提供了6个贴近大学生学习生活的可视化案例,为读者自由灵活应用可视化参考提供了有力的参考。 本书可作为高等院校数据科学与大数据技术、统计学及其相关专业的本科课程教材,也可供有一定实践经验的软件开发人员、管理人员作为自学和参考用书。
本书是由斯普林格出版社2018年出版的介绍物联网雾计算前沿技术的书籍,全书详细介绍了物联网雾计算发展的背景及驱动因素,系统分析了雾计算的计算服务、存储服务和通信服务;从雾层管理方面,阐述了雾计算中物联网资源评估所面临的挑战及模型,分析了雾计算的分层处理在物联网超大规模系统中的作用;从雾层服务方面,阐述了雾计算隐私保护的现状和未来,描绘了隐私保护领域自感知雾计算的发展,探讨了城市物联网边缘计算;以信息物理能源系统、医疗保健领域为例分析了雾计算应用实践。
本书将大数据分析用于管理实践与政策评估中的多个应用场景,运用管理学、数据科学、系统工程、交通工程、统计学、数学等不同学科的分析模型和研究方法,实现多学科的深度交叉融合,促进数据建模与预测科学的发展。本书的研究内容将有助于提升管理者的决策能力和创新效率,揭示决策范式转变的机理与规律,开展以决策支撑为导向的科学治理,探索研究成果转化政策建议及优化决策模式的有效路径,将研究成果快速转化为政策建议,并直接应用于不同层级的辅助决策。
本书定位是HBase从入门到应用的简明教程,特色是以实战案例为主,内容系统全面,讲解深入浅出,操作步骤清晰明了。本书配套示例源码、PPT课件、开发环境、教学视频、习题及答案以及其他丰富的教学 资源。 本书共分为8章,内容包括NoSQL数据库、HBase体系架构、HBase的接口、MapReduce与HBase、HBase表设计、HBase和Hive、HBase深入剖析、论坛日志分析实战。 本书既适合HBase初学者、大数据分析与挖掘初学者阅读,也适合作为高等院校和培训机构人工智能、大数据等相关专业师生的教学参考书。
本书以大数据发展的历史、特征、发展趋势为切入点,介绍了大数据产业的背景、大数据的显著特征、大数据的构成以及大数据带来的机遇与挑战,重点介绍了大数据采集、存储、管理及数据分析与挖掘的前沿技术,并分析了大数据在各行各业及政府机构间的具体应用案例,阐明了大数据对指导实际工作与生活的现实意义与作用。本书系作者根据自己多年的研究教学经验编著而成,结构体系科学,内容全面合理,理论联系实际,案例丰富,有助于广大读者理解大数据的基本内容、核心技术、使用机制等。
本书系统地介绍了岩爆试验综述、大数据人工智能分析方法框架、数据采集与预处理技术、压缩算法、多源异构融合算法、大数据可视化分析,且结合实际工程介绍了岩爆实验大数据AI处理系统。本书深入探讨了岩爆试验大数据的人工智能分析方法,系统阐述了以人工智能方法研究岩爆机理,为读者提供了一种全新的视角和解决问题的思路,填补了国内外相关领域的空白。
近年来,随着数据获取能力的不断提高和计算机的飞速发展,人们获得的数据信息越来越多,数据维数越来越高,如何寻找这些海量高维数据信息中潜在的规律,更好地为人类服务,是目前人工智能面临的挑战之一。 在没有标签信息的情况下,对高维数据实施维数约简的同时进行归类分析,挖掘数据的内在低秩结构,是当前机器学习的一个难点、也是热点之一。谱聚类作为聚类分析的一种,不仅对初始值和数据噪声有更好的鲁棒性,而且实施简单,可以被标准的线性代数方法进行有效求解。因此,基于低秩结构学习的谱聚类理论和方法在机器学习、人工智能、大数据技术方面有着更加广阔的应用空间。本书主要研究了基于低秩结构学习的谱聚类理论与方法,从矩阵和张量两方面进行研究。重点关注紧凑低秩表示学习、鲁棒的无监督特征选择学习、图正则化低秩
《大数据分析方法项目实战》从多个方向对数据分析和典型的项目案例进行介绍,涉及数据分析的各个方面,主要包括数据分析应用场景、数据分析方法理论、数据分析方法;数据分析常用的工具和模块使用等知识。《大数据分析方法项目实战》知识点的讲解由浅入深,让读者全面、深入、透彻地理解数据分析是对各个分析模块和分析工具的使用,不仅能够保持整《大数据分析方法项目实战》的知识深度,还可以提高实际开发水平和项目能力。
近年来,针对互联网数据滥用、平台垄断、隐私泄漏等问题,全球兴起了Web3.0探索热潮,力图通过区块链等技术重构新一代互联网。2021年,国家《 十四五 数字经济发展规划》中指出,要推动数字技术在数据流通中的应用,鼓励企业、研究机构等主体基于区块链等数字技术探索数据授权使用、数据溯源等应用,提升数据交易流通效率;2022年,国务院《关于数字经济发展情况的报告》中也指出,数字经济成为重组全球要素资源、重塑全球经济结构、改变全球竞争格局的关键力量,其发展离不开区块链等数字产业。区块链的分布式账本和智能合约实现了数据的确权、定价、交易和赋能,是Web3.0中数字经济的 新基建 ,也是元宇宙的创作者所有权经济的基础。本书以笔者团队负责的真实区块链应用案例为蓝本,深度剖析了区块链如何赋能金融科技、智慧能源、企业管理和
本书是《数据库系统概论》一书的辅导和补充教材。 本书分为三大部分,部分是每章基本知识点的讲解、习题参考解答与解析,模拟试卷和答案。第二部分是三个附录,是《数据库系统概论》的补充教材。第三部分是一张随书的《数据库辅助教学软件》光盘,其中包括教师投影演示教案及文稿、学生课堂复习与练习解答两大部分。 本书是应广大读者和出版社的要求,为了配合《数据库系统概论》课程的学习而编写的。通过习题的练习和参考答案,读者可以进一步加深对数据库系统基本概念的理解,对基本技术的运用,对基本知识的掌握。 本书可以作为高等学校计算机有关专业的数据库课程参考书,特别是可以作为《数据库系统概论》一书的补充教材。