数据是什么?如何应用数据?如何把数据变成更有价值的东西?本书主要适合刚开始使用数据的读者,能让他们对数据的含义、价值及用途有清晰的认识和了解,本书目的是介绍数据的相关知识,同时鼓励人们参与到日益增多的与数据有关的对话中。 本书通过介绍简单数据相关知识,即从一个总体目标、两种思维系统、三大应用领域、四种数据尺度、五种数据分析方法、六种数据展现方式、七种数据活动、八个提前问的问题分别展开阐释数据和分析的方法和思维方式。
《SQL即查即用》从实用角度出发,由浅入深地讲解了SQL的基本概念、常用语法和操作技术。全书共24章,包括数据的简单查询、条件查询、模糊查询、过滤数据以及数据排序、分组、统计等内容,还包括子查询、多表连接、数据的增删改查、视图、存储过程、游标、事务处理以及数据库和数据表的管理等高级技术。包括200多个SQL语法,200多个应用示例。有很强的实用性和可操作性,既适合作为SQL初学者的学习用书,又适合作为程序开发人员和数据库管理人员随时查阅的参考工具书。为便于读者对SQL语法的理解,书中所有知识点和语法都结合具体示例进行讲解,并以对比图方式鲜明直观地展示数据变化,帮助读者快速掌握实际操作技巧,学以致用。书中还设置了注意、说明、常见错误、多学两招等贴心栏目,及时指出注意事项并给出相应的解决方案,帮助读者避开学
互联网公司里面几乎很少有公司不用MySQL,国内互联网巨头都在大规模使用MySQL。如果把MySQL比喻成数据库界的一条巨龙,则性能优化和高可用架构设计实践就是点睛之笔。本书将详细讲解 MySQL 5.7高可用和性能优化技术,细致梳理思路,并与真实生产案例相结合,通过原理阐述到实战部署,帮助读者将所学知识点运用到实际工作中。 本书分为13章,详解MySQL 5.7数据库体系结构,InnoDB存储引擎,MySQL事务和锁,性能优化,服务器全面优化、性能监控,以及MySQL主从复制、PXC、MHA、MGR、Keepalived 双主复制等高可用集群架构的设计与实践过程,并介绍海量数据分库分表和Mycat中间件的实战操作。 本书既适合有一定基础的 MySQL数据库学习者、MySQL数据库开发人员和 MySQL数据库管理人员阅读,同时也能作为高等院校和培训学校相关专业师生的参考用书。
SQL是使用最广泛的数据库语言,绝大多数重要的DBMS支持SQL。本书由浅入深地讲解了SQL的基本概念和语法,涉及数据的排序、过滤和分组,以及表、视图、联结、子查询、游标、存储过程和触发器等内容,实例丰富,便于查阅。新版对书中的案例进行了全面的更新,并增加了章后挑战题,便于读者巩固所学知识。
在新媒体时代,如果对新闻报道、网上搜索的结果或者所谓的 专家告知 不加思考地完全相信,那你就等着上当受骗吧! 本书围绕当今*受瞩目的大数据科学理论,通过日本政府公布的公开数据,集中针对访日游客的增加、舆论调查的可靠性、 安倍经济学 的成果、东日本大地震后的状况、相对贫困、失业率的下降、年轻人远离ХХ、全球变暖问题、减肥、恩格尔系数的上升等10个主题进行数据解读,帮助读者模拟体验数据读取方法,提高理解和分析数据的能力,挖掘出数据背后隐藏的真相。 作为 大数据分析 的超级入门书,即使不擅长数学、不了解统计学的人,读完本书也可以彻底掌握数据解读方法!
本书与以往统计学中的概率论略有不同,添加了一些复杂数据类型的概率基础知识和模拟计算中的相关概率知识。具体安排如下所述。本书共分6章。第1章为概率与计数,基本内容是随机事件、概率空间、计数方法、概率的确定方法。第2章为条件概率,基本内容是条件概率与乘法公式、事件的独立性、全概率公式与贝叶斯公式。第3章为随机变量,基本内容是随机变量及其分布函数、随机变量的分类、二维随机向量、随机变量的独立性、随机变量函数的分布。第4章为常用的概率分布,基本内容是常用的离散型随机变量、常用的连续型随机变量、随机数的产生。第5章为随机变量的数字特征,基本内容是数学期望、方差和协方差、矩和矩母函数、条件期望。第6章为不等式和极限定理,基本内容是概率不等式、大数定律及其应用、中心极限定理。
《Python大数据分析与挖掘》是一本以大数据获取与分析为核心的教材,共分为4篇11章,循序渐进地引导读者深入学习Python在大数据领域的应用。第1篇为Python基础,全面介绍Python语言的基本特点和编程基础。第2篇为Python数据分析基础,主要内容包括NumPy、Pandas和Matplotlib数据分析工具包的使用,为数据分析与可视化奠定基础。第3篇为数据采集,介绍网络爬虫方法,包括静态网页和动态网页的爬取技术,使读者能够灵活获取网络数据。第篇为大数据分析实践,涵盖了数据探索性分析、机器学习以及自然语言处理等内容,并提供了丰富的实践案例。
本书是中山大学重点学科建设成果,获中国矿物岩石地球化学协会大数据与数学地球科学专业委员会推荐,是我国*部地质科学大数据与机器学习教材。本书是中山大学研究生试用研究型教材,对运用大数据挖掘与机器学习算法解决地球科学问题大有裨益。适合地质科学领域研究生和高年级本科生做教材,也可供科研人员研究时参考。它系统地介绍了地球科学大数据挖掘与机器学习的基本框架与原理,重点分析高维数据的降维、分类与预测、大图形社区结构识别、无限流数据处理、机器学习及人工智能地质学的建模过程,对必要的应用场景,使用Python语言给出案例。
本书详细介绍了意大利那不勒斯菲里德里克第二大学Massimo Aria和Corrado Cuccurullo基于R语言开发的BIBLIOMETRIX工具包。该R工具包基本上涵盖了进行科学计量和知识可视化的功能,可以满足爱好R软件,并试图使用R进行科学计量和知识图谱分析的读者。在此基础上,本书对于科学计量与知识图谱相关的一些R工具包,包括rAltmetric、wordcloud2、gender以及tidytext等工具包进行了简要介绍。
MySQL是世界上受欢迎的数据库管理系统之一。书中从介绍简单的数据检索开始,逐步深入一些复杂的内容,包括联结的使用、子查询、正则表达式和基于全文本的搜索、存储过程、游标、触发器、表约束,等等。通过重点突出的章节,条理清晰、系统而扼要地讲述了读者应该掌握的知识,使他们不经意间立刻功力大增。 《MySQL必知必会》注重实用性,操作性很强,适用于广大软件开发和数据库管理人员学习参考。
这是一部从技术、流程、管理等多个维度系统讲解华为数据治理和数字化转型的著作。华为是一家超大型企业,华为的数据底座和数据治理方法支撑着华为在全球170多个国家/地区开展多业态、差异化的运营。书中凝聚了大量数据治理和数字化转型方面的有价值的经验、方法论、规范、模型、解决方案和案例,不仅能让读者即学即用,还能让读者了解华为数字化建设的历程。 全书共10章,内容从逻辑上分为四个部分。 部分(~3章) 章以非数字原生企业在数字化转型方面面临的挑战开篇,介绍了华为在数据治理和数字化转型方面的目标、愿景、蓝图和框架;第2章从企业政策和架构协同的角度,介绍了企业级的数据综合治理体系,理顺了数据与变革、运营、IT之间的协同关系,明确了数据管理的责任主体在业务;第3章详细阐述了不同类型的数据的管理方式和要点。 第二
本书是由斯普林格出版社2018年出版的介绍物联网雾计算前沿技术的书籍,全书详细介绍了物联网雾计算发展的背景及驱动因素,系统分析了雾计算的计算服务、存储服务和通信服务;从雾层管理方面,阐述了雾计算中物联网资源评估所面临的挑战及模型,分析了雾计算的分层处理在物联网超大规模系统中的作用;从雾层服务方面,阐述了雾计算隐私保护的现状和未来,描绘了隐私保护领域自感知雾计算的发展,探讨了城市物联网边缘计算;以信息物理能源系统、医疗保健领域为例分析了雾计算应用实践。
这是一部从技术、流程、管理等多个维度系统讲解华为数据治理和数字化转型的著作。华为是一家超大型企业,华为的数据底座和数据治理方法支撑着华为在全球170多个国家/地区开展多业态、差异化的运营。书中凝聚了大量数据治理和数字化转型方面的有价值的经验、方法论、规范、模型、解决方案和案例,不仅能让读者即学即用,还能让读者了解华为数字化建设的历程。 全书共10章,内容从逻辑上分为四个部分。 部分(~3章) 章以非数字原生企业在数字化转型方面面临的挑战开篇,介绍了华为在数据治理和数字化转型方面的目标、愿景、蓝图和框架;第2章从企业政策和架构协同的角度,介绍了企业级的数据综合治理体系,理顺了数据与变革、运营、IT之间的协同关系,明确了数据管理的责任主体在业务;第3章详细阐述了不同类型的数据的管理方式和要点。 第二
技术是把双刃剑,当我们在积极拥抱新技术的同时,也不能忽视其所带来的风险,比如当今大数据时代个人隐私和安全问题。本书是两位作者结合各自出色的专业知识和丰富的从业经验为大众倾力奉献的一本大数据时代隐私问题的普及读物。书中展示了我们在家庭和工作中的日常活动是如何成为大数据收集的一部分的。同时,列举大量的大数据应用以及安全和隐私相关案例,包括企业如何利用大数据进行营销、执法机构如何利用大数据执法等,也包括不法分子如何利用非法或合法的手段获取数据,如何利用社交网络进行犯罪。针对上述问题,本书也列出了一些工具、技巧用来检查和防范,这在当前很有现实意义。
本书展示了如何验证自己的设想、找到真正的客户、打造能赚钱的产品,以及提升企业知名度。30多个案例分析,全球100多位知名企业家的真知灼见,为你呈现来之不易、经过实践检验的创业心得和宝贵经验,值得每位创业家和企业家一读。 深入理解精益创业、数据分析基础,和数据驱动的思维模式 如何将六个典型的商业模式应用到各种规模的新企业 找到你的关键指标 确定底线,找到出发点 在大企业中应用精益分析,打造新产品
本书将大数据分析用于管理实践与政策评估中的多个应用场景,运用管理学、数据科学、系统工程、交通工程、统计学、数学等不同学科的分析模型和研究方法,实现多学科的深度交叉融合,促进数据建模与预测科学的发展。本书的研究内容将有助于提升管理者的决策能力和创新效率,揭示决策范式转变的机理与规律,开展以决策支撑为导向的科学治理,探索研究成果转化政策建议及优化决策模式的有效路径,将研究成果快速转化为政策建议,并直接应用于不同层级的辅助决策。
本书主要介绍了数据可视化的基础知识、可视化工具的入门和应用、使用Python流行的库创建美观的数据可视化效果,并总结了了7大类40种不同的可视化图形,从基本信息、构成与视觉通道、适用数据、使用场景、注意事项、变体等多方面详细介绍了每种可视化图形的使用权方法,可作为常用可视化图形的使用手册。本书还提供了6个贴近大学生学习生活的可视化案例,为读者自由灵活应用可视化参考提供了有力的参考。 本书可作为高等院校数据科学与大数据技术、统计学及其相关专业的本科课程教材,也可供有一定实践经验的软件开发人员、管理人员作为自学和参考用书。