《深入浅出数据分析》以类似 章回小说 的活泼形式,生动地向读者展现优秀的数据分析人员应知应会的技术:数据分析基本步骤、实验方法、化方法、假设检验方法、贝叶斯统计方法、主观概率法、启发法、直方图法、回归法、误差处理、关系数据库、数据整理技巧;正文之后,意犹未尽地以三篇附录介绍数据分析十大要诀、R工具及ToolPak工具,在充分展现目标知识以外,为读者搭建了走向深入研究的桥梁。 本书通过精心设计的实践场景,让读者不由自主地代入角色当中,真正在体验中学习、思考,将数据分析的要点融化于心,自如地应用在工作和生活中。
内容简介商业分析有用吗?当然有用!商业分析是行走职场、创业启航的一项技能。 作者结合自己多年的工作经验,用生动的语言介绍如何用数据分析解决商业问题。 本书分为6 篇,共17 章,其中第1 篇是概念篇,讲述商业分析的基本概念;第2 篇是基础篇,讲述如何用基础的分析方法评估企业经营状况;第3 篇是进阶篇,讲述如何构建分析体系解决较复杂的问题;第4 篇是高阶篇,讲述如何应对复杂的商业难题;第5 篇是基础实践篇,通过案例讲述如何解决更复杂的商业问题;第6 篇是高阶实践篇,通过案例讲述如何解决商业分析中的疑难杂症。 本书的讲解思路是层层递进的,从简单场景到复杂场景,从基础的方法到复杂的方法。因此,无论读者是否有数据分析基础和经验,都建议从头开始阅读,这样可以一步步提升认知,更快地掌握商业分析的方法。
本书是一本全面关注工业企业数据治理方面的工具书,主要内容分为概述篇、体系篇、工具篇、实施篇及案例篇。其中概述篇主要介绍工业企业数据治理的基础概念、主流数据治理标准及框架、数据治理的发展趋势等;体系篇主要介绍数据管控、数据战略、数据架构、主数据管理等的基本原理与管理体系;工具篇主要介绍主数据管理工具、数据模型管理工具、数据资产运营工具等;实施篇主要介绍具体实施策略及路径选择、顶层架构规划与设计、数据资产运营实施等;案例篇主要介绍电力、能源化工、钢铁、制造、战略投资等行业的数据治理案例,为读者提供专业、丰富、可信的数据治理实施范例。本书是工业大数据应用技术国家工程实验室多年潜心研究的重要科研成果的总结和凝聚,既具有理论高度,也具备面向中国工业企业的可实操性。参与本书编著的作者均
本书旨在建立和推动“动力学刻画的数据科学”理论和应用研究。全书共六章,内容包括:复杂动力系统理论基础、高维数据的临界预警理论及方法、短时间序列的预测理论及方法、动力学因果检测理论及方法、基于动力学的势能景观构建理论及方法、混沌反馈学习理论及深度学习方法等。全书交叉融合了数学理论、统计学方法、人工智能、计算系统生物学方法等知识,做到数学理论与实际应用并重,动力学算法与统计学方法互补,内容图文并茂、清晰易读、由浅入深,并在第2章至第6章末尾配有相关前沿领域的展望与讨论,读者可以通过阅读本书了解所涉及研究方向的发展趋势。
本书主要介绍基于GraphPad Prism 9 的学术图表绘制方法。本书以软件所定义的8 种数据表为纲,按照 数据录入 数据分析 图表生成与美化 的顺序,结合科研实例,使用t 检验、方差分析、生存分析和主成分分析等相关统计分析方法,介绍了散点图、气泡图、柱状图、线图、饼图、面积图等常见学术图表的绘制和美化方法。同时本书提炼了学术图表绘制的一般流程、配色方法及GraphPad Prism 绘图的进阶技巧,兼顾学术图表绘制的实用性和美观性,适用于需要绘制学术图表的高校学生和科研人员。
本书是一本全面关注企业数据标准化方面的工具书,主要分为5 篇。 第1 篇介绍了数据标准化是数据治理的基础,包括数据标准化与数据治理的关系,以及数据标准化主要内容、本书阅读导引。 第2 篇介绍了数据标准化框架体系,包括架构类数据标准、对象类数据标准、基础类数据标准。 第3 篇介绍了数据标准化实施流程与方法,包括建立数据标准化保障机制、现状分析及评估、技术平台和工具、数据标准化关键域实施。 第4 篇介绍了数据标准化评价,包括数据标准化评价方法、数据标准成熟度评价、数据标准化成熟度评价流程。 第5 篇介绍了数据标准化案例,包括油气行业、多元化集团、装备制造行业、核电行业、汽车行业、金融行业、政务行业、互联网行业等行业的数据治理案例,为读者提供了专业、丰富、可信的数据治理实施范例。 本书是工业大数据应
数据要素是新型生产要素之一,因其蕴含着巨大价值,其重要性被提到了新的高度,但其理论体系尚未完全形成,全生命周期各个环节的理论和技术还在不断探索中。《BR》本书以数据要素知识体系构建和数据要素价值的发掘应用为主线,从理论和行业案例两个方面,对数据要素生命周期涉及的基础理论、概念和方法及数据要素驱动业务发展行业应用案例进行梳理和呈现。基础知识部分包括数据要素的属性、价值、支撑技术,数据要素规范管理、数据确权和交易,以及数据要素市场化配置等内容。行业案例部分从主数据管理实践、数据治理能力提升、数据要素驱动业务创新应用、数据要素催生创新模式四个方面梳理了21个案例,旨在通过多个行业领域的应用案例分析来帮助数据要素相关理论知识的理解和应用。
本书以数据思维为主题,以数据分析全流程为主线,融合了与数据思维相关的编程语言、统计学基础及案例分析等内容,全书分为4 篇,囊括了数据思维的概念和培养方法、数据来源及体系建设、数据分析三大思维方式及用户流失、用户转化实战等共11 章的内容。本书囊括了数据分析中常用的分析方法,包括经典的海盗(AARRR)模型、麦肯锡的MECE 模型、逻辑树、漏斗分析、路径分析、对比分析、A/B 试验、RFM 模型、K-Means 算法、5W2H 等分析方法,还包括各类方法的实践案例及Python 实操项目。可以说本书是数据分析方法论与统计学知识、编程语言及应用案例的完美结合。 本书适合工作了1~3 年的初级数据分析师;已经掌握了数据分析工具,需要培养数据思维的转行人员;数据科学行业的人力专家和猎头等。
本书在梳理和反思数字化转型和数字治理现状的基础上,以马克思主义政治经济学中有关生产力与生产关系的经典理论为指导,将数字化转型与数字治理之间的互动关系作为切入点,详细解读了数字经济时代的数字化转型和数字治理挑战,提出了数字化转型和数字治理的创新思路,以期走出一条科学思想与人性光辉共同闪耀的数字繁荣之路。其中,在数字化转型方面,基于"技术-社会”互构视角提出了"技术动力”与"结构调适”的数字化转型机制;在数字治理方面,基于当前的治理挑战和治理需求提出了数字治理"三位一体”体系框架。 此外,本书还对数字化转型和数字治理的未来发展进行了展望。
本书是关于时空数据分析与应用的专著。本书从时空大数据的潜空间入手,展示基于时空大数据低维内蕴流形的数据分析方法,并介绍如何从几何与拓扑的视角进行时空大数据分析,以及如何将其应用于各种地理科学问题。本书共十章,涵盖时空大数据的基本概念、几何与拓扑数据分析理论、技术研究方法和示范性应用。本书旨在为读者提供一种新的思考时空大数据的角度和方法,以便更好地理解和应用时空大数据。通过本书的阅读,读者将能够掌握几何和拓扑的基本概念,了解如何从时空大数据的形状和结构中提取出有用的信息,并将这些知识应用于实际的时空数据分析中。
大数据时代,各行各业积累的数据不断增多,海量数据经过清洗、整理以后,基于分析与挖掘工作,才能获取到有用的数据信息,挖掘到数据背后的价值,掌握大数据的规律。而数据分析与挖掘的核心工作即是数据建模。数据建模,通俗地说,就是通过建立数据科学模型的手段解决现实问题的过程。 本书共分为五章,内容包括数据建模概述、数据建模常用数据计算软件MATLAB和SPSS入门介绍、数据建模方法、实战案例分析等。本书注重理论与实践相结合,不仅有详细的数据建模理论方法,还有赛题案例,以及非常详细的程序代码,让读者既能具备数据建模理论的基础,又能掌握解决数据建模问题的技巧与方法,还能轻松应对大数据问题的编程计算。
数据包络分析(DEA)方法是一种应用广泛的效率评价方法。本书结合作者近年来的研究成果,将数据包络分析方法进行扩展与集成,使之成为一种开展系统综合评价的有效方法。本书重点介绍DEA公共权重配置和DMU完全排序方法、DEA中DMU结构分析和效率分解方法、不确定信息条件下的鲁棒DEA方法、径向和非径向DEA集成效率测度方法、基于DEA的资源配置和目标分解方法等DEA领域的前沿建模方法。同时本书还介绍了DEA方法在能源与环境绩效评价、银行和供应链效率分析中的应用。
本书针对分类属性数据无监督数据挖掘任务中的三个关键问题?特征学习、分析过程和结果评价,阐述分类属性数据深度无监督学习理论及决策应用。全书共7章,第1章概述数据驱动决策支持的技术基础、有监督学习和无监督学习两类数据挖掘方法及分类属性数据无监督学习问题;第2章介绍分类属性数据的无监督特征学习、聚类分析和聚类结果评价等相关理论与方法;第3章系统阐述深度无监督特征学习、深度聚类和网络嵌入方法;第4~6章针对分类属性数据提供了包含深度无监督特征学习、深度聚类和聚类内部有效性评价的一整套深度无监督学习解决方案;第7章以人才招聘为实际问题背景,演绎了分类属性数据深度无监督学习方法在决策支持中的应用。
本书由浅入深、循序渐进向广大瀚高数据库维护人员、应用开发人员及国产化软件的爱好者全面地介绍瀚高数据库的使用方法和技巧。本书共分上下两篇,上篇(运维篇)主要针对数据库管理人员,包括数据库安装部署、备份管理、日常维护等;下篇(适配开发篇)主要用于指导应用程序开发人员基于瀚高数据库进行开发,指导读者高效完成从国外数据库如 Oracle、Mysql、PostgreSQL 向国产化数据库迁移的工作。瀚高数据库坚持开源技术路线,是基于目前全球排名前三的 PostgreSQL 开源数据库发展的中国商用版本,同时瀚高也是国际社区中 PostgreSQL 手册中文版的核心翻译贡献者,通过对该书的学习,可以帮助读者掌握 PostgreSQL 的相关技术,书中部分注释内容引用了手册部分内容,因此作为国内为数不多的关于 PostgreSQL 的中文资料也是不错的选择。
《DAMA数据管理知识体系指南(原书第2版)》是DAMA国际(DAMA International)组织专家对过去30多年数据管理领域知识和实践的总结,是一部综合了数据管理方方面面具有权威性的基础工具书。本书从数据治理、数据架构、数据质量、数据安全、主数据管理、参考数据管理、元数据管理、商务智能和数据参考管理、数据建模设计、数据存储和操作、数据集成和互操作、文档和内容管理、大数据、数据管理人员的道德要求等方面介绍了数据管理的知识体系。DMBOK已经成为数据管理领域的“圣经”,是指导个人知识体系完善和企业数据管理能力建设的重要文献。本书适合各种组织负责信息化和数字化转型的领导(如CIO、CDO),从事数据管理的各种技术及业务人员,工作中涉及数据的会计、法律、咨询、教育、政务等领域的人士阅读。同时,也可作为高校MBA和计算机专业教学用
云计算按需提供基于互联网的软件即服务(SaaS)、平台即服务(PaaS)、基础设施即服务(IaaS),云计算技术与大数据技术同为人工智能时代IT和DT业热门技术。本教材有10章、3个附录(教学大纲、实验指导书、模拟考试),全面介绍云计算原理及机制,OpenStack云平台,谷歌、 、微软、阿里云计算,云管理、云安全,开源云计算(Hadoop)、云计算技术发展(Docker、Spark)等,主要立足云端应用开发和营运技术。实例多、重实践、教学资源丰富,特别适用于应用型人才培养的教学。可作本科数据科学与大数据技术专业、计算机科学与技术专业、网络工程专业、物联网工程专业、软件工程专业数字媒体专业等计算机类专业及通信工程类专业教科书、培训教材,也供科技人员、学者、工程师自学参考。
本书是一本针对设计充分利用云灵活性的现代可伸缩数据平台的实践指南。你将了解云数据平台设计的核心组件,以及Spark和Kafka流等关键技术的作用。你还将探索如何设置流程来管理基于云的数据,确保数据的安全,并使用 分析和BI工具对数据进行分析。本书旨在帮助企业通过现代云数据平台使用所有数据的业务集成视图,并利用 的分析实践来驱动预测和迄今无法想象的数据服务。