Stata是一种功能全面的统计分析软件包,具有易操作、运行速度快、功能强大的特点,主要针对经济、管理、医学、农学、教育、市场研究、社会调查等行业和领域,是大数据时代为流行的计量软件之一。 全书内容共分17章。第1、2章介绍Stata操作入门及数据处理基础知识、描述性统计与图形绘制基础。第3~5章介绍假设检验、方差分析、相关分析等基础分析方法。第6~10章通过相关案例介绍经典及放松各种假定条件的回归分析,包括基本线性回归分析、线性回归分析诊断与处理、非线性回归分析、因变量离散回归分析、因变量受限回归分析等应用。第11~16章以典型案例讲解主成分分析与因子分析、聚类分析、时间序列数据分析、面板数据分析、生存分析、多方程模型等高级分析方法。第17章介绍如何使用Stata进行高质量的综合性研究,讲解研究方案设计、调查问卷的制
《GraphPad Prism科技绘图与数据分析》以GraphPad Prism 9.4为软件平台,结合编者多年的数据分析经验,通过大量实例系统全面地介绍Prism在科研数据处理中的使用方法与技巧。全书共11章:第1~3章主要讲解GraphPad Prism的基础知识,包括用户界面、项目组成、图形的输出、数据的输入、数据表类型、图形的修饰与美化等;第4~11章结合Prism数据表的特点,分别讲解各类数据表的数据格式、数据表能够完成的图表绘制以及可以实现的统计分析等。通过阅读本书,可以帮助读者快速掌握GraphPad的应用,从而更好地处理和分析科研数据。 本书注重基础,内容翔实,突出示例讲解,既可以作为从事数据分析处理的科研工程技术人员的自学用书,还可以作为高等学校相关专业的本科生和研究生的教学用书。
Access是Microsoft Office套件中的一员,是一个数据库管理程序,用于管理数据。本书以Access 2021软件为平台,从管理人员和办公人员的工作需求出发,配合大量典型实例,全面而系统地讲解Access 2021在数据管理中的应用,帮助用户轻松高效地完成数据库的创建与维护。 本书以 完全掌握Access 为出发点来安排内容,全书共6篇,分为15章。第1篇为基础学习篇(第1~4章):本篇主要针对初学者,从零开始,系统并全面地讲解Access 2021的基本操作、数据库的创建与使用、数据表的创建与使用,以及规范数据库的方法。第2篇为查询分析篇(第5~6章):介绍在Access 2021中创建查询、编辑查询字段、使用SQL查询、嵌套查询和多表查询等内容。第3篇为窗体报表篇(第7~9章):介绍在Access 2021中创建普通窗体、创建主/次窗体、在窗体中添加控件和编辑控件,以及创建和分析报表的方法。
本书以统计学史上著名人物的伟大成就为脉络,将数据分析这一学科的发展历程娓娓道来。从开普勒仰望星空拉开统计学序幕,贝叶斯提出主观概率,到人工智能、深度学习逐步渗透今天的日常生活。本书带领读者在数据科学的熠熠星光下,看透大数据的深邃内核。
本书在前四版畅销书的基础上,根据SPSS 26.0软件升级的市场应用需求进行第5次升级修订。 本书结合具体的SPSS统计分析实例,图文并茂地介绍了**版本SPSS 26.0的各种统计分析方法,包括基本统计分析、参数与非参数检验、方差分析、相关分析、回归分析、多重响应分析、聚类分析、判别分析、因子分析、主成分分析、对应分析、时间序列模型、信度分析、生存分析和缺失值分析的原理和使用方法。全书注重内容的实用性,在详细介绍SPSS常用的操作功能基础上,通过一些综合应用案例(在医学、经济管理、自然科学和社会科学中的应用)来演示实际统计分析中SPSS的使用。 本书适用于SPSS软件17.0~26.0版本,作者录制了96个视频教学文件,读者可通过扫描各章节二维码阅读学习。本书可作为高校经济学、管理学、统计学、公共管理、社会学和卫生统计等专业学生学习大数
内容简介这是一部能指引零基础读者顺利完成数据资产入表的实操性著作。它不仅为读者提供了数据资产入表所需的全部知识,还给出了实际操作层面的方法指引;既是数据资产入表的初学者指南,也是企业实施数据资产入表操作的工作手册。本书由数据资产管理领域的标杆企业亿信华辰倾情奉献,同时融合了行业的先进实践经验,开创性提出 数据资产三次入表理论 (数据原始资源入表、数据产品入表、数据金融资产入表),得到了来自学术界和企业界的12位数据资产管理专家的高度评价和强烈推荐。本书分为四部分,不仅从战略、方法、工具、实操、案例等角度为读者提供了全面的数据资产入表知识体系,还前瞻性地探讨了数据资产入表后的价值挖掘、资产评估和金融创新。第一部分 数据资产入表全景概览(第1和第2章)深入分析数据资产入表的宏观背景、核
本书分为四大部分,分别为准备篇、基础篇、提高篇和配套开源软件及架构篇。准备篇为没有数据库基础的读者准备的,如果读者已经具备了一定的数据库基础,可以跳过其中的一些内容。基础篇介绍了PostgreSQL数据库中的一些基础内容,读者学习完此篇可以完成基本的PostgreSQL数据库的日常操作工作。提高篇讲解了一些更深的内容,如PostgreSQL的一些技术内幕、特色功能、优化等方面的内容,读者仔细阅读此篇以便早日成为PostgreSQL数据库高手。第三方开源软件及架构篇讲解了与PostgreSQL数据库配套使用的一些常用的开源软件及架构设计方面的内容,通过阅读此篇,可以提高读者的眼界和数据库架构设计能力。
《算法竞赛入门经典 训练指南(升级版)》是《算法竞赛入门经典(第2版)》一书的重要补充,旨在补充原书中没有涉及或者讲解得不够详细的内容,从而构建一个更完整的知识体系。本书通过大量有针对性的题目,让抽象复杂的算法和数学具体化、实用化。 《算法竞赛入门经典 训练指南(升级版)》共包括6章,分别为算法设计基础、数学基础、实用数据结构、几何问题、图论算法与模型以及更多算法专题。全书通过206道例题深入浅出地介绍了上述领域的各个知识点、经典思维方式以及程序实现的常见方法和技巧,并在章末给出了丰富的分类习题,供读者查漏补缺和强化学习效果。 《算法竞赛入门经典 训练指南(升级版)》题目多选自近年来ACM/ICPC区域赛和总决赛真题,内容全面,信息量大,覆盖了常见算法竞赛中的大多数细分知识点。书中还给出了所有重
本书对可视化技术、交互技术以及数据分析方法进行了系统和全面的讲解。介绍了交互式可视化数据分析解决方案的设计标准,论述了设计中的影响因素以及工作流程的检验方法。读者可以从中了解可视化编码的基础知识,以及用于多元数据、时间数据、地理空间数据和图形数据等方面的众多可视化技术。 书中专门用一章的内容来介绍与可视化效果互动的常规概念,并且利用图示来说明现代交互技术如何推动可视化数据分析的发展。针对如今庞大而复杂的数据,本书涵盖了自动化分析计算支持可视化数据分析的相关内容,另外还介绍了多屏幕环境下的高级可视化概念、数据分析过程中的用户指南以及渐进式可视化数据分析等技术。 作者用简洁明了的术语以自上而下的视角解读了交互式可视化数据分析。众多真实案例和丰富的插图将使学生、本领域专家、数据密
《matplotlib数据可视化实战》借助matplotlib讲解开展数据可视化实践所需要掌握的关键知识和技能,从设置图表基础元素(坐标轴、标签、颜色、数学符号等),到根据表现内容绘制不同类型的图表(折线图、条形图、圆饼图、小提琴图等),全面讲解了 matplotlib 的使用方法。为方便读者学习, 书中对相关操作都配以案例及代码进行讲解,读者可以根据自身需求,灵活使用其中的函数 和语句。 本书适合数据分析、数据可视化领域的爱好者、从业者阅读,也适合作为高校相关专业的教材。
对于任何依赖经常性收入和重复销售的企业来说,让客户保持活跃并持续购买是必不可少的。客户流失(或 流失 ),这种代价高昂且令人沮丧的事情是可以预防的。通过使用本书中介绍的技术,你可以识别客户流失的预警信号,并学会在客户离开之前识别并挽留他们。 《客户留存数据分析与预测》向开发人员和数据科学家传授经过实践证明的技术与方法,可以在客户流失发生之前阻止其发生。本书包含很多来自现实中的示例,介绍如何将原始数据转换为可衡量的行为指标、计算客户生命周期价值,并使用人口统计数据改进客户流失预测。通过遵循 Zuora 首席数据科学家 Carl Gold 的方法,你将获得高客户留存率带来的优势。 主要内容 ● 计算流失指标 ● 通过客户行为预测客户流失 ● 使用客户细分策略减少客户流失 ● 将客户流失分析技术应用于其他业务领域 ● 使用
本书是数据治理领域公认的标准性著作,能为各种类型企业和机构的数据治理提供全面指导。用友集团官方出品,得到了用友集团董事长王文京、DAMA中国区主席汪广盛等9位企业界和学术界数字化专家的一致好评,同时也被中国数据要素高层次人才发展大会(DGBOK)作为指定教材。 它基于国际主流的数据治理框架和用友多年的数据治理经验,从道、法、术、器4个维度全面、深入展开,不仅有数据治理在战略层面的顶层设计,还有数据治理在执行层面的实施方法,既可以作为数据治理的纲领性指南,又可作为数据治理的实操手册。 从数据治理的战略规划到落地实施,本书将各环节的核心内容凝练为 3 个战略机制、8 项关键举措、7 种技术能力、7 个治理工具 : 数据治理之道:3个战略机制 高屋建瓴地介绍了数据治理的数据战略、组织机制和数据文化。这3个机制
本书介绍了数据工程生命周期,并展示如何组合运用各种云技术来满足下游数据消费者的需求。本书分为三部分:第一部分介绍了数据工程的定义、数据工程的生命周期、合理的架构设计和帮助技术选型的框架;第二部分深入介绍了数据工程生命周期的每个阶段 数据生成、存储、获取、转换和服务;第三部分讨论了数据工程的重要部分 安全和隐私。附录还介绍了与处理数据文件和评估数据系统的性能有关的序列化和压缩,以及云网络。本书适合软件工程师、数据科学家、数据工程师和数据分析师等相关技术人员阅读。
这是一本用精益思想指导企业以数据为核心进行数字化转型的著作,它将帮助企业事半功倍地找到正确的数字化转型战略、方法与路径。 作者结合自己20余年的实战经验,将精益思想与数据利用深度融合,总结了一套从业务目标出发,以价值场景为抓手,以数据为驱动的精益数据方法论。进一步以该方法论为基础,衍生出精益数据花瓣模型、精益数字化转型三步法、数据驱动的六大能力模型,精益数字化转型共创工作坊,四大精益数据画布,数据驱动的成熟度评估模型,从认知到实践、从工具到方法,从路径到指南,全方位指导企业将数字化转型落地,在数字化转型大浪潮中有里程碑意义。 本书的核心内容围绕精益数据方法论展开,该方法论分为精益数据宣言、精益数字化企业、精益数字化转型路径、精益数据共创工作坊4个模块。 ( 1 )精益数据宣言 包含
主要内容 ● 监控性能,找出效果不佳的查询 ● 选取要优化的查询,**限度地提高收益 ● 使用EXPLAIN ANALYZE和Visual Explain等工具来分析查询 ● 借助多种策略改进慢查询 ● 正确使用索引和直方图,创建快速的执行计划 ● 了解并分析锁,从而解决争用问题,提升系统吞吐量
这是一部从工程实践角度讲解互联网广告系统的业务价值、产品形态、架构设计、技术选型、落地方法论、实施路径和行业案例的著作,是作者在Google和腾讯从事广告系统架构设计与工程实现的10余年经验总结。 通过本书,你将掌握以下内容: (1)互联网广告的生态和产品形态 首先介绍了谷歌、Meta、亚马逊、微软等主要在线广告平台;然后介绍了主要在线广告网络和程序化购买生态;蕞后介绍了在线广告产品形态,包括在线广告的投递方式和计费方式。主要目的是帮助读者建立对互联网广告生态的宏观认知。 (2)广告投放系统的架构与设计 结合Facebook Marketing、Google Ads、Twitter Ads等广告平台讲解了广告投放系统,主要内容包括广告的层级结构、三个广告平台API的特点及用法演示,以及API的基本设计原则和设计方法论。读者可以从本章中学到现代广告系统投放子
本书由算法领域的知名专家Steven Skiena教授撰写,重点介绍了收集、分析和解释数据所需的技能和原理。作者由浅入深地介绍了数据科学的概念、所需的数学基础、数据的整理清洗方法、数据分析方法(统计分析、可视化、数学模型、线性逻辑回归、机器学习算法等)以及学习大数据分析的意义。作者结合应用领域的大量数据分析案例,以解释大数据分析所需技能与原理,帮助者快速理解和掌握大数据分析的理论与方法,也将这些技能的实际应用方式展现得淋漓尽致,具有很强的可操作性。
本书是一本指导DBA进行数据库开发和运维的实用手册,本书共9章,包括漫谈数据库、如何提升数据库性能、如何运维好数据库、如何进行数据库设计、如何做好数据库之间的数据同步、认识HTAP技术、认识数据库的功能原理、认识数据库中的数学(逻辑与算法),以及DBA的日常:数据库管理及开发的最佳实践。另有附录DBA杂谈。 本书内容是资深DBA多年实践经验的归纳总结,涵盖DBA日常工作中的主要方面,通过剖析众多的真实案例,并解读原理、分享技巧、提供思路,内容具备较强的启发性和指导性。 本书的受众包括但不限于想要了解如何提升数据库性能的应用开发人员、DBA、业务架构师、IT架构师、数据架构师、数据分析师、系统架构师、解决方案架构师和企业高级管理人员。
这是一本金融数据挖掘与分析领域的实战性著作,它能指导零Python编程基础和零数据挖掘与分析基础的读者快速掌握金融数据挖掘与分析的工具、技术和方法。 读完本书,你将会有如下3个方面的收获: (1)Python编程基础和数据预处理 首先详细讲解了Python的核心语法,以及NumPy、Matplotlib、PySpark、Jupyter Notebook等Python数据处理工具的使用;然后详细介绍了数据预处理的流程和技巧。通过深入浅出的语言和丰富的样例展示,帮助初学者快速上手 Python,为之后的数据分析实战夯实基础。 (2)数据挖掘与分析的经典方法 详细讲解了经典的数据挖掘方法,包括聚类分析、回归分析、分类分析、异常检测、关联分析、时间序列分析等。 (3)主要金融应用场景的数据挖掘方法 针对网络舆情的采集和热点分析、舆情分析中的情感分析、股价趋势预测、个人信用评分、企业信用
本书结合丰富的案例,清晰地诠释了SQL Server 2019 编程语言与数据库开发涉及的每一个核心概念和技术。全书力求阐述实际开发应用中涉及的SQL Server 2019 的功能组件和管理工具;注重实际操作,采用可视化图解的方式,对SSMS、SSCM 等关键工具的操作步骤进行了详细说明,使得读者能够直观地看到操作过程和操作效果;注重编程技巧,对于核心的T-SQL 操作,在详细介绍其语法、参数后,都会附加案例的高级编程T-SQL 代码,这些T-SQL 代码在笔者的开发环境中都经过严格的调试,读者可以直接用于自己的项目开发实践。本书可供数据库设计与开发等方向初学者、程序开发人员阅读,也可作为高等院校计算机、软件开发相关专业的教材。
本书主要作为教育领域从事教育大数据研究工作者的参考用书。本书从教育大数据的重要意义、国内外教育大数据的研究现状以及政策支持出发,对教育大数据的相关概念和内涵做阐述说明,介绍了教育大数据的技术、技术标准、治理与开放、风险管理与法律政策,重点阐述了教育大数据在教育领域的典型应用,包括教育大数据在课堂教育、校园管理、在线教育、开放远程教育、教育培训行业以及学生综合素质评价等方面的应用,*后提出教育大数据的发展趋势和机遇挑战。