Stata是一种功能全面的统计分析软件包,具有易操作、运行速度快、功能强大的特点,主要针对经济、管理、医学、农学、教育、市场研究、社会调查等行业和领域,是大数据时代为流行的计量软件之一。 全书内容共分17章。第1、2章介绍Stata操作入门及数据处理基础知识、描述性统计与图形绘制基础。第3~5章介绍假设检验、方差分析、相关分析等基础分析方法。第6~10章通过相关案例介绍经典及放松各种假定条件的回归分析,包括基本线性回归分析、线性回归分析诊断与处理、非线性回归分析、因变量离散回归分析、因变量受限回归分析等应用。第11~16章以典型案例讲解主成分分析与因子分析、聚类分析、时间序列数据分析、面板数据分析、生存分析、多方程模型等高级分析方法。第17章介绍如何使用Stata进行高质量的综合性研究,讲解研究方案设计、调查问卷的制
《大话数据结构【溢彩加强版】》以一个计算机教师的教学过程为场景,讲解数据结构和相关算法的知识。全书以趣味方式来叙述,大量引用各种各样的生活知识来类比,并充分运用全彩色图形语言来解读抽象内容,对数据结构所涉及的一些经典算法做出逐行分析、多算法比较。与同类图书相比,《大话数据结构【溢彩加强版】》内容有趣易读,算法讲解细致深入,是一本非常适合自学的读物。 对于学习数据结构来说,难点之一是对相关算法的理解。《大话数据结构【溢彩加强版】》创新性地采用全彩印刷,图表、流程、代码等内容结合色彩来重新进行约定和归纳,使得对一些难以理解的知识点的解析更加清晰顺畅,极大提升了阅读体验。 《大话数据结构【溢彩加强版】》主要内容包含:数据结构介绍、算法推导大O阶的方法;顺序结构与链式结构差异、栈与队列
本书是国际数据管理协会(DAMA国际)组织众多国际专家对过去30多年数据管理领域知识和实践的总结,是市场上综合了数据管理方方面面的一部具有性的基础工具书。从数据治理、数据架构、数据质量、数据安全、主数据管理、参考数据管理、元数据管理、商务智能和数据参考管理、数据建模设计、数据存储和操作、数据集成和互操作、文档和内容管理、大数据、数据管理人员的道德要求等方面介绍了数据管理的知识体系。
《GraphPad Prism科技绘图与数据分析》以GraphPad Prism 9.4为软件平台,结合编者多年的数据分析经验,通过大量实例系统全面地介绍Prism在科研数据处理中的使用方法与技巧。全书共11章:第1~3章主要讲解GraphPad Prism的基础知识,包括用户界面、项目组成、图形的输出、数据的输入、数据表类型、图形的修饰与美化等;第4~11章结合Prism数据表的特点,分别讲解各类数据表的数据格式、数据表能够完成的图表绘制以及可以实现的统计分析等。通过阅读本书,可以帮助读者快速掌握GraphPad的应用,从而更好地处理和分析科研数据。 本书注重基础,内容翔实,突出示例讲解,既可以作为从事数据分析处理的科研工程技术人员的自学用书,还可以作为高等学校相关专业的本科生和研究生的教学用书。
《数据分析实践:专业知识和职场技巧》从初学者的角度出发,讲解了进阶为高级数据分析师所需的知识和技能,其中既包括数据分析岗位的介绍、发展现状及未来趋势,也包括实际工作中各环节的方法策略、实战案例,还包括职场中的困惑解答及面试指导。阅读本书,并基于本书进一步拓展所需要的知识能,可以帮助读者形成一套成系统、可实战的数据分析方法论。
《数据分析思维:分析方法和业务知识》分为两大部分: 方法篇 和 实战篇 。 方法篇 介绍了数据分析中常用的业务指标、分析方法以及如何用数据分析解决问题的步骤。 实战篇 讲解了如何应用*篇的方法来解决工作中的问题,分享十二个行业(国内电商、跨境电商、金融信贷、金融第三方支付、家政、旅游、在线教育、运营商、内容、房产、汽车、零售)的业务知识,以及该行业内用数据分析解决问题的实例。每个行业都包括业务模式、业务指标、案例分析三方面的内容。 通过本书的学习,你会熟悉数据分析的方法,并将其灵活应用在自己所处的行业中。
伴随人类社会数字化进程的深入,数据正不断渗透于日常的生活、生产、分配、流通、消费等各个环节,对人类社会的影响日益凸显。数据已成为继土地、劳动力、资本、技术之后的第五大生产要素,对其他生产要素的整合能力也使其成为既有要素中比较重要的和难以替代的关键要素,并成为值得重点讨论的时代性议题与理解数字时代的基本入手点。 对数据要素的理解涉及多学科、多视野,本书从与数据要素关系较为密切的信息、权属、价值、安全、交易等五个维度出发,汇聚不同学科背景的既有文献,整合现有观点,对数据要素的多维特性进行探讨,以丰富人们对数据要素的认知,凝聚共识,澄清数字时代的发展与治理迷思,为未来的相关创新提供起点。
《中文版 SPSS 28 统计分析从入门到精通(实战案例版)》详细介绍了 SPSS 28 在数据统计分析方面的使用方法 和应用技巧,它是一本 SPSS 基础教程,同时包含了大量的 SPSS 视频教程。 《中文版 SPSS 28 统计分析从入门到精通(实战案例版)》全书共 20 章,内容包括 SPSS 28 概述、初识 SPSS 28、SPSS 数据结构、数据管理、数据分类、数据清洗和数据加工、数据计算、数据分析图表、数据分布的特征分析、参数检验、非参数检验、均值分析、单因素方差分析、多因素方差分析、相关性分析、列联表相关性分析、回归分析、聚类分析、判别分析和电力中断数据分析实例等知识。通过丰富的实例,详细介绍了 SPSS 数据统计分析的全方位知识。本书在讲解过程中理论联系实际,并配有详细的操作步骤,图文对应,可以提高读者的动手能力,并加深对知识点的理解。 《中文版 SPSS 28
目前,大数据成为人们耳熟能详的名词。在人工智能、大数据时代,数据处理、数据分析成为非常重要的工作,但是数据存储在哪里,数据是怎么存储的,数据库的工作原理是什么,面对大量数据,我们应该如何操作,很多人可能并不清楚。本书就用通俗易懂的文字,结合直观清晰的插图,对这些问题的关键技术 数据库相关知识点进行了详细解说。具体内容包括数据库的基础知识 理解数据库的基本概念、数据的存储方式 关系型数据库的特征、操作数据库 SQL的使用方法、管理数据 避免非法数据的功能、引入数据库 数据库的结构与表的设计、运用数据库 旨在安全运用、用于保护数据库的基础知识 故障恢复与安全措施、活用数据库 在应用程序中使用数据库等。本书适合所有对数据、数据库感兴趣的读者学习。
本书以统计学史上著名人物的伟大成就为脉络,将数据分析这一学科的发展历程娓娓道来。从开普勒仰望星空拉开统计学序幕,贝叶斯提出主观概率,到人工智能、深度学习逐步渗透今天的日常生活。本书带领读者在数据科学的熠熠星光下,看透大数据的深邃内核。
数据是什么?如何应用数据?如何把数据变成更有价值的东西?本书主要适合刚开始使用数据的读者,能让他们对数据的含义、价值及用途有清晰的认识和了解,本书目的是介绍数据的相关知识,同时鼓励人们参与到日益增多的与数据有关的对话中。 本书通过介绍简单数据相关知识,即从一个总体目标、两种思维系统、三大应用领域、四种数据尺度、五种数据分析方法、六种数据展现方式、七种数据活动、八个提前问的问题分别展开阐释数据和分析的方法和思维方式。
《算法竞赛入门经典 训练指南(升级版)》是《算法竞赛入门经典(第2版)》一书的重要补充,旨在补充原书中没有涉及或者讲解得不够详细的内容,从而构建一个更完整的知识体系。本书通过大量有针对性的题目,让抽象复杂的算法和数学具体化、实用化。 《算法竞赛入门经典 训练指南(升级版)》共包括6章,分别为算法设计基础、数学基础、实用数据结构、几何问题、图论算法与模型以及更多算法专题。全书通过206道例题深入浅出地介绍了上述领域的各个知识点、经典思维方式以及程序实现的常见方法和技巧,并在章末给出了丰富的分类习题,供读者查漏补缺和强化学习效果。 《算法竞赛入门经典 训练指南(升级版)》题目多选自近年来ACM/ICPC区域赛和总决赛真题,内容全面,信息量大,覆盖了常见算法竞赛中的大多数细分知识点。书中还给出了所有重
本书对可视化技术、交互技术以及数据分析方法进行了系统和全面的讲解。介绍了交互式可视化数据分析解决方案的设计标准,论述了设计中的影响因素以及工作流程的检验方法。读者可以从中了解可视化编码的基础知识,以及用于多元数据、时间数据、地理空间数据和图形数据等方面的众多可视化技术。 书中专门用一章的内容来介绍与可视化效果互动的常规概念,并且利用图示来说明现代交互技术如何推动可视化数据分析的发展。针对如今庞大而复杂的数据,本书涵盖了自动化分析计算支持可视化数据分析的相关内容,另外还介绍了多屏幕环境下的高级可视化概念、数据分析过程中的用户指南以及渐进式可视化数据分析等技术。 作者用简洁明了的术语以自上而下的视角解读了交互式可视化数据分析。众多真实案例和丰富的插图将使学生、本领域专家、数据密
对于任何依赖经常性收入和重复销售的企业来说,让客户保持活跃并持续购买是必不可少的。客户流失(或 流失 ),这种代价高昂且令人沮丧的事情是可以预防的。通过使用本书中介绍的技术,你可以识别客户流失的预警信号,并学会在客户离开之前识别并挽留他们。 《客户留存数据分析与预测》向开发人员和数据科学家传授经过实践证明的技术与方法,可以在客户流失发生之前阻止其发生。本书包含很多来自现实中的示例,介绍如何将原始数据转换为可衡量的行为指标、计算客户生命周期价值,并使用人口统计数据改进客户流失预测。通过遵循 Zuora 首席数据科学家 Carl Gold 的方法,你将获得高客户留存率带来的优势。 主要内容 ● 计算流失指标 ● 通过客户行为预测客户流失 ● 使用客户细分策略减少客户流失 ● 将客户流失分析技术应用于其他业务领域 ● 使用
数据科学的关键技术包括数据存储计算、数据治理、结构化数据分析、语音分析、视觉分析、文本分析和知识图谱等方面。本书的重点是详细介绍文本分析和知识图谱方面的技术。文本分析技术主要包括文本预训练模型、多语种文本分析、文本情感分析、文本机器翻译、文本智能纠错、NL2SQL问答以及ChatGPT大语言模型等。知识图谱技术主要包括知识图谱构建和知识图谱问答等。本书将理论介绍和实践相结合,详细阐述各个技术主题的实现路线,并对应用于业界算法大赛中的技术方案和技巧进行源代码解读,帮助读者深入理解技术原理。最后,本书还介绍了文本分析和知识图谱技术在政务、公共安全、应急等多个行业中的智能应用实践案例。 《数据科学技术:文本分析和知识图谱》适合具备Python和机器学习技术基础的高等院校学生、文本分析(或者自然语言处理)以
本书以 实战、实用、实效 为原则,充分考虑智慧公安、智慧交通、智慧金融、智慧城市等用户的大数据应用痛点,紧贴大数据实践的业务场景,汇集数据分析模型全生命 周期的关键应用技术,包括数据准备、工作表管理、可视化图表创建、数据大屏制作、数据模型创建和自定义算子设计等内容。 本书内容通俗易懂,案例丰富,图文并茂,同时配有教学视频和建模平台,适合初级、中级数据分析师和广大数据分析爱好者参考学习。通过本书,读者无须具备计算机、 软件开发等专业知识背景,即可熟练掌握大数据分析建模的基本方法和技巧。
在大数据爆发的短短10多年中,NoSQL成为处理大数据必须掌握的热门核心技术之一。《NoSQL数据库入门与实践(基于MongoDB、Redis)(第2版)》正是在这种背景下应运而生的,本书结合MongoDB、Redis和测试工具等全面介绍NoSQL数据库技术,是一本NoSQL数据库入门图书,也是初学者了解NoSQL 技术全貌的图书。全书包括3部分,其中NoSQL基础部分包括初识NoSQL、TRDB与NoSQL的技术比较、NoSQL数据存储模式;NoSQL实践部分(电商大数据)分别介绍了文档数据库MongoDB和键值数据库Redis 入门及提高知识,并通过两个电商平台综合案例详细介绍了MongoDB和Redis在实现不同业务(如日志存储、商品评价、订单信息记录、点击量存储、商品推荐、购物车、记录浏览商品行为等)功能模块开发过程中的具体应用;NoSQL提高部分(电商大数据〉介绍了大数据环境下MongoDB和Redis 在操作速度和数据存储方面的优化方法
广博的网络空间里,藏品以数字化的形态储存,检索、提取、分析、欣赏,物与人之间 零距离 ;多种类的服务场景里,博物馆体验走向定制化,打破虚拟与现实的边界,公众在展厅内外开启自由多样的智识旅程。在智慧博物馆,千里在俄顷,三江坐超忽。 历经信息化、数字化时代,博物馆已走上智慧化实践的征程。利用物联网、大数据、云计算和移动通信等新技术,整合博物馆信息资源,重建信息交流通道,实现智慧服务、智慧保护、智慧管理。通过感知、互通和互联,智慧博物馆更加突出 以人为中心 。 本书辨析智慧博物馆公众服务的定义、特征和内容,构建智慧博物馆公众服务的系统框架;分析面向公众服务的数据资源建设与管理,阐述系统感知、运行和发展的过程;构建绩效评价指标体系和完善机制保障,从内外部确保智慧博物馆公众服务的平稳有效运
Apache Flink项目的资深贡献者Fabian Hueske和Vasiliki Kalavri展示了如何使用Flink DataStream API实现可伸缩的流式应用,以及怎样在业务环境中持续运行和维护这些应用。流处理的理想应用场景有很多,包括低延迟ETL、流式分析、实时仪表盘以及欺诈检测、异常检测和报警。你可以在任意类型的持续数据(包括用户交互、金融交易和物联网等数据)生成后,立即对它们进行处理。本书主要内容包括: 了解有关分布式状态化流处理的概念和挑战。 探索Flink的系统架构,包括事件时间处理模式和容错模型。 理解DataStream API的基础知识和构成要素,包括基于时间和有状态的算子。 以精确一次的一致性读写外部系统。 部署和配置Flink集群。 对持续运行的流式应用进行运维。
《人人会建的大数据可视化大屏》重点阐述数据可视化的重要性、基本概念、主要应用和意义,通过需求梳理、数据准备、屏幕测算、合理布局、图表颜色等方面的设计,呈现数据分析的关键指标,增强数据的可读性。同时,以海致科技集团自主研发的伏羲数据可视化平台应用为例,通俗易懂地介绍伏羲数据可视化大屏设计思路、组件功能和制作方法,举例说明公安、金融、交通、能源、司法等领域的数据大屏应用。 《人人会建的大数据可视化大屏》适于各行各业大数据可视化工程师、数据分析人员、大数据爱好者、人工智能从业人员、计算机软件应用专业的在读大学生等参阅。
互联网公司里面几乎很少有公司不用MySQL,国内互联网巨头都在大规模使用MySQL。如果把MySQL比喻成数据库界的一条巨龙,则性能优化和高可用架构设计实践就是点睛之笔。本书将详细讲解 MySQL 5.7高可用和性能优化技术,细致梳理思路,并与真实生产案例相结合,通过原理阐述到实战部署,帮助读者将所学知识点运用到实际工作中。 本书分为13章,详解MySQL 5.7数据库体系结构,InnoDB存储引擎,MySQL事务和锁,性能优化,服务器全面优化、性能监控,以及MySQL主从复制、PXC、MHA、MGR、Keepalived 双主复制等高可用集群架构的设计与实践过程,并介绍海量数据分库分表和Mycat中间件的实战操作。 本书既适合有一定基础的 MySQL数据库学习者、MySQL数据库开发人员和 MySQL数据库管理人员阅读,同时也能作为高等院校和培训学校相关专业师生的参考用书。
网络图的表征能力异常强大,它能够对事物之间任意类型的相互作用关系进行建模,因此网络图数据在生物信息、交通网络、科研合作、万维网和社交网络等领域的一系列实际场景中随处可见。图数据挖掘用于从图数据中发现有用的信息和知识。然而,网络中节点和链路及其半结构形式的复杂性在各种计算任务,如节点分类、链路预测和图分类等方面提出了挑战。在这一背景下,研究人员最近提出了各种前沿的图机器学习算法,包括图嵌入和图神经网络,显著地提升了图数据挖掘的性能。 《图数据挖掘:算法、安全与应用》提供了对图数据挖掘方法的**评述,在此基础上引申出一个前沿课题,即图数据挖掘的安全性问题,并介绍了一系列检测方法来识别图数据中的对抗样本。此外,它向读者介绍了图数据增强和子图网络以进一步增强模型,即提高其准确性和鲁