Stata是一种功能全面的统计分析软件包,具有易操作、运行速度快、功能强大的特点,主要针对经济、管理、医学、农学、教育、市场研究、社会调查等行业和领域,是大数据时代为流行的计量软件之一。 全书内容共分17章。第1、2章介绍Stata操作入门及数据处理基础知识、描述性统计与图形绘制基础。第3~5章介绍假设检验、方差分析、相关分析等基础分析方法。第6~10章通过相关案例介绍经典及放松各种假定条件的回归分析,包括基本线性回归分析、线性回归分析诊断与处理、非线性回归分析、因变量离散回归分析、因变量受限回归分析等应用。第11~16章以典型案例讲解主成分分析与因子分析、聚类分析、时间序列数据分析、面板数据分析、生存分析、多方程模型等高级分析方法。第17章介绍如何使用Stata进行高质量的综合性研究,讲解研究方案设计、调查问卷的制
《GraphPad Prism科技绘图与数据分析》以GraphPad Prism 9.4为软件平台,结合编者多年的数据分析经验,通过大量实例系统全面地介绍Prism在科研数据处理中的使用方法与技巧。全书共11章:第1~3章主要讲解GraphPad Prism的基础知识,包括用户界面、项目组成、图形的输出、数据的输入、数据表类型、图形的修饰与美化等;第4~11章结合Prism数据表的特点,分别讲解各类数据表的数据格式、数据表能够完成的图表绘制以及可以实现的统计分析等。通过阅读本书,可以帮助读者快速掌握GraphPad的应用,从而更好地处理和分析科研数据。 本书注重基础,内容翔实,突出示例讲解,既可以作为从事数据分析处理的科研工程技术人员的自学用书,还可以作为高等学校相关专业的本科生和研究生的教学用书。
本书以 实战、实用、实效 为原则,充分考虑智慧公安、智慧交通、智慧金融、智慧城市等用户的大数据应用痛点,紧贴大数据实践的业务场景,汇集数据分析模型全生命 周期的关键应用技术,包括数据准备、工作表管理、可视化图表创建、数据大屏制作、数据模型创建和自定义算子设计等内容。 本书内容通俗易懂,案例丰富,图文并茂,同时配有教学视频和建模平台,适合初级、中级数据分析师和广大数据分析爱好者参考学习。通过本书,读者无须具备计算机、 软件开发等专业知识背景,即可熟练掌握大数据分析建模的基本方法和技巧。
当应用于大型分布式数据集时,标准算法和数据结构可能会变慢或完全失效。选择专为大数据设计的算法可以节省时间、提高准确性并降低处理成本。《漫画算法与数据结构(大规模数据集)》将最前沿的研究论文提炼为实用的技术,用于绘制、流式传输并组织磁盘和云中的大规模数据集,十分独特。 大规模数据集的算法与数据结构为大型分布式数据引入了处理和分析技术。《漫画算法与数据结构(大规模数据集)》作为指南,包含了行业故事和有趣的插图,使复杂的概念也易于理解。在学习如何将强大的算法(如Bloom 过滤器、计数最小草图、HyperLogLog和LSM树)映射到你自己的用例时,将对真实世界的示例进行探索。 主要内容: ● 概率草图数据结构 ● 选择正确的数据库引擎 ● 设计高效的磁盘数据结构和算法 ● 大规模系统中的算法权衡 ● 有限空间资源下的百分
本书对可视化技术、交互技术以及数据分析方法进行了系统和全面的讲解。介绍了交互式可视化数据分析解决方案的设计标准,论述了设计中的影响因素以及工作流程的检验方法。读者可以从中了解可视化编码的基础知识,以及用于多元数据、时间数据、地理空间数据和图形数据等方面的众多可视化技术。 书中专门用一章的内容来介绍与可视化效果互动的常规概念,并且利用图示来说明现代交互技术如何推动可视化数据分析的发展。针对如今庞大而复杂的数据,本书涵盖了自动化分析计算支持可视化数据分析的相关内容,另外还介绍了多屏幕环境下的高级可视化概念、数据分析过程中的用户指南以及渐进式可视化数据分析等技术。 作者用简洁明了的术语以自上而下的视角解读了交互式可视化数据分析。众多真实案例和丰富的插图将使学生、本领域专家、数据密
本书以统计学史上著名人物的伟大成就为脉络,将数据分析这一学科的发展历程娓娓道来。从开普勒仰望星空拉开统计学序幕,贝叶斯提出主观概率,到人工智能、深度学习逐步渗透今天的日常生活。本书带领读者在数据科学的熠熠星光下,看透大数据的深邃内核。
本书与以往统计学中的概率论略有不同,添加了一些复杂数据类型的概率基础知识和模拟计算中的相关概率知识。具体安排如下所述。本书共分6章。第1章为概率与计数,基本内容是随机事件、概率空间、计数方法、概率的确定方法。第2章为条件概率,基本内容是条件概率与乘法公式、事件的独立性、全概率公式与贝叶斯公式。第3章为随机变量,基本内容是随机变量及其分布函数、随机变量的分类、二维随机向量、随机变量的独立性、随机变量函数的分布。第4章为常用的概率分布,基本内容是常用的离散型随机变量、常用的连续型随机变量、随机数的产生。第5章为随机变量的数字特征,基本内容是数学期望、方差和协方差、矩和矩母函数、条件期望。第6章为不等式和极限定理,基本内容是概率不等式、大数定律及其应用、中心极限定理。
《matplotlib数据可视化实战》借助matplotlib讲解开展数据可视化实践所需要掌握的关键知识和技能,从设置图表基础元素(坐标轴、标签、颜色、数学符号等),到根据表现内容绘制不同类型的图表(折线图、条形图、圆饼图、小提琴图等),全面讲解了 matplotlib 的使用方法。为方便读者学习, 书中对相关操作都配以案例及代码进行讲解,读者可以根据自身需求,灵活使用其中的函数 和语句。 本书适合数据分析、数据可视化领域的爱好者、从业者阅读,也适合作为高校相关专业的教材。
《算法竞赛入门经典 训练指南(升级版)》是《算法竞赛入门经典(第2版)》一书的重要补充,旨在补充原书中没有涉及或者讲解得不够详细的内容,从而构建一个更完整的知识体系。本书通过大量有针对性的题目,让抽象复杂的算法和数学具体化、实用化。 《算法竞赛入门经典 训练指南(升级版)》共包括6章,分别为算法设计基础、数学基础、实用数据结构、几何问题、图论算法与模型以及更多算法专题。全书通过206道例题深入浅出地介绍了上述领域的各个知识点、经典思维方式以及程序实现的常见方法和技巧,并在章末给出了丰富的分类习题,供读者查漏补缺和强化学习效果。 《算法竞赛入门经典 训练指南(升级版)》题目多选自近年来ACM/ICPC区域赛和总决赛真题,内容全面,信息量大,覆盖了常见算法竞赛中的大多数细分知识点。书中还给出了所有重
对于任何依赖经常性收入和重复销售的企业来说,让客户保持活跃并持续购买是必不可少的。客户流失(或 流失 ),这种代价高昂且令人沮丧的事情是可以预防的。通过使用本书中介绍的技术,你可以识别客户流失的预警信号,并学会在客户离开之前识别并挽留他们。 《客户留存数据分析与预测》向开发人员和数据科学家传授经过实践证明的技术与方法,可以在客户流失发生之前阻止其发生。本书包含很多来自现实中的示例,介绍如何将原始数据转换为可衡量的行为指标、计算客户生命周期价值,并使用人口统计数据改进客户流失预测。通过遵循 Zuora 首席数据科学家 Carl Gold 的方法,你将获得高客户留存率带来的优势。 主要内容 ● 计算流失指标 ● 通过客户行为预测客户流失 ● 使用客户细分策略减少客户流失 ● 将客户流失分析技术应用于其他业务领域 ● 使用
数据建模指的是对现实世界各类数据的抽象组织,确定数据库需管辖的范围、数据的组织形式等直至转化成现实的数据库。而数据模型是构建应用系统的核心,是尽可能精准地表示业务运转的概念性框架。本书通过平实的语言,对数据模型及建模过程进行了深入浅出的介绍。全书内容分为5个部分,对数据建模简介、数据模型要素,概念、逻辑和物理数据模型、数据模型质量以及数据建模的进阶内容等方面进行讲解,全面细致地为读者解答与数据建模相关的知识点和疑问。除此之外,本书的zui后还对各类专业术语进行了细致的解释,方便读者参考。本书是一本经典的数据建模指南,非常适合对数据建模感兴趣的读者以及从事数据科学等相关工作的专业人士参考阅读。
对数据生产和大数据处理带来的挑战,是当代社会和人工智能时代的重点。大数据的快速发展、信息共享和社交媒体的大众化带来了各方面的风险和挑战。我们需要遵循正确的流程、方法和沟通战略 且手头的数据必须准确,才能推演出高价值的结论。而数据越多,我们面临的陷阱可能就越深。在本书中,杰森?辛克从数据通用和收集的策略、数据分析的准则、数据展示的策略出发,讨论了应对数据挑战、获得和洞察数据的价值和内涵的可行方式。
《大数据真相 谁动了我的数据》由浪潮集团广东区云事业部总经理杨绪宾编著,书中依据目前个人大数据利用的乱象系统阐述了个人大数据的概念、财产属性、权力属性,以及如何保证数据安全、数据如何量化、实现数据共享和未来数据权利如何分配等内容,跨越经济、社会、文化和法律制度、IT设计、土地开发及系统建设等多个主题。 书中提出了开发 数说 APP的概念,展现数据采集、整合、分类、赋值、交易等思路,结合区块链技术对个人数据进行存储和价值*化处理,并对实现数字永生的未来世界进行展望。本书围绕着个人大数据系统提出了个人数据的概念、财产属性、权力属性、数据安全、数据量化、数据共享和未来的 数据 等方面的内容,跨越经济、社会、文化和法律制度,以及IT设计、城市规划、土地开发、系统建设等诸多领域。作者作为IT行业和城市
本书以互联网企业中常见数据运营场景为切入点,以工作中实际面临解决的问题为案例,从方法、技术、业务、实践4个维度讲述数据运营的场景及应用方式。书中从实践出发,结合工作中数据运营经验,以应用案例为主线,通过业务分析 代码实践这种更“接地气”的方式讲述数据的应用。书中对于搭建数据监控指标体系、数据分析、数据挖掘、ABTest、埋点策略、用户画像建模等常见数据运营方式做了详细的介绍。
空间数据技术既是地理信息系统(GIS)的重要组成部分,也是其核心技术之一。建立科学、合理的空间数据库是GIS项目成功的关键,但空间数据库是理论性和实践性都很强的学科,理解起来非常抽象。《规范版高职高专测绘类专业“十二五”规划教材:空间数据库技术应用》结构清晰,难易适中,理论与案例相结合,具有较强的实用性和通用性,可以帮助读者更好地理解和掌握数据库、空间数据库的基本原理、设计及构建方法。全书共分为6章。包括:数据库基础知识,空间数据库理论基础,空间数据库设计,空间数据库的建立与维护,空间数据库技术应用实例,空间数据库发展趋势。
《普通高等教育“十二五”规划教材:数据库技术与应用实践教程(第2版)》是与《数据库技术与应用》(第二版)配套的教学参考书,是根据*高等计算机基础课程教学指导委员会2011年10月出版的《高等学校计算机基础核心课程教学实施方案》(新白皮书)中关于“数据库技术及应用”课程实施方案的精神,结合作者多年教学实践与研发的经验,并考虑到读者的反馈信息,遵循非计算机专业的特点,从新的视角对原来出版的《数据库应用基础实践教程》各个章节的内容和结构等进行了修订、调整、完善和补充。全书分为实验指导篇和课程设计案例篇。实验指导篇共安排20个实验,内容选择恰当,具有启发性和实用性,与教材内容紧密结合,强调对动手能力的培养,达到即学即用的目的。课程设计案例篇共安排5个案例,是分别从文学、法学、医学和工学的角度