Stata是一种功能全面的统计分析软件包,具有易操作、运行速度快、功能强大的特点,主要针对经济、管理、医学、农学、教育、市场研究、社会调查等行业和领域,是大数据时代为流行的计量软件之一。 全书内容共分17章。第1、2章介绍Stata操作入门及数据处理基础知识、描述性统计与图形绘制基础。第3~5章介绍假设检验、方差分析、相关分析等基础分析方法。第6~10章通过相关案例介绍经典及放松各种假定条件的回归分析,包括基本线性回归分析、线性回归分析诊断与处理、非线性回归分析、因变量离散回归分析、因变量受限回归分析等应用。第11~16章以典型案例讲解主成分分析与因子分析、聚类分析、时间序列数据分析、面板数据分析、生存分析、多方程模型等高级分析方法。第17章介绍如何使用Stata进行高质量的综合性研究,讲解研究方案设计、调查问卷的制
《华为数据之道》 这是一部从技术、流程、管理等多个维度系统讲解华为数据治理和数字化转型的著作。华为是一家超大型企业,华为的数据底座和数据治理方法支撑着华为在全球170多个国家/地区开展多业态、差异化的运营。书中凝聚了大量数据治理和数字化转型方面的有价值的经验、方法论、规范、模型、解决方案和案例,不仅能让读者即学即用,还能让读者了解华为数字化建设的历程。 ============= 《华为数字化转型之道》 本书由华为公司质量与流程IT团队官方出品,从认知、理念、转型框架、规划和落地方法、业务重构、平台构建等多个维度全面总结和阐述了华为自身的数字化转型历程、方法和实践,能为准备开展或正在开展数字化转型的企业提供系统、全面的参考。
本书旨在向广大有志于投身芯片设计行业的人士及正在从事芯片设计的工程师普及芯片设计知识和工作方法,使其更加了解芯片行业的分工与动向。 本书共分9个章节,从多角度透视芯片设计,特别是数字芯片设计的流程、工具、设计方法、仿真方法等环节。凭借作者多年业内经验,针对IC新人关心的诸多问题,为其提供了提升个人能力,选择职业方向的具体指导。本书第1章是对IC设计行业的整体概述,并解答了IC新人普遍关心的若干问题。第2章和第3章分别对数字IC的设计方法和仿真验证方法进行了详细阐述,力图介绍实用、规范的设计和仿真方法,避免了Verilog语法书中简单的语法堆砌及填鸭式的灌输。第4章是在前两章的基础上,通过实例进一步阐述设计方法中的精髓。第5章详细介绍了作为当今数字芯片主流的SoC芯片架构和设计方法,并对比了非SoC架构的设计,
《GraphPad Prism科技绘图与数据分析》以GraphPad Prism 9.4为软件平台,结合编者多年的数据分析经验,通过大量实例系统全面地介绍Prism在科研数据处理中的使用方法与技巧。全书共11章:第1~3章主要讲解GraphPad Prism的基础知识,包括用户界面、项目组成、图形的输出、数据的输入、数据表类型、图形的修饰与美化等;第4~11章结合Prism数据表的特点,分别讲解各类数据表的数据格式、数据表能够完成的图表绘制以及可以实现的统计分析等。通过阅读本书,可以帮助读者快速掌握GraphPad的应用,从而更好地处理和分析科研数据。 本书注重基础,内容翔实,突出示例讲解,既可以作为从事数据分析处理的科研工程技术人员的自学用书,还可以作为高等学校相关专业的本科生和研究生的教学用书。
本书以实战案例为主线,以函数理论基础为核心,引导读者从整体上理解Power Query的灵活应用,从实例中获得解决问题的思路和灵感。 本书共24章,分为原理篇、实战篇、函数篇、扩展篇,详细讲解了PQ的原理和函数应用。原理篇详细讲述三大数据结构(简称为三大容器)的原理和M函数的传参,实战篇通过案例讲函数,函数篇按照类名讲函数,扩展篇讲解自定义函数等灵活的应用。 本书的特点是,举一反三把逻辑原理讲透、用类比法强化记忆、案例配套在线视频。不管使用Excel还是PQ处理数据,不仅要求快,更要准确,本书列举了许多数据处理的思维和细节,提醒读者避坑。 本书面向会PQ界面操作的用户,作为从基础到中级水平的进阶参考书。
Access是Microsoft Office套件中的一员,是一个数据库管理程序,用于管理数据。本书以Access 2021软件为平台,从管理人员和办公人员的工作需求出发,配合大量典型实例,全面而系统地讲解Access 2021在数据管理中的应用,帮助用户轻松高效地完成数据库的创建与维护。 本书以 完全掌握Access 为出发点来安排内容,全书共6篇,分为15章。第1篇为基础学习篇(第1~4章):本篇主要针对初学者,从零开始,系统并全面地讲解Access 2021的基本操作、数据库的创建与使用、数据表的创建与使用,以及规范数据库的方法。第2篇为查询分析篇(第5~6章):介绍在Access 2021中创建查询、编辑查询字段、使用SQL查询、嵌套查询和多表查询等内容。第3篇为窗体报表篇(第7~9章):介绍在Access 2021中创建普通窗体、创建主/次窗体、在窗体中添加控件和编辑控件,以及创建和分析报表的方法。
本书对可视化技术、交互技术以及数据分析方法进行了系统和全面的讲解。介绍了交互式可视化数据分析解决方案的设计标准,论述了设计中的影响因素以及工作流程的检验方法。读者可以从中了解可视化编码的基础知识,以及用于多元数据、时间数据、地理空间数据和图形数据等方面的众多可视化技术。 书中专门用一章的内容来介绍与可视化效果互动的常规概念,并且利用图示来说明现代交互技术如何推动可视化数据分析的发展。针对如今庞大而复杂的数据,本书涵盖了自动化分析计算支持可视化数据分析的相关内容,另外还介绍了多屏幕环境下的高级可视化概念、数据分析过程中的用户指南以及渐进式可视化数据分析等技术。 作者用简洁明了的术语以自上而下的视角解读了交互式可视化数据分析。众多真实案例和丰富的插图将使学生、本领域专家、数据密
《华为数据之道》 《华为数据之道》 这是一部从技术、流程、管理等多个维度系统讲解华为数据治理和数字化转型的著作。华为是一家超大型企业,华为的数据底座和数据治理方法支撑着华为在优选170多个国家/地区开展多业态、差异化的运营。书中凝聚了大量数据治理和数字化转型方面的有价值的经验、方法论、规范、模型、解决方案和案例,不仅能让读者即学即用,还能让读者了解华为数字化建设的历程。 全书共10章,内容从逻辑上分为四个部分。 第一部分(~3章) 第1章以非数字原生企业在数字化转型方面面临的挑战开篇,介绍了华为在数据治理和数字化转型方面的目标、愿景、蓝图和框架;第2章从企业政策和架构协同的角度,介绍了企业级的数据综合治理体系,理顺了数据与变革、运营、IT之间的协同关系,明确了数据管理的责任主体在业务;第3章详细
本书是基于作者多年的教学与实践撰写的,重点介绍PostgreSQL的核心原理与体系架构,涉及开发、运维、管理与架构等内容。 本书共12章,涉及以下几方面内容:PostgreSQL基础,安装与配置PostgreSQL,管理数据库与数据库实例,管理数据库对象,并行查询,事务与并发控制,应用程序开发,管理数据库安全,备份与恢复,监控、诊断与优化数据库,PostgreSQL的高可用架构,以及从Oracle迁移到PostgreSQL。
对于任何依赖经常性收入和重复销售的企业来说,让客户保持活跃并持续购买是必不可少的。客户流失(或 流失 ),这种代价高昂且令人沮丧的事情是可以预防的。通过使用本书中介绍的技术,你可以识别客户流失的预警信号,并学会在客户离开之前识别并挽留他们。 《客户留存数据分析与预测》向开发人员和数据科学家传授经过实践证明的技术与方法,可以在客户流失发生之前阻止其发生。本书包含很多来自现实中的示例,介绍如何将原始数据转换为可衡量的行为指标、计算客户生命周期价值,并使用人口统计数据改进客户流失预测。通过遵循 Zuora 首席数据科学家 Carl Gold 的方法,你将获得高客户留存率带来的优势。 主要内容 ● 计算流失指标 ● 通过客户行为预测客户流失 ● 使用客户细分策略减少客户流失 ● 将客户流失分析技术应用于其他业务领域 ● 使用
《matplotlib数据可视化实战》借助matplotlib讲解开展数据可视化实践所需要掌握的关键知识和技能,从设置图表基础元素(坐标轴、标签、颜色、数学符号等),到根据表现内容绘制不同类型的图表(折线图、条形图、圆饼图、小提琴图等),全面讲解了 matplotlib 的使用方法。为方便读者学习, 书中对相关操作都配以案例及代码进行讲解,读者可以根据自身需求,灵活使用其中的函数 和语句。 本书适合数据分析、数据可视化领域的爱好者、从业者阅读,也适合作为高校相关专业的教材。
《算法竞赛入门经典 训练指南(升级版)》是《算法竞赛入门经典(第2版)》一书的重要补充,旨在补充原书中没有涉及或者讲解得不够详细的内容,从而构建一个更完整的知识体系。本书通过大量有针对性的题目,让抽象复杂的算法和数学具体化、实用化。 《算法竞赛入门经典 训练指南(升级版)》共包括6章,分别为算法设计基础、数学基础、实用数据结构、几何问题、图论算法与模型以及更多算法专题。全书通过206道例题深入浅出地介绍了上述领域的各个知识点、经典思维方式以及程序实现的常见方法和技巧,并在章末给出了丰富的分类习题,供读者查漏补缺和强化学习效果。 《算法竞赛入门经典 训练指南(升级版)》题目多选自近年来ACM/ICPC区域赛和总决赛真题,内容全面,信息量大,覆盖了常见算法竞赛中的大多数细分知识点。书中还给出了所有重
● 如何使用R语言进行高级数据分析,涉及的技术包括广义线性模型、广义可加模型、混合效应模型、机器学习、并行处理 ● 如何使用R语言的数据可视化技术实现回归,如线性回归和高级回归,并了解回归样条和可加模型 ● 如何使用R语言实现机器学习,包含平行处理、降维、特征选取和分类 ● 如何使用R语言的多重插补技术解决数据缺失问题 ● 如何使用广义线性可加模型实现普通量、二值量和计次量的输出,如何使用自采样法(Bootstrapping)分析不确定性 ● 学习如何对个体内的变异性进行建模,进而捕捉个体在方法以及时间稳定性上的差异
本书英文原版由全球数据中心业内专家共同编写,中文版由国内数据中心业内专家共同翻译并修订完成。内容涵盖了数据中心全生命周期的相关技术及运营管理策略。从数据中心规划、选址、设计、建设、测试、验收、运营到灾备,内容全面详实。是作者及译者多年经验所得。是一本来自全球不同国家、不同企业、不同专业领域的专家共同完成的杰作。 本书可作为数据中心设计者、建设者、管理者以及投资者的学习及参考材料,亦可作为高校相关专业学生及其他人士了解数据中心行业的入门材料。
本书主要介绍基于GraphPad Prism 9 的学术图表绘制方法。本书以软件所定义的8 种数据表为纲,按照 数据录入 数据分析 图表生成与美化 的顺序,结合科研实例,使用t 检验、方差分析、生存分析和主成分分析等相关统计分析方法,介绍了散点图、气泡图、柱状图、线图、饼图、面积图等常见学术图表的绘制和美化方法。同时本书提炼了学术图表绘制的一般流程、配色方法及GraphPad Prism 绘图的进阶技巧,兼顾学术图表绘制的实用性和美观性,适用于需要绘制学术图表的高校学生和科研人员。
本书探索工业大数据的 工程方法体系 并介绍了其中的关键技术,提出了多领域的工业物理对象建模方法和查询技术。全书共10章,第1章讨论了工业大数据的内涵与特点,并给出了工业大数据工程的三个要素,即数据资源、数据分析和数据应用;第2~4章提出了领域模型驱动的数据资源的建模技术,并给出了工业大系统技术与建设方法;第5、6章讨论了敏捷工业大数据分析与运维方法,并阐述了背后的分析软件技术;第7章讨论了用户驱动的数据应用的低代码开发技术;第8~10章用风电、水电、煤矿综采三个行业,展示了工业大数据工程方法的应用过程。
SPSS高级建模技术可广泛应用于商业领域的量化分析。本书的**特色以精选的商用案例详解SPSS前沿建模技术在商业领域的综合应用,以期为通过建模量化分析改善商业运营水平管理,或提升核心竞争力的职场人士阅读参考。 全书共12章,第1章~第2章介绍SPSS快速入门和建模技术要点,后续各章节均以实际商业应用案例的形式详解SPSS在商用实践建模中的应用与分析。建模技术方面,本书系统介绍了神经网络多层感知器、径向基函数、决策树等热门大数据处理建模技术应用,以及SPSS专门用于市场营销的联合分析、直销模块分析等高级专业建模技术应用,也介绍了经典的线性回归分析、相关分析、因子分析、聚类分析、描述性分析、方差分析、交叉表分析等一般统计建模技术应用;精选的案例都是当下流行热门的商业运营领域,包括市场调研、市场营销、客户满意度调查
本书针对大学程序设计竞赛和课程教学,基于数据结构的知识体系结构和循序渐进的原则组织内容,包括基本编程能力训练、线性数据结构的编程、树的编程、图的编程。在每一章中,先介绍了相关的数据结构知识后,然后给出相应的范例;在每章的结尾给出相关题库。
本书以敏捷分析工具Tableau为基础,部分章节辅以SQL讲解,系统介绍了数据可视化分析的体系和方法,内容涵盖问题分析方法、数据合并和建模、可视化图形的选择和构建、多种交互方式及其组合、仪表板设计与高级交互、基本计算和高级计算等。 本书以Tableau Desktop的应用为中心,借工具讲解原理,以原理深化工具应用,并由点及面地介绍了业务分析的思考和原理,特别是提出了实践性的"业务 数据 分析 层次框架,并以三类"详细级别 的概念贯通数据模型、高级筛选和高级计算三大主题。 本书重点介绍工具应用背后的思考方式和原理,帮助读者建立"详细级别 的思考框架,举一反三,从而实现多维、结构化分析。
主要内容 ● 监控性能,找出效果不佳的查询 ● 选取要优化的查询,**限度地提高收益 ● 使用EXPLAIN ANALYZE和Visual Explain等工具来分析查询 ● 借助多种策略改进慢查询 ● 正确使用索引和直方图,创建快速的执行计划 ● 了解并分析锁,从而解决争用问题,提升系统吞吐量
数字经济已成为各国经济增长的新动能,并上升为国家发展战略,各国政府和人民对数据跨境流动安全问题的关注与日俱增。本书系统介绍了全球数据跨境规则的产生背景及其发展演变的脉络,重点分析了全球主要国家和地区数据跨境治理规则的内容和相互之间的异同,特别介绍了欧盟、美国话语权下的数据跨境流动规则及规则间的弥合,也介绍了其他国际性文件及十余个重点国家和地区的立法现状,同时展望了全球数据跨境规则的未来走向,在此基础上对我国的数据跨境流动治理规则现状进行梳理,并对其实施与完善提出了相关建议。本书语言平实易读,主要以法律法规、执法部门的解释性指南、判决书等一手资料作为参考,介绍分析了国内外立法现状和法律实践。
本书介绍Kafka的技术原理和应用技巧。内容包括如何安装和配置Kafka、如何使用Kafka API、Kafka的设计原则和可靠性保证,以及Kafka的一些架构细节,如复制协议、控制器和存储层。本书列举了一些非常流行的Kafka应用场景,比如基于事件驱动的微服务系统的消息总线、流式处理应用程序和大规模数据管道。通过学习本书,你不仅能够深入理解这项大数据核心技术,还能够将所学知识付诸实践,在生产环境中更好地运行Kafka,并基于它构建稳健的高性能应用程序。