一本书如果没有作者自己的观点,而只是知识的堆叠,那么这类书是没有太大价值的。尤其在当前网络发达的时代,几乎任何概念和知识点都可以从网络上查到。但是有一点你很难查到,那就是统计分析的思路和观点。比如,你可以很容易地在网上查到什么是线性回归,但你却查不到怎么 做 线性回归分析,在你遇到实际数据时仍然不知道如何分析。在《白话统计》中,你可以获得这些思路和观点。尽管这些观点未必是所有人都认可的,但根据笔者多年的分析经验,它们在实践中通常是奏效的。《白话统计》凝结了作者十多年来对统计分析的理解,对各种方法的介绍采用全新的理念和思路,不再是介绍方法本身,而是试图将各种方法之间的联系阐述清楚;不再是介绍方法如何计算出结果,而是尽量说明方法背后的思想。当然,本书同时提供了如何实现结果的软件(
本书是国际数据管理协会(DAMA国际)组织众多国际专家对过去30多年数据管理领域知识和实践的总结,是市场上综合了数据管理方方面面的一部具有性的基础工具书。从数据治理、数据架构、数据质量、数据安全、主数据管理、参考数据管理、元数据管理、商务智能和数据参考管理、数据建模设计、数据存储和操作、数据集成和互操作、文档和内容管理、大数据、数据管理人员的道德要求等方面介绍了数据管理的知识体系。
内容简介商业分析有用吗?当然有用!商业分析是行走职场、创业启航的一项技能。 作者结合自己多年的工作经验,用生动的语言介绍如何用数据分析解决商业问题。 本书分为6 篇,共17 章,其中第1 篇是概念篇,讲述商业分析的基本概念;第2 篇是基础篇,讲述如何用基础的分析方法评估企业经营状况;第3 篇是进阶篇,讲述如何构建分析体系解决较复杂的问题;第4 篇是高阶篇,讲述如何应对复杂的商业难题;第5 篇是基础实践篇,通过案例讲述如何解决更复杂的商业问题;第6 篇是高阶实践篇,通过案例讲述如何解决商业分析中的疑难杂症。 本书的讲解思路是层层递进的,从简单场景到复杂场景,从基础的方法到复杂的方法。因此,无论读者是否有数据分析基础和经验,都建议从头开始阅读,这样可以一步步提升认知,更快地掌握商业分析的方法。
本书是热销书《SQL基础教程》的作者MICK为志在向中级进阶的数据库工程师编写的一本SQL技能提升指南。全书可分为两大部分。部分介绍了SQL语言不同寻常的使用技巧,带领读者重新认识CASE表达式、窗口函数、自连接、EXISTS谓词、HAVING子句、外连接、行间比较、集合运算、数列处理等SQL常用技术,发掘它们的新用法。这部分不仅穿插讲解了这些技巧背后的逻辑和相关知识,而且辅以丰富的示例程序,旨在帮助读者从面向过程的思维方式转换为面向集合的思维方式。第二部分介绍了关系数据库的发展史,并从集合论和逻辑学的角度讲述了SQL和关系模型的理论基础,旨在帮助读者加深对SQL语言和关系数据库的理解。此外,本书很多节的末尾设置有练习题,并在书末提供了解答,方便读者检验自己对书中知识点的掌握程度。
《Power Query从入门到精通》从 Excel 处理大型数据的缺点开始讲起,逐步讲解了 Excel 和 Power BI 中的 Power Query 组件,并重点介绍了Power Query 的底层 M 语言的应用知识。 《Power Query从入门到精通》分为 10 章,主要讲解了 Power Query 的入门知识和数据集成、Power Query 的 M 语法规则系列知识,针对 Power Query 如何实现数据清洗和重构系列知识做了详细的讲解,还重点介绍了目前 Power Query 的各类内置函数的功能,后介绍了如何利用自定义函数实现复杂的数据处理和重构过程。 《Power Query从入门到精通》内容通俗易懂,案例丰富,实用性强,特别适合入门级数据分析人员学习,也适合进阶阅读,相信通过阅读《Power Query从入门到精通》,读者对数据分析过程中的清洗和重构会有一个新的认识。
本书介绍了数据链的基本概念、发展历程和趋势,重点分析了Link-4、Link-11、Link-16和Link-22数据链的系统组成、工作模式、技术特点等内容,并以Link-16数据链为重点,全面阐述了该数据链的信道共享机制、时间同步技术、传输消息类型、封装结构、信号波形等内容,给出了多网、导航、中继、距离扩展等功能实现方法;以数据链关键技术为主线,详细论述了数据链的消息格式、信息传输、网络协议、通信安全等方面相关知识,剖析了数据链的本质。
数据建模指的是对现实世界各类数据的抽象组织,确定数据库需管辖的范围、数据的组织形式等直至转化成现实的数据库。而数据模型是构建应用系统的核心,是尽可能精准地表示业务运转的概念性框架。本书通过平实的语言,对数据模型及建模过程进行了深入浅出的介绍。全书内容分为5个部分,对数据建模简介、数据模型要素,概念、逻辑和物理数据模型、数据模型质量以及数据建模的进阶内容等方面进行讲解,全面细致地为读者解答与数据建模相关的知识点和疑问。除此之外,本书的zui后还对各类专业术语进行了细致的解释,方便读者参考。本书是一本经典的数据建模指南,非常适合对数据建模感兴趣的读者以及从事数据科学等相关工作的专业人士参考阅读。
本书主要介绍基于GraphPad Prism 9 的学术图表绘制方法。本书以软件所定义的8 种数据表为纲,按照 数据录入 数据分析 图表生成与美化 的顺序,结合科研实例,使用t 检验、方差分析、生存分析和主成分分析等相关统计分析方法,介绍了散点图、气泡图、柱状图、线图、饼图、面积图等常见学术图表的绘制和美化方法。同时本书提炼了学术图表绘制的一般流程、配色方法及GraphPad Prism 绘图的进阶技巧,兼顾学术图表绘制的实用性和美观性,适用于需要绘制学术图表的高校学生和科研人员。
本书英文原版由全球数据中心业内专家共同编写,中文版由国内数据中心业内专家共同翻译并修订完成。内容涵盖了数据中心全生命周期的相关技术及运营管理策略。从数据中心规划、选址、设计、建设、测试、验收、运营到灾备,内容全面详实。是作者及译者多年经验所得。是一本来自全球不同国家、不同企业、不同专业领域的专家共同完成的杰作。 本书可作为数据中心设计者、建设者、管理者以及投资者的学习及参考材料,亦可作为高校相关专业学生及其他人士了解数据中心行业的入门材料。
本书通过实战案例和可视化的图形讲解数据分析的知识。通过阅读本书,读者可以从容地处理数据,高效地完成数据分析工作。本书共9章,主要内容包括不同场景下的数据分析方法,从业者应具备的数据分析基本知识,数据分析师应具有的思维方式,海盗法则和指标体系建模,用户画像赋能数据分析,数据可视化的实操技巧等。 本书不仅适合产品经理、运营人员、市场营销人员阅读,还适合数据分析人员阅读。
本书以敏捷分析工具Tableau为基础,部分章节辅以SQL讲解,系统介绍了数据可视化分析的体系和方法,内容涵盖问题分析方法、数据合并和建模、可视化图形的选择和构建、多种交互方式及其组合、仪表板设计与高级交互、基本计算和高级计算等。 本书以Tableau Desktop的应用为中心,借工具讲解原理,以原理深化工具应用,并由点及面地介绍了业务分析的思考和原理,特别是提出了实践性的"业务 数据 分析 层次框架,并以三类"详细级别 的概念贯通数据模型、高级筛选和高级计算三大主题。 本书重点介绍工具应用背后的思考方式和原理,帮助读者建立"详细级别 的思考框架,举一反三,从而实现多维、结构化分析。
本书是一本全面关注企业数据标准化方面的工具书,主要分为5 篇。 第1 篇介绍了数据标准化是数据治理的基础,包括数据标准化与数据治理的关系,以及数据标准化主要内容、本书阅读导引。 第2 篇介绍了数据标准化框架体系,包括架构类数据标准、对象类数据标准、基础类数据标准。 第3 篇介绍了数据标准化实施流程与方法,包括建立数据标准化保障机制、现状分析及评估、技术平台和工具、数据标准化关键域实施。 第4 篇介绍了数据标准化评价,包括数据标准化评价方法、数据标准成熟度评价、数据标准化成熟度评价流程。 第5 篇介绍了数据标准化案例,包括油气行业、多元化集团、装备制造行业、核电行业、汽车行业、金融行业、政务行业、互联网行业等行业的数据治理案例,为读者提供了专业、丰富、可信的数据治理实施范例。 本书是工业大数据应
如今企业数字化转型和“互联网+”已成为热门话题。那么,如何开展转型工作,让具体工作可以落到实处呢?由于数字化转型工作的复杂性,很多企业管理者感觉无从下手,市面上也十分缺乏相关的指引和资料。本书介绍的企业架构方法以及多个领先企业和行业数字化案例,可以使读者系统地掌握数字化转型的理论和落地方法,帮助企业完成生死攸关的转型变革。本书回答了“什么是数字经济,什么是数字化转型,什么是数字化转型的关键要素”等问题,并在转型方法方面介绍了数字化企业架构的业务架构、流程、组织、IT架构,详细阐述了金融、零售、医疗、物联网、AI、智能制造等方面近期新的商业模式和技术发展。本书打开了一扇新的数字化转型方法之门,是企业管理者、信息化从业者以及管理咨询服务机构、IT服务公司从业人员、大专院校师生很好的参考资
目前,在基于大数据技术的数据中台建设过程中,由于缺乏完备的架构参考和类似于 脚手架 的原型项目,很多IT团队会在工程技术层面上感到无从下手。开发人员迫切地需要设计良好的架构参考和简单易用的原型项目帮助他们快速启动自己的数据中台建设,本书就是为这一目标而写作的。 《 大数据平台架构与原型实现:数据中台建设实战 》以大数据平台的架构设计为主题,围绕一个2万行源代码的原型项目讲解和演示如何在工程技术层面构建当下流行的数据中台。全书涵盖建设一个企业数据平台所需的各个重要环节,包括基础设施建设、数据采集、主数据管理、实时计算、批处理与数据仓库、数据存储及作业调度,每个环节独立成章,每一章介绍对应主题的架构方案和技术选型,然后结合原型项目讲解具体的实现细节。 如果你是一位架构师,本书可以帮助你提
本书介绍Kafka的技术原理和应用技巧。内容包括如何安装和配置Kafka、如何使用Kafka API、Kafka的设计原则和可靠性保证,以及Kafka的一些架构细节,如复制协议、控制器和存储层。本书列举了一些非常流行的Kafka应用场景,比如基于事件驱动的微服务系统的消息总线、流式处理应用程序和大规模数据管道。通过学习本书,你不仅能够深入理解这项大数据核心技术,还能够将所学知识付诸实践,在生产环境中更好地运行Kafka,并基于它构建稳健的高性能应用程序。
本书以数据思维为主题,以数据分析全流程为主线,融合了与数据思维相关的编程语言、统计学基础及案例分析等内容,全书分为4 篇,囊括了数据思维的概念和培养方法、数据来源及体系建设、数据分析三大思维方式及用户流失、用户转化实战等共11 章的内容。本书囊括了数据分析中常用的分析方法,包括经典的海盗(AARRR)模型、麦肯锡的MECE 模型、逻辑树、漏斗分析、路径分析、对比分析、A/B 试验、RFM 模型、K-Means 算法、5W2H 等分析方法,还包括各类方法的实践案例及Python 实操项目。可以说本书是数据分析方法论与统计学知识、编程语言及应用案例的完美结合。 本书适合工作了1~3 年的初级数据分析师;已经掌握了数据分析工具,需要培养数据思维的转行人员;数据科学行业的人力专家和猎头等。
本书在梳理和反思数字化转型和数字治理现状的基础上,以马克思主义政治经济学中有关生产力与生产关系的经典理论为指导,将数字化转型与数字治理之间的互动关系作为切入点,详细解读了数字经济时代的数字化转型和数字治理挑战,提出了数字化转型和数字治理的创新思路,以期走出一条科学思想与人性光辉共同闪耀的数字繁荣之路。其中,在数字化转型方面,基于"技术-社会”互构视角提出了"技术动力”与"结构调适”的数字化转型机制;在数字治理方面,基于当前的治理挑战和治理需求提出了数字治理"三位一体”体系框架。 此外,本书还对数字化转型和数字治理的未来发展进行了展望。
本书主要分为两部分。第一部分以核心概念和基本应用为脉络,介绍了Flink的核心特性(如检查点机制、时间与窗口、shuffle机制等),部署,DataStream API、Dataset API、Table API的应用,运行时的原理等内容,每一章先对概念做基本的介绍,然后基于应用实例详细分析Flink的设计思想和源码实现。第二部分基于对原理的理解,手把手教读者如何进行定制化的特性开发和性能提升,能够让读者对Flink的理解有质的飞跃。这一部分内容来自作者大量的工作实践,所引用例均源自企业级的真实需求,能够解决非常复杂的现网问题。
详细介绍了企业的数据战略规划和企业内外部数据的应用,并分析了零售、快速消费品、汽车、航空、保险等行业的实战案例,对企业未来的数字化转型也做了简要介绍。
在大数据爆发的短短10多年中,NoSQL成为处理大数据必须掌握的热门核心技术之一。《NoSQL数据库入门与实践(基于MongoDB、Redis)(第2版)》正是在这种背景下应运而生的,本书结合MongoDB、Redis和测试工具等全面介绍NoSQL数据库技术,是一本NoSQL数据库入门图书,也是初学者了解NoSQL 技术全貌的图书。全书包括3部分,其中NoSQL基础部分包括初识NoSQL、TRDB与NoSQL的技术比较、NoSQL数据存储模式;NoSQL实践部分(电商大数据)分别介绍了文档数据库MongoDB和键值数据库Redis 入门及提高知识,并通过两个电商平台综合案例详细介绍了MongoDB和Redis在实现不同业务(如日志存储、商品评价、订单信息记录、点击量存储、商品推荐、购物车、记录浏览商品行为等)功能模块开发过程中的具体应用;NoSQL提高部分(电商大数据〉介绍了大数据环境下MongoDB和Redis 在操作速度和数据存储方面的优化方法
Power BI 自 2015 年 7 月发布后,极大地改变了商业智能市场的格局,连续多年被评为商业智能产品的领导者。本书集合了 20 多套运用 Power BI 的 DAX 引擎来处理、分析常见商业问题的即用型解决方案。 DAX 设计模式是由 BI 领域专家 阿尔贝托 法拉里和马尔科 鲁索总结并提出的。本书同时使用 Power BI 和 Excel 作为工具*行编写,并对应用模式*行了大幅更新,内容涵盖了时间智能、分组、ABC 分类、客户分析、购物篮分析等常用模式。本书所包含的每一套设计模式都经过不断的实践,被提炼为易用的数据模型和优雅的 DAX 公式。 本书适合 Excel 高级用户、商业智能分析人员、使用 DAX 和微软分析工具的专业人士阅读。