本书由一线数据分析师精心编写,通过大量案例介绍了数据分析工作中常用的数据分析方法与工具。本书包括5章内容,分别是数据分析入门、数据分析 从玩转Excel开始、海量数据管理 拿MySQL说事儿、数据可视化 Tableau的使用、数据分析进阶 Python数据分析。本书通俗易懂、通过大量贴近企业真实场景的案例,帮助读者在提高数据处理技能的同时加深对数据分析思维的理解。 本书适合有志于从事数据分析工作或已从事初级数据分析工作的人士自学,也可作为产品经理、运营人员、市场人员、对数据分析感兴趣的企业高管以及创业者的参考用书。
本书从数据库角度全面系统地介绍数据挖掘的概念、方法和技术以及技术研究进展,并重点关注近年来该领域重要和 新的课题——数据仓库和数据立方体技术,流数据挖掘,社会化网络挖掘,空间、多媒体和其他复杂数据挖掘。本书是数据挖掘和知识发现领域内的所有教师、研究人员、开发人员和用户都的一本书。
内容介绍 本书从业务、数据、运营3个维度为电商的经营和决策提供了科学的方法论,是一部电商运营真经,真正做到了“业务中有数据,数据中有运营”。作者是资深的电商行业专家,从事电商数据分析与数据化运营10余年,本书是他在多个知名电商品牌操盘多个千万级项目的经验总结。 为了增强本书的趣味性和读者的角色代入感,本书采用了纪实和叙事的写作手法,书中虚拟了3个核心人物: ?Alex:临危受命、勇挑重担、运筹帷幄的BI部门经理(资深数据分析师)。 ?叶子:有电商行业从业经验但是不懂数据分析的业务员。 ?大白:从其他行业转型到电商行业的数据分析师。 全书有两条主线: ?暗线:叶子和大白在Alex的指导和帮助下成长为“精业务、精数据、精运营”的“三精”数据分析师的经历,这对数据分析师的职业规划和成长有重要借鉴意义。 ?明线:Alex将
本书是一本系统介绍Clickhouse的指导型工具书,全书总共分为11章: 第1章 介绍ClickHouse的由来、发展历程、核心特点与核心特点。第2~6章 介绍了ClickHouse基础使用部分,包括整体架构、如何安装、数据定义、数据引擎、数据查询和函数的特性和使用方法。第7~9章介绍了ClickHouse高级特性部分,包括数据库管理操作,数据分片、数据副本和高可用的特性和使用方法。第10~11章介绍了如果自己手动实现ClickHouse中间件的思路和示例,同时也介绍了几款可视化工具与ClickHouse集成的方法。
算力、数据、AI已经成为驱动当今社会技术发展的三架马车,而算力也从传统的超级计算向云超算的方向发展。本书旨在探讨当前超级计算与云计算的融合而给算力带来的新的发展,介绍当前在算力领域的一些实践和探索,从理论到工程,帮助读者了解超级计算的关键技术与未来发展,从而更好地应用和发展高性能技术。
这是一部从技术、流程、管理等多个维度系统讲解华为数据治理和数字化转型的著作。华为是一家超大型企业,华为的数据底座和数据治理方法支撑着华为在全球170多个国家/地区开展多业态、差异化的运营。书中凝聚了大量数据治理和数字化转型方面的有价值的经验、方法论、规范、模型、解决方案和案例,不仅能让读者即学即用,还能让读者了解华为数字化建设的历程。 全书共10章,内容从逻辑上分为四个部分。 第一部分(第1~3章) 第1章以非数字原生企业在数字化转型方面面临的挑战开篇,介绍了华为在数据治理和数字化转型方面的目标、愿景、蓝图和框架;第2章从企业政策和架构协同的角度,介绍了企业级的数据综合治理体系,理顺了数据与变革、运营、IT之间的协同关系,明确了数据管理的责任主体在业务;第3章详细阐述了不同类型的数据的管理方式和
Elasticsearch是一款高性能的文档数据库,广泛应用于分布式搜索和分析引擎等相关领域,本书首先介绍了数据建模的通用设计原理,然后针对Elasticsearch 介绍了文档数据库建模的特点和要求,例如和设计模式有关的实现、注意事项,以及实践过程中的注意点等。 本书的两位作者,一位是资深的Elasticsearch 专家,一位是建模领域的大师,联合为读者呈现了这本著作。如果你是一名希望扩展Elasticsearch 建模技能的读者,或者是一名了解Elasticsearch 但需要提高模式设计技能的从业人员,推荐阅读本书。
部分(第1~4章)为基础和背景部分,主要介绍数据分析挖掘和数据化运营的相关背景、数据化运营中“协调配合”的本质,以及实践中常见分析项目类型的介绍。第二部分(第6~13章)是数据分析挖掘中的具体技巧和案例分享部分,主要介绍实践中常见的分析挖掘技术的实用技巧,并对大量的实践案例进行了全程分享展示。第三部分(第5章,第14~19章)是有关数据分析师的责任、意识、思维的培养和提升的总结和探索,以及一些有效的项目质控制度和经典的方法论介绍。
了解数据结构与算法是透彻理解计算机科学的前提。随着Python日益广泛的应用,Python程序员需要实现与传统的面向对象编程语言相似的数据结构与算法。本书是用Python描述数据结构与算法的开山之作,汇聚了作者多年的实战经验,向读者透彻讲解在Python环境下,如何通过一系列存储机制有效地实现各类算法。通过本书,读者将深刻理解Python数据结构、递归、搜索、排序、树与图的应用,等等。这一版重写了书中的示例代码,并对诸多内容做了修正。
本书系统讲述数据仓库的基本概念、基本原理以及建立数据仓库的方法和过程。主要内容包括:决策支持系统的发展、数据仓库环境结构、数据仓库设计、数据仓库粒度划分、数据仓库技术、分布式数据仓库、ElS系统和数据仓库的关系,外部和非结构化数据与数据仓库的关系、数据装载问题、数据仓库与Web、ERP与数据仓库以及数据仓库设计的复查要目。 本书是数据仓库之父撰写的关于数据仓库的 权威著作,既可作为相关专业的研究生教材,也是数据仓库的研究、开发和管理人员的指南。
本书是畅销书《SQL基础教程》第2版,介绍了关系数据库以及用来操作关系数据库的SQL语言的使用方法。书中通过丰富的图示、大量示例程序和详实的操作步骤说明,让读者循序渐进地掌握SQL的基础知识和使用技巧,切实提高编程能力。每章结尾设置有练习题,帮助读者检验对各章内容的理解程度。另外,本书还将重要知识点总结为“法则”,方便读者随时查阅。第2版除了将示例程序更新为对应近期新的DB的SQL之外,还新增了一章,介绍如何从应用程序执行SQL。
本书分12章重点阐述了数据管理的重要性,数据管理面临的挑战,DAMA的数据管理原则,数据伦理,数据治理,数据生命周期管理的规划及设计,数据赋能和数据维护,使用和增强数据,数据保护、隐私、安全和风险管理,元数据管理,数据质量管理,以及现在应该怎么办,能够帮助企业管理层在了解和执行数据管理的过程中不致迷失在技术术语的迷宫之中。本书可供非数据专业人士、企业管理者、数据行业研究者等读者学习和参考。
本书将现代统计学的重要思想引入数理统计课程中,强调了数据分析、图形工具和计算机技术,并注重统计的实务和应用.本书内容丰富,几乎涵盖了所有经典和前沿的概率论与数理统计理论和方法,主要包括概率、*变量、联合分布、期望、极限定理、抽样调查、参数估计、假设检验、数据汇总、两样本比较、方差分析、分类数据分析和线性小二乘等. 本书用真实数据分析了实际问题,以此增强读者对理论的理解;作者将自助方法与传统的推论性过程结合起来,增加了蒙特卡罗方法.此外,为了使概念更清晰,书中提供了大量的示例,而且还有丰富的习题,以增强读者的计算能力. 本书适合作为统计学、数学、其他理工科专业以及社会科学和经济学专业高年级本科生和低年级研究生的教材,同时也可供相关领域技术人员参考.
数据作为生产要素已经被提升至国家战略层面,如何激活数据要素、体现数据价值,如何有效利用数据赋能数字化转型,成为当前炙手可热的问题。本书厘清了数据治理、数据管理和数字化转型的关系,介绍了数据治理核心工作中经常出现的问题和优秀实践,明确了数字化转型的核心内容、方法路径和评估机制,通过大型企业数据治理或数字化转型案例为读者提供有价值的参考。本书适合首席执行官、首席信息官、首席数据官等从事企业管理和数据管理工作的人员阅读,有助于提升对数据治理和数字化转型的认识,为在组织中有效开展数据治理和数字化转型工作提供思路和借鉴。
随着物联网、云计算、大数据与人工智能等技术的蓬勃发展,计算服务逐渐从计算密集型向数据密集型(Data Intensive)转变。高性能、高通量的数据服务关键技术成为智慧城市、智能制造、智慧农业等国家重大需求解决方案的核心基础。并行与分布式数据处理的概念启发于上世纪80年代,源自讨论在内存及二级存储极为有限的条件下如何跨越 内存墙 ,完成计算任务的优化技术。而今,互联网与私有网络数据指数级增长、数据服务的事务性需求复杂多变、跨地域数据同步需求动态不统一、如何应对当前及未来大数据服务及其上的人工智能计算对并行与分布式数据服务提出了新的问题与挑战。本书从并行与分布式数据服务的基础理论、事务模型、数据处理语言等基础内容,并进一步讨论分布式数据一致性模型及全观性的数据处理架构方面的先进及实用的研究及系统软件
《Power BI商务智能数据分析》是一本教你用Microsoft Power BI分析处理经营业务数据的教程。《Power BI商务智能数据分析》从职场实战出发,精选作者线下培训课程精华,能够帮助企事业单位各部门数据分析人员,通过图形化工具界面,轻松完成大数据处理与可视化交互分析。 《Power BI商务智能数据分析》共分为5章,帮助你从商业智能、数据可视化分析的*新技术入门;按照数据分析流程,逐步完成数据清洗与预处理、建立数据分析模型、可视化报表设计、在线报表发布等工作。Microsoft Power BI以互联网思维打造产品,桌面端免费,每月迭代更新,本书中的Power BI桌面版与Online版操作界面以2020年更新版本为主。 《Power BI商务智能数据分析》适合企事业单位数据分析人员阅读。
本书围绕数据中心业务如何经营这一主题展开论述,以数据中心产业演变为切入点,围绕“布局-建设-服务”三大核心环节,针对数据中心产业面临的集群化布局、低碳化建设、智能化服务的机遇与挑战,通过变革中的数据中心产业、数据中心产业面临的挑战、数据中心布局之道、数据中心低碳建设之道、数据中心智能服务之道、数据中心产业政策实施之道、新形态数据中心经营之道等内容剖析原因、洞察规律、研讨案例、搭建模型,为相关经营主体给出了专业务实的策略。 本书实用性强,内涵丰富,采用情景对话方式编写,可读性强,具备较高参考价值。 本书可供通信运营商、第三方专业服务商、跨界服务商等各类数据中心运营主体的从业人员阅读,也可供主管数据中心建设与运营的政府部门的工作人员阅读。