本书围绕精益创业展开讨论,融合了精益创业法、客户开发、商业模式画布和敏捷/持续集成的精华。本书汇聚了100多位创始人、投资人、内部创业者和创新者的成功创业经验,呈现了 30 多个极具价值的案例分析,可以为各阶段的创业者提供行为准则。 如果你是一名创业者,或者你是一名产品开发、产品管理、市场营销、公共关系和投资领域的商务专业人员,那么本书不容错过。
全书分为三大部分: 主要讨论有关增强数据密集型应用系统所需的若干基本原则。首先开篇第1章即瞄准目标:可靠性、可扩展性与可维护性,如何认识这些问题以及如何达成目标。第2章我们比较了多种不同的数据模型和查询语言,讨论各自的适用场景。接下来第3章主要针对存储引擎,即数据库是如何安排磁盘结构从而提高检索效率。第4章转向数据编码(序列化)方面,包括常见模式的演化历程。 我们将从单机的数据存储转向跨机器的分布式系统,这是扩展性的重要一步,但随之而来的是各种挑战。所以将依次讨论数据远程复制(第5章)、数据分区(第6章)以及事务(第7章)。接下来的第8章包括分布式系统的更多细节,以及分布式环境如何达成一致性与共识(第9章)。 主要针对产生派生数据的系统,所谓派生数据主要指在异构系统中,如果无法用一个数
《华为数据之道》 这是一部从技术、流程、管理等多个维度系统讲解华为数据治理和数字化转型的著作。华为是一家超大型企业,华为的数据底座和数据治理方法支撑着华为在全球170多个国家/地区开展多业态、差异化的运营。书中凝聚了大量数据治理和数字化转型方面的有价值的经验、方法论、规范、模型、解决方案和案例,不仅能让读者即学即用,还能让读者了解华为数字化建设的历程。 ============= 《华为数字化转型之道》 本书由华为公司质量与流程IT团队官方出品,从认知、理念、转型框架、规划和落地方法、业务重构、平台构建等多个维度全面总结和阐述了华为自身的数字化转型历程、方法和实践,能为准备开展或正在开展数字化转型的企业提供系统、全面的参考。
本书主要以项目实战为主线,从0到1的项目开发流程,教会读者如何开发全栈项目。它基于最新的Spring Boot3.1以上版本和Vue.js3.0版本的前后端分离项目开发,以及面向用户端的uni-app的小程序开发。本书基础的知识会在项目的开发过程中穿插讲解,不会单独的基础知识讲解,采用实战驱动学习知识的教学方法,并通过详细的代码示例、清晰的图解和源码解析帮助读者快速理解和掌握全栈项目开发的技巧和最佳项目实践。 本书共22章,包括Spring Boot篇、Vue篇和uni-app篇。Spring Boot篇(第1~14章)从环境搭建到项目上线,逐步深入讲解项目开发流程,并使用了众多企业级流行的开发技术,如Redis、Docker、Jenkins、Mybatis-plus等。Vue.js篇(第15~19章)使用Vue 3.0版本,采用开源的Vue.js框架Vue-Vben-Admin作为项目启动模板,帮助快速搭建后台管理系统,节约时间成本等。uni-app篇(第20~22章
内容简介这是一部能指引零基础读者顺利完成数据资产入表的实操性著作。它不仅为读者提供了数据资产入表所需的全部知识,还给出了实际操作层面的方法指引;既是数据资产入表的初学者指南,也是企业实施数据资产入表操作的工作手册。本书由数据资产管理领域的标杆企业亿信华辰倾情奉献,同时融合了行业的先进实践经验,开创性提出 数据资产三次入表理论 (数据原始资源入表、数据产品入表、数据金融资产入表),得到了来自学术界和企业界的12位数据资产管理专家的高度评价和强烈推荐。本书分为四部分,不仅从战略、方法、工具、实操、案例等角度为读者提供了全面的数据资产入表知识体系,还前瞻性地探讨了数据资产入表后的价值挖掘、资产评估和金融创新。第一部分 数据资产入表全景概览(第1和第2章)深入分析数据资产入表的宏观背景、核
本书旨在为包括研究生和工业从业者在内的研究人员提供有关为数据驱动的进化优化而开发的最新方法的全面描述。本书共分12章,第1~4章简要介绍了优化、进化计算和机器学习中精心挑选的重要主题和方法。第5章提供了数据驱动优化的基础知识,包括启发式算法和基于获取函数的代理模型管理。第6章介绍使用多个代理模型进行单目标优化的方法。第7~8章中描述用于求解多目标和多目标优化算法的代表性进化算法以及代理模型辅助数据驱动的进化多目标和多目标优化。第9章详细阐述了高维数据驱动优化的方法。第10章描述迁移学习和迁移优化。第11章讨论离线数据驱动的进化优化,以翼型设计优化等实际优化问题为例、原油蒸馏优化和急救系统优化。最后,第12章强调了深度神经架构搜索作为数据驱动的昂贵优化问题。
《Power BI商业智能数据分析与可视化》以DAX为核心线索,围绕数据分析和数据可视化,系统全面地介绍了Power BI的核心知识体系。 《Power BI商业智能数据分析与可视化》的主要内容包括数据分析和数据可视化基础知识,Power Query数据获取、转换与加载,Power BI数据模型,DAX基础和进阶知识、DAX的实践案例、DAX驱动数据可视化交互,仪表板开发实践、仪表板多场景应用,以及AI辅助学习等。 《Power BI商业智能数据分析与可视化》体系完整、重点突出、内容新颖翔实、案例贴近实际,适合数据分析师、Power BI分析人员、Excel高级用户,以及想提高数据分析能力的各类人员阅读。
《Hadoop海量数据处理》从Hadoop的基础知识讲起,逐步深入Hadoop分布式文件系统(HDFS)和MapReduce分布式编程框架的核心技术,帮助读者全面、系统、深入地理解Hadoop海量数据处理技术的精髓。本书在讲解技术原理时穿插大量的典型示例,并详解两个典型项目实战案例,帮助读者提高实际项目开发水平。 《Hadoop海量数据处理》共15章,分为4篇。第1篇Hadoop基础知识,包括大数据概述、Hadoop概述、Hadoop环境搭建与配置;第2篇Hadoop分布式存储技术,包括HDFS概述、HDFS基础操作、HDFS的读写原理和工作机制、Hadoop 3.x的新特性;第3篇MapReduce分布式编程框架,包括MapReduce概述、MapReduce开发基础、MapReduce框架的原理、MapReduce数据压缩、YARN资源调度器、Hadoop企业级优化;第4篇项目实战,包括Hadoop高可用集群搭建实战和统计TopN经典项目案例实战。 《Hadoop海量数据处理》通俗易懂、案
本书结合理论和实践,由浅入深,全方位介绍了Hadoop这一高性能的海量数据处理和分析平台。全书5部分24章,第Ⅰ部分介绍Hadoop基础知识,主题涉及Hadoop、MapReduce、Hadoop分布式文件系统、YARN、Hadoop的I/O操作。第Ⅱ部分介绍MapReduce,主题包括MapReduce应用开发;MapReduce的工作机制、MapReduce的类型与格式、MapReduce的特性。第Ⅲ部分介绍Hadoop的运维,主题涉及构建Hadoop集群、管理Hadoop。第Ⅳ部分介绍Hadoop相关开源项目,主题涉及Avro、Parquet、Flume、Sqoop、Pig、Hive、Crunch、Spark、HBase、ZooKeeper。第Ⅴ部分提供了三个案例,分别来自医疗卫生信息技术服务商塞纳(Cerner)、微软的人工智能项目ADAM(一种大规模分布式深度学习框架)和开源项目Cascading(一个新的针对MapReduce的数据处理API)。 本书是一本权威、全面的Hadoop参考书和工具书,阐述了Hadoop生态圈的*发展和应用,程序员可以从中探
XGBoost是一种经过行业验证的开源软件库,为快速高效地处理数十亿数据点提供了梯度提升框架。首先,本书在介绍机器学习和XGBoost在scikit-learn中的应用后,逐步深入梯度提升背后的理论知识。读者将学习决策树,并分析在机器学习环境中的装袋技术,同时学习拓展到XGBoost的超参数;并将从零开始构建梯度提升模型,将梯度提升扩展到大数据领域,同时通过计时器的使用了解速度限制。接着,本书重点探讨XGBoost的细节,着重于速度提升和通过数学推导导出参数。通过详细案例研究,读者将练习使用scikit-learn及原始的Python API构建和微调XGBoost分类器与回归器;并学习如何利用XGBoost的超参数来提高评分、纠正缺失值、缩放不平衡数据集,并微调备选基学习器。最后,读者将学习应用高级XGBoost技术,如构建非相关的集成模型、堆叠模型,并使用稀疏矩阵、定制转换器和
《Doris实时数据仓库理论与实战》系统地介绍了Doris的核心概念、架构原理和各项功能。全书共7章。第1章对Doris做了初步介绍。第2章重点介绍了Doris的数据表设计。第3章聚焦于Doris的数据导入。第4章介绍了Doris的数据导出和数据管理。第5章讨论了Doris中的数据更新和删除操作。第6章将读者带入Doris的进阶使用领域。第7章展示了Doris的生态扩展。通过《Doris实时数据仓库理论与实战》的学习,读者可以全面而深入地了解运用Doris构建高效、可扩展、实时数据仓库系统的方法,从理论到实践,从基础到进阶。 《Doris实时数据仓库理论与实战》适用于Doris开发人员和数据工程师,或有志从事数据仓库开发的技术人员。
内容简介 这是一部全面讲解数据产品经理核心知识体系的著作。12位作者大多来自国内的知名企业,涉及不同的行业,让本书拥有了更广泛的视角,能帮助读者从不同的角度去了解数据产品经理如何在数据、产品、运营、市场等多个方面产生价值。本书的*终目的是让读者全面了解数据产品经理的工作内容、系统掌握数据产品的核心知识体系,快速实现从入门到进阶的突破。 全书一共11章,重点讲解了数据产品经理应该掌握的11个核心知识点,可以概括为四个部分。 第壹部分 基础知识(第1章) 首先介绍了数据产品的定义、组成、分类,其次介绍了数据产品经理的分类和能力模型,*后介绍了数据产品经理的招聘、应聘和面试。 第二部分 通用能力(第2~3章) 讲解了数据产品经理应该具备的数据分析能力和项目运作能力(产品路线图)。 第三部分 数据管理(第4~9章
这是一部从技术、流程、管理等多个维度系统讲解华为数据治理和数字化转型的著作。华为是一家超大型企业,华为的数据底座和数据治理方法支撑着华为在全球170多个国家/地区开展多业态、差异化的运营。书中凝聚了大量数据治理和数字化转型方面的有价值的经验、方法论、规范、模型、解决方案和案例,不仅能让读者即学即用,还能让读者了解华为数字化建设的历程。 全书共10章,内容从逻辑上分为四个部分。 第一部分(第1~3章) 第1章以非数字原生企业在数字化转型方面面临的挑战开篇,介绍了华为在数据治理和数字化转型方面的目标、愿景、蓝图和框架;第2章从企业政策和架构协同的角度,介绍了企业级的数据综合治理体系,理顺了数据与变革、运营、IT之间的协同关系,明确了数据管理的责任主体在业务;第3章详细阐述了不同类型的数据的管理方式和
本书包括导论以及对齐(Align)、细化(Refine)、设计(Design)三章。通过将业务术语、逻辑和物理三个建模层次重命名为对齐、细化、设计,在名称中包含了该层次所做的工作。 导论介绍了数据模型的三个特征 精确性、最小化和可视化;数据模型的三个组件 实体、关系和属性;数据模型的三个层次 业务术语(对齐)、逻辑(细化)和物理(设计),以及数据建模的三个视角 关系、维度和查询。第1章对齐是关于通用业务术语的,以便每个人都能在术语和总体计划范围上保持一致。第2章细化是关于搜集业务需求的,即完善我们对项目的了解,专注于关键业务要点。第3章设计是关于技术需求的,即针对独特软硬件需求进行模型设计。 对齐、细化和设计,这就是本书遵循的方法,并通过 宠物之家 案例对概念加以强化。本书适合需要将建模技能扩展到MongoDB的数据
洞见产业新生态,解码数字新经济 行业场景真实展示 实际案例深度梳理,感受数字转型路径风格 谭建荣院士、郭华东院士、邬贺铨院士、张宏科院士 共同推荐 《产业数字化 释义、场景及应用案例》以《 十四五 数字经济发展规划》中产业数字化部分的核心内容为纲领,从入选工业和信息化部的大数据产业发展示范项目中,选取了具有产业代表性的来自生产一线的数字化转型实践案例,连同数字化建设和转型的共性基础内容,组织了42 个案例,从实践背景、方法手段、主要应用的技术、实践过程中遇到的典型问题、实施流程、典型应用场景等方面,分享了多个行业、多家单位的实践经验,以期帮助读者对产业数字化转型产生更为具体的了解和体会、获得间接经验,为读者提升数字认知和工作能力做一定的基础铺垫。 本书适合具有产业数字化转型需求的相关企业的管理者、
本书介绍可以帮助读者处理真实数据分析挑战的概念和技能。它涵盖了概率论、统计推断、线性回归和机器学习等概念。它还帮助读者提升如下技能:R编程、数据清洗、数据可视化、预测算法构建、使用UNIX/Linux shell组织文件、使用Git和GitHub进行版本控制以及可复制的文档准备。全书分为六个部分,分别为R、数据可视化、统计与R、数据清洗、机器学习和生产力工具。
本书循序渐进、深入讲解了R语言数据统计分析与应用的核心知识,并通过具体实例的实现过程演练了知识点的用法和流程。全书共16章,分别讲解了R语言基础、R语言数据统计语法基础、数据获取和处理、绘制可视化统计图、描述性统计分析、探索性数据分析、推论统计、回归分析、方差分析、非参数统计分析、主成分分析、聚类分析、生存分析、因子分析、基于机器学习的患者再入院预测分析系统和中概科技指数统计分析与投资系统。全书简洁而不失其技术深度,内容丰富全面,历史资料翔实齐全。同时,本书易于阅读,以极简的文字介绍了复杂的案例,同时涵盖了其他同类图书中很少涉及的历史参考资料,是学习R语言数据统计分析与应用的实用教程。
本书介绍了 Kubernetes 部署大规模容器的复杂流程。只有精通每个网络层的抽象工具,才能在生产集群中高效地排查故障并维护集群。本书涵盖如下内容:Kubernetes网络模型。如何从CNCF CNI项目中选择最Z适合集群的接口。Kubernetes 背后的网络基础和Linux基础。如何快速排除网络问题并防止停机。AWS、Google Cloud和Microsoft Azure的云网络和Kubernetes服务。各种网络工具的利弊以及如何为你的技术栈选择最Z合适的工具。
利用这本书,你将学习以下内容:了解如何选择Spark转换实现优化的解决方案。探索强大的转换和归约,包括reduceByKey()、combineByKey()和mapPartitions()。理解数据分区以实现优化查询。使用PySpark设计模式构建和应用模型。对图数据应用motif查找算法。使用GraphFrames API分析图数据。对临床医学和基因组数据应用PySpark算法。学习如何在ML算法中使用和应用特征工程。了解并使用实用的数据设计模式。
《数据中台:让数据用起来 第2版》 在数字中国这一国家战略的牵引下,数据要素和数字化转型的研究和落地如火如荼。数据中台是企业开展数据要素相关实践和数字化转型的关键基础设施,本书在这样的时代背景下,以帮助企业“管好数据、用好数据”为宗旨,内容围绕数据中台架构与建设方法论、数据中台建设流程和内容、数据中台工程化交付、数据中台行业解决方案4个维度全面、深度展开。 ============== 《华为数据之道 》 这是一部从技术、流程、管理等多个维度系统讲解华为数据治理和数字化转型的著作。华为是一家超大型企业,华为的数据底座和数据治理方法支撑着华为在全球170多个国家/地区开展多业态、差异化的运营。书中凝聚了大量数据治理和数字化转型方面的有价值的经验、方法论、规范、模型、解决方案和案例,不仅能让读者即学即用,还能让
本书是一本数据科学的入门与提升教程,全书共5篇,按照由浅入深、循序渐进的方式介绍R语言的基本语法与实际应用,并结合现实数据进行实战操作。内容涵盖R语言的安装与运行、数据对象的创建与编程、R语言初级与高级绘图、数据的管理与清洗、统计分析与数据降维、无监督与有监督学习、利用R Markdown创建动态报告和制作幻灯片等。本书为读者提供了相关案例的源码(获取方式见封底)。 本书适合对数据可视化、统计建模、数据分析、数据挖掘感兴趣的研究人员和工程技术人员阅读,也可作为高等院校数学、统计学、数据科学、计算机科学、人工智能、云计算、大数据分析、生物医学、工业统计等方向本科生或研究生的参考教程。
《企业数据治理与SAP MDG实现》从讲解大数据与企业数据治理之间的重要关系出发,首先阐述数据治理在企业数字化转型过程中的定位与作用。然后通过讲述数据治理框架以及企业数据管理规划等方面的基础内容来阐述数据治理相关内容在企业中推进的顶层方向、推行范围与落地方式。通过概念解析、方案实例等方式讲述了主数据管理维度在数据管理中的定位、作用、目标以及某行业中此类项目建设的部分实际内容,如对数据管控方案和相关主数据平台产品(SAP MDG)进行了重点介绍。接着对企业数字化转型中的数字化共享平台,尤其是企业中台(包括业务中台、数据中台)的概念、内容与核心目标等方面进行了阐述。*后通过大数据平台规划与大数据应用层面的内容,详细讲述了数字化转型的特点和大数据平台规划与建设的手段与实例,让读者从点到面了解企业数字