全书分为三大部分: 主要讨论有关增强数据密集型应用系统所需的若干基本原则。首先开篇第1章即瞄准目标:可靠性、可扩展性与可维护性,如何认识这些问题以及如何达成目标。第2章我们比较了多种不同的数据模型和查询语言,讨论各自的适用场景。接下来第3章主要针对存储引擎,即数据库是如何安排磁盘结构从而提高检索效率。第4章转向数据编码(序列化)方面,包括常见模式的演化历程。 我们将从单机的数据存储转向跨机器的分布式系统,这是扩展性的重要一步,但随之而来的是各种挑战。所以将依次讨论数据远程复制(第5章)、数据分区(第6章)以及事务(第7章)。接下来的第8章包括分布式系统的更多细节,以及分布式环境如何达成一致性与共识(第9章)。 主要针对产生派生数据的系统,所谓派生数据主要指在异构系统中,如果无法用一个数
本书围绕精益创业展开讨论,融合了精益创业法、客户开发、商业模式画布和敏捷/持续集成的精华。本书汇聚了100多位创始人、投资人、内部创业者和创新者的成功创业经验,呈现了 30 多个极具价值的案例分析,可以为各阶段的创业者提供行为准则。 如果你是一名创业者,或者你是一名产品开发、产品管理、市场营销、公共关系和投资领域的商务专业人员,那么本书不容错过。
这是一部从技术、流程、管理等多个维度系统讲解华为数据治理和数字化转型的著作。华为是一家超大型企业,华为的数据底座和数据治理方法支撑着华为在全球170多个国家/地区开展多业态、差异化的运营。书中凝聚了大量数据治理和数字化转型方面的有价值的经验、方法论、规范、模型、解决方案和案例,不仅能让读者即学即用,还能让读者了解华为数字化建设的历程。 全书共10章,内容从逻辑上分为四个部分。 第壹部分(第1~3章) 第1章以非数字原生企业在数字化转型方面面临的挑战开篇,介绍了华为在数据治理和数字化转型方面的目标、愿景、蓝图和框架;第2章从企业政策和架构协同的角度,介绍了企业级的数据综合治理体系,理顺了数据与变革、运营、IT之间的协同关系,明确了数据管理的责任主体在业务;第3章详细阐述了不同类型的数据的管理方式
本书由一线数据分析师精心编写,通过大量案例介绍了数据分析工作中常用的数据分析方法与工具。本书包括5章内容,分别是数据分析入门、数据分析 从玩转Excel开始、海量数据管理 拿MySQL说事儿、数据可视化 Tableau的使用、数据分析进阶 Python数据分析。本书通俗易懂、通过大量贴近企业真实场景的案例,帮助读者在提高数据处理技能的同时加深对数据分析思维的理解。 本书适合有志于从事数据分析工作或已从事初级数据分析工作的人士自学,也可作为产品经理、运营人员、市场人员、对数据分析感兴趣的企业高管以及创业者的参考用书。
内容简介这是一部能指引零基础读者顺利完成数据资产入表的实操性著作。它不仅为读者提供了数据资产入表所需的全部知识,还给出了实际操作层面的方法指引;既是数据资产入表的初学者指南,也是企业实施数据资产入表操作的工作手册。本书由数据资产管理领域的标杆企业亿信华辰倾情奉献,同时融合了行业的先进实践经验,开创性提出 数据资产三次入表理论 (数据原始资源入表、数据产品入表、数据金融资产入表),得到了来自学术界和企业界的12位数据资产管理专家的高度评价和强烈推荐。本书分为四部分,不仅从战略、方法、工具、实操、案例等角度为读者提供了全面的数据资产入表知识体系,还前瞻性地探讨了数据资产入表后的价值挖掘、资产评估和金融创新。第一部分 数据资产入表全景概览(第1和第2章)深入分析数据资产入表的宏观背景、核
本书结合理论和实践,由浅入深,全方位介绍了Hadoop这一高性能的海量数据处理和分析平台。全书5部分24章,第Ⅰ部分介绍Hadoop基础知识,主题涉及Hadoop、MapReduce、Hadoop分布式文件系统、YARN、Hadoop的I/O操作。第Ⅱ部分介绍MapReduce,主题包括MapReduce应用开发;MapReduce的工作机制、MapReduce的类型与格式、MapReduce的特性。第Ⅲ部分介绍Hadoop的运维,主题涉及构建Hadoop集群、管理Hadoop。第Ⅳ部分介绍Hadoop相关开源项目,主题涉及Avro、Parquet、Flume、Sqoop、Pig、Hive、Crunch、Spark、HBase、ZooKeeper。第Ⅴ部分提供了三个案例,分别来自医疗卫生信息技术服务商塞纳(Cerner)、微软的人工智能项目ADAM(一种大规模分布式深度学习框架)和开源项目Cascading(一个新的针对MapReduce的数据处理API)。 本书是一本权威、全面的Hadoop参考书和工具书,阐述了Hadoop生态圈的*发展和应用,程序员可以从中探
本书从数据库角度全面系统地介绍数据挖掘的概念、方法和技术以及技术研究进展,并重点关注近年来该领域重要和 新的课题——数据仓库和数据立方体技术,流数据挖掘,社会化网络挖掘,空间、多媒体和其他复杂数据挖掘。本书是数据挖掘和知识发现领域内的所有教师、研究人员、开发人员和用户都的一本书。
数据、模型与决策是应用数学建模和计算机技术帮助决策者解决问题。作为国外一本优秀的数据、模型与决策的教材,本书具有以下特色: 1.对枯燥、复杂和技术化的数学问题用简明易懂的语言予以解释,兼顾严谨的数理逻辑。 2.突出建模分析框架和基础逻辑的讲授和训练,在某种程度上实现了艺术与科学的有机融合。 3.课后习题丰富,并配有网络题库,供自学者加强训练,及时检查对理论模型及其求解方法的掌握程度。 第12版把修订重点放在企业和组织的*技术发展上,增加了商业分析(第1章)、项目风险(第8章)以及数据挖掘(第14章)等内容。
内容简介 这是一部全面讲解数据产品经理核心知识体系的著作。12位作者大多来自国内的知名企业,涉及不同的行业,让本书拥有了更广泛的视角,能帮助读者从不同的角度去了解数据产品经理如何在数据、产品、运营、市场等多个方面产生价值。本书的*终目的是让读者全面了解数据产品经理的工作内容、系统掌握数据产品的核心知识体系,快速实现从入门到进阶的突破。 全书一共11章,重点讲解了数据产品经理应该掌握的11个核心知识点,可以概括为四个部分。 第壹部分 基础知识(第1章) 首先介绍了数据产品的定义、组成、分类,其次介绍了数据产品经理的分类和能力模型,*后介绍了数据产品经理的招聘、应聘和面试。 第二部分 通用能力(第2~3章) 讲解了数据产品经理应该具备的数据分析能力和项目运作能力(产品路线图)。 第三部分 数据管理(第4~9章
这是一本教我们如何制作完美可视化图表,挖掘大数据背后意义的书。作者认为,可视化是一种媒介,向我们揭示了数据背后的故事。他循序渐进、深入浅出地道出了数据可视化的步骤和思想。本书让我们知道了如何理解数据可视化,如何探索数据的模式和寻找数据间的关联,如何选择适合自己的数据和目的的可视化方式,有哪些我们可以利用的可视化工具以及这些工具各有怎样的利弊。 作者给我们提供了丰富的可视化信息以及查看、探索数据的多元视角,丰富了我们对于数据、对于可视化的认知。对那些对设计和分析过程感兴趣的人,本书无疑就是一本书。
《基于Python的大数据分析基础及实战》是一本介绍如何用Python 3.6进行数据处理和分析的学习指南。其主要内容包括:Python语言基础、数据处理、数据分析、数据可视化,以及利用Python对数据库的操作、自建Python应用库的共享发布等。 《基于Python的大数据分析基础及实战》分3个部分:第1部分为基础知识,第2部分为实战案例,第3部分为拓展与延伸。本书内容丰富,讲解通俗易懂,非常适合本科生、研究生,以及对Python语言感兴趣或者想要使用Python语言进行数据分析的广大读者。
数字经济已成为各国经济增长的新动能,并上升为国家发展战略,各国政府和人民对数据跨境流动安全问题的关注与日俱增。本书系统介绍了全球数据跨境规则的产生背景及其发展演变的脉络,重点分析了全球主要国家和地区数据跨境治理规则的内容和相互之间的异同,特别介绍了欧盟、美国话语权下的数据跨境流动规则及规则间的弥合,也介绍了其他国际性文件及十余个重点国家和地区的立法现状,同时展望了全球数据跨境规则的未来走向,在此基础上对我国的数据跨境流动治理规则现状进行梳理,并对其实施与完善提出了相关建议。本书语言平实易读,主要以法律法规、执法部门的解释性指南、判决书等一手资料作为参考,介绍分析了国内外立法现状和法律实践。
nbsp nbsp《Power BI 商业数据分析完全自学教程》是一本系统地讲解利用 Power BI 软件进行商业数据智能分析的自学宝典。《Power BI商业数据分析完全自学教程》以 完全精通 Power BI 为出发点,以 用好 Power BI 为目标来安排内容,全书共 5 篇,分为 14 章,循序渐进地介绍了 Power BI 的基本操作、数据导入、数据整理、数据建模、数据可视化分析、数据发布等相关技能。 第 1 篇为基础入门篇(第 1 章 ~ 第 3 章),主要针对初学者,从零开始,系统且全面地讲解了 Power BI 的入门知识点、基本操作及数据的输入和连接操作。 第 2 篇为数据处理篇(第 4 章 ~ 第 6 章),介绍了 Power BI 数据的整理操作、表格中行 / 列数据的管理,以及 Power BI 数据的高级处理、M 函数的使用等。 第 3 篇为数据分析篇(第 7 章 ~ 第 9 章),介绍了 Power BI 数据的建模操作及 DAX 语言的入门和进阶操作等。
本书从Power BI的基础功能讲起,逐步深入到Power BI进阶实战,以业务案例为导向,以Power BI桌面版操作为基础进行讲解,深入讲述Power BI在各个业务部门的应用。本书包括7篇共21章内容,分业务场景进行讲解。第1篇用1章内容讲述Power BI基础操作,方便读者快速入门;第2篇用4章内容讲述如何用Power BI爬取天气、电影、销售、股票等数据;第3篇用4章内容讲述销售部门如何用Power BI分解销售目标,分析业绩达成、会员RFM和业绩构成;第4篇用5章内容讲述产品相关应用,包括存货分析、帕累托分析、关联分析、畅销款分析和数据化陈列;第5篇用2章内容讲述在财务方面的应用,包括盈亏平衡分析和上市公司利润表分析;第6篇用3章内容讲述人力资源应用,包括人员结构及离职率分析、新员工分析和考勤分析;第7篇用2章内容讲述简化报告的技巧。
《谁说菜鸟不会数据分析(Python篇)》从解决工作实际问题出发,提炼总结工作中Python 常用的数据处理、数据分析实战方法与技巧。本书力求通俗易懂地介绍相关知识,在不影响学习理解的前提下,尽可能地避免使用晦涩难懂的Python 编程、统计术语或模型公式。 《谁说菜鸟不会数据分析(Python篇)》定位是带领Python 数据分析初学者入门,并能解决学习、工作中大部分的问题或需求。入门后如还需要进一步进阶学习,可自行扩展阅读相关书籍或资料,学习是永无止境的,正所谓 师傅领进门,修行在个人 。
《Python数据分析与大数据处理从入门到精通》主要讲解数据分析与大数据处理所需的技术、基础设施、核心概念、实施流程。从编程语言准备、数据采集与清洗、数据分析与可视化,到大型数据的分布式存储与分布式计算,贯穿了整个大数据项目开发流程。本书轻理论、重实践,目的是让读者快速上手。1篇首先介绍了Python的基本语法、面向对象开发、模块化设计等,掌握Python的编程方式。然后介绍了多线程、多进程及其相互间的通信,让读者对分布式程序有个基本的认识。第2篇介绍了网络数据采集、数据清洗、数据存储等技术。第3篇介绍了Python常用的数据分析工具,扩展了更多的数据清洗、插值方法,为*终的数据可视化奠定基础。第4篇是大数据分析的重点。首先介绍了Hadoop的框架原理、调度原理,MapReduce原理与编程模型、环境搭建,接着介绍了Spark框架原
内 容 简 介 本书针对未来想要从事数据分析工作的在校学生、想要转行做数据分析的在职人员,以及想要在数据分析领域提高自己或跳槽的从业人员,深入浅出地讲解了面试和未来实际工作中所需的知识与技能,让读者对数据分析师这个岗位有更为全面和深刻的了解。 全书主要分为面试前的准备、面试中的技巧、面试中所需的知识储备、编程技能、实战技能,以及进一步学习提高的方法几部分,内容涵盖数据分析师面试的全流程,全方位提高读者在未来面试中的竞争力。
面对小数据和大数据,数据分析师应该如何收集数据信息?传统的业务框架如何与统计学相关联?测量学扮演着什么角色?建模过程有哪些预分析技术和修正技术?建模工作完成后,如何解析?如何归因?如何预测?等等,这些数据分析能力构成了本书的分析框架。本书分为8章,小数据与大数据分析模式的动态切换贯穿全书,展示了数据分析案例的模块化分析思路。第1~3章为数据预分析部分,强调业务问题与统计问题的衔接;第4~6章为统计建模阶段,其中附有对行业案例和业务敏感度的训练、对统计和业务整合的审美建议,进而构造出一套具有灵活调校的数据分析模式。第7~8章解决的问题是,如何将晦涩难懂的统计解释转换成业务解释。由衷地希望本书能够成为数据运营人员与初中级数据分析师分析数据的行动指南。
R语言在心理语言学研究中的应用已经有相当长的历史,但什么情况下要对数据进行怎样的处理,模型应该如何构建,得到结果后应该如何科学地读取和规范地报告等问题仍未得到很好的解决,本书意在解决这些问题。 本书首先介绍了R语言基础知识、基本统计思路和初步数据整理,对经由真实眼动研究得到的数据进行清理、转换和描述性统计,以及数据可视化等操作,然后介绍了线性混合模型和最大随机效应,结果解释、整理和提升,power分析和Bayes分析在R语言中的实现;接着介绍了线性混合模型和重复测量方差分析结果的比较;最后介绍了多种眼动指标整理的方法。
全书分为:灵活的数据布局、应用感知及可视化存储智能、存储类芯片、储海钩沉、集群和多控制器、传统存储系统、新兴存储系统、大话光存储系统、体系结构、I/O协议栈及性能分析、存储软件、固态存储等,其中每章又有多个小节。每一个小节都是一个独立的课题。本书秉承作者一贯的写作风格,完全从读者角度来创作本书,语言优美深刻,包罗万象。另外,不仅阐释了存储技术,而且同时也加入了计算机系统技术和网格技术的一些解读,使读者大开眼界,茅塞顿开,激发读者的阅读兴趣。 本书适合存储领域所有从业人员阅读研习,同时可以作为《大话存储*版》的读者的延伸高新资源。
随着中台概念被广泛讨论,其中数据中台又被赋予担任企业智能化任务的重任。当前,不仅是大企业,很多企业都在开始打造或者引入中台,用来解决企业面临的系统重复建设与数据孤岛的问题,在这个过程中,中台产品经理需要做什么事,解决什么问题,又会遇到怎样的困难与挑战? 本书第1~2章讲解了中台起源与数据中台产品需要什么样的能力;第3~6章主要讲解中台中的数据中台的建设与规划、数据分析的方法与策略、数据体系建设方法与应用和企业数据的价值等;第7~9章主要讲解数据平台的需求分析与数据知识、系统平台的建设实战和用户画像体系的建设等内容。
本书的主要内容包括网络数据的定义及相关指标、大规模网络中的链路预测、网络聚类分析、网络数据中的空间自回归模型、大规模网络数据中的模型估计方法、网络数据中的空间自回归模型的拓展及应用、网络中的空间自回归模型的其他研究方向等。本书关注大规模网络数据分析中的模型方法。除模型方法本身的理论拓展之外,在估计方法等方面会涉及大规模数据中的快速计算方法。由于网络分析本身的范围非常广泛,故本书涉及的内容仅局限于作者及团队研究工作中使用到的一部分。在本书的后,为了启发读者思路,对于部分已有网络研究进行了梳理。
本书以LabVIEW 2017为基础,讲述LabVIEW图形化编程语言的原理,以及如何利用LabVIEW完成虚拟仪器设计。全书共15章,分为两篇,分别是基础知识篇(第1~13章)和实际应用篇(第14、15章)。第1章,综述虚拟仪器技术的构建思想和方法论。第2~7章,讲述LabVIEW图形化编程语言的基本原理以及编程方法,内容包括LabVIEW入门、基本数据类型、程序结构、复合数据类型、文件I/O、图形显示及其他技巧。第8~12章,阐述如何利用LabVIEW去控制仪器硬件以实现对被测信号的数据采集,内容包括选择专用的数据采集卡进行数据采集; 利用计算机自带的声卡实现数据采集; 利用摄像头完成图像采集; 仪器控制和控制单片机。第13章,讲述用LabVIEW实现仪器应用的若干算法和信号分析处理的相关知识。第14、15章,介绍利用LabVIEW完成有实际应用背景的两个虚拟仪器项目,分别是用LabVIEW构建函