本书的主要内容有:熟悉Spark的编程模型和生态系统。学习数据科学的一般方法。检查分析大型公共数据集执行步骤的完整性。发现哪些机器学习工具对特定问题有帮助。探索可适应多种用途的代码。
本书的主要内容有:研究数据管理趋势,包括技术发展、法规要求和隐私问题。深?了解可拓展架构,学习各组件之间如何协同?作。探索数据治理和数据安全、主数据管理、?助式数据市场,以及元数据的重要性。
本书介绍了 Kubernetes 部署大规模容器的复杂流程。只有精通每个网络层的抽象工具,才能在生产集群中高效地排查故障并维护集群。本书涵盖如下内容:Kubernetes网络模型。如何从CNCF CNI项目中选择最Z适合集群的接口。Kubernetes 背后的网络基础和Linux基础。如何快速排除网络问题并防止停机。AWS、Google Cloud和Microsoft Azure的云网络和Kubernetes服务。各种网络工具的利弊以及如何为你的技术栈选择最Z合适的工具。
编写本书的目的是使读者可以在最z短时间内掌握Excel 数据分析。本书以数据分析的整体流程和知识难易度来安排各章内容及其在全书中的次序,每一章内容都紧密围绕数据分析展开。全书共10 章,每天学习一章,10 天就能学会Excel 中的大多数数据分析工具的用法和技巧。 本书的主要内容包括数据分析的基本概念和流程、Excel 中的数据分析工具的功能和特点、导入外部数据和输入不同类型的数据、修复有问题的数据、设置数据格式、排序、筛选、分类汇总、数据透视表、公式和函数基础知识、提取和格式化文本、汇总和统计数据、计算日期、模拟分析、单变量求解、规划求解、分析工具库、图表的基本概念和基础操作、创建不同类型的图表、导入和刷新数据、使用Power Query 编辑器整理数据、使用Power Pivot 创建数据模型、创建计算列和度量值、销售分析和客户分析等
K线图已经成为金融交易平台和图表程序的关键组成部分。使用这些图表,交易者们从中学习基础模式,用于解释价格走势历史,并预测未来市场。这本详细的指南向投资组合经理、量化分析师、策略师和分析师展示了如何使用Python来识别、扫描K线图模式,根据模式进行交易,并回测K线图模式的盈利能力。 金融作家、交易顾问和机构市场策略师Sofien Kaabar在本书中展示了如何创建K线图扫描器和指标,通过这些指标,我们可以比较不同模式的盈利能力。通过这本实践指南,你还将探索一种类似K线图的新型图表系统,以及从未介绍过的新模式。 通过这本书,你将学会: 创建并理解经典和现代K线图模式所需的条件。 学习这些模式背后的市场心理。 使用一个框架来学习如何进行交易策略的回测。 探索不同的图表系统并理解它们的局限性 在Python中导入不同时间框架的OHLC
过去几十年里,Web的迅速发展使其成为世界上规模zui大的公共数据源。Web挖掘的目标是从Web超链接、网页内容和使用日志中探寻有用的信息。 《世界计算机教材精选:Web数据挖掘(第2版)》旨在阐述Web数据挖掘的概念及其核心算法,使读者获得相对完整的关于Web数据挖掘的算法和技术知识。本书不仅介绍了搜索、页面爬取和资源探索以及链接分析等传统的Web挖掘主题,而且还介绍了结构化数据的抽取、信息整合、观点挖掘和Web使用挖掘等内容,这些内容在已有书籍中没有提及过,但它们在Web数据挖掘中却占有非常重要的地位。全书分为两大部分:部分包括第2章到第5章,介绍数据挖掘的基础,第二部分包括第6章到2章,介绍Web相关的挖掘任务。从本书自版出版之后,很多领域已经有了重大的进展。新版大部分的章节都已经添加了新的材料来反应这些进展,主要