数据是什么?如何应用数据?如何把数据变成更有价值的东西?本书主要适合刚开始使用数据的读者,能让他们对数据的含义、价值及用途有清晰的认识和了解,本书目的是介绍数据的相关知识,同时鼓励人们参与到日益增多的与数据有关的对话中。 本书通过介绍简单数据相关知识,即从一个总体目标、两种思维系统、三大应用领域、四种数据尺度、五种数据分析方法、六种数据展现方式、七种数据活动、八个提前问的问题分别展开阐释数据和分析的方法和思维方式。
本书的主要内容有:熟悉Spark的编程模型和生态系统。学习数据科学的一般方法。检查分析大型公共数据集执行步骤的完整性。发现哪些机器学习工具对特定问题有帮助。探索可适应多种用途的代码。
K线图已经成为金融交易平台和图表程序的关键组成部分。使用这些图表,交易者们从中学习基础模式,用于解释价格走势历史,并预测未来市场。这本详细的指南向投资组合经理、量化分析师、策略师和分析师展示了如何使用Python来识别、扫描K线图模式,根据模式进行交易,并回测K线图模式的盈利能力。 金融作家、交易顾问和机构市场策略师Sofien Kaabar在本书中展示了如何创建K线图扫描器和指标,通过这些指标,我们可以比较不同模式的盈利能力。通过这本实践指南,你还将探索一种类似K线图的新型图表系统,以及从未介绍过的新模式。 通过这本书,你将学会: 创建并理解经典和现代K线图模式所需的条件。 学习这些模式背后的市场心理。 使用一个框架来学习如何进行交易策略的回测。 探索不同的图表系统并理解它们的局限性 在Python中导入不同时间框架的OHLC
编写本书的目的是使读者可以在最z短时间内掌握Excel 数据分析。本书以数据分析的整体流程和知识难易度来安排各章内容及其在全书中的次序,每一章内容都紧密围绕数据分析展开。全书共10 章,每天学习一章,10 天就能学会Excel 中的大多数数据分析工具的用法和技巧。 本书的主要内容包括数据分析的基本概念和流程、Excel 中的数据分析工具的功能和特点、导入外部数据和输入不同类型的数据、修复有问题的数据、设置数据格式、排序、筛选、分类汇总、数据透视表、公式和函数基础知识、提取和格式化文本、汇总和统计数据、计算日期、模拟分析、单变量求解、规划求解、分析工具库、图表的基本概念和基础操作、创建不同类型的图表、导入和刷新数据、使用Power Query 编辑器整理数据、使用Power Pivot 创建数据模型、创建计算列和度量值、销售分析和客户分析等
Apache Flink项目的资深贡献者Fabian Hueske和Vasiliki Kalavri展示了如何使用Flink DataStream API实现可伸缩的流式应用,以及怎样在业务环境中持续运行和维护这些应用。流处理的理想应用场景有很多,包括低延迟ETL、流式分析、实时仪表盘以及欺诈检测、异常检测和报警。你可以在任意类型的持续数据(包括用户交互、金融交易和物联网等数据)生成后,立即对它们进行处理。本书主要内容包括: 了解有关分布式状态化流处理的概念和挑战。 探索Flink的系统架构,包括事件时间处理模式和容错模型。 理解DataStream API的基础知识和构成要素,包括基于时间和有状态的算子。 以精确一次的一致性读写外部系统。 部署和配置Flink集群。 对持续运行的流式应用进行运维。
本书介绍了 Kubernetes 部署大规模容器的复杂流程。只有精通每个网络层的抽象工具,才能在生产集群中高效地排查故障并维护集群。本书涵盖如下内容:Kubernetes网络模型。如何从CNCF CNI项目中选择最Z适合集群的接口。Kubernetes 背后的网络基础和Linux基础。如何快速排除网络问题并防止停机。AWS、Google Cloud和Microsoft Azure的云网络和Kubernetes服务。各种网络工具的利弊以及如何为你的技术栈选择最Z合适的工具。
数据科学伦理是关于人们在进行数据科学方面的行为的道德规范。到目前为止,数据科学主要应用于企业和社会并产生了积极成果。 然而,就像任何技术一样,数据科学也带来了一些负面后果:隐私侵犯的增加,对敏感群体的数据驱动的歧视以及使用不可解释的复杂模型做出决策。 没有哪个数据科学家和业务经理是天生不道德的,只是他们没有接受过培训来考虑他们在工作中的伦理问题 本书旨在填补这个越来越重要的空白和解释不同的概念和技术,帮助读者理解从k-匿名和差别隐私到同态加密和零知识证明等技术已可以解决隐私侵犯问题,消除敏感群体歧视和提供各种可解释的人工智能。 现实生活中的警世故事进一步说明了数据科学伦理的重要性和潜在影响,包括种族主义机器人的故事、搜索审查和人脸识别等。本书中穿插着结构化的练习,提供假设的场景和
了解数据结构与算法是透彻理解计算机科学的前提。随着Python日益广泛的应用,Python程序员需要实现与传统的面向对象编程语言相似的数据结构与算法。本书是用Python描述数据结构与算法的开山之作,汇聚了作者多年的实战经验,向读者透彻讲解在Python环境下,如何通过一系列存储机制有效地实现各类算法。通过本书,读者将深刻理解Python数据结构、递归、搜索、排序、树与图的应用,等等。这一版重写了书中的示例代码,并对诸多内容做了修正。
继煤炭、钢铁和石油之后,数据正在成为重要的国家战略资源和国家间竞争的战略工具。数据主权是国家主权在网络空间的逻辑延伸和核心表现,关乎数据安全、个人隐私和数字经济发展,是国家安全和发展的核心利益所在。 《数据主权与治理模式辨析》围绕数据主权及治理模式进行剖析,调研全球主要经济体的数据主权治理模式演化过程,在厘清数据主权内涵和概念、借鉴国外数据主权治理模式的基础上,以主权平等、合作共治为原则,从跨境数据流动、数据本地化存储、数字贸易、 长臂管辖 及其反制策略等方面,分析比较各国数据主权治理的模式及其实施效果,构建匹配中国数字经济和数据资源体量、符合中国数据规制要求,兼顾各国利益的数据主权治理规则,推动全球数字经济全面健康发展,是中国数据治理的重要使命和时代担当。
本书的主要内容有:研究数据管理趋势,包括技术发展、法规要求和隐私问题。深?了解可拓展架构,学习各组件之间如何协同?作。探索数据治理和数据安全、主数据管理、?助式数据市场,以及元数据的重要性。
随着云技术的迅猛发展和普及,商业组织正面临着满足用户需求的巨大挑战。本书深入探讨了云技术在数字化社会中的重要地位和创新应用。通过研究、创新和发展的视角,本书引领读者走进云技术的前沿,揭示了其在构建下一代卓越计算环境中的关键作用。书中汇集了多位专家学者的研究成果和实践经验,为读者提供了宝贵的洞察和指导。无论是对于云计算领域的专业人士,还是对于对数字化社会感兴趣的读者,本书都是一本不可或缺的参考书。通过阅读本书,您将深入了解云技术在数字化社会中的影响和价值,激发您的创新思维,为您在未来的技术革新中取得卓越成就打下坚实的基础。
本书重点介绍Amos、Mplus 和SmartPLS 统计软件里的结构方程分析方法。包括结构方程模型路径图的构建与数据的收集,结构方程模型的识别、分析结果评价及修正,反映型指标、形成型指标与二阶段分析,调节效应分析、中介效应分析、多群体差异分析与潜在平均分析,以及结构方程模型高级的分析方法即贝叶斯检验、混合回归分析、潜在成长模型、MTMM 模型等内容。没有复杂的理论推导,而是结合作者自身的教学与科研实践,以数据为依托,深入浅出,使读者能在短时间内理解并掌握结构方程模型分析方法,进而应用到自己的研究实践中。
《基于Oracle的SQL优化》是一本与众不同的书,它的目的是使读者真正掌握如何在 Oracle数据库里写出高质量的 SQL语句,以及如何在 Oracle数据库里对有性能问题的 SQL做诊断和调整。 《基于Oracle的SQL优化》从 Oracle处理 SQL的本质和原理入手,由浅入深、系统地介绍了 Oracle数据库里的优化器、执行计划、Cursor和绑定变量、查询转换、统计信息、Hint和并行等这些与 SQL优化息息相关的本质性内容,并辅以大量极具借鉴意义的一线 SQL优化实例,阐述了作者倡导的“从本质和原理入手,以不变应万变”的优化思路,最后还介绍了作者在实际工作中总结出来的 Oracle数据库里 SQL优化的方法论。 《基于Oracle的SQL优化》适用于使用 Oracle数据库的开发人员、Oracle DBA和其他对 Oracle数据库感兴趣的人员,也可以作为各院校相关专业的教学辅导和参考用书,或作为相关培训机构的培训
对数据生产和大数据处理带来的挑战,是当代社会和人工智能时代的重点。大数据的快速发展、信息共享和社交媒体的大众化带来了各方面的风险和挑战。我们需要遵循正确的流程、方法和沟通战略 且手头的数据必须准确,才能推演出高价值的结论。而数据越多,我们面临的陷阱可能就越深。在本书中,杰森?辛克从数据通用和收集的策略、数据分析的准则、数据展示的策略出发,讨论了应对数据挑战、获得和洞察数据的价值和内涵的可行方式。
本书通过对数据、算法与模型的概念、特征、相关技术、模型原理及构成、应用领域等一系列问题的深入讲解,呈现数据与算法之间的紧密关系,从数据的视角构建算法为数据服务的核心思想,明确数据资源的地位和价值。
《SQL Server 2012 T-SQL基础教程》全面系统地介绍了SQL Server 2012 T-SQL技术,包括T-SQL查询和编程的背景、单表查询、联接、子查询、表表达式、集合运算符、查询、数据修改、事务和并发处理、可编程对象等内容。 《SQL Server 2012 T-SQL基础教程》提供了一个附录“入门指南”,来帮助你设置环境、下载本书的源代码、安装TSQL2012示例数据库、开始编写SQL Server代码,并了解如何使用SQL Server联机丛书获得帮助。本书还提供了大量的练习,帮助读者实践所学、快速上手。 《SQL Server 2012 T-SQL基础教程》主要针对具有很少或是没有经验的T-SQL学习者,适用于T-SQL开发人员、DBA、BI从业者、报表编写者、分析师以及刚开始使用SQL Server并且需要使用Transact-SQL编写查询、开发代码的用户。
在数字时代,我们就可以完全相信数据吗 对数字的过度依赖,是否会让经济学和人文学视角长期冲突 是人类利用量化造福,还是量化用数字局限人类的思维 本书是多篇文章的汇编。本书主要讲述了定量分析的弊端,通过对定量分析在实际运用中的分析,指出定量分析在很多时候并不能成为我们做判断的依据。本书肯定了定量分析有价值的部分,同时指出了定量分析的局限性和不正确使用带来的问题,提倡我们在运用中应综合定量分析与定性分析两种方式,根据实际情况进行选择。