Apache Flink项目的资深贡献者Fabian Hueske和Vasiliki Kalavri展示了如何使用Flink DataStream API实现可伸缩的流式应用,以及怎样在业务环境中持续运行和维护这些应用。流处理的理想应用场景有很多,包括低延迟ETL、流式分析、实时仪表盘以及欺诈检测、异常检测和报警。你可以在任意类型的持续数据(包括用户交互、金融交易和物联网等数据)生成后,立即对它们进行处理。本书主要内容包括: 了解有关分布式状态化流处理的概念和挑战。 探索Flink的系统架构,包括事件时间处理模式和容错模型。 理解DataStream API的基础知识和构成要素,包括基于时间和有状态的算子。 以精确一次的一致性读写外部系统。 部署和配置Flink集群。 对持续运行的流式应用进行运维。
本书对可视化技术、交互技术以及数据分析方法进行了系统和全面的讲解。介绍了交互式可视化数据分析解决方案的设计标准,论述了设计中的影响因素以及工作流程的检验方法。读者可以从中了解可视化编码的基础知识,以及用于多元数据、时间数据、地理空间数据和图形数据等方面的众多可视化技术。 书中专门用一章的内容来介绍与可视化效果互动的常规概念,并且利用图示来说明现代交互技术如何推动可视化数据分析的发展。针对如今庞大而复杂的数据,本书涵盖了自动化分析计算支持可视化数据分析的相关内容,另外还介绍了多屏幕环境下的高级可视化概念、数据分析过程中的用户指南以及渐进式可视化数据分析等技术。 作者用简洁明了的术语以自上而下的视角解读了交互式可视化数据分析。众多真实案例和丰富的插图将使学生、本领域专家、数据密
《 区块链知识 大众普及版 》 本书只从外部来介绍区块链这个事物,注重的是普通人的理解,基本不涉及技术内容。内容覆盖了区块链常见知识的95%,适合大众了解和认识区块链。从区块链技术的诞生、特点、主要发展历程、热点概念、相关原理等内容都做了完整的介绍,并介绍了当前典型的区块链应用,如区块链电子发票,DCEP等。还介绍了区块链领域的监管、安全、危害等内容。同时分析了国内外对区块链的态度与指导思想,鼓励方向与政策等内容。 《区块链知识 技术普及版》 本书覆盖了区块链的技术基础知识,适合技术从业者从技术角度认知区块链。技术普及版用一种类似庖丁解牛的方式,将区块链技术的肌肉、骨骼、灵魂,逐一分解来讲解,是当前区块链知识技术分解比较完整和全面的一本书。 《图灵区块链》 有了《区块链知识-大众普及版
对数据生产和大数据处理带来的挑战,是当代社会和人工智能时代的重点。大数据的快速发展、信息共享和社交媒体的大众化带来了各方面的风险和挑战。我们需要遵循正确的流程、方法和沟通战略 且手头的数据必须准确,才能推演出高价值的结论。而数据越多,我们面临的陷阱可能就越深。在本书中,杰森?辛克从数据通用和收集的策略、数据分析的准则、数据展示的策略出发,讨论了应对数据挑战、获得和洞察数据的价值和内涵的可行方式。
《数据库设计与关系理论(影印版)》的每一章都包含一组练习,它或者展示了如何把理论知识应用到实践中,或者提供了更多的信息,或者要求你验证一些简单的理论结果。如果你非常熟悉数据库的关系模式,并且你希望深入了解数据库设计,那么这本书就完全适合你。
本书将现代统计学的重要思想引入数理统计课程中,强调了数据分析、图形工具和计算机技术,并注重统计的实务和应用.本书内容丰富,几乎涵盖了所有经典和前沿的概率论与数理统计理论和方法,主要包括概率、变量、联合分布、期望、极限定理、抽样调查、参数估计、假设检验、数据汇总、两样本比较、方差分析、分类数据分析和线性最小二乘等. 本书用真实数据分析了实际问题,以此增强读者对理论的理解;作者将自助方法与传统的推论性过程结合起来,增加了蒙特卡罗方法.此外,为了使概念更清晰,书中提供了大量的示例,而且还有丰富的习题,以增强读者的计算能力. 本书适合作为统计学、数学、其他理工科专业以及社会科学和经济学专业高年级本科生和低年级研究生的教材,同时也可供相关领域技术人员参考.
制定多种匿名化解决方案,覆盖多种应用场景,满足对可识别性的不同要求。 解决方案跟所用数据、数据接收方和分析目标相匹配。 为数据采集模式量身定制匿名化流水线,覆盖不同业务需求。 为原始数据生成匿名化版本或用分析平台生成匿名化输出。 检查匿名数据使用的伦理问题。
《数据结构》(第四版)是新世纪高职高专教材编委会组编的高职高专计算机专业基础系列规划教材之一。 数据结构是计算机程序设计的重要理论技术基础,它不仅是计算机学科的核心课程,也是其他理工专业的热门选修课。在计算机应用领域的开发研制工作中,数据结构有着广泛的应用。本书是为数据结构课程编写的教材,其内容选取既符合高职高专计算机专业教学大纲的要求,又兼顾了学科的广度和深度。 本书共分8章,第1章介绍了数据结构的基本概念,并对算法、算法分析作了简要说明,介绍了算法的时间复杂度和空间复杂度的评价方法;第2章到第4章介绍了线性表、数组、栈、队列和串等线性结构的基本定义及其常用算法的实现和基本应用;第5章和第6章介绍了非线性结构的树、二叉树和图,包括其逻辑特征、常用算法的实现和基本应用;第7章和第8
《数据库原理与运用基础教程/高等院校计算机基础系列教材》主要内容包括利用模板建立Access数据库;直接建立一个数据库;根据现有文件新建数据库;打开已存在的数据库;表的建立与修改;使用向导创建表;字段、数据类型、字段属性等。
《普通高等教育“十二五”规划教材:数据库技术与应用(第2版)》在延续版编写风格的基础上,根据*高等计算机基础课程教学指导委员会2011年10月出版的《高等学校计算机基础核心课程教学实施方案》(新白皮书)中关于“数据库技术及应用”课程实施方案的精神,结合作者多年教学实践与研发经验,并考虑到读者的反馈信息,遵循非计算机专业的特点,从新的视角对各个章节的内容、结构等进行了修订、调整、完善和补充。 本书以SQLServer2000为蓝本,以VisualBasic6.0和Delphi7.0作为开发工具,以应用为目的,从数据库技术与应用系统开发的角度介绍数据库系统的基本概念及应用。全书共10章,内容包括:数据库技术概论、SQLServer数据库的管理与使用、SQLServer数据表的管理与维护、数据查询、索引与视图、存储过程与触发器、SQLServer数据转换、SQLServer数据库
本书以当前主流的关系数据库为主线,全面阐述了数据库的基本原理、基本技术、基本方法和应用技术,介绍了 数据库技术的研究动态,探讨了数据库领域研究的新进展。本书主要内容包括:关系理论、关系数据库标准语言 SQL.关系规范化理论、关系数据库设计、数据库的实施与调优、数据完整性约束、数据库的安全性、事务管理和锁、数 据库的备份和恢复、现代数据库技术新进展等。 本书注重数据库技术的实际应用,强调理论与实践紧密结合,可供从事数据库技术领域工作的科技人员参考使 用。
本书是《数据库系统原理》的配套教学、实验、学习和考试指导用书。目的是为了巩固和掌握数据库系统的基本理论和应用技术,并顺利通过数据库系统原理的相关考试。全书共分3个部分;具体包括《数据库系统原理》的学习要点与习题详解、课程实验与范例模板、考试大纲与仿真试题。 《数据库系统原理学习指导》以SQL Server 2008为DBMS,以VisualC++为主语言,通过课程实验详细介绍了数据库系统的设计与实现技术,并提供详细操作和完整程序代码。 本书内容精简、注重实用,通过六套仿真试题的测试,进一步巩固所学知识。本书不但可供学生进行学习辅导,而且可供教师用作配套教学参考。 本书适合高校计算机和网络、软件工程、物流管理和信息管理等相关专业《数据库原理》课程的教学、实验、学习和考试辅导材料。
数据结构教程(第3版) 第3版第2次印刷
你是否需要把一个关系型数据库应用迁移到Hadoop上?卡普里奥罗等著的《Hive编程(影印版)》这本全面的指南将为你介绍ApacheHive,它是Hadoop的数据仓库平台。你将快速了解如何使用Hive的sQL方言——HiveQL——来汇总、查询和分析存储在Hadoop分布式文件系统中的大数据集。 《Hive编程(影印版)》为你展数据库应用于示了如何在你的环境中搭建和配置Hive,它也提供了对Hadoop和MapReduce的概括介绍,并且演示了Hive是如何在Hadoop的生态系统中工作的。你还将在其中找到现实世界的实例分析,它们展示了那些使用Hive的公司是如何解决PB容量数据层面上的独特问题。