Apache Flink项目的资深贡献者Fabian Hueske和Vasiliki Kalavri展示了如何使用Flink DataStream API实现可伸缩的流式应用,以及怎样在业务环境中持续运行和维护这些应用。流处理的理想应用场景有很多,包括低延迟ETL、流式分析、实时仪表盘以及欺诈检测、异常检测和报警。你可以在任意类型的持续数据(包括用户交互、金融交易和物联网等数据)生成后,立即对它们进行处理。本书主要内容包括: 了解有关分布式状态化流处理的概念和挑战。 探索Flink的系统架构,包括事件时间处理模式和容错模型。 理解DataStream API的基础知识和构成要素,包括基于时间和有状态的算子。 以精确一次的一致性读写外部系统。 部署和配置Flink集群。 对持续运行的流式应用进行运维。
对数据生产和大数据处理带来的挑战,是当代社会和人工智能时代的重点。大数据的快速发展、信息共享和社交媒体的大众化带来了各方面的风险和挑战。我们需要遵循正确的流程、方法和沟通战略 且手头的数据必须准确,才能推演出高价值的结论。而数据越多,我们面临的陷阱可能就越深。在本书中,杰森?辛克从数据通用和收集的策略、数据分析的准则、数据展示的策略出发,讨论了应对数据挑战、获得和洞察数据的价值和内涵的可行方式。
本书将现代统计学的重要思想引入数理统计课程中,强调了数据分析、图形工具和计算机技术,并注重统计的实务和应用.本书内容丰富,几乎涵盖了所有经典和前沿的概率论与数理统计理论和方法,主要包括概率、变量、联合分布、期望、极限定理、抽样调查、参数估计、假设检验、数据汇总、两样本比较、方差分析、分类数据分析和线性最小二乘等. 本书用真实数据分析了实际问题,以此增强读者对理论的理解;作者将自助方法与传统的推论性过程结合起来,增加了蒙特卡罗方法.此外,为了使概念更清晰,书中提供了大量的示例,而且还有丰富的习题,以增强读者的计算能力. 本书适合作为统计学、数学、其他理工科专业以及社会科学和经济学专业高年级本科生和低年级研究生的教材,同时也可供相关领域技术人员参考.
Elixir简单直接的语法非常适合用来学习函数式编程。 本书循序渐进地讲解函数式编程的关键概念,包括递归函数、模式匹配、不可变值、显式数据转换、模块、高阶函数、多态函数、错误处理等,借助清晰明了的案例让读者在不知不觉中掌握函数式编程思想和Elixir语法。 理解函数式编程的三个关键概念:模式匹配、递归、流程控制。 学习在函数式编程中使用列表、元组、映射表等常用数据结构。 利用高阶函数改善程序的可读性。 借助流提高编程效率。 使用多态和协议处理各种类型的数据。 ?掌握错误处理。
信息不对称,是引起人类困局的根源所在,这也是人类千年难以破解的难题。物理世界中,由于时空的限制,人类无法获得有效的数据信息,因此,信息不对称的人类困局无法获得根本性解决。 技术的进步,物理世界中所产生大量数据突然呈现在我们面前,我们面对海量数据感觉惶惶然和蠢蠢然的同时,物理世界、网络世界、数据世界等三个并行的 多维世界 已经悄然构建起来,如何思维和行为,取决于我们处于哪个世界。 数据乃至大数据并不是一个新鲜的事物,只不过信息技术让其更加清晰的展现并实际走入和影响我们每个人的生活罢了,只要你洞悉大势,只要你亲昵数据,只要你拥有大数据的灵魂 相关性思维,你也可以成为数据领袖。
本书以当前主流的关系数据库为主线,全面阐述了数据库的基本原理、基本技术、基本方法和应用技术,介绍了 数据库技术的研究动态,探讨了数据库领域研究的新进展。本书主要内容包括:关系理论、关系数据库标准语言 SQL.关系规范化理论、关系数据库设计、数据库的实施与调优、数据完整性约束、数据库的安全性、事务管理和锁、数 据库的备份和恢复、现代数据库技术新进展等。 本书注重数据库技术的实际应用,强调理论与实践紧密结合,可供从事数据库技术领域工作的科技人员参考使 用。
《普通高等教育“十二五”规划教材:数据库技术与应用(第2版)》在延续版编写风格的基础上,根据*高等计算机基础课程教学指导委员会2011年10月出版的《高等学校计算机基础核心课程教学实施方案》(新白皮书)中关于“数据库技术及应用”课程实施方案的精神,结合作者多年教学实践与研发经验,并考虑到读者的反馈信息,遵循非计算机专业的特点,从新的视角对各个章节的内容、结构等进行了修订、调整、完善和补充。 本书以SQLServer2000为蓝本,以VisualBasic6.0和Delphi7.0作为开发工具,以应用为目的,从数据库技术与应用系统开发的角度介绍数据库系统的基本概念及应用。全书共10章,内容包括:数据库技术概论、SQLServer数据库的管理与使用、SQLServer数据表的管理与维护、数据查询、索引与视图、存储过程与触发器、SQLServer数据转换、SQLServer数据库
《数据库原理与运用基础教程/高等院校计算机基础系列教材》主要内容包括利用模板建立Access数据库;直接建立一个数据库;根据现有文件新建数据库;打开已存在的数据库;表的建立与修改;使用向导创建表;字段、数据类型、字段属性等。
制定多种匿名化解决方案,覆盖多种应用场景,满足对可识别性的不同要求。 解决方案跟所用数据、数据接收方和分析目标相匹配。 为数据采集模式量身定制匿名化流水线,覆盖不同业务需求。 为原始数据生成匿名化版本或用分析平台生成匿名化输出。 检查匿名数据使用的伦理问题。
什么是 管理大数据 :管理大数据是指企业发展过程中不断出现和积累的,涉及战略、组织、人力资源、企业文化等专业领域的各项管理数据。众多企业的管理数据整合到一起,可以形成多生态跨产业链的垂直整合、横向共享的完整生态体系,具有 海量、人工智能 的特征。 管理大数据的优势:丰富性,管理数据覆盖行业范围广,维度丰富,数据量巨大。完整性,管理数据涵盖企业战略描述、组织信息、管理制度、企业文化、管理变革过程记录等,数据完整。连续性,管理数据记录周期长、延续性好。实效性,管理数据为组织变革提供及时有效的支撑。 出版背景:2017年3月27日, 运筹帷幄,全球共享 中源数聚管理大数据(RBD)发布会在北京中关村创业大街3W咖啡隆重举行。来自管理咨询行业、互联网领域、创投界、政商界的一百多位精英齐聚一堂,共同见证全球
本书主要介绍数据库的基本原理,并以MySQL数据库为平台,讲解关系型数据库基本原理在MySQL数据库中的应用,是数据库原理学习和MySQL数据库应用学习的基础教材。本书共16章,第1章介绍数据库基本概念;第2章介绍概念模型设计;第3章介绍逻辑模型设计;第4章介绍MySQL数据库环境;第5章介绍MySQL数据库的创建与管理;第6章介绍数据表的创建与管理;第7章介绍数据输入与维护相关的DML语句及其用法;第8章单独介绍数据查询语句及其用法;第9章介绍Sql编程基础,如MySQL常用函数、游标等;第10章介绍视图的定义与使用;第11章介绍索引的定义与使用;第12章介绍存储过程的定义与使用;第13章介绍触发器的定义与使用;第14章介绍MySQL数据库的安全管理;第15章介绍MySql高级应用分布式部署;第16章使用Java语言开发了个MySQL数据库应用案例,以此介绍Java操作MySQL数据库的
本书分为两个部分。部分是《大数据学科发展报告》,该部分对大数据学科的基本范畴、主要分支和关键议题、发展现状和未来发展方向进行了深入研究。第二部分是《大数据技术路线图》,以大数据的重大应用需求和特征为依据,利用产业技术路线图在评估新型技术发展过程中的作用,通过对重点领域前沿综述、专家咨询、技术研讨和预判等工作,绘制大数据产业技术路线图,希望能够引导企业和科研机构进行技术研发活动,明确产业技术在未来市场的发展机会,并在全球化竞争中获取竞争优势,为我国经济社会转型和改善民生等方面提供智力支持。
《普通高等教育“十二五”规划教材:数据库技术与应用实践教程(第2版)》是与《数据库技术与应用》(第二版)配套的教学参考书,是根据*高等计算机基础课程教学指导委员会2011年10月出版的《高等学校计算机基础核心课程教学实施方案》(新白皮书)中关于“数据库技术及应用”课程实施方案的精神,结合作者多年教学实践与研发的经验,并考虑到读者的反馈信息,遵循非计算机专业的特点,从新的视角对原来出版的《数据库应用基础实践教程》各个章节的内容和结构等进行了修订、调整、完善和补充。全书分为实验指导篇和课程设计案例篇。实验指导篇共安排20个实验,内容选择恰当,具有启发性和实用性,与教材内容紧密结合,强调对动手能力的培养,达到即学即用的目的。课程设计案例篇共安排5个案例,是分别从文学、法学、医学和工学的角度