Apache Flink项目的资深贡献者Fabian Hueske和Vasiliki Kalavri展示了如何使用Flink DataStream API实现可伸缩的流式应用,以及怎样在业务环境中持续运行和维护这些应用。流处理的理想应用场景有很多,包括低延迟ETL、流式分析、实时仪表盘以及欺诈检测、异常检测和报警。你可以在任意类型的持续数据(包括用户交互、金融交易和物联网等数据)生成后,立即对它们进行处理。本书主要内容包括: 了解有关分布式状态化流处理的概念和挑战。 探索Flink的系统架构,包括事件时间处理模式和容错模型。 理解DataStream API的基础知识和构成要素,包括基于时间和有状态的算子。 以精确一次的一致性读写外部系统。 部署和配置Flink集群。 对持续运行的流式应用进行运维。
对数据生产和大数据处理带来的挑战,是当代社会和人工智能时代的重点。大数据的快速发展、信息共享和社交媒体的大众化带来了各方面的风险和挑战。我们需要遵循正确的流程、方法和沟通战略 且手头的数据必须准确,才能推演出高价值的结论。而数据越多,我们面临的陷阱可能就越深。在本书中,杰森?辛克从数据通用和收集的策略、数据分析的准则、数据展示的策略出发,讨论了应对数据挑战、获得和洞察数据的价值和内涵的可行方式。
本书以关系数据库为基础,以数据库的设计与编程为重点,以引进面向对象的数据库技术为特色。本书内容新颖、系 统全面;突出重点、注重总结;概念清晰、分析深入;例题丰富、实用性强。 全书从数据库系统基础、关系代数、规范化理论、SQL Server 2008 安全管理、SQL Server 2008 数据库创建和备份、数 据库的恢复与传输、SQL Server 2008 T-SQL 数据查询、SQL 高级应用、Web 编程基础、JSP 技术方面结合了实际数据库开 发需要和高等教育的特点完成编写。
本书提供了一种简单、高效、通用的关系型数据库索引设计方法。作者通过系统的讲解及大量的案例清晰地阐释了关系型数据库的访问路径选择原理,以及表和索引的扫描方式,详尽地讲解了如何快速地估算SQL运行的CPU时间及执行时间,帮助读者从原理上理解SQL、表及索引结构、访问方式等对关系型数据库造成的影响,并能够运用量化的方法进行判断和优化,指导关系型数据库的索引设计。
本书分为两个部分。部分是《大数据学科发展报告》,该部分对大数据学科的基本范畴、主要分支和关键议题、发展现状和未来发展方向进行了深入研究。第二部分是《大数据技术路线图》,以大数据的重大应用需求和特征为依据,利用产业技术路线图在评估新型技术发展过程中的作用,通过对重点领域前沿综述、专家咨询、技术研讨和预判等工作,绘制大数据产业技术路线图,希望能够引导企业和科研机构进行技术研发活动,明确产业技术在未来市场的发展机会,并在全球化竞争中获取竞争优势,为我国经济社会转型和改善民生等方面提供智力支持。
Elixir简单直接的语法非常适合用来学习函数式编程。 本书循序渐进地讲解函数式编程的关键概念,包括递归函数、模式匹配、不可变值、显式数据转换、模块、高阶函数、多态函数、错误处理等,借助清晰明了的案例让读者在不知不觉中掌握函数式编程思想和Elixir语法。 理解函数式编程的三个关键概念:模式匹配、递归、流程控制。 学习在函数式编程中使用列表、元组、映射表等常用数据结构。 利用高阶函数改善程序的可读性。 借助流提高编程效率。 使用多态和协议处理各种类型的数据。 ?掌握错误处理。