全书分为三大部分: 主要讨论有关增强数据密集型应用系统所需的若干基本原则。首先开篇第1章即瞄准目标:可靠性、可扩展性与可维护性,如何认识这些问题以及如何达成目标。第2章我们比较了多种不同的数据模型和查询语言,讨论各自的适用场景。接下来第3章主要针对存储引擎,即数据库是如何安排磁盘结构从而提高检索效率。第4章转向数据编码(序列化)方面,包括常见模式的演化历程。 我们将从单机的数据存储转向跨机器的分布式系统,这是扩展性的重要一步,但随之而来的是各种挑战。所以将依次讨论数据远程复制(第5章)、数据分区(第6章)以及事务(第7章)。接下来的第8章包括分布式系统的更多细节,以及分布式环境如何达成一致性与共识(第9章)。 主要针对产生派生数据的系统,所谓派生数据主要指在异构系统中,如果无法用一个数
Apache Flink项目的资深贡献者Fabian Hueske和Vasiliki Kalavri展示了如何使用Flink DataStream API实现可伸缩的流式应用,以及怎样在业务环境中持续运行和维护这些应用。流处理的理想应用场景有很多,包括低延迟ETL、流式分析、实时仪表盘以及欺诈检测、异常检测和报警。你可以在任意类型的持续数据(包括用户交互、金融交易和物联网等数据)生成后,立即对它们进行处理。本书主要内容包括: 了解有关分布式状态化流处理的概念和挑战。 探索Flink的系统架构,包括事件时间处理模式和容错模型。 理解DataStream API的基础知识和构成要素,包括基于时间和有状态的算子。 以精确一次的一致性读写外部系统。 部署和配置Flink集群。 对持续运行的流式应用进行运维。
本书对可视化技术、交互技术以及数据分析方法进行了系统和全面的讲解。介绍了交互式可视化数据分析解决方案的设计标准,论述了设计中的影响因素以及工作流程的检验方法。读者可以从中了解可视化编码的基础知识,以及用于多元数据、时间数据、地理空间数据和图形数据等方面的众多可视化技术。 书中专门用一章的内容来介绍与可视化效果互动的常规概念,并且利用图示来说明现代交互技术如何推动可视化数据分析的发展。针对如今庞大而复杂的数据,本书涵盖了自动化分析计算支持可视化数据分析的相关内容,另外还介绍了多屏幕环境下的高级可视化概念、数据分析过程中的用户指南以及渐进式可视化数据分析等技术。 作者用简洁明了的术语以自上而下的视角解读了交互式可视化数据分析。众多真实案例和丰富的插图将使学生、本领域专家、数据密
是不是准备把你的静态HTML页面上升到新高度,想要使用PHP和MySQL构建数据库驱动的网站? 《Head First PHP MySQL(中文版)》正是你需要的实践指南,可以让你很快地建立并运行动态网站。你可以具体动手构建真实的应用,包括从一个视频游戏高分公告板到一个在线约会网站等大量应用。读完这本书,你将学会如何验证表单、使用会话ID和cookie、完成数据库查询和联接、处理文件I/O操作等。
《 区块链知识 大众普及版 》 本书只从外部来介绍区块链这个事物,注重的是普通人的理解,基本不涉及技术内容。内容覆盖了区块链常见知识的95%,适合大众了解和认识区块链。从区块链技术的诞生、特点、主要发展历程、热点概念、相关原理等内容都做了完整的介绍,并介绍了当前典型的区块链应用,如区块链电子发票,DCEP等。还介绍了区块链领域的监管、安全、危害等内容。同时分析了国内外对区块链的态度与指导思想,鼓励方向与政策等内容。 《区块链知识 技术普及版》 本书覆盖了区块链的技术基础知识,适合技术从业者从技术角度认知区块链。技术普及版用一种类似庖丁解牛的方式,将区块链技术的肌肉、骨骼、灵魂,逐一分解来讲解,是当前区块链知识技术分解比较完整和全面的一本书。 《图灵区块链》 有了《区块链知识-大众普及版
对数据生产和大数据处理带来的挑战,是当代社会和人工智能时代的重点。大数据的快速发展、信息共享和社交媒体的大众化带来了各方面的风险和挑战。我们需要遵循正确的流程、方法和沟通战略 且手头的数据必须准确,才能推演出高价值的结论。而数据越多,我们面临的陷阱可能就越深。在本书中,杰森?辛克从数据通用和收集的策略、数据分析的准则、数据展示的策略出发,讨论了应对数据挑战、获得和洞察数据的价值和内涵的可行方式。
在新媒体时代,如果对新闻报道、网上搜索的结果或者所谓的 专家告知 不加思考地完全相信,那你就等着上当受骗吧! 本书围绕当今*受瞩目的大数据科学理论,通过日本政府公布的公开数据,集中针对访日游客的增加、舆论调查的可靠性、 安倍经济学 的成果、东日本大地震后的状况、相对贫困、失业率的下降、年轻人远离ХХ、全球变暖问题、减肥、恩格尔系数的上升等10个主题进行数据解读,帮助读者模拟体验数据读取方法,提高理解和分析数据的能力,挖掘出数据背后隐藏的真相。 作为 大数据分析 的超级入门书,即使不擅长数学、不了解统计学的人,读完本书也可以彻底掌握数据解读方法!
本书以笔者多年积累的实际经验分析数据库管理员的工作职责。详细介绍Oracle数据库的运作原理与组成架构;针对常用的“基本对象”及延伸应用的“高可用性对象”提供详尽说明;详解Oracle数据库的安装、建置,以及安全认证方式;深入剖析Oracle的网络联机架构与设定,包含各类“网络服务组态文件”;详细介绍Oracle数据库的备份与恢复,并列举多项功能强大的复原管理工具;针对数据库、实体结构与Instance讲解效能调校的重要性,并以实例示范;解析Oracle Statspack及Oracle Optimizer;完整说明索引与SQL语法的有效运用。 本书适合数据库开发人员参考学习,也可作为高等院校相关师生的参考书。
本书提供了监控、分析和优化Oracle Database 10g的方法,书中包含了详细的案例研究、实践和丰富的Oracle新的调整特性的代码示例。通过对本书的学习,读者可以了解到如何选择化的索引选项,有效地管理驱动器和磁盘阵列,对查询执行故障检修,以及可靠地预测将来的性能。本书还将详细介绍PL/SQL性能增强、初始化文件调整,以及的数据库调查和报告使用程序。
本书将现代统计学的重要思想引入数理统计课程中,强调了数据分析、图形工具和计算机技术,并注重统计的实务和应用.本书内容丰富,几乎涵盖了所有经典和前沿的概率论与数理统计理论和方法,主要包括概率、变量、联合分布、期望、极限定理、抽样调查、参数估计、假设检验、数据汇总、两样本比较、方差分析、分类数据分析和线性最小二乘等. 本书用真实数据分析了实际问题,以此增强读者对理论的理解;作者将自助方法与传统的推论性过程结合起来,增加了蒙特卡罗方法.此外,为了使概念更清晰,书中提供了大量的示例,而且还有丰富的习题,以增强读者的计算能力. 本书适合作为统计学、数学、其他理工科专业以及社会科学和经济学专业高年级本科生和低年级研究生的教材,同时也可供相关领域技术人员参考.
这是一本跟数据科学和数据科学家有关的“手册”,它还包含传统统计学、编程或计算机科学教科书中所没有的信息。 本书有3个组成部分:一是多层次地讨论数据科学是什么,以及数据科学涉及哪些其他学科;二是数据科学的技术应用层面,包括教程和案例研究;三是给正在从业和有抱负的数据科学家介绍一些职业资源。本书中有很多职业和培训相关资源(如数据集、网络爬虫源代码、数据视频和如何编写API),所以借助本书,你现在就可以开始数据科学实践,并快速地提升你的职业水平。
本书以当前主流的关系数据库为主线,全面阐述了数据库的基本原理、基本技术、基本方法和应用技术,介绍了 数据库技术的研究动态,探讨了数据库领域研究的新进展。本书主要内容包括:关系理论、关系数据库标准语言 SQL.关系规范化理论、关系数据库设计、数据库的实施与调优、数据完整性约束、数据库的安全性、事务管理和锁、数 据库的备份和恢复、现代数据库技术新进展等。 本书注重数据库技术的实际应用,强调理论与实践紧密结合,可供从事数据库技术领域工作的科技人员参考使 用。
随着计算机网络技术的迅速发展、数据库技术与网络技术的紧密结合,数据库技术已经广泛应用于各领域,小到工资管理系统,大到电子商务平台,数据库技术已经成为基于Web的数据库应用系统的*开发技术。作为一种数据库管理系统,SQL Server已经逐渐替代Visual FoxPro,成为当今数据库应用系统的主流后台数据库,同时,SQL Server也成为国内外高等院校计算机相关专业的专业基础课和非计算机专业的通识教育课程。 《SQL Server 2000实用教程》是学习SQL Server 2000数据库的实用教程,通过将理论与案例相结合,全面介绍了关系型数据库的基础理论和数学模型,并以此为基础介绍了SQL Server 2000数据库的原理与技术。 本教材共分12章:第1章介绍数据库系统概述;第2章介绍关系数据库数据模型;第3章介绍SQL Server 2000数据库基础;第4章介绍数据库的创建和管理;第5章介绍
《数据结构》(第四版)是新世纪高职高专教材编委会组编的高职高专计算机专业基础系列规划教材之一。 数据结构是计算机程序设计的重要理论技术基础,它不仅是计算机学科的核心课程,也是其他理工专业的热门选修课。在计算机应用领域的开发研制工作中,数据结构有着广泛的应用。本书是为数据结构课程编写的教材,其内容选取既符合高职高专计算机专业教学大纲的要求,又兼顾了学科的广度和深度。 本书共分8章,第1章介绍了数据结构的基本概念,并对算法、算法分析作了简要说明,介绍了算法的时间复杂度和空间复杂度的评价方法;第2章到第4章介绍了线性表、数组、栈、队列和串等线性结构的基本定义及其常用算法的实现和基本应用;第5章和第6章介绍了非线性结构的树、二叉树和图,包括其逻辑特征、常用算法的实现和基本应用;第7章和第8
本书以Access 2010关系型数据库管理系统软件为背景,介绍数据库的基本概念、数据库的建立、维护、管理及数据库设计的步骤。同时兼顾到Access 2007版,也阐述了与Access 2003版的区别及兼容性。本书共分8章,第1章介绍数据库的理论基础,第2章至第7章按Access数据库的6个对象(表、查询、窗体、报表、宏、模块)依次划分章节,每章都以案例引入,采用提出问题、解决问题、归纳总结的步骤讲解。每章都有理论习题与两个不同难度的实验题。第8章提供两个有实用价值的综合实验。书中的习题与上机练习涵盖《全国计算机等级考试二级Access考试大纲》的考试内容。各章上机实例以及实验题都经过精心设计与推敲,力求用这些实验*限度地覆盖Access的知识面。书中例题及实验按难易程度分成三个档次,所有实验都经过上机运行并通过。本书既适合作为高等院校数据库课
本书主要讲述了Microsoft公司*推出的大型数据库管理系统SQL Server 2005的功能特点以及使用SQL Server 2005进行数据库开发的实用技术。作者根据多年的教学和开发经验,按照教学规律编写了本书,主要内容包括:SQL Server 2005概述、SQL Server 2005常用工具、数据库与表的创建和管理、表中数据的操作、Transact-SQL程序设计,视图、索引、存储过程、触发器的创建和使用、SQL Server的安全性管理、数据库的备份和还原、SQL Server数据转换等。 本书对SQL Server 2005的主要功能及使用方法的描述清晰明了,突出重点和难点,并将理论知识融合到具体的数据库开发实例中,使学生在学习了相关知识后能够立即动手开发自己的数据库系统,真正做到学以致用。 本书既可作为高等院校科学与技术专业及相关专业的教材,也可供广大有志于掌握数据库开发技术的人员使用。
Oracle数据库管理系统是目前世界上流行的关系数据库系统之一。本书从面向用户的角度,以简洁的语言和具体的实例,结合作者多年数据库教学及项目开发的经验,系统地介绍了Oracle9i关系数据库的基本概念、组织结构、交互式命令语言及工具使用、系统管理等知识。通过学习,读者可以快速掌握Oracle的基本概念和各种实用技术,并进行数据库系统的开发和应用。 全书共分11章,第1章和第2章主要概述了Oracle9i数据库的安装及体系结构;第3章和第4章介绍SQL语言及PL/SQL的使用;第5章-第8章讲述了Oracle9i的日常管理、安全特性、备份恢复功能以及Oracle9i的主要开发工具;第9章和第10章简单介绍了数据库性能优化技术及网络管理知识:第11章以连锁经营信息管理系统为例,介绍了Oracle数据库应用系统的分析、设计方法及部分实现程序。全书内容翔实,结构清晰,力求做到