本书与以往统计学中的概率论略有不同,添加了一些复杂数据类型的概率基础知识和模拟计算中的相关概率知识。具体安排如下所述。本书共分6章。第1章为概率与计数,基本内容是随机事件、概率空间、计数方法、概率的确定方法。第2章为条件概率,基本内容是条件概率与乘法公式、事件的独立性、全概率公式与贝叶斯公式。第3章为随机变量,基本内容是随机变量及其分布函数、随机变量的分类、二维随机向量、随机变量的独立性、随机变量函数的分布。第4章为常用的概率分布,基本内容是常用的离散型随机变量、常用的连续型随机变量、随机数的产生。第5章为随机变量的数字特征,基本内容是数学期望、方差和协方差、矩和矩母函数、条件期望。第6章为不等式和极限定理,基本内容是概率不等式、大数定律及其应用、中心极限定理。
本书从初学者易于理解的角度,以通俗易懂的语言、丰富的实例、简洁的图表、传统和现代数据特征的对比,将大数据这一计算机前沿科学如数家珍地娓娓道来。既介绍了大数据和相关的基础知识,又与具体应用有机结合起来,并借助可视化图表的画面感立体地为读者剖析了大数据的技术和原理,非常便于自学。本书内容包括大数据概论、大数据采集及预处理、大数据分析、大数据可视化、Hadoop概论、HDFS和Common概论、MapReduce概论、NoSQL技术介绍、Spark概论、云计算与大数据、大数据相关案例等内容。本书既可以作为想了解大数据技术和应用的初学者的教材,也适合作为培训中心、IT人员、企业策划和管理人员的参考书。
如今企业数字化转型和“互联网+”已成为热门话题。那么,如何开展转型工作,让具体工作可以落到实处呢?由于数字化转型工作的复杂性,很多企业管理者感觉无从下手,市面上也十分缺乏相关的指引和资料。本书介绍的企业架构方法以及多个领先企业和行业数字化案例,可以使读者系统地掌握数字化转型的理论和落地方法,帮助企业完成生死攸关的转型变革。本书回答了“什么是数字经济,什么是数字化转型,什么是数字化转型的关键要素”等问题,并在转型方法方面介绍了数字化企业架构的业务架构、流程、组织、IT架构,详细阐述了金融、零售、医疗、物联网、AI、智能制造等方面*的商业模式和技术发展。本书打开了一扇新的数字化转型方法之门,是企业管理者、信息化从业者以及管理咨询服务机构、IT服务公司从业人员、大专院校师生很好的参考资料。
过去几十年里,Web的迅速发展使其成为世界上规模zui大的公共数据源。Web挖掘的目标是从Web超链接、网页内容和使用日志中探寻有用的信息。 《世界计算机教材精选:Web数据挖掘(第2版)》旨在阐述Web数据挖掘的概念及其核心算法,使读者获得相对完整的关于Web数据挖掘的算法和技术知识。本书不仅介绍了搜索、页面爬取和资源探索以及链接分析等传统的Web挖掘主题,而且还介绍了结构化数据的抽取、信息整合、观点挖掘和Web使用挖掘等内容,这些内容在已有书籍中没有提及过,但它们在Web数据挖掘中却占有非常重要的地位。全书分为两大部分:部分包括第2章到第5章,介绍数据挖掘的基础,第二部分包括第6章到2章,介绍Web相关的挖掘任务。从本书自版出版之后,很多领域已经有了重大的进展。新版大部分的章节都已经添加了新的材料来反应这些进展,主要
本书以大数据为研究背景,系统分析了传统数据技术当前存在的问题以及面临的挑战,并对比了当前主流的面向大数据的数据库解决方案,在此基础上阐述了笔者的研究工作:基于MapReduce平台高处处理大数据的OLAP研究。书中反应了当前大规模数据仓库研究的热点和成果,值得大数据研究的人员参考和应用。
本教材基于IBM SPSS19.0中文版进行编写,通过实验项目的形式介绍了相关统计方法原理、SPSS软件操作与应用。全书分10章约30个实验。每一章设计了实验目的、准备知识、实验内容、实验步骤、实验结果与分析、实验总结、练习与作业。本教材既可以作为高等院校学生学习SPSS软件的实验教材,也可以作为应用SPSS软件进行数据统计分析的一本参考手册,而且特别适用从事统计分析、社会学、市场分析、金融统计、经济统计分析的专业人员和管理人员。
本书内容共分为7章。 第1章介绍了数据分析的应用背景、研究内容和基本概念。第2章聚焦于数据的可视化方法,并例举了现有网络工具的使用方法,本章内容几乎不需要编程基础。第3章着眼于数据分析与数学优化建模的联系,并介绍了常用的梯度下降优化算法。第4章凸显了数据降维和特征提取的必要性,给出了一些常用的降维算法。第5章和第6章详述了无监督学习和有监督学习的典型算法及示例。第7章介绍了深度学习的鲁棒性问题,这是当前数据分析的前沿领域。本书 的附录部分简述了深度神经网络的基本原理以及PyTorch开发框架。
数据库(Database,DB)简而言之就是存放数据的仓库,是为了实现一定目的,按照某种规则组织起来的数据的集合。MySQL数据库是当前*主流的关系型数据库之一,本书以MySQL数据库为核心,主要内容包括数据库安装、 数据库表创建管理、使用SQL语句实现数据添加、修改、查询以及事务、视图、索引、备份和恢复等知识,并以员工晋级系统为例,完成一个典型系统的数据库的设计。为保证*优学习效果,本书紧密结合实际应用,利用大量案例说明和实 践,提炼含金量十足的开发经验。本书围绕对MySQL数据库的操作进行讲解,并配以完善的学习资源和支持服务,包括视频教程、案例素材下载、学习交流社区、讨论组等终身学习内容,为开发者带来全方位的学习体验,更多技术支持请访问课工场官网:www.kgc.cn。
本书内容简介:数据挖掘和文本挖掘是当前信息技术中的一个重要研究领域;将遗传算法和社会演化算法应用于数据及文本挖掘方法研究,具有较大的理论意义和实用价值本书研究了基于遗传算法和社会演化算法的数据挖掘和文本挖掘方法,主要包括数据挖掘和文本挖掘中的属性约简问题、聚类问题,并将其应用于产品研发决策中所做主要工作包括:提出一种基于遗传算法和k-medoids算法的新的聚类方法;采用遗传算法和模式聚合进行文本特征降维;采用遗传算法和潜在语义索引进行文本特征降维;采用社会演化算法进行聚类;采用混沌社会演化算法进行聚类;采用改进的遗传算法和社会演化算法进行文本聚类研究;将文本挖掘应用到产品研发决策中,构建产品研发文本知识地图,以期提高产品研发的效率和质量。
《SQLServer从入门到精通》从初学者的角度出发,通过通俗易懂的语言、丰富多彩的实例,详细地介绍了SQLServer2008开发应该掌握的各方面技术。全书共分15章,包括数据库基础、初识SQLServer2008、管理SQLServer2008、创建与管理数据库、操作数据表与视图、维护SQLServer2008、T-SQL概述、SQL数据语言操作、SQL数据查询、存储过程和触发器、索引与数据完整性、游标的使用、SQL函数的使用、SQL中的事务、基于C#的企业ERP管理系统。书中所有知识都结合具体实例进行介绍,涉及的程序代码给出了详细的注释,可以使读者轻松领会SQLServer2008的精髓,快速提高开发技能。另外,本书除了纸质内容之外,配书光盘中还给出了海量开发资源库,主要内容如下: u语音视频讲解:总时长10小时,共81段 u实例资源库:900多个实例及源码详细分析 u项目案例资源库:15个企业项目开发过程完整展
本书作为一本创作之初就定位于技术应用的实践参考书,虽然前前后后串联了Oracle数据库中十余个常用特性或工具,但在章节的设计上完全遵循这一理念。在涉及特性或工具应用的每一个章节,均有相关实例演示如何应用,所有示例的最终目的,就是希望阅读本书的朋友,能够将双手解放出来,自信灵活地使用书中介绍的各项特性和工具。全书共分5部分:初始化环境、加载数据、保护数据、传输数据和基础补充。 本书语言生动幽默,案例丰富,实践性强,在章节编排和内容组织方面,主要面向初次接触Oracle数据库的技术人员,以及对数据库操作感兴趣的开发人员,对于具有一定技术实力的中OracleDBA也有一定帮助,同时本书也可以作为大中专院校相关专业师生的参考工具书和相关培训机构的培训教材。
大数据是当前流行的热点概念之一,其已由技术名词衍生到对很多行业产生颠覆性影响的社会现象,作为明确的技术发展趋势之一,基于大数据的各种新型产品必将会对每个人的日常生活产生日益重要的影响。 张俊林著的这本《大数据日知录:架构与算法》从架构与算法的角度全面梳理了大数据存储与处理的相关技术。大数据技术具有涉及的知识点异常众多且正处于快速演进发展过程中等特点,其技术点包括底层的硬件体系结构、相关的基础理论、大规模数据存储系统、分布式架构设计、各种不同应用场景下的差异化系统设计思路、机器学习与数据挖掘并行算法以及层出不穷的新架构、新系统等。本书对众多纷繁芜杂的相关技术文献和系统进行了择优汰劣并系统性地对相关知识分门别类地进行整理和介绍,将大数据相关技术分为大数据基础理论、大数据系统体系结
在全世界不同的文化中,数据的收集与组织都有着悠久的历史,甚至在计算机思想出现之前很久就已存在。但只是到了互联网时代,日常产生的数据量才开始变得 巨大,而且继续呈指数级增长,其中包括我们上传的文件、视频、照片、社交媒体信息、在线购物,甚至我们汽车的GPS导航数据。大数据这一术语所代表的不仅仅是一种量变,而是一种质变;其所指涉的不仅是新的技术,还有企业和政府利用它的方式。霍尔姆斯基于统计学、概率论和计算机科学,对大数据这一主题进行了概要性探讨,并强调指出,大数据不仅改变了商业的运营模式,而且改变了医疗研究的进行方式。与此同时,它也引起了一些重要的伦理问题,作者据此对斯诺登事件、数据安全,以及家庭智能设备可能被黑客挟持等实例进行了讨论。
《深度挖掘:Oracle RAC数据库架构分析与实战攻略》分为3个部分,共9章。部分介绍集群的概念与RAC的结构和原理以及存储基本知识。第二部分全面介绍RAC的安装和管理维护以及RAC的备份恢复。第三部分对RAC性能调优的方法和工具进行了分析。《深度挖掘:Oracle RAC数据库架构分析与实战攻略》的特点是侧重于理论讲解和经验总结,从实战出发,同时辅以大量的案例进行讲解,力图从点到面,使读者对每个知识领域都有全面的了解和认识。 《深度挖掘:Oracle RAC数据库架构分析与实战攻略》不仅适合Oracle DBA阅读和参考,还适合Oracle高可用架构设计的系统管理员、系统架构师以及管理者阅读和参考,也可以作为各大中专院校相关专业的参考用书和相关培训机构的培训教材使用。
本书为考虑是否可以使用和如何使用NoSQL数据库的企业提供了可靠的决策依据。它由软件开发大师和软件开发“教父”MartinFowler与Jolt生产效率大奖图书作者Pramod J.Sadalage共同撰写。书中全方位比较了关系型数据库与NoSQL数据库的异同;分别以Riak、MongoDB、Cassandra和Neo4J为代表,详细讲解了键值数据库、文档数据库、列族数据库和图数据库这4大类NoSQL数据库的优劣势、用法和适用场合;深入探讨了实现NoSQL数据库系统的各种细节,以及与关系型数据库的混用。 全书分为两部分,共15章:部分(~7章)主要讲述NoSQL的核心概念。其中章解释了NoSQL发展迅速的原因;第2章描述了在NoSQL领域的三种主要的数据模型中如何体现“聚合”这一概念;第3章介绍了聚合的缺点;第4章描述了数据库如何在集群中分布数据;第5章论及了更新与读取操作对一致性的影响;第6章讨论了版本
本书是一本从理论到实践的全面且细致的企业数据驱动指南,作者见证并献身百度大数据的建设,毫无保留地将成败摸索实践的真实场景进行完整还原,并对近十年大数据从业经验与心得做了归纳和总结,同时详解大数据本质、理念与现状,并围绕数据驱动四环节——采集、建模、分析、指标,深入浅出地讲述企业如何从零到一将完整的数据驱动方案落地,全面展示大数据在各领域内的应用情况与趋势展望。
SQL Server 2005是微软下一代数据管理和分析解决方案,为企业级数据和分析应用程序提供更强的扩展性、可用性和安全性。围绕着SQL Server 2005这一主题,本书通过一次一个步骤,一学就会的方式,提升读者设计、测试、部署和维护SQL Server 数据库的技能。 本书共13章,介绍了如何创建SQL Server数据库来保存应用程序数据,如何通过SQL Server来查询数据,如何修改SQL Server中的数据。讲解透彻,借助于练习帮助读者掌握SQL Server应用技巧,是一本理想的初、中级参考书,适合数据库应用和开发人员阅读。
《OracleDBA手记·4:数据安全警示录》以数据安全为主线将众多灾难挽救过程串联在一起,不仅对各个案例的发生过程进行了详细描述,更为读者提供了具体的规避法则。其间穿插介绍了很多新鲜的技术细节和恢复方法,以及作者对于数据安全的思考。 本书不仅是写给技术人员看的,更是写给企业数据管理者看的,力求帮助企业避免遭遇本书所述种种灾难。同时,这也是一本相当深入的技术书,包括了一些相当深入的技术探讨,不仅可以帮助读者加深对于Oracle数据库技术的认知,还可以帮你在遇到类似案例时,做出同样的营救工作。
本书以“在线书签”项目贯穿全书,随着每一章的讲述都在适当的时候将 Servlet &JSP技术应用于“在线书签”程序之中,并作适当修改,以了解完整的应用程序构建方法。 本书内容包括简单的Web应用程序,开发简单的Servlet &JSP合理管理,JSP的使用,整合数据库等相关内容,本书适合Servlet & JSP初学者,以及广大的Servlet& JSP技术应用人员。
本书由浅入深、循序渐进地介绍了微软公司推出的数据库管理系统——中文版Microsoft SQL Server 2005系统的操作方法和使用技巧。全书共分13章,分别介绍了数据库技术的基础知识、Microsoft SQL Server 2005系统的安装和配置、Transact-SQL语言、安全性管理、管理数据库文件、备份和还原、数据类型和表、操纵表中数据、索引管理、查询优化技术、视图、存储过程、触发器、用户定义函数、数据完整性、自动化管理任务、系统监视和调整等内容。 本书内容丰富,结构清晰,语言简练,图文并茂,具有很强的实用性和可操作性,是一本适合于大中专院校、职业院校及各类社会培训学校的教材,也是广大初、中级电脑用户的自学参考书。