本书与以往统计学中的概率论略有不同,添加了一些复杂数据类型的概率基础知识和模拟计算中的相关概率知识。具体安排如下所述。本书共分6章。第1章为概率与计数,基本内容是随机事件、概率空间、计数方法、概率的确定方法。第2章为条件概率,基本内容是条件概率与乘法公式、事件的独立性、全概率公式与贝叶斯公式。第3章为随机变量,基本内容是随机变量及其分布函数、随机变量的分类、二维随机向量、随机变量的独立性、随机变量函数的分布。第4章为常用的概率分布,基本内容是常用的离散型随机变量、常用的连续型随机变量、随机数的产生。第5章为随机变量的数字特征,基本内容是数学期望、方差和协方差、矩和矩母函数、条件期望。第6章为不等式和极限定理,基本内容是概率不等式、大数定律及其应用、中心极限定理。
过去几十年里,Web的迅速发展使其成为世界上规模zui大的公共数据源。Web挖掘的目标是从Web超链接、网页内容和使用日志中探寻有用的信息。 《世界计算机教材精选:Web数据挖掘(第2版)》旨在阐述Web数据挖掘的概念及其核心算法,使读者获得相对完整的关于Web数据挖掘的算法和技术知识。本书不仅介绍了搜索、页面爬取和资源探索以及链接分析等传统的Web挖掘主题,而且还介绍了结构化数据的抽取、信息整合、观点挖掘和Web使用挖掘等内容,这些内容在已有书籍中没有提及过,但它们在Web数据挖掘中却占有非常重要的地位。全书分为两大部分:部分包括第2章到第5章,介绍数据挖掘的基础,第二部分包括第6章到2章,介绍Web相关的挖掘任务。从本书自版出版之后,很多领域已经有了重大的进展。新版大部分的章节都已经添加了新的材料来反应这些进展,主要
本教材基于IBM SPSS19.0中文版进行编写,通过实验项目的形式介绍了相关统计方法原理、SPSS软件操作与应用。全书分10章约30个实验。每一章设计了实验目的、准备知识、实验内容、实验步骤、实验结果与分析、实验总结、练习与作业。本教材既可以作为高等院校学生学习SPSS软件的实验教材,也可以作为应用SPSS软件进行数据统计分析的一本参考手册,而且特别适用从事统计分析、社会学、市场分析、金融统计、经济统计分析的专业人员和管理人员。
本书内容共分为7章。 第1章介绍了数据分析的应用背景、研究内容和基本概念。第2章聚焦于数据的可视化方法,并例举了现有网络工具的使用方法,本章内容几乎不需要编程基础。第3章着眼于数据分析与数学优化建模的联系,并介绍了常用的梯度下降优化算法。第4章凸显了数据降维和特征提取的必要性,给出了一些常用的降维算法。第5章和第6章详述了无监督学习和有监督学习的典型算法及示例。第7章介绍了深度学习的鲁棒性问题,这是当前数据分析的前沿领域。本书 的附录部分简述了深度神经网络的基本原理以及PyTorch开发框架。
《SQLServer从入门到精通》从初学者的角度出发,通过通俗易懂的语言、丰富多彩的实例,详细地介绍了SQLServer2008开发应该掌握的各方面技术。全书共分15章,包括数据库基础、初识SQLServer2008、管理SQLServer2008、创建与管理数据库、操作数据表与视图、维护SQLServer2008、T-SQL概述、SQL数据语言操作、SQL数据查询、存储过程和触发器、索引与数据完整性、游标的使用、SQL函数的使用、SQL中的事务、基于C#的企业ERP管理系统。书中所有知识都结合具体实例进行介绍,涉及的程序代码给出了详细的注释,可以使读者轻松领会SQLServer2008的精髓,快速提高开发技能。另外,本书除了纸质内容之外,配书光盘中还给出了海量开发资源库,主要内容如下: u语音视频讲解:总时长10小时,共81段 u实例资源库:900多个实例及源码详细分析 u项目案例资源库:15个企业项目开发过程完整展
数据库(Database,DB)简而言之就是存放数据的仓库,是为了实现一定目的,按照某种规则组织起来的数据的集合。MySQL数据库是当前*主流的关系型数据库之一,本书以MySQL数据库为核心,主要内容包括数据库安装、 数据库表创建管理、使用SQL语句实现数据添加、修改、查询以及事务、视图、索引、备份和恢复等知识,并以员工晋级系统为例,完成一个典型系统的数据库的设计。为保证*优学习效果,本书紧密结合实际应用,利用大量案例说明和实 践,提炼含金量十足的开发经验。本书围绕对MySQL数据库的操作进行讲解,并配以完善的学习资源和支持服务,包括视频教程、案例素材下载、学习交流社区、讨论组等终身学习内容,为开发者带来全方位的学习体验,更多技术支持请访问课工场官网:www.kgc.cn。
本书内容简介:数据挖掘和文本挖掘是当前信息技术中的一个重要研究领域;将遗传算法和社会演化算法应用于数据及文本挖掘方法研究,具有较大的理论意义和实用价值本书研究了基于遗传算法和社会演化算法的数据挖掘和文本挖掘方法,主要包括数据挖掘和文本挖掘中的属性约简问题、聚类问题,并将其应用于产品研发决策中所做主要工作包括:提出一种基于遗传算法和k-medoids算法的新的聚类方法;采用遗传算法和模式聚合进行文本特征降维;采用遗传算法和潜在语义索引进行文本特征降维;采用社会演化算法进行聚类;采用混沌社会演化算法进行聚类;采用改进的遗传算法和社会演化算法进行文本聚类研究;将文本挖掘应用到产品研发决策中,构建产品研发文本知识地图,以期提高产品研发的效率和质量。
本书作为一本创作之初就定位于技术应用的实践参考书,虽然前前后后串联了Oracle数据库中十余个常用特性或工具,但在章节的设计上完全遵循这一理念。在涉及特性或工具应用的每一个章节,均有相关实例演示如何应用,所有示例的最终目的,就是希望阅读本书的朋友,能够将双手解放出来,自信灵活地使用书中介绍的各项特性和工具。全书共分5部分:初始化环境、加载数据、保护数据、传输数据和基础补充。 本书语言生动幽默,案例丰富,实践性强,在章节编排和内容组织方面,主要面向初次接触Oracle数据库的技术人员,以及对数据库操作感兴趣的开发人员,对于具有一定技术实力的中OracleDBA也有一定帮助,同时本书也可以作为大中专院校相关专业师生的参考工具书和相关培训机构的培训教材。
大数据是当前流行的热点概念之一,其已由技术名词衍生到对很多行业产生颠覆性影响的社会现象,作为明确的技术发展趋势之一,基于大数据的各种新型产品必将会对每个人的日常生活产生日益重要的影响。 张俊林著的这本《大数据日知录:架构与算法》从架构与算法的角度全面梳理了大数据存储与处理的相关技术。大数据技术具有涉及的知识点异常众多且正处于快速演进发展过程中等特点,其技术点包括底层的硬件体系结构、相关的基础理论、大规模数据存储系统、分布式架构设计、各种不同应用场景下的差异化系统设计思路、机器学习与数据挖掘并行算法以及层出不穷的新架构、新系统等。本书对众多纷繁芜杂的相关技术文献和系统进行了择优汰劣并系统性地对相关知识分门别类地进行整理和介绍,将大数据相关技术分为大数据基础理论、大数据系统体系结
在全世界不同的文化中,数据的收集与组织都有着悠久的历史,甚至在计算机思想出现之前很久就已存在。但只是到了互联网时代,日常产生的数据量才开始变得 巨大,而且继续呈指数级增长,其中包括我们上传的文件、视频、照片、社交媒体信息、在线购物,甚至我们汽车的GPS导航数据。大数据这一术语所代表的不仅仅是一种量变,而是一种质变;其所指涉的不仅是新的技术,还有企业和政府利用它的方式。霍尔姆斯基于统计学、概率论和计算机科学,对大数据这一主题进行了概要性探讨,并强调指出,大数据不仅改变了商业的运营模式,而且改变了医疗研究的进行方式。与此同时,它也引起了一些重要的伦理问题,作者据此对斯诺登事件、数据安全,以及家庭智能设备可能被黑客挟持等实例进行了讨论。
本书详细介绍了分布式数据库系统涉及的主要技术,包括分布式数据库设计、分布式查询处理和优化、分布式事务管理和恢复、分布式并发控制、分布式数据库的可靠性、分布式数据库的安全性等内容,同时介绍了分布式数据库系统的几个典型应用和发展趋势。本书在第二版的基础上做了一些修改和补充,增加或补充了数据库技术和计算机网络基础知识回顾、分布式数据库系统的主要应用、分布式数据库系统的发展趋势等内容,并结合当前流行的云计算技术增加了一些新的内容,如GFS、HDFS、BigTable、HBase等,以使读者对分布式数据库系统的未来发展有较为清晰的了解。本书对分布式数据库系统的基本内容进行了详实的讲解,对一些有争议的问题进行了开放式的讨论,但对深奥的理论没有采用繁琐的证明方式,而是采用大量的图示和实例做浅显的解释,从而增加了可
《SQL Server2008数据库设计案例教程》采用项目教学方式,通过一个完整案例,循序渐进地介绍了SQLServer2008常用的各项功能,内容涵盖软件安装,数据库设计,数据库和表的创建,基于C/S模式的数据库管理系统的结构搭建,增删改查功能的实现,存储过程、游标和事务等编程元素的应用,数据库的安全机制和用户权限的设置方法,数据库的备份与还原、分离与附加等。 《SQL Server2008数据库设计案例教程》具有如下特点:(1)全书内容依据SQL Server2008的功能和实际用途来安排:(2)在各项目中首先通过“理论指导”部分讲解项目涉及的SQL Server2008的核心功能,然后在“任务实践”部分通过案例对相关功能进行练习;(3)将SQL Server2008的知识很好地融入到了学生成绩管理系统的实现中,从而使本书获得增值,使读者能够真正学有所用。 本书可作为高等院校,中
SQL Server 2005是微软下一代数据管理和分析解决方案,为企业级数据和分析应用程序提供更强的扩展性、可用性和安全性。围绕着SQL Server 2005这一主题,本书通过一次一个步骤,一学就会的方式,提升读者设计、测试、部署和维护SQL Server 数据库的技能。 本书共13章,介绍了如何创建SQL Server数据库来保存应用程序数据,如何通过SQL Server来查询数据,如何修改SQL Server中的数据。讲解透彻,借助于练习帮助读者掌握SQL Server应用技巧,是一本理想的初、中级参考书,适合数据库应用和开发人员阅读。
数据仓库项目开发者面临着许多独特的管理挑战,这些挑战足以难倒最富经验的项目管理者。本书针对这些挑战,用流畅易读的语言,为项目经理提供了管理数据仓库设计、开发、实现等方面的指导性意见。作者Sid Adelman和Larissa Moss拥有丰富的实战经验,他们指出了成功管理数据仓库的关键要素,揭示了许多必须提防的陷阱,并提供了可行的解决人案,帮助读者成功地完成数据仓库项目。 通过本书,你将能够深入地了解以下方面的内容; ·成功的关键要素和失败原因 ·结果评价 ·成本-效益分析 ·选择正确的工具软件和供应商 ·开发组成员的角色及责任 ·快速应用开发和并行开发途径的方法 ·为整合数据而开发逻辑数据模型和物理数据模型 ·数据质量的重要性以及如何清理原文件中的脏数据 在每一章结尾处,作者通过“警示”提
本书从大数据架构的角度全面解析大数据技术及算法,探讨大数据的发展和趋势。不仅对大数据相关技术及算法做了系统性的分析和描述,梳理了大数据的技术分类,如基础架构支持、大数据采集、大数据存储、大数据处理、大数据展示及交互,还融合了大数据行业的技术进展和大型互联网公司的大数据架构实践,努力为读者提供一个大数据的全景画卷。
支持向量机是数据挖掘中的一个新方法。支持向量机能非常成功地处理回归问题(时间序列分析)和模式识别(分类问题、判别分析)等诸多问题,并可推广于预测和综合评价等领域,因此可应用于理科、工科和管理等多种学科。目前国际上支持向量机在理论研究和实际应用两方面都正处于飞速发展阶段。希望本书能促进它在我国的普及与提高。 本书对象既包括关心理论的研究工作者,也包括关心应用的实际工作者。对于有关领域的具有高等数学知识的实际工作者,略去书中的某些理论部分,仍能对支持向量机的本质有一个概括的理解,从而用它解决自己的问题。 本书适合高等院校高年级学生、研究生、教师和相关科研人员及相关领域的实际工作者使用。
本书为数据挖掘的基础教程,是作者多年来从事数据挖掘和专家系统课程教学经验的总结。它从商业角度介绍了数据挖掘的原理以及从数据中提取隐含模式的技术。本书首先帮助读者建立起数据挖掘的概念,进而通过13个数据挖掘示例帮助读者掌握数据挖掘的原理。本书的最后部分还介绍了结合专家系统和智能代理解决复杂问题的方法。 本书适合作为信息管理系统(MIS)和计算机科学专业的大学教授。它还可以为研究生提供数据挖掘和知识发现的基础知识。它也适合对使用数据挖掘解决商业问题感兴趣的专业人士作为自学指导。
在《白话统计》中你可以解决很多简单的网络搜索所不能解决的问题。在当前网络发达的时代,几乎任何概念和知识点都可以从网络上查到。但是有一点你很难查到,那就是统计分析的思路和观点。比如,你可以很容易地在网上查到什么是线性回归,但你却查不到怎么“做”线性回归分析,在你遇到实际数据时仍然不知道如何分析。在《白话统计》中你可以获得这些思路和观点。尽管这些观点未必是所有人都认可的,但根据笔者多年的分析经验,它们在实践中通常是奏效的。《白话统计》凝结了作者十多年来对统计分析的理解,对各种方法的介绍采用全新的理念和思路,不再是介绍方法本身,而是试图将各种方法之间的联系阐述清楚;不再是介绍方法如何计算出结果,而是尽量说明方法背后的思想。当然,本书同时提供了如何实现结果的软件(涉及Excel、SAS、R、JMP
本书作为《数据库原理及应用》的配套实验与上机指导教材。全书内容包括三部分:部分,基础实验章(设计、验证性);第二部分,综合性实验章(实例学习章);第三部分,自主性创新实验章(开发提高章)。本实验与上机指导教材通过详细的基础实验、技术训练来巩固学生的数据库系统理论知识,培养学生数据库的设计、数据库应用系统开发与维护的能力。 本书本着理论够用、突出应用,综合开发,以学生为中心,充分发挥学生的学习主动性,培养学生创新能力为指导思想,其内容丰富、实用性强,且具有创新性、综合性和启发性,既可以作为高等学校计算机及相关专业的数据库实验与上机指导教材,又适合即将从事数据库应用系统开发的人员和广大计算机用户参考与自学。