本书与以往统计学中的概率论略有不同,添加了一些复杂数据类型的概率基础知识和模拟计算中的相关概率知识。具体安排如下所述。本书共分6章。第1章为概率与计数,基本内容是随机事件、概率空间、计数方法、概率的确定方法。第2章为条件概率,基本内容是条件概率与乘法公式、事件的独立性、全概率公式与贝叶斯公式。第3章为随机变量,基本内容是随机变量及其分布函数、随机变量的分类、二维随机向量、随机变量的独立性、随机变量函数的分布。第4章为常用的概率分布,基本内容是常用的离散型随机变量、常用的连续型随机变量、随机数的产生。第5章为随机变量的数字特征,基本内容是数学期望、方差和协方差、矩和矩母函数、条件期望。第6章为不等式和极限定理,基本内容是概率不等式、大数定律及其应用、中心极限定理。
C#语言已经成为.NET平台中*流行的编程语言。本书以Visual Studio 2012和SQL Server 2008为开发平台,从实际应用的角度出发,重点介绍了使用C#开发Windows应用程序的方法和技术。全书共9章内容,第1章为C#概述,介绍了Microsoft.NET平台概述、C#语言简介、Visual Studio集成开发环境和C#程序结构介绍;第2~3章为C#程序设计基础,通过实例以循序渐进的方式介绍了C#语言的各种语法、知识点和面向对象的基本思想;第4~5章介绍了使用C#语言开发Windows窗体应用程序,包括Windows窗体常用控件、菜单编程、对话框和多文档编程;第6章介绍了各种文件操作;第7章介绍了进程,包括线程和多线程编程;第8章介绍了数据库编程;第9章通过开发一个图书馆管理系统,全面介绍了软件开发流程,阐述了使用Visual C# 2012开发Windows应用程序的基本知识。本书内容立足于课堂教学和实际应用,各章均配有
本书内容共分为7章。 第1章介绍了数据分析的应用背景、研究内容和基本概念。第2章聚焦于数据的可视化方法,并例举了现有网络工具的使用方法,本章内容几乎不需要编程基础。第3章着眼于数据分析与数学优化建模的联系,并介绍了常用的梯度下降优化算法。第4章凸显了数据降维和特征提取的必要性,给出了一些常用的降维算法。第5章和第6章详述了无监督学习和有监督学习的典型算法及示例。第7章介绍了深度学习的鲁棒性问题,这是当前数据分析的前沿领域。本书 的附录部分简述了深度神经网络的基本原理以及PyTorch开发框架。
在全世界不同的文化中,数据的收集与组织都有着悠久的历史,甚至在计算机思想出现之前很久就已存在。但只是到了互联网时代,日常产生的数据量才开始变得 巨大,而且继续呈指数级增长,其中包括我们上传的文件、视频、照片、社交媒体信息、在线购物,甚至我们汽车的GPS导航数据。大数据这一术语所代表的不仅仅是一种量变,而是一种质变;其所指涉的不仅是新的技术,还有企业和政府利用它的方式。霍尔姆斯基于统计学、概率论和计算机科学,对大数据这一主题进行了概要性探讨,并强调指出,大数据不仅改变了商业的运营模式,而且改变了医疗研究的进行方式。与此同时,它也引起了一些重要的伦理问题,作者据此对斯诺登事件、数据安全,以及家庭智能设备可能被黑客挟持等实例进行了讨论。
本书是一本从理论到实践的全面且细致的企业数据驱动指南,作者见证并献身百度大数据的建设,毫无保留地将成败摸索实践的真实场景进行完整还原,并对近十年大数据从业经验与心得做了归纳和总结,同时详解大数据本质、理念与现状,并围绕数据驱动四环节——采集、建模、分析、指标,深入浅出地讲述企业如何从零到一将完整的数据驱动方案落地,全面展示大数据在各领域内的应用情况与趋势展望。
《数据库原理与应用(VFP第2版)》由长期从事“数据库原理与应用”课程一线教学工作的教师编写完成。在编写过程中,主编祝胜林参考了相关的著作、中文VFP的帮助信息和各种与中文VFP有关的等级或水平考试大纲,同时融合了自身的教学经验。因此,《数据库原理与应用(VFP第2版)》具有如下特点:(1)系统性。可以帮助学生系统地学习有关数据库的基本原理与方法。 (2)针对性。本书的举例和习题经过精心挑选,应用分析条理清晰,可以满足学生参加各种考试复习的需求。 (3)新颖性。对传统的章节结构进行了重新编排,使内容更加紧凑,同时也更加突出数据库应用的重点。 (4)实践性。“数据库原理与应用”课程是一门实践性非常强的课程,本书根据应用操作的需要,精心设计了上机操作的题目。
在大数据领域,Hadoop无疑是最炙手可热的技术。作为分布式系统架构,Hadoop具有高可靠性、高扩展性、高效性、高容错性和低成本的优点。然而随着数据体积越来越大,实时处理能力成为了许多机构需要面对的首要挑战。Hadoop是一个批处理系统,在实时计算处理方面显得十分乏力。storm是一个类似于Hadoop勺实时数据处理框架,也是一个非常有效的开源实时计算工具,通常被比作“实时的Hadoop”。 《大数据技术丛书:Storm实时数据处理》通过丰富的实例,系统讲解Storm的基础知识和实时数据处理的实践方法,内容涵盖Storm本地开发环境搭建、日志流数据处理、Trident、分布式远程过程调用、Topology在不同编程语言中的实现方法、Storm与Hadoop的集成方法、实时机器学习、持续交付和如何在AWS上部署Storm。此外,《大数据技术丛书:Storm实时数据处理》旨在围绕Storm技术促
本书以现代化数据库技术发展研究为主线,系统地介绍了现在、代数据库技术的基础知识与新技术的研究发展。全书共分14章,包括绪论、关系模型及关系操作、关系数据库规范化理论、结构化查询语言SQL、SQL Server程序设计的高级应用、数据库中的数据查询处理与优化、数据库中数据的控制、数据库系统设计、数据库的应用与实现、数据库应用程序开发、移动对象数据库及其索引技术、时态数据库技术、主动数据库及其规则分析、其他数据库新技术。本书注重理论与实践相结合、语言简洁、条例清晰、可作为数据库相关技术人员的参考书。
Elasticsearch搜索集群系统在生产和生活中发挥着越来越重要的作用。本书介绍了Elasticsearch的使用、原理、系统优化与扩展应用。本书用例子说明了Java、Python、Scala和PHP的编程API,其中在Java搜索界面实现上,介绍了使用Spring实现微服务开发。为了扩展Elasticsearch的功能,本书以中文分词和英文文本分析为例介绍了插件开发方法。本书介绍了使用Elasticsearch作为数据管理平台的日志监控与分析方法,介绍了使用OCR从图像中提取文本以及问答式搜索的开发方法。
《数字出版数据库基础与实训教程》以碎片化的数字出版物内容管理为案例,以SQL Server 2005为数据库管理工具,介绍了基于数字出版的数据库基础知识与应用。教程共分为七章,内容安排如下: 章:介绍数据库的基础知识,主要包括数据库系统的基本概念、数据模型的基本概念、关系模型的概念与规范化要求、数据完整性的概念与使用、关系型数据库的设计流程等,并运用这些基础理论,设计了一个“数字出版内容管理”数据库模型,为后面各章节的学习打下坚实的基础。 第二章:介绍SQL Server 2005数据库管理系统及其安装步骤和配置管理等。 第三章:介绍SQL Server 2005的系统数据库、数据库存储文件以及用户数据库的创建与维护操作方法。此外,应数据库管理的安全性需要,介绍了通过分离和附加的方法实现数据库的备份和还原功能。 第四章:介绍SQL
本书主要内容包括:数据清洗在数据科学领域中的重要作用,文件格式、数据类型、字符编码的基本概念,组织和处理数据的电子表格与文本编辑器,各种格式数据的转换方法,解析和清洗网页上的HTML 文件的三种策略,提取和清洗PDF 文件中数据的方法,检测和清除RDBMS 中的坏数据的解决方案,以及使用书中介绍的方法清洗来自Twitter 和Stack Overflow 的数据。