本书与以往统计学中的概率论略有不同,添加了一些复杂数据类型的概率基础知识和模拟计算中的相关概率知识。具体安排如下所述。本书共分6章。第1章为概率与计数,基本内容是随机事件、概率空间、计数方法、概率的确定方法。第2章为条件概率,基本内容是条件概率与乘法公式、事件的独立性、全概率公式与贝叶斯公式。第3章为随机变量,基本内容是随机变量及其分布函数、随机变量的分类、二维随机向量、随机变量的独立性、随机变量函数的分布。第4章为常用的概率分布,基本内容是常用的离散型随机变量、常用的连续型随机变量、随机数的产生。第5章为随机变量的数字特征,基本内容是数学期望、方差和协方差、矩和矩母函数、条件期望。第6章为不等式和极限定理,基本内容是概率不等式、大数定律及其应用、中心极限定理。
本书是为广大数据分析师量身定制的入门读物,它旨在帮助读者站在大数据时代的制高点。数据分析处于统计学、计算机信息科学、运筹学、数据库等多个领域的交叉地带,大数据时代的到来大大丰富了数据分析的内涵,数据分析师的职责与以往相比发生了巨大的改变。本书全面介绍了经典数据分析、模式识别、机器学习、深度学习、数据挖掘、商务智能等多个领域的数据分析算法,将大数据时代的数据分析热点技术一网打尽。本书为每个数据分析算法都搭配了一个经典案例,并按照由易到难的原则构建知识框架,充分照顾了不同水平读者的阅读习惯。通过阅读本书,读者将对大数据时代下的数据分析有一个全面的认识。无论是入门级的数据分析员还是有一定基础的数据分析师,都能通过本书完善、加深对数据分析的认识。
本书是中山大学重点学科建设成果,获中国矿物岩石地球化学协会大数据与数学地球科学专业委员会推荐,是我国*部地质科学大数据与机器学习教材。本书是中山大学研究生试用研究型教材,对运用大数据挖掘与机器学习算法解决地球科学问题大有裨益。适合地质科学领域研究生和高年级本科生做教材,也可供科研人员研究时参考。它系统地介绍了地球科学大数据挖掘与机器学习的基本框架与原理,重点分析高维数据的降维、分类与预测、大图形社区结构识别、无限流数据处理、机器学习及人工智能地质学的建模过程,对必要的应用场景,使用Python语言给出案例。
本书通过选购笔记本电脑的案例引入数据包络分析(dataenvelopmentanalysis,DEA)的基本概念和模型,并运用简单的EXCEL模型让读者更易理解和运用DEA。本书着重阐述如何将DEA作为一种运营分析工具,进行绩效评估,找出基准标杆。探讨的主题包括:平衡的基准,昀佳实践,相对效率的概念及绩效提升。特别地,本书探讨的数据分析方法能够帮助一个组织重新审视它对生产效率高低的已有观点是否合理,并为组织不断改进提供指导。本书是市面上唯一本不要求读者具备线性规划和线性代数知识,就可以熟练应用DEA方法的DEA方法指导用书。
在新媒体时代,如果对新闻报道、网上搜索的结果或者所谓的 专家告知 不加思考地完全相信,那你就等着上当受骗吧! 本书围绕当今*受瞩目的大数据科学理论,通过日本政府公布的公开数据,集中针对访日游客的增加、舆论调查的可靠性、 安倍经济学 的成果、东日本大地震后的状况、相对贫困、失业率的下降、年轻人远离ХХ、全球变暖问题、减肥、恩格尔系数的上升等10个主题进行数据解读,帮助读者模拟体验数据读取方法,提高理解和分析数据的能力,挖掘出数据背后隐藏的真相。 作为 大数据分析 的超级入门书,即使不擅长数学、不了解统计学的人,读完本书也可以彻底掌握数据解读方法!
《数据库管理人员(SQL Server4级第2版1+X职业技术职业资格培训教材)》(作者赵敏、徐龙章)由人力资源和社会保障部教材办公室、中国就业培训技术指导中心上海分中心、上海市职业培训研究发展中心依据上海1+X数据库管理人员(四级)职业技能鉴定细目组织编写。教材从强化培养操作技能,掌握实用技术的角度出发,较好地体现了当前*的实用知识与操作技术,对于提高从业人员基本素质,掌握四级数据库管理员的核心知识与技能有直接的帮助和指导作用。 《数据库管理人员(SQL Server4级第2版1+X职业技术职业资格培训教材)》在编写中根据本职业的工作特点,以能力培养为根本出发点,采用模块化的编写方式。全书共分为9章,内容包括:安装和卸载SQLServer 2005,连接与配置系统,创建和管理数据库,创建和管理数据库表,SQL Server2005的安全管理,数据库启动、连接
在软件设计和开发过程中,需求分析确定后,在开发软件前就需要先设计数据库,然后再编写代码。 韩立刚主编的这本《跟韩老师学SQL Server数据库设计与开发》讲解的内容是软件开发人员必须要掌握的技术,先讲解如何根据项目的需求按关系型数据库设计规范设计数据库中的表,然后使用自己设计的数据库来学习SQL语句。 本书完整地讲述了SQL语句中使用的变量、数据类型、注释行、运算符、常用函数,以及流程控制语句。从单表查询讲起,讲解使用WHERE筛选行将查询的结果分组、排序,然后讲解多表查询和数据汇总,讲解多表交叉联结、内联结、外联结、自联结,使用 UNION合并查询结果集,使用聚合函数汇总查询结果,接着讲解了子查询、开窗函数和行列转换技术,实现数据完整性,创建和使用索引优化性能,在数据库中创建和使用视图简化查询,使用存储过程
数据库技术是计算机信息系统与应用系统的核心技术和重要基础,也是计算机科学技术中发展快、应用广的技术之一。从20世纪60年代末产生到现在,已形成了比较完整的理沦体系和一大批有应用前景的商品化系统,已成为计算机软忭科学领域的.个重要分支。 本书较为详细地讲述了数据库系统的基本概念、原理、方法、SQL语句同时阐述了数据库没计、实现的基本过程.此外根据我国的实际情况,网状和层次数据库系统已经很少使用,应用主流足关系数据库,所以本书在介绍基本概念和原理的时候重点阐述关系数据库的相关理论。同时专门在第5章介绍了关系数据库管邢系统Access的具体使用方法。 全节共分为6章,具体内齐如下: 第1章介绍数据斥技术的基准概念、数据模型、数据库体系结构。 第2章介绍关系模型、关系代数和关系数据库管理系
本书基于作者近几年来的研究开发成果及应用实践,对物联网大数据技术体系进行了系统归纳,阐述了物联网环境下感知数据的特性、数据模型、事务模型以及调度处理方法等核心概念及关键技术,并对物联网大数据存储、管理、计算与分析的基本概念和关键技术进行了剖析。本书还介绍了自行研发的面向物联网的ChinDB实时感知数据库系统以及针对云计算环境下物联网大数据管理与应用的DeCloud云平台,介绍了它们在智能交通、智能电厂、教育、安全监控等多个行业的应用。书中所有实例,均来自作者所在团队的实际应用,大部分在物联网项目中得到了实践应用。本书对物联网应用的开发以及两化融合、工业4.0环境下的大数据处理分析具有重要参考价值。
本书以大数据为研究背景,系统分析了传统数据技术当前存在的问题以及面临的挑战,并对比了当前主流的面向大数据的数据库解决方案,在此基础上阐述了笔者的研究工作:基于MapReduce平台高处处理大数据的OLAP研究。书中反应了当前大规模数据仓库研究的热点和成果,值得大数据研究的人员参考和应用。
数据库(Database,DB)简而言之就是存放数据的仓库,是为了实现一定目的,按照某种规则组织起来的数据的集合。MySQL数据库是当前*主流的关系型数据库之一,本书以MySQL数据库为核心,主要内容包括数据库安装、 数据库表创建管理、使用SQL语句实现数据添加、修改、查询以及事务、视图、索引、备份和恢复等知识,并以员工晋级系统为例,完成一个典型系统的数据库的设计。为保证*优学习效果,本书紧密结合实际应用,利用大量案例说明和实 践,提炼含金量十足的开发经验。本书围绕对MySQL数据库的操作进行讲解,并配以完善的学习资源和支持服务,包括视频教程、案例素材下载、学习交流社区、讨论组等终身学习内容,为开发者带来全方位的学习体验,更多技术支持请访问课工场官网:www.kgc.cn。
基于国家973和863相关项目成果,采用汤森路透德温特世界专利创新索引数据库作为统计数据来源,对信息存储领域的专利文献进行检索分析,从存储器件、设备、系统等层面,选取了目前信息存储领域中的多项重要技术,利用专利统计分析的方法对其发展态势进行了研究,特别是对信息存储领域相关专利进行宏观统计分析以及核心专利的具体分析,可以全方位了解信息存储技术的发展历程、专利的国家或地区分布、重要专利权人的竞争态势,为制定相关战略提供决策参考。同时结合华为、中兴、联想、浪潮、IBM、EMC、三星、美光等国内外知名企业的实际案例,从中国本土和全球的布局两个角度分别分析了专利产出、主要竞争者、热点技术和研发重点以及竞争态势,力求找到信息存储技术专利申请对技术产业化与企业发展的作用,供信息存储研发人员、专利工作者和
本书内容简介:数据挖掘和文本挖掘是当前信息技术中的一个重要研究领域;将遗传算法和社会演化算法应用于数据及文本挖掘方法研究,具有较大的理论意义和实用价值本书研究了基于遗传算法和社会演化算法的数据挖掘和文本挖掘方法,主要包括数据挖掘和文本挖掘中的属性约简问题、聚类问题,并将其应用于产品研发决策中所做主要工作包括:提出一种基于遗传算法和k-medoids算法的新的聚类方法;采用遗传算法和模式聚合进行文本特征降维;采用遗传算法和潜在语义索引进行文本特征降维;采用社会演化算法进行聚类;采用混沌社会演化算法进行聚类;采用改进的遗传算法和社会演化算法进行文本聚类研究;将文本挖掘应用到产品研发决策中,构建产品研发文本知识地图,以期提高产品研发的效率和质量。
《物联网之云:云平台搭建与大数据处理》为 物联网工程实战丛书 第4卷。《物联网之云:云平台搭建与大数据处理》阐述了云计算的基本概念、工作原理和信息处理流程,详细讲述了云计算的数学基础及大数据处理方法,并给出了云计算和雾计算的项目研发流程,展望了云计算的发展前景。 《物联网之云:云平台搭建与大数据处理》共10章。第1章介绍了物联网数据分析中的一些数学基础、概率论和数理统计方法,以及分布式计算、网格计算和云计算方法,及其在物联网中的应用;第2章给出了云计算的概念和原理,并针对云计算的一些技术和体系架构做了详细介绍;第3、4章阐述了云计算平台的建设,重点阐述了PaaS平台的搭建流程及其针对智慧城市和垂直行业的云平台搭建实战;第5、6章阐述了大数据概念及大数据处理的常见数学方法;第7章阐述了物联网云计算
《数据库原理与应用(VFP第2版)》由长期从事“数据库原理与应用”课程一线教学工作的教师编写完成。在编写过程中,主编祝胜林参考了相关的著作、中文VFP的帮助信息和各种与中文VFP有关的等级或水平考试大纲,同时融合了自身的教学经验。因此,《数据库原理与应用(VFP第2版)》具有如下特点:(1)系统性。可以帮助学生系统地学习有关数据库的基本原理与方法。 (2)针对性。本书的举例和习题经过精心挑选,应用分析条理清晰,可以满足学生参加各种考试复习的需求。 (3)新颖性。对传统的章节结构进行了重新编排,使内容更加紧凑,同时也更加突出数据库应用的重点。 (4)实践性。“数据库原理与应用”课程是一门实践性非常强的课程,本书根据应用操作的需要,精心设计了上机操作的题目。
Transact-SQL是ANSI标准SQL数据库查询语言的一个强大的实现。为了构建高效的数据库应用程序,需要彻底理解Transact-SQL的功能。本书提供了对T-SQL语言的全面介绍,展示了如何在SQL Server 2000和SQL Server 2005这两个版本中使用T-SQL的方法。 本书先简要介绍了T-SQL使用的SQL Server查询操作与工具,然后深入浅出地介绍了如何设计、构建越来越复杂的应用程序的方法。有了对T-SQL语言的深入了解,就能满足日益增长的对编程技术的要求。 本书主要内容 ·利用T-SQL创建一些工具,用于管理上百个数据库 ·各种使用视图与存储过程的编程技术 ·优化查询性能的方法 ·如何创建数据库,作为以后开发的应用程序的必要基础 本书读者对象 本书针对尚未使用Transact-SQL进行过程序设计的数据库开发人员与管理员。如果读者具有关系数据库与SQL基础知识,
如今企业数字化转型和“互联网+”已成为热门话题。那么,如何开展转型工作,让具体工作可以落到实处呢?由于数字化转型工作的复杂性,很多企业管理者感觉无从下手,市面上也十分缺乏相关的指引和资料。本书介绍的企业架构方法以及多个领先企业和行业数字化案例,可以使读者系统地掌握数字化转型的理论和落地方法,帮助企业完成生死攸关的转型变革。本书回答了“什么是数字经济,什么是数字化转型,什么是数字化转型的关键要素”等问题,并在转型方法方面介绍了数字化企业架构的业务架构、流程、组织、IT架构,详细阐述了金融、零售、医疗、物联网、AI、智能制造等方面近期新的商业模式和技术发展。本书打开了一扇新的数字化转型方法之门,是企业管理者、信息化从业者以及管理咨询服务机构、IT服务公司从业人员、大专院校师生很好的参考资
本书由国内办公软件专家联袂微软高级培训教师精心策划编著,内容紧密贴合微软公司关于“Office专家”的认证要求,以精彩、丰富的应用实例为主线,借助大量图片和交互式多媒体教学,深入浅出地介绍了使用 Access软件建立并应用各种数据库的方法与技巧。 为了能够让读者更轻松、更顺利地学习本书,本书使用了丰富的色彩,对标题、图注、提示等各种重点内容进行了明确、醒目的标注,帮助读者明确学习重点。同时,为了能使读者获得更好的学习效果,书中提供了 “实例进阶”、“重点知识分析”、“本章小结”、“举一反三”和“练习”等实用内容,帮助读者分析、总结、练习。本书语言流畅、装帧精美,既是初、中级读者学习Access软件的*工具书,也非常适合作为公司岗位培训的指导教材。
本书深入浅出、循序渐进地介绍了SQL语言的知识体系,以及在Access、SQL Server和Oracle数据库系统中的使用方法。 本书共24章,内容涵盖了SQL语言各方面的知识,包括数据库的基础知识,搭建运行SQL语言实例的环境,SQL语言的历史、特点,创建和使用数据库、数据表、索引、视图的方法,高级数据查询的各种使用方法,SQLServer和Oracle常用函数的用法,聚合函数的各种用法,数据更新语句的使用方法,创建和使用存储过程、自定义函数和触发器的方法,数据库系统的安全性和完整性方面的知识,T-SQL和PL/SQL的控制流语句,事务处理和并发事务处理,以及如何在VisualBasic、Visual C++和VisualC#中使用SQL语句操作数据库等。本书*的特色在于理论与实践并重,书中配有大量的精选实例,具有很好的教学价值与参考价值,力求让读者迅速掌握SQL语言的使用方法和各种技巧。
通过阅读这样一本实用的参考书,开发能对数据进行ETL(提取、转换和加载)处理的解决方案将变得比以前更容易。本书介绍了如何应用SQLServer 2005 IntegrationServices(SSIS)组件构建符合要求的企业ETL应用程序,内容涉及数据仓储ETL、错误处理、管理和数据集成等,对SQLServer管理员有极高的参考价值。 本书由两位SQL ServerMVP编写,给出了清楚的描述和具体的范例,全面介绍了有关脚本和数据提取方面的所有背景信息和基础知识,教会您设计和实现必要的体系结构以及应用正确的管理技术。通过学习本书,您将快速了解如何利用SSIS功能实现数据集成和处理需求。 本书主要内容 充分利用脚本开发出更高级的应用程序 关系型数据库转换及维度表和事实表的加载方法 逐步创建能简单、有效处理错误的复杂解决方案 利用SSIS功能更好地维护可移
本书以*考试中心*颁布的全国计算机等级考试大纲(2008版)为依据,以对考生进行综合指导为原则。综合了近3年连续5次考试题和考前辅导班教师的实际教学经验编写而成。 全书共分三部分。部分在深入研究考试大纲的基础上,总结提炼出二级公共基础知识的主要考点,针对各考点组织了相关内容并编写了相关习题,主要包括基本数据结构和算法、程序设计基础、软件工程基础及数据库基础等内容。第二部分为二级Visual FoxPr0程序设计笔试部分,主要综合了近3年连续5次考试真题及其详解,同时融汇考前辅导班教师的实际教学经验编写了模拟试题及详细解析。第三部分为二级Visual FoxPr0程序设计上机考试部分,主要从基本操作题、简单应用题和综合应用题3个方面总结了历次上机考试常考的知识点;并通过图示详细讲解真题,总结重要的考点、答题思路和应试技巧。
大数据让我们以一种前所未有的方式,通过对海量数据进行分析,获得有巨大价值的产品和服务,*终形成变革之力。本书围绕Hadoop和Spark这两个主流技术进行讲解,主要内容包括Hadoop环境配置、分布式文件系统HDFS、分布式计算框架MapReduce、资源调度框架YARN与Hadoop新特性、大数据数据仓库Hive、离线处理辅助系统、Spark Core、 Spark SQL、Spark Streaming等知识。 为保证*学习效果,本书紧密结合实际应用,利用大量案例说明和实践,提炼含金量十足的开发经验。本书使用Hadoop和Spark进行大数据开发,并配以完善的学习资源和支持服务,包括视频教程、案例素材下载、学习交流社区、讨论组等终身学习内容,为开发者带来全方位的学习体验,更多技术支持请访问课工场官网:www.kgc.cn。
本书是面对当前大数据应用、可视分析研究和应用的新形势,专门为数据科学与大数据技术、智能科学与技术、计算机、数据处理等专业本科生开设数据可视化课程而编写的一本教材。该书将教学之严谨和科研之创新有机地结合,全面诠释了大数据可视化的内涵与外延,详细介绍了大数据可视化概述、可视化的类型与模型、数据可视化基础、数据可视化的常用方法、大数据可视化的关键技术、可视化交互、大数据可视化工具、大数据可视化系统 魔镜以及大数据可视化的行业案例等内容。为了便于学习,每章都附有习题。