在数据湖仓的所有新增要素中,排名的就是可以利于数据分析和机器学习所用的分析基础设施。分析基础设施包括一众大家广为熟悉的东西,当然也包括一些可能对大家还有些陌生或略带新鲜感的概念。比如包括:元数据、数据血缘、 数据体量的度量 、数据创建的历史记录、数据转换描述。 数据湖仓的第二个新增要素,是识别和使用通用连接器。通用连接器允许合并和比较所有不同来源的数据。如果没有通用连接器,就很难(实际上是几乎不可能)将数据湖仓中的不同数据关联起来。但有了这个中西,就可以关联任何类型的数据。 使用数据湖仓,就有可能实现以往任何其它方式都不可行或不可能实现的某种程度的数据分析和机器学习。 但与其它架构一样,我们需要理解数据湖仓的架构以及它的能力,以便于我们基于这种架构创建数据分析蓝图和开展数据分析规
本书是一本介绍Access 2013软件的实用工具书,全书共15章,主要包括数据库的基础知识、Access基础操作、Access高级操作、宏和VBA代码编程以及综合实战应用等内容。通过本书的学习,不仅能让读者学会和掌握Access软件的基本操作,还可以通过书中的实战案例学会举一反三,在实际工作中运用自如,有效提高工作效率。本书主要定位于希望快速掌握用Access 2013制作和设计数据库的初、中级用户,适合不同年龄段的办公人员、文秘、财务人员、后勤人员和国家公务员学习使用。此外,本书也可作为各大中专院校及电脑培训班的办公软件方面的教材。
本教材依据普通高校信管类专业的培养目标,按学科的课程设置要求,突出应用型、实践性和立体化的特点编写。全书以数据库系统基本概念、关系代数、SQL语言、设计理论与工程设计、实施、维护、、应用发展和系统实例为主线,强调在网络环境、知识经济和信息经济环境下数据库系统所表现出的特点。本书结构新颖,内容详实,案例丰富,实用性较强,既可作为普通高校信息管理与信息系统、管理科学与工程、工商管理等经管类相关专业的教材,也可供企事业单位和信息系统相关人员作为参考书使用。随书配备的光盘包含丰富的习题与案例,电子教案、课程设计、优秀作业展示等资料,便于教学和自学。
《大数据分析:决胜互联网金融时代》第1章主要介绍了大数据分析的定义和由来、大数据的重要性,以及大数据时代的历史背景和发展趋势。第2章通过对成功企业领导者的采访,详细介绍了大数据分析在信息、金融、传媒、医疗等领域的使用案例,并通过这些案例帮助读者了解如何将大数据分析方法应用到商业活动中。第3章详细介绍了大数据分析采用的一系列技术手段及案例,并指出大数据技术应用到实际生活中的一些关键问题。第4章介绍了承载大数据应用的计算、存储等底层基础设施的关键技术,并讨论了大数据计算的瓶颈及近年来涌现出的新技术。第5章详细介绍了在大数据时代商业分析的方法及涉及的关键技能,以及如何对分析结果进行归纳总结,并终对企业的决策产生影响。第6章主要介绍了数据科学家的定义,以及数据科学和决策科学人才培养的方
本书分10章,全面介绍了Hadoop云技术及其在光网络研究方面的真实案例。读者通过本书的学习,可以掌握搭建及维护Hadoop平台的相关知识和技术。
本书从人力资源管理的战略转型谈起,使大家进一步理解和把握人力资源发展的趋势,进而提出什么是人力资源大数据,如何在海量数据中挖掘出有用的数据,如何将大数据、人工智能与企业人力资源管理实践有机结合,如何在企业内部建立人力资源大数据分析模型和分析平台,如何形成企业人力资源报表体系和指标体系,从科学到实践、从理念到案例,深入浅出地给出了详尽的答案。为eHR、HRD、HRVP及企业CEO等高管进行人力资源大数据分析提供模型、技术方法及可借鉴的典型应用场景,为数据分析师进入人力资源领域提供了人力资源前沿理论及实践,为所有人力资源管理者及爱好者提供了崭新的理念、可操作性的技术方法及典型案例。
本书是按照*高等教育司组织制定的《高等学校文科类专业大学计算机教学基本要求》中有关数据库技术的教学基本要求编写的。以MicrosoftAccess2010关系数据库为背景,以作者精心设计的“教学管理”数据库案例贯串全书,系统地介绍了数据库基础知识、Access2010数据库的六大对象以及数据库管理与安全等内容。教学案例中精选的10个基本表,覆盖了双字段组合和三字段组合主键,其表间关联复杂但表述清晰、层次分明、结构严谨,突破了现有教材教学案例的瓶颈制约,彰显了主键与表间关系的重要性。重点章节中精选的具有极强实用性和连贯性的教学例题,从不同角度和深度挖掘了查询、窗体、报表和宏对象设计的操作技巧。根据各章的重要程度安排了个数不等的实验项目,练习内容丰富且重点明确。本书的突出特色是:教学案例数据翔实逼真、基本表结构设计严谨
Oracle 11g是目前很流行的数据库开发平台之一,拥有较大的市场占有率和众多的高端用户,是大型数据库应用系统的优选后台数据库系统。Oracle数据库管理和应用系统开发已经成为靠前外高校计算机专业和许多非计算机专业的必修或选修课程。 本教程结合大量的实例,介绍如何利用Oracle 11g来管理和维护数据,以及使用Visual C#和ASP等开发工具开发C/S(Client/Server)模式和B/S(Browser/Server)模式网络数据库应用程序。 本书可以作为大学本科有关课程的教材,也可供大专、高职使用,也可作为广大Oracle数据库管理员和数据库应用程序开发人员的参考资料。
尚展垒、宋文军编著的《Oracle数据库管理与开发(慕课版)》作为Oracle程序设计的教程,系统、全面地介绍了有关Oracle程序开发所涉及的各方面知识。全书共分13章,内容包括数据库的基本概念与0racle环境、数据库创建、表与表数据操作、数据库的查询和视图、索引和数据的完整性、PL/SQL语言介绍、存储过程和触发器、 数据类型、系统安全管理、备份和恢复、闪回操作和IJndo表空间、其他概念、课程设计一一企业人事管理系统。全书每章内容都与实例紧密结合,有助于学生理解知识、应用知识,达到学以致用的目的。 本书是慕课版教材,各章节主要内容配备了以二维码为载体的微课,并在人邮学院(www.rymooc.com)平台上提供了慕课。此外本书还提供了配套资源包,其中提供了本书所有实例、上机指导、综合案例和课程设计的源代码,制作精良的电子课件PPT,
Moving Objects Databases(移动对象数据库)是近年诞生的—个较新的研究领域,其主要目标是允许用户在数据库中表示移动对象,并可以支持与时空变化(“移动”)相关的用户查询。随着移动计算、位置相关服务、GIS等应用的不断发展,移动对象数据库受到了国内外越来越多的关注。本书包括了目前国际上的*研究成果,覆盖了支持移动对象应用的几乎所有的底层数据库技术,如数据模型、查询代数、查询语言、索引、查询优化等,同时也对移动对象数据库的相关基本概念以及移动对象数据库的发展历史和未来趋势进行了总结、比较和展望。 本书可作为高等学校计算机、GIS、遥感等相关专业研究生或高年级本科生的教学参考书,也可供数据库研究人员和GIS、空间数据分析等专业人员参考使用。
随着大数据的概念、技术、应用深入到了社会中的各个方面,它在迅速而深刻地改变着我们工作方式和生活方式。Hadoop作为大数据行业中的一位元老级成员,它提供了一种可以高效处理海量规模数据的方式,为大数据的发展提供了巨大帮助。本书紧密结合理实一体化教学,以项目的形式呈现了基于Hadoop的大数据平台的构建、使用与管理,具体包括六个模块:(1)搭建单节点Nadoop整合平台;(2)搭建高可用Hadoop整合平台;(3)Hadoop整合平台的使用与管理;(4)基于Linux的MySQL数据库平台的搭建;(5)Hive数据仓库的搭建和使用;(6)使用ETL工具Sqoop转换数据。每个项目又划分成多个学习任务,呈现出一个个真实案例,在教学中取得了良好的教学效果,让读者通过案例实践对大数据以及Hadoop平台有更直观的认识。
数字化转型是企业在数字经济时代面对的重大战略选择,其本质是通过有效地使用数据资源对业务进行全面的升级和优化,提高企业的综合产业竞争力。本书将数据科学作为出发点,结合大数据、人工智能技术,以数据分析的方法和理论为观察视角,介绍了企业数字化转型的核心知识概念及主要的应用实践策略。 本书共8章,分为数字化产业目标、数据科学原理、数据科学技术,以及数字化业务实践4部分。 数字化产业目标部分(第1章)介绍数字经济时代的产业特征和格局,以及企业数字化的业务本质和重大意义;数据科学原理部分(第2章)主要讨论数据要素的核心价值体系及数据科学的基本理论范畴;数据科学技术部分(第3~6章)主要介绍数据获取及预处理方法、数据规律挖掘方法、数据建模方法,以及数据相关技术系统的建设方法;数字化业务实践部分(第7、8章)讨论企
本书通过浅显易懂的叙述方式和大量的图示,详细介绍了网站分析的关键技术要点,包括: 网站分析中重要的数据、网站数据分析的工具、网站分析工具的使用技巧以及分析数据的方法。本书共分为11章,首先让读者了解网站分析的作用和做网站分析必须了解的一些重要指标;然后介绍目前国内广泛使用的网站分析工具 百度统计,并对百度统计中各种维度的分析报告进行详细的阐述,包括推广报告、趋势报告、来源报告、网页分析报告、访客分析报告和各种优化报告,等等。本书内容丰富、语言简洁、图文并茂,适合广大网络营销初学者及从事网络推广的企业和个体阅读,是站长和广大网站运营人员的手册。
本书主要介绍大数据概论,内容包括大数据概述、科学研究第四范式、分布系统设计的CAP理论、NoSQL数据库、复杂网络、MapReduce分布编程模型、大数据存储、大数据分析、大数据挖掘、大数据可视化、大数据安全、大数据机器学习、大数据推荐技术,以及数据科学与数据思维。全书对上述内容概念性地介绍,语言精练、内容全面。
本书是 十三五 国家重点图书规划 大数据科学 丛书著作。 全书从管理的角度分时代篇、概念篇、学术篇和实践篇4篇,对大数据领导者的研究内容展开探讨。本书共10章,主要内容包括:大数据的概念和特点,大数据时代的机遇与挑战,首席数据官的兴起和内涵,首席数据官的理论基础、角色以及与组织绩效的关系,首席数据官需求评估和岗位设计,中国的大数据战略以及对首席数据官的访谈实录。对于业界人士,可以借助本书深入理解首席数据官的角色和岗位职责;对于研究人员,可以通过本书了解首席数据官的理论基础和研究方向。 大数据科学 丛书涉及大数据理论、技术、产业和管理的方方面面,旨在帮助相关专业的学者,特别是产业界了解世界大数据研究和应用的前沿,也可以作为教学之用。
当下,由于强大的数据挖掘软件平台很容易获得,草率地使用数据挖掘方法和技术将导致挖掘的结果混淆难解。这种失误往往源自盲目使用“黑盒子”方法进行数据挖掘,而好的避免途径就是使用“自盒子”方法,理解隐藏在软件背后的算法和统计模型结构。 本书分为7章,第l章是对降维方法的介绍,这是数据挖掘技术的一个先决条件;第2章至第6章为经典的数据挖掘算法和技术,包括一元回归模型、多元回归模型、逻辑回归模型、贝叶斯网络分析以及遗传算法,通过实际案例引导读者由已预处理的数据使用不同的挖掘技术从而得出所需结论;第7章为基于数据挖掘过程模型上的多个案例研究,通过多个领域的案例来阐述算法和技术是如何被运用的。 本书可作为数据挖掘课程教学用书,适用于高年级本科生和研究生的教学,也可供科研人员参考使用。
本书在基本数据结构的基础上,围绕一些常用的高级数据结构,结合大量实战例题,深入分析 数据结构是如何服务于算法的 ,这也是本书编写的一个核心理念:学习数据结构是为了 用好 数据结构。本次修订除了改错,主要是更换全书的程序代码为(C )。本书的适用对象包括:中学信息学竞赛SHOU*选手及辅导老师、大学ACM比赛SHOU*选手及教练、高等院校计算机专业的师生、程序设计爱好者等。