《分布式数据库系统及其应用(第2版)》在版的基础上做了较大的修改,增加了与分布式数据库技术密切相关的、新的网络与数据库的接口技术,基于组件的新的软件开发方法,数据库,移动数据库,数据仓库和数据挖掘等内容,反映了分布式数据库技术和应用开发的新的发展趋势。本书还增加了习题和部分习题的参考答案。本书对分布式数据库系统的基本内容提供了翔实的讲解,对一些有争议的问题进行了开放式讨论,但对深奥的理论没有采用繁琐的证明方法,而是采用大量的图示和实例做浅显的解释,从而增加了它的知识性和易理解性。 本书可作为计算机专业高年级本科生的选修课教材,特别适合作研究生的专业课教材,也可作为从事计算机信息处理研究或相关应用开发人员的参考书。
《Spark大数据处理技术》是一本全面介绍Spark及Spark生态圈相关技术的书籍,是首本深入介绍Spark原理和架构的技术书籍。主要内容有Spark基础功能介绍及内部重要模块分析,包括部署模式、调度框架、存储管理以及应用监控;同时也详细介绍了Spark生态圈中其他的软件和模块,包括SQL处理引擎Shark和SparkSQL、流式处理引擎SparkStreaming、图计算框架Graphx以及分布式内存文件系统Tachyon。《Spark大数据处理技术》从概念和原理上对Spark核心框架和生态圈做了详细的解读,并对Spark的应用现状和未来发展做了的介绍,旨在为大数据从业人员和Spark爱好者提供一个更深入学习的平台。 《Spark大数据处理技术》适合任何大数据、Spark领域的从业人员阅读,同时也为架构师、软件开发工程师和大数据爱好者展现了一个现代大数据框架的架构原理和实现细节。相信通过学习《Spark大数据
大数据时代已经来临,这将引起深刻的行业变革。但是,大数据的真意在于数据分析,即从繁多的数据中找出洞见,并将其应用于实际决策中,以产生更明智的决策。这是一个看起来简单、做起来较难的事情。 《发现数据之美:数据分析原理与实践》从一个自底向上的角度,全面地阐述了数据分析所涉及的知识和技术,对于经典算法和工具的介绍也不止于泛泛而谈,而是加入了作者的经验和理解。所谓自底向上的角度,即从数据分析实践开始时所需要的数据准备、数据探查、数据再处理等,到经典的统计分析和数据挖掘算法及应用,还讲述了模型的部署,优化技术的引入,最终到决策自动化。 《发现数据之美:数据分析原理与实践》对企业管理者、数据分析从业者及高校的学生都有参考意义。管理者能看到一个较全面的数据分析的阐述,明确自身的需求
本书通过浅显易懂的叙述方式和大量的图示,详细介绍了网站分析的关键技术要点,包括: 网站分析中重要的数据、网站数据分析的工具、网站分析工具的使用技巧以及分析数据的方法。本书共分为11章,首先让读者了解网站分析的作用和做网站分析必须了解的一些重要指标;然后介绍目前广泛使用的网站分析工具——百度统计,并对百度统计中各种维度的分析报告进行详细的阐述,包括推广报告、趋势报告、来源报告、网页分析报告、访客分析报告和各种优化报告,等等。本书内容丰富、语言简洁、图文并茂,适合广大网络营销初学者及从事网络推广的企业和个体阅读,是站长和广大网站运营人员的手册。
本书以EMBA班的“数据挖掘技术及其应用”教学为场景,带领读者步入数据挖掘的神秘殿堂,领略数据挖掘的神奇魅力。全书分为9章:章从三个真实故事开始数据挖掘之旅;第2章以某企业生产中遇到的质量控制难题的解决过程为线索,展现数据挖掘的实施过程;第3章到第9章以典型案例的形式分别介绍了数据挖掘技术在电力行业、交通航空领域、冶金行业、税务与金融行业、电信行业、故障诊断以及互联网行业的应用。 数据挖掘是一种专业性极强的技术,本书避开大量晦涩的概念和令人生畏的数学公式,以师生互动讨论的形式让读者走进数据挖掘殿堂,进而深入浅出、循序渐进地感知数据挖掘。随着阅读,读者会自然而然地身临课堂,“让数据说话,从数据中发现规律,科学决策”等新的理念会使读者对实际工作中面临的复杂问题浮想联翩、另辟新径。 本书适合企
本书以商业数据分析为主线,立足互联网工作现实,从数据分析工作的要求开始,从如何获取数据到如何在实际工作场景中分析数据,最后以如何呈现数据分析的结果为结尾。 本书分2部分共9大章,分主题为理解商业与理解数据,系统地介绍了商业数据分析工作的主要内容、主要工作流程,配以实际案例详细介绍了如何挖掘数据以及数据分析工具、的使用。第二部分内容为在实践中提高商业数据分析能力,从立足公司内部到如何进行行业分析、趋势分析与竞争对手分析。
《数据仓库(原书第4版)》系统讲述数据仓库的基本概念、基本原理以及建立数据仓库的方法和过程。主要内容包括;决策支持系统的发展、数据仓库环境结构、数据仓库设计、数据仓库粒度划分、数据仓库技术、分布式数据仓库、EIS系统和数据仓库的关系、外部和非结构化数据与数据仓库的关系、数据装载问题、数据仓库与Web、ERP与数据仓库以及数据仓库设计的复查要目。 《数据仓库(原书第4版)》是数据仓库之父撰写的关干数据仓库的最著作,既可作为相关专业的研究生教材,也是数据仓库的研究、开发和管理人员的指南。
本书全面介绍了数据挖掘的理论和方法,旨在为读者提供将数据挖掘应用于实际问题所必需的知识。本书涵盖五个主题:数据、分类、关联分析、聚类和异常检测。除异常检测外,每个主题都包含两章:前面一章讲述基本概念、代表性算法和评估技术,后面一章较深入地讨论高级概念和算法。目的是使读者在透彻地理解数据挖掘基础的同时,还能了解更多重要的高级主题。此外,书中还提供了大量示例、图表和习题。 本书适合作为相关专业高年级本科生和研究生数据挖掘课程的教材,同时也可作为数据挖掘研究和应用开发人员的参考书。
本书共16章,共三篇。基础篇(~5章),章的主要内容是数据挖掘概述;第2章对本书所用到的数据挖掘建模工具MATALB进行了简明扼要的说明;第3章、第4章、第5章对数据挖掘的建模过程,包括数据探索、数据预处理及挖掘建模的常用算法与原理进行了介绍。实战篇(第6~15章),重点对数据挖掘技术在电力、航空、医疗、互联网、生产制造以及公共服务等行业的应用进行了分析。在案例结构组织上,本书是按照先介绍案例背景与挖掘目标,再阐述分析方法与过程,最后完成模型构建的顺序进行的,在建模过程关键环节,穿插程序实现代码。最后通过上机实践,加深数据挖掘技术在案例应用中的理解。提高篇(6章),介绍了基于MATLAB二次开发的数据挖掘应用软件——TipDM数据挖掘建模工具,并以此工具为例详细介绍了基于MATLAB接口完成数据挖掘二次开发的各个步骤,
随着智能终端、移动互联网以及物联网等信息技术的发展,数字社会中的数据无论在类型还是规模上都得到飞速发展,大数据迅速渗透到我们生活、工作的各个领域。想要从庞大的数据库中提取有用的信息或知识,就离不开大数据分析技术和工具。 在大数据和业务智能领域,Splunk是功能强大、简单易学并且能够快速获取直接动力的一个分析工具。你可以利用Splunk实时地监控数据,或者在海量事实中进行数据挖掘。Splunk提供的强有力的可视化工具可以帮助你从海量的数据中发现商业价值。Splunk的地理位置功能支持在地图上显示数据,你可以根据自己的兴趣下钻到某个地理区域。 通过Splunk,你可以即时地识别出不断变化的趋势和通过社会化媒体发布的公众意见,以及新的电商模式和客户行为,并积极响应。在今天这样一个快节奏的互联网业务世界中,能即时
《SOA概念、技术与设计》系统介绍SOA概念、技术与设计。全书共分五部分,分别介绍SOA与Web服务的基本原理,SOA与第二代Web服务规范扩展,SOA与面向服务,构建SCA的计划与分析、技术与设计。《SOA概念、技术与设计》由浅人深,示例翔实,应用大量模式,真正覆盖SOA实质部分。每章配有要点小结,使渎者能更深入理解该章主题。《SOA概念、技术与设计》适合于考虑实施面向服务架构的软件开发者、架构师或项目经理阅读参考。 学习SOA的指南在世界范围所采用的革命性计算平台中,面向服务架构(SOA)处于核心位置,并赢得了主要软件供应商的普遍支持。《SOA概念、技术与设计》是部端到端的SOA教程,逐步指导读者从零开始学习面向服务的建模与设计方法。《SOA概念、技术与设计》通过125个案例研究、300多个模式,详细讲解和分析构建SOA平台的最重要方面:目标
金融从业者每天都要与海量的数据打交道,如何从这些数据中挖掘出需要的信息,并进行相应的分析,是很多金融从业者非常关心的内容。本书以功能强大且较易上手的Python语言为编程环境,全面讲解了金融数据的获取、处理、分析及结果呈现。 全书共16章,内容涉及Python基础知识、网络数据爬虫技术、数据库存取、数据清洗、数据可视化、数据相关性分析、IP代理、浏览器模拟操控、邮件发送、定时任务、文件读写、云端部署、机器学习等,可以实现舆情监控、智能投顾、量化金融、大数据风控、金融反欺诈模型等多种金融应用。无论是编程知识还是金融相关知识,本书都力求从易到难、循序渐进地讲解,并辅以商业实战案例来加深印象。 本书定位为一本金融科技入门读物,但书中的数据挖掘与分析思想对其他行业来说也具备较高的参考价值。本书又是一个金融
《高等学校计算机基础课程多元教学系列教材·数据库技术及应用:Access 2010(第2版)》共两篇:篇介绍与全国计算机等级考试二级(公共基础知识)紧密结合的相关理论知识;第二篇以“高校学费管理系统”的开发过程为主线,对Access 2010数据库对象进行讲述。《高等学校计算机基础课程多元教学系列教材·数据库技术及应用:Access 2010(第2版)》在讲述过程中注重从初学者的认识规律出发,强调实用性和可操作性。全书对数据库的基本知识和Access 2010数据库对象的基本操作方法的讲述浅显易懂、深入浅出,书中还安排了大量短小精悍、典型实用的案例,使学习者能够结合案例熟练掌握Access 2010数据库的操作方法和技巧。
本书从Power BI的基础功能讲起,逐步深入到Power BI进阶实战,以业务案例为导向,以Power BI桌面版操作为基础进行讲解,深入讲述Power BI在各个业务部门的应用。本书包括7篇共21章内容,分业务场景进行讲解。篇用1章内容讲述Power BI基础操作,方便读者快速入门;第2篇用4章内容讲述如何用Power BI爬取天气、电影、销售、股票等数据;第3篇用4章内容讲述销售部门如何用Power BI分解销售目标,分析业绩达成、会员RFM和业绩构成;第4篇用5章内容讲述产品相关应用,包括存货分析、帕累托分析、关联分析、款分析和数据化陈列;第5篇用2章内容讲述在财务方面的应用,包括盈亏平衡分析和上市公司利润表分析;第6篇用3章内容讲述人力资源应用,包括人员结构及离职率分析、新员工分析和考勤分析;第7篇用2章内容讲述简化报告的技巧。
“大数据”近年成为IT领域的热点话题,人们每天都会通过互联网、移动设备等产生大量数据。如何管理大数据、掌握大数据的核心技术、理解大数据相关的生态系统等,是作为大数据开发者必须学习和熟练掌握的。本系列书以“大数据开发者”应掌握的技术为主线,共分两卷,以7个模块分别介绍如何管理大数据生态系统、如何存储和处理数据、如何利用Hadoop工具、如何利用NoSQL与Hadoop协同工作,以及如何利用Hadoop商业发行版和管理工具。本系列书涵盖了大数据开发工作的核心内容,全面且详尽地涵盖了大数据开发的各个领域。 本书为卷,共4个模块,分别介绍大数据基础知识、大数据生态系统的管理、HDFS和MapReduce以及Hadoop工具(如Hive、Pig和Oozie等)。本书适用于想成为大数据开发者以及所有对大数据开发感兴趣的技术人员和决策者阅读。
Oracle 10g是目前的数据库开发平台之一,拥有较高的市场占有率和众多的高端用户,成为大型数据库应用系统的后台数据库系统。Oracle数据库管理和应用系统开发已经成为外高校计算机专业和许多非计算机专业的必修或选修课程。 本书结合大量的实例,介绍如何利用Oracle 10g来管理和维护数据,以及使用Visual Basic和ASP等开发工具开发C/S(Client/Server)模式和B/S(Browser/Server)模式网络数据库应用程序。 本书可作为大学本科相关课程教材,也可供广大Oracle数据库管理员和数据库应用程序开发人员参考。
本书讲述在流行的大数据分布式存储和计算平台Hadoop上设计实现数据仓库,将传统数据仓库建模与SQL开发的简单性与大数据技术相结合,快速、高效地建立可扩展的数据仓库及其应用系统。 本书内容包括数据仓库、Hadoop及其生态圈的相关概念,使用Sqoop从关系数据库全量或增量抽取数据,使用HIVE进行数据转换和装载处理,使用Oozie调度作业周期性执行,使用Impala进行快速联机数据分析,使用Hue将数据可视化,以及数据仓库中的渐变维(SCD)、代理键、角色扮演维度、层次维度、退化维度、无事实的事实表、迟到的事实、累积的度量等常见问题在Hadoop上的处理等。本书适合数据库管理员、大数据技术人员、Hadoop技术人员、数据仓库技术人员,也适合高等院校和培训机构相关专业的师生教学参考。
本书根据计算机专业“数据库原理”课程的教学大纲编写。作者在原书《数据库原理习题与解析》(第2版)的基础上,根据读者的反馈意见,对习题部分进行了大幅修订和更新,并补充进一些近年的研究生入学考试试题。 全书共分9章,分别介绍数据库的基础知识、关系数据库、SQL语言、关系系统及其查询优化、关系数据理论、数据库设计、数据库保护、面向对象数据库系统和分布式数据库系统。每章由基本知识点和例题分析组成,前者高度概括和梳理本章应重点掌握的相关知识;后者详尽地解析精选的典型习题,能使学生充分掌握“数据库原理”课程求解问题的技巧与方法,深化对基本概念的理解,切实提高分析问题和解决问题的能力。 本书内容丰富,习题覆盖面广,可以作为计算机专业本、专科数据库原理课程的学习参考书,也是报考计算机专业硕士研究