本书介绍了 PostgreSQL 内部的工作原理,包括数据库对象的逻辑组织与物理实现,进程与内存的架构。并依次剖析了几个重要的子系统:查询处理、外部数据包装器、并发控制、清理过程、缓冲 区管理、WAL、备份及流复制。本书为 DBA 与系统开发者提供了一幅全景概念地图,有助于读者形 成对数据库实现的整体认识,亦可作为深入学习 PostgreSQL 源代码的导读手册,对于理解数据库原 理与 PostgreSQL 内部实现大有裨益。 本书适合数据库开发人员及相关领域的研究人员、数据库 DBA 及高等院校相关专业的学生阅读。
本书以了解COBOL语言为基础,通过由浅入深的讲解,循序渐进地介绍了如何使用COBOL语言进行实际开发。同时在讲解的过程中,也穿插了部分IBM大型机的知识及其在实际应用中的操作。 本书共分14章,从内容上可分为COBOL的入门篇、高级处理篇与实战篇。入门篇介绍了掌握一门语言必须了解的基础知识,包括数据类型、流程控制和各种运算;高级处理篇是针对COBOL有难度的一些技术点,包括表、子程序、数据处理、VSAM面向对象等;实战篇是通过一个完整的实例带你走完一个用COBOL开发的流程。
本书稿重点介绍数据建模与数据库设计的理论及应用。从数据模型的发展历程及其必要性引入,基于作者在研究和项目实践中积累的经验,让读者理解数据建模是业务负责人与数据设计者之间沟通的工具,数据模型决定数据处理性能与数据管理便利性。书稿中首先将数据建模划分为概念建模、逻辑建模、物理建模以及*后的数据库设计四个阶段,明确了导出实体、设定实体的重要关系、设定唯一键的数据建模流程。为了提高数据整合性和业务流程性能,先后提出了范式化和反范式化过程,在构建*容易理解的数据结构的同时兼顾数据库的访问成本,寻找盈亏平衡点。
我们能相信统计么? 抛了5次硬币,结果都是正面,抛硬币是否肯定是正面?如何从高层的统计指标看透数据后面的本质?如何在大数据时代获取战略制高点,确定自己的职业发展定位?从一个互联网公司数据分析师的成长经历,为您娓娓道来,数据分析中的奇闻趣事、心得总结、方法技巧与哲学感悟。
本书是在作者多年从事数据挖掘行业实践和相关科学研究的基础上编写而成,书中包括数据挖据理论研究及实际应用的现状分析、研究内容的组织框架、研究方法与技术路线的描述、数据挖掘理论及应用的综述、不确定性理论、多目标优化的分类器方法、模糊多目标优化的分类器模型和算法、基于粗糙集和统计贡献度的特征选择算法、基于粗糙集预处理和粗近似的多目标优化的分类器模型和算法以及基于模糊化、核方法和惩罚因子的多目标优化的分类器模型和算法等内容。本书含有不确定性多目标优化的数据挖掘在信用评分、Web客户忠诚度分析、蛋白质交互的热点区域预测以及重大疾病的医疗诊断和预测等几个经典领域中的实际应用的描述。最后,通过对研究内容和实际应用效果的总结,展望了进一步研究和应用的方向。本书可供从事数据挖掘、机器学习与知识工
AuthorizedtranslationfromtheEnglishlanguageedition,entitledBeyondBigData:UsingSocialMDMtoDriveDeepCustomerInsight,0 13 350980 XbyMartinOberhofer,publishedbyPearsonEducation,Inc,publishingasIBM,copyright?i2014.AllRightsReserved.Nopartofthiookmaybereproducedortransmittedinanyformorbyanymeans,electronicormechanical,includingphotocopying,recordingorbyanyinformationstorageretrievalsystem,withoutpermissionfromPearsoneducation,Inc.CHINESESIMPLIFIEDlanguageeditionpublishedbyTSINGHUAUNIVERSITYPRESSCopyright?i2016.
社交主数据管理(masterdatamanagement,MDM)是业务数据处理过程中的全新革命。它把客户和产品中心与大数据衔接在一起,从根本上改进了客户体验和产品策略。传统意义上的主数据管理涉及一整套的流程、做法和技术,其目的是为了创建一个单一视图,供多个业务流程和多个系统(如客户、产品、供应商和位置系统)共享共同的核心业务对象。目前,企业纷纷采用这种数据管理方式,用于改进销售、运营和客户支持的流程。然而传统的主数据管理的核心是结构化数据的管理。目前,与客户和产品相关的有价值的信息被锁定在微博、博客、脸书(Facebook)、电子邮件、呼叫中心谈话记录、呼叫记录中。这些社交数据不仅体量巨大,而且是非结构化的、事务性的数据。随着大数据分析技术Hadoop和分析软件Biginsights的广泛应用,提取这些信息不再是遥不可及的事情了。
在阿里巴巴集团内,数据人员面临的现实情况是:集团数据存储已经达到EB级别,部分单张表每天的数据记录数高达几千亿条;在2016年“双11购物狂欢节”的24小时中,支付金额达到了1207亿元人民币,支付峰值高达12万笔/秒,下单峰值达17.5万笔/秒,媒体直播大屏处理的总数据量高达百亿级别且所有数据都需要做到实时、准确地对外披露……巨大的信息量给数据采集、存储和计算都带来了极大的挑战。 《大数据之路:阿里巴巴大数据实践》就是在此背景下完成的。《大数据之路:阿里巴巴大数据实践》中讲到的阿里巴巴大数据系统架构,就是为了满足不断变化的业务需求,同时实现系统的高度扩展性、灵活性以及数据展现的高性能而设计的。 《大数据之路:阿里巴巴大数据实践》由阿里巴巴数据技术及产品部组织并完成写作,是阿里巴巴分享对
《写给数据产品经理新人的工作笔记》的目标在于,为数据产品从业新人或准备转行做数据产品的读者提供一个本领域的通解通法,并对即将面临的问题做出预判,并找到解决方案。 《写给数据产品经理新人的工作笔记》以数据产品经理角色的定位和合作关系为切入点,站在整个数据体系的视角,从工作流程的角度剖析数据需求沟通和判断的过程、指标体系搭建的过程,同时介绍了部分通用工具,并详细剖析这些工具和对应的数据体系要解决的问题之间的关系。最后补充了必要的统计学常识、数据技术常识,并对一些在数据产品经理的工作过程中经常遇到的问题给出解决方案。