在阿里巴巴集团内,数据人员面临的现实情况是:集团数据存储已经达到EB级别,部分单张表每天的数据记录数高达几千亿条;在2016年“双11购物狂欢节”的24小时中,支付金额达到了1207亿元人民币,支付峰值高达12万笔/秒,下单峰值达17.5万笔/秒,媒体直播大屏处理的总数据量高达百亿级别且所有数据都需要做到实时、准确地对外披露……巨大的信息量给数据采集、存储和计算都带来了极大的挑战。 《大数据之路:阿里巴巴大数据实践》就是在此背景下完成的。《大数据之路:阿里巴巴大数据实践》中讲到的阿里巴巴大数据系统架构,就是为了满足不断变化的业务需求,同时实现系统的高度扩展性、灵活性以及数据展现的高性能而设计的。 《大数据之路:阿里巴巴大数据实践》由阿里巴巴数据技术及产品部组织并完成写作,是阿里巴巴分享对
本书是作者及所在课题组近年来关于数据驱动全局优化方法研究成果的总结。先介绍数据驱动优化方法的发展现状、关键技术及常用的测试函数,然后介绍基于空间缩减的全局优化方法、基于混合代理模型的全局优化方法、基于多代理模型全局优化方法、代理模型辅助的约束全局优化方法及离散全局优化方法、代理模型辅助的高维全局优化方法。本书介绍的数据驱动全局优化方法优化效率高,新颖性和先进性强,可广泛用于解决工程优化问题。
Python在数据分析领域得到了越来越广泛的应用。第一部分着眼于风险对股市指数期权的价值、股票、利率的影响。第二部分介绍套利定价理论、离散时间内风险中性估值,持续时间,介绍了两种流行的期权定价方法。最后,第三部分介绍市场估值工作的整个过程。
本书主要探讨SQLServer2008的底层原理,对每个结论都精心设计实验并给予实际验证,主要内容包括:系统视图与resource数据库、堆表及索引数据存储方式、空间管理数据页、数据删除或修改后的空间重用、数据页I/O保护机制、重做Et志原理、执行计划的重用和重编译、锁的原理、游标和备份原理。???本书适合数据库管理员等有一定经验的相关技术人员使用,同时也可作为大学计算机专业师生数据库技术的参考用书。
本书是作者研究SQLServer2005数据库系统管理的经验总结。全书共分为15章,内容包括初学SQLServer2005的问题,安装SQLServer2005,配置SQLServer2005网络,管理SQLServer2005服务器,SQLServer2005体系结构,管理SQLServer2005数据库,管理SQLServer2005表,Transact-SQL基础,用Transact-SQL操作数据、用Transact-SQL查询数据,管理SQLServer2005索引,其他数据对象,数据完整性,管理SQLServer2005安全,备份、恢复和维护等。本书内容全面,思路流畅,实用性强,所有实例均经过上机反复实践。本书适合SQLServer2005初学者阅读和参考,可作为SQLServer2005数据库技术培训。本书配套包括各章标注的内容及作者亲自配音制作的多媒体视频。
本书专为开发人员编写,先引导开发新手熟悉Oracle环境,然后进入数据库开发,并要掌握项目开发中的一些技巧。开发技巧展示是本书的一大特色(这一点很值得资深的开发人员借鉴)!本书共24章,主要介绍了Oracle安装、干净卸载Oracle、数据库启动关闭、Oracle网络配置等相关内容。在介绍Oracle系统管理的知识以后,将介绍与开发相关的内容(如PL/SQL基础知识、存储过程、函数、包等),并介绍数据库性能调整,本书重点介绍SQL语句调优。SQL语句调优是本书的另一大特色!
数据挖掘是一个融合了数据库技术、人工智能、机器学习、统计学、知识工程、面向对象方法等新技术的多学科交叉的研究领域。今天,越来越多的人们投入数据挖掘技术的研究领域,各种算法的不断改进和推陈出新,再加上高性能的关系数据库技术以及数据仓库技术的成熟,使得数据挖掘技术有了飞速的发展,并使数据挖掘技术进入了实用的阶段。 《数据挖掘算法及其应用研究》结合大量国内外最近几年数据挖掘的最新资料和作者的研究成果,系统地介绍了数据挖掘算法以及相关的技术及其在一些领域中的应用。《数据挖掘算法及其应用研究》共分2个部分,第1部分介绍数据挖掘算法,包括决策树算法、贝叶斯网络算法、人工神经网络、支持向量机、关联规则、聚类分析以及一些数据挖掘的相关技术等。第2部分主要讨论数据挖掘的应用研究,包括在信
本书是在作者多年从事数据挖掘行业实践和相关科学研究的基础上编写而成,书中包括数据挖据理论研究及实际应用的现状分析、研究内容的组织框架、研究方法与技术路线的描述、数据挖掘理论及应用的综述、不确定性理论、多目标优化的分类器方法、模糊多目标优化的分类器模型和算法、基于粗糙集和统计贡献度的特征选择算法、基于粗糙集预处理和粗近似的多目标优化的分类器模型和算法以及基于模糊化、核方法和惩罚因子的多目标优化的分类器模型和算法等内容。本书含有不确定性多目标优化的数据挖掘在信用评分、Web客户忠诚度分析、蛋白质交互的热点区域预测以及重大疾病的医疗诊断和预测等几个经典领域中的实际应用的描述。最后,通过对研究内容和实际应用效果的总结,展望了进一步研究和应用的方向。本书可供从事数据挖掘、机器学习与知识工