计算广告是一项新兴的研究课题,它涉及大规模搜索和文本分析、信息获取、统计模型、机器学习、分类、优化以及微观经济学等诸多领域的知识。本书从实践出发,系统地介绍计算广告的产品、问题、系统和算法,并且从工业界的视角对这一领域进行具体技术的深入剖析。 本书立足于广告市场的根本问题,从计算广告各个阶段所遇到的市场挑战出发,以广告系统业务形态的需求和变化为主线,依次介绍合约广告系统、竞价广告系统、程序化交易市场等重要课题,并对计算广告涉及的关键技术和算法做深入的探讨。这一版中更是加入了深度学习的基础方法论及其在计算广告中的应用。 无论是互联网公司商业化部门的产品技术人员,还是对个性化系统、大数据变现或交易有兴趣的产品技术人员,传统企业互联网化进程的决策者,传统广告业务的从业者,互联网创
全书分为三大部分: 主要讨论有关增强数据密集型应用系统所需的若干基本原则。首先开篇第1章即瞄准目标:可靠性、可扩展性与可维护性,如何认识这些问题以及如何达成目标。第2章我们比较了多种不同的数据模型和查询语言,讨论各自的适用场景。接下来第3章主要针对存储引擎,即数据库是如何安排磁盘结构从而提高检索效率。第4章转向数据编码(序列化)方面,包括常见模式的演化历程。 我们将从单机的数据存储转向跨机器的分布式系统,这是扩展性的重要一步,但随之而来的是各种挑战。所以将依次讨论数据远程复制(第5章)、数据分区(第6章)以及事务(第7章)。接下来的第8章包括分布式系统的更多细节,以及分布式环境如何达成一致性与共识(第9章)。 主要针对产生派生数据的系统,所谓派生数据主要指在异构系统中,如果无法用一个数
本书围绕精益创业展开讨论,融合了精益创业法、客户开发、商业模式画布和敏捷/持续集成的精华。本书汇聚了100多位创始人、投资人、内部创业者和创新者的成功创业经验,呈现了 30 多个极具价值的案例分析,可以为各阶段的创业者提供行为准则。 如果你是一名创业者,或者你是一名产品开发、产品管理、市场营销、公共关系和投资领域的商务专业人员,那么本书不容错过。
随着TheDataWarehouseToolkit(1996)第1版的出版发行,RalphKimball为整个行业引入了维度建模技术。从此,维度建模成为一种被广泛接受的表达数据仓库和商业智能(DW/BI)系统中数据的方法。该经典书籍被认为是维度建模技术、模式和实践的资源。 该书汇集了到目前为止全面的维度建模技术。 该书采用新的思路和实践对上一版本进行了全面修订,给出了设计维度模型的全面指南,既适合数据仓库新手,也适合经验丰富的专业人员。 该书涉及的所有技术都基于作者实际从事DW/BI的设计经验,通过实际案例加以描述。 该书主要内容: 实用设计技术 有关维度和事实表的基本和高级技术。 14个案例研究,涉及零售业、电子商务、客户关系管理、采购、库存、订单管理、会计、人力资源、金融服务、医疗卫生、保险、教育、电信和运输等。
本书结合理论和实践,由浅入深,全方位介绍了Hadoop这一高性能的海量数据处理和分析平台。全书5部分24章,第Ⅰ部分介绍Hadoop基础知识,主题涉及Hadoop、MapReduce、Hadoop分布式文件系统、YARN、Hadoop的I/O操作。第Ⅱ部分介绍MapReduce,主题包括MapReduce应用开发;MapReduce的工作机制、MapReduce的类型与格式、MapReduce的特性。第Ⅲ部分介绍Hadoop的运维,主题涉及构建Hadoop集群、管理Hadoop。第Ⅳ部分介绍Hadoop相关开源项目,主题涉及Avro、Parquet、Flume、Sqoop、Pig、Hive、Crunch、Spark、HBase、ZooKeeper。第Ⅴ部分提供了三个案例,分别来自医疗卫生信息技术服务商塞纳(Cerner)、微软的人工智能项目ADAM(一种大规模分布式深度学习框架)和开源项目Cascading(一个新的针对MapReduce的数据处理API)。 本书是一本权威、全面的Hadoop参考书和工具书,阐述了Hadoop生态圈的*发展和应用,程序员可以从中探
作为一本 Power Query 初级入门读本,《Power Query 智能化数据汇总与分析》不深入介绍 M 函数,而是结合大量的实际案例,利用 Power Query 可视化的操作向导,来解决实际工作中烦琐的数据整理、汇总和分析问题,让读者在短时间内,能够对 Power Query 有一个较为全面的了解和掌握,并能迅速提升数据处理和统计分析效率。 《Power Query 智能化数据汇总与分析》适合具有 Excel 基础知识并经常处理大量数据的各类人员阅读,也可作为大专院校经济类本科生、研究生和 MBA 学员的教材或参考书。
数字技术为企业的管理方式带来颠覆性变革,我们正在经历从依赖企业管理者解读数据并做出业务决策,到由算法通过计算数据做出分析和判断,然后自动指挥业务活动的转变。作为企业管理者,需要思考如何顺应时代趋势,利用数字技术,实现企业管理方式升级,提升管理效率,降低管理费用,提高企业竞争力。撰写本书的主要目的是,帮助企业体系化地推进数字化管理升级。本书的主要内容包括数字技术驱动企业管理方式升级、企业数字化管理体系的四条线、企业数字化管理体系建设七步法、企业数字化管理体系建设实战、企业数字化管理体系建设中的瓶颈与难点、企业数字化管理体系建设的技术架构,以及未来数字智能技术展望。
大数据时代,对数据进行统计、分析和学习变得尤为重要,并被应用在各方各面,如无人驾驶汽车、AlphaGo、机器学习和人工智能等,而统计思维也成为大数据时代的基本思维。不仅这些高科技以统计学为基础理论,大数据时代的每个人都应该懂点统计学,学会读懂并分析数据,学会让数据说话,让数据为自己服务。《大数据时代的统计学思维:让你从众多数据中找到真相》就是大数据时代统计学思维的科普书籍,全书共10章,第1章用几个有趣好玩的例子引导读者进入统计学的世界,并调动读者学习统计学的兴趣。第2~10章结合生活和工作中的例子全面介绍统计学原理和方法,涵盖统计学中的数据收集、数据处理和统计推断等内容,既有抽样调查、概率、相关性分析、回归分析等实用统计方法,也有大数定律和中心极限定理等基本统计学原理。用实例引导理论,通俗
本书是中山大学重点学科建设成果,获中国矿物岩石地球化学协会大数据与数学地球科学专业委员会推荐,是我国*部地质科学大数据与机器学习教材。本书是中山大学研究生试用研究型教材,对运用大数据挖掘与机器学习算法解决地球科学问题大有裨益。适合地质科学领域研究生和高年级本科生做教材,也可供科研人员研究时参考。它系统地介绍了地球科学大数据挖掘与机器学习的基本框架与原理,重点分析高维数据的降维、分类与预测、大图形社区结构识别、无限流数据处理、机器学习及人工智能地质学的建模过程,对必要的应用场景,使用Python语言给出案例。
洞见产业新生态,解码数字新经济 行业场景真实展示 实际案例深度梳理,感受数字转型路径风格 谭建荣院士、郭华东院士、邬贺铨院士、张宏科院士 共同推荐 《产业数字化 释义、场景及应用案例》以《 十四五 数字经济发展规划》中产业数字化部分的核心内容为纲领,从入选工业和信息化部的大数据产业发展示范项目中,选取了具有产业代表性的来自生产一线的数字化转型实践案例,连同数字化建设和转型的共性基础内容,组织了42 个案例,从实践背景、方法手段、主要应用的技术、实践过程中遇到的典型问题、实施流程、典型应用场景等方面,分享了多个行业、多家单位的实践经验,以期帮助读者对产业数字化转型产生更为具体的了解和体会、获得间接经验,为读者提升数字认知和工作能力做一定的基础铺垫。 本书适合具有产业数字化转型需求的相关企业的管理者、
Origin是国际科技出版界公认的标准作图软件,它功能强大、操作简单,被科研人员、工程技术人员、高校师生等广泛使用。Origin软件不仅具有强大的数据可视化功能,还具有统计分析、信号处理、函数拟合、峰值分析等功能,且支持多种格式的数据导入和导出。 本书基于Origin 2021和Origin 2022版本进行案例讲解,旨在帮助读者快速入门,并掌握Origin软件的使用技巧。本书由浅入深地讲解了Origin软件的功能和相关案例,涉及基础2D图、等高线图、3D图以及专业图的绘制,也涵盖了数学运算、拟合分析、信号处理、多峰分析等主题。 本书适用于Origin软件的初学者和希望提高科技绘图及数据分析处理能力的读者,尤其适用于大中专院校的师生以及广大科研工作者。
本书面向数学与工程计算,主要讲解了MATLAB 2017a软件基础、初等数学专题概要、高等数学基本问题、线性代数与矩阵论基本问题、概率论与数理统计基本问题、数值分析基本问题、CASIO fx 991CN X(中文版)函数科学计算器简介七方面的内容。本书适合大中专院校理工科学生学习使用,也可供广大科研人员、学者、工程技术人员及MATLAB专业人员参考。
本书内容简介:数据挖掘和文本挖掘是当前信息技术中的一个重要研究领域;将遗传算法和社会演化算法应用于数据及文本挖掘方法研究,具有较大的理论意义和实用价值本书研究了基于遗传算法和社会演化算法的数据挖掘和文本挖掘方法,主要包括数据挖掘和文本挖掘中的属性约简问题、聚类问题,并将其应用于产品研发决策中所做主要工作包括:提出一种基于遗传算法和k-medoids算法的新的聚类方法;采用遗传算法和模式聚合进行文本特征降维;采用遗传算法和潜在语义索引进行文本特征降维;采用社会演化算法进行聚类;采用混沌社会演化算法进行聚类;采用改进的遗传算法和社会演化算法进行文本聚类研究;将文本挖掘应用到产品研发决策中,构建产品研发文本知识地图,以期提高产品研发的效率和质量。
本书主要分为两*分。第**分以核心概念和基本应用为脉络,介绍了Flink的核心*性(如检查点机制、时间与窗口、shuffle机制等),*署,DataStream API、Dataset API、Table API的应用,运行时的原理等内容,每*章先对概念做基本的介绍,然后基于应用实例详细分析Flink的设计思想和源码实现。第二*分基于对原理的理解,手把手教读者如何进行定制化的*性开发和性能提*,能够让读者对Flink的理解有质的飞跃。这**分内容来自作者大量的工作实践,所引用例均源自企业级的真实需求,能够解决非常复杂的现网问题。
本书以精练的语言介绍HBase的基础知识,让初学者能够快速上手使用HBase,对HBase的核心思想(如数据读取、数据备份等)和HBase架构(如LSM树、WAL)有深入的分析,让有经验的HBase开发人员也能够循序渐进地深入理解HBase源码,以便更好地去调试和解决线上遇到的各种问题。本书更加专注HBase在线实时系统的调优,让HBase集群响应延迟更低,能够更好地为在线实时系统服务。本书结合企业的“用户行为分析系统”,让读者能够快速上手的同时,也不乏企业HBase实际应用场景,理论不脱离实际,真正做到从入门到精通。 本书适合有一定Java基础的程序员作为HBase入门教程,HBase运维人员可以将本书作为参考手册来部署和监控HBase,正在将HBase应用到在线生成环境中的软件开发人员也可以参考本书来调优HBase在线集群性能。
《MySQL是怎样运行的:从根儿上理解 MySQL》采用诙谐幽默的表达方式,对MySQL的底层运行原理进行了介绍,内容涵盖了使用MySQL的同学在求职面试和工作中常见的一些核心概念。总计22 章,划分为4个部分。第1部分介绍了MySQL入门的一些知识,比如MySQL的服务器程序和客户端程序有哪些、MySQL的启动选项和系统变量,以及使用的字符集等。第2部分是本书后续章节的基础,介绍了MySQL的一些基础知识,比如记录、页面、索引、表空间的结构和用法等。第3部分则与大家在工作中经常遇到的查询优化问题紧密相关,介绍了单表查询、连接查询的执行原理,MySQL基于成本和规则的优化具体指什么,并详细分析了Explain语句的执行结果。第4部分则是与MySQL中的事务和锁相关,介绍了事务概念的来源,MySQL是如何实现事务的,包括redo日志、undo日志、MVCC、各种锁的细节等。 尽管《MySQL
本书是华为ICT学院大数据技术官方教材,旨在帮助学生进一步学习大数据的基本概念、技术原理,以及大数据平台的搭建和使用。 本书从大数据的概念和特征开始讲起,首先让读者对大数据有一个感性的认识;接下来结合大数据平台的各个功能模块,详细介绍大数据的存储、处理、分析、可视化等原理和操作;对大数据在各种行业中的应用加以叙述,让读者更加充分地感受到大数据应用的价值。 除华为ICT学院的学生之外,本书同样适合正在备考HCNA-Big Data认证,或者正在参加HCNA-Big Data技术培训的学员进行阅读和参考。其他有志进入ICT行业的人员和大数据技术爱好者也可以通过阅读本书,加深自己对大数据技术的理解。
《MySQL是怎样使用的:快速入门MySQL》采用通俗易懂的表达方式,对如何使用MySQL进行了详细的介绍。 《MySQL是怎样使用的:快速入门MySQL》完全从零基础用户的角度出发,依照用户认知习惯,从MySQL的安装开始,介绍了MySQL的服务器程序和客户端程序的使用、MySQL的数据类型、数据库和表的基本操作、列的属性、MySQL中的表达式和函数、简单和复杂的增删改查语句等入门知识,还介绍了视图、存储程序、备份与恢复、用户与权限管理等高级概念以及使用Java语言连接MySQL服务器等知识。 《MySQL是怎样使用的:快速入门MySQL》较好地契合了MySQL初学人员的学习曲线,内容深入浅出,通俗易懂,可帮助初学人员迅速入门MySQL。
本书以案例的形式,介绍从思维模型分析到场景实践的数据分析方法。全书围绕“数据分析”与“运营增长”两大关键要素,在系统介绍数据分析思维、数据分析方法、数据采集技能、数据清洗技能等基础知识的同时,以问题为导向,解读运营与增长的关键性业务内容,在获客、*、留存、变现、自传播循环等各个核心运营环节展开数据分析实战。 本书提供案例相关数据集与源码包,适合数据分析、产品运营、市场营销等行业有数据分析具体业务需求的人士阅读,也适合相关专业的师生阅读。
Power BI 自 2015 年 7 月发布后,极大地改变了商业智能市场的格局,连续多年被评为商业智能产品的*。本书集合了 20 多套运用 Power BI 的 DAX 引擎来处理、分析常见商业问题的即用型解决方案。 DAX 设计模式是由 BI 领域*——阿尔贝托·法拉里和马尔科·鲁索总结并提出的。本书同时使用 Power BI 和 Excel 作为工具进行编写,并对应用模式进行了大幅更新,内容涵盖了时间智能、分组、ABC 分类、客户分析、购物篮分析等常用模式。本书所包含的每一套设计模式*经过不断的实践,被提炼为易用的数据模型和优雅的 DAX 公式。 本书适合 Excel *用户、商业智能分析人员、使用 DAX 和微软分析工具的专业人士阅读。
本书从初学者的角度循序渐进地讲述了MATLAB R2018b的基础知识和应用,全书共分2篇,第1篇为MATLAB基础知识,详细介绍了MATLAB R2018b概述、MATLAB使用初步、MATLAB数值计算及符号计算、MATLAB计算的可视化和GUI设计、 MATLAB程序设计、Simulink仿真、MATLAB应用程序接口等基础知识。第2篇为MATLAB应用,分别介绍了MATLAB工具箱概述,MATLAB在图像处理、优化设计、数字信号处理、控制系统、电力系统、深度学习中的应用,尤其对于MATLAB R2018b全新增加的深度学习功能进行了深入介绍,读者可在基础知识学习的同时进行上机练习。 本书内容深入浅出,简明扼要,结构清晰,方便读者选择学习阅读,适合广大科研及工程技术人员使用,也可作为高校理工科学生的专业教学用书和参考用书。
本书详细介绍了各种数据库的SQL查询技术和一些基础的SQL查询语句,并且通过实例操作的方式讲解了如何插入、更新和删除数据等相关知识。另外,本书还介绍了如何使用SQL语句进行日期处理,以及一些其他的SQL语句查询操作,能够帮助你掌握相关的SQL知识。
这是一本跟数据科学和数据科学家有关的“手册”,它还包含传统统计学、编程或计算机科学教科书中所没有的信息。 本书有3个组成部分:一是多层次地讨论数据科学是什么,以及数据科学涉及哪些其他学科;二是数据科学的技术应用层面,包括教程和案例研究;三是给正在从业和有抱负的数据科学家介绍一些职业资源。本书中有很多职业和培训相关资源(如数据集、网络爬虫源代码、数据视频和如何编写API),所以借助本书,你现在就可以开始数据科学实践,并快速地提升你的职业水平。
进入大数据时代,让数据开口说话将成为司空见惯的事情,本书将从大数据时代的前因后果讲起,全面分析大数据时代的特征、企业实践的案例、大数据的发展方向、未来的机遇和挑战等内容,展现一个客观立体、自由开放的大数据时代。