本书是一本系统介绍Clickhouse的指导型工具书,全书总共分为11章: 第1章 介绍ClickHouse的由来、发展历程、核心特点与核心特点。第2~6章 介绍了ClickHouse基础使用部分,包括整体架构、如何安装、数据定义、数据引擎、数据查询和函数的特性和使用方法。第7~9章介绍了ClickHouse高级特性部分,包括数据库管理操作,数据分片、数据副本和高可用的特性和使用方法。第10~11章介绍了如果自己手动实现ClickHouse中间件的思路和示例,同时也介绍了几款可视化工具与ClickHouse集成的方法。
内容介绍 本书从业务、数据、运营3个维度为电商的经营和决策提供了科学的方法论,是一部电商运营真经,真正做到了“业务中有数据,数据中有运营”。作者是资深的电商行业专家,从事电商数据分析与数据化运营10余年,本书是他在多个知名电商品牌操盘多个千万级项目的经验总结。 为了增强本书的趣味性和读者的角色代入感,本书采用了纪实和叙事的写作手法,书中虚拟了3个核心人物: ?Alex:临危受命、勇挑重担、运筹帷幄的BI部门经理(资深数据分析师)。 ?叶子:有电商行业从业经验但是不懂数据分析的业务员。 ?大白:从其他行业转型到电商行业的数据分析师。 全书有两条主线: ?暗线:叶子和大白在Alex的指导和帮助下成长为“精业务、精数据、精运营”的“三精”数据分析师的经历,这对数据分析师的职业规划和成长有重要借鉴意义。 ?明线:Alex将
本书分12章重点阐述了数据管理的重要性,数据管理面临的挑战,DAMA的数据管理原则,数据伦理,数据治理,数据生命周期管理的规划及设计,数据赋能和数据维护,使用和增强数据,数据保护、隐私、安全和风险管理,元数据管理,数据质量管理,以及现在应该怎么办,能够帮助企业管理层在了解和执行数据管理的过程中不致迷失在技术术语的迷宫之中。本书可供非数据专业人士、企业管理者、数据行业研究者等读者学习和参考。
本书是畅销书《SQL基础教程》第2版,介绍了关系数据库以及用来操作关系数据库的SQL语言的使用方法。书中通过丰富的图示、大量示例程序和详实的操作步骤说明,让读者循序渐进地掌握SQL的基础知识和使用技巧,切实提高编程能力。每章结尾设置有练习题,帮助读者检验对各章内容的理解程度。另外,本书还将重要知识点总结为“法则”,方便读者随时查阅。第2版除了将示例程序更新为对应近期新的DB的SQL之外,还新增了一章,介绍如何从应用程序执行SQL。
内容简介 这是一本写给互联网消费金融行业从业者的实战指南,从产品创新、业务架构、精细化运营、数字化转型等多个维度对互联网消费金融进行了有针对性的讲解。 作者是互联网消费金融领域的先行者和布道者,从行业兴起一直深耕至今,目前是知名互联网消费金融机构运营和技术负责人,对行业创新和应用架构有深刻理解,经验非常丰富,本书是他们多年从业经验的总结。 第1章简要介绍了互联网消费金融的核心概念、生态、趋势和痛点,旨在让读者对这个行业有一个整体认识; 第2章以构建成功的客户旅程为切入点,讲解了如何以用为为中心来设计互联网消费金融类产品,这是产品创新的关键; 第3~4章首先讲解了互联网消费金融的业务架构方法论,然后具体讲解了银行、消费金融公司、金融科技公司的互联网消费金融的业务架构; 第5~6章详细讲解了互联
刘振华著的《电商数据分析与数据化运营》从业务、数据、运营3个维度为电商的经营和决策提供了科学的方法论,是一部电商运营真经,真正做到了“业务中有数据,数据中有运营”。作者是资深的电商行业专家,从事商数据分析与数据化运营10余年,本书是他在多个知名电商品牌操盘多个千万级项目的经验总结。 为了增强本书的趣味性和读者的角色代入感,本书采用了纪实和叙事的写作手法,书中虚拟了3个核心人物: Alex:临危受命、勇挑重担、运筹帷幄的BI部门经理(资深数据分析师)。 叶子:有电商行业从业经验但是不懂数据分析的业务员。 大白:从其他行业转型到电商行业的数据分析师。 全书有两条主线: 暗线:叶子和大白在Alex的指导和帮助下成长为“精业务、精数据、精运营”的“三精”数据分析师的经历,这对数据分析师的职业
MySQL是流行的关系型数据库管理系统之一。书中从数据设计和数据库的基本使用开始介绍,逐步深入一些复杂的内容,包括连接查询的使用、子查询、字符串函数、数字函数、日期函数以及新版本的窗口函数,还包括存储过程、游标、创建高效的索引以及SQL优化技巧等。通过大量的示例应用,系统地讲述读者应该掌握的知识,以及对于数据库的优化,其中包括MySQL的架构以及MySQL 8的新特征,也包含MySQL基准测试和性能剖析,数据库软硬件性能优化,内存优化,复制、备份和恢复,高可用与高可扩展性,尤其对于MySQL中各种锁机制以及MySQL的MVCC的核心原理都一一通过理论和大量的示例进行解析,以方便读者理解。
内容简介 这是一部面向初级广告优化师、渠道运营人员的广告数据分析和效果优化的实战指南。 数据分析功底的深浅,决定了广告优化师能力水平的高低。这本书一方面告诉读者成为一名厉害的广告优化师需要掌握的数据分析技能,以及如何快速掌握这些技能;一方面又为读者总结了SEM广告、信息流广告、应用商店广告数据的分析方法论和效果优化的方法,以及多广告推广渠道的统筹优化。书中提供大量真实数据案例,助你提升广告数据分析的理论深度和业务水平。 全书一共8章: 第1-3章全面讲解了广告优化中的统计学,包括计学和广告数据定量分析的主要思想、统计学与广告优化的关系、广告数据分析中的统计学原理,以及如何用图表描述广告数据。 第4-7章依次讲解了SEM广告的优化痛点以及相应的数据分析解决思路、信息流广告优化面临的难点以及针对性的数
这是一部教你如何从0到1架构与实现一个企业级大数据平台的著作,是作者在大数据和系统架构领域超过20000小时的经验总结。作者从横向视角出发,手把手教你如何拉通Hadoop体系技术栈,以此搭建一个真实可用、安全可靠的大数据平台。通过阅读本书,一定能从本书的内容中找到灵感和思路来应对实际工作中面对的问题。
本书首先介绍如何设置基本的数据科学工具箱,然后带你进入数据改写和预处理阶段,这一部分主要是阐明所有与核心数据科学活动相关的数据分析过程,如数据加载、转换、修复以及数据探索和处理等。通过主要的机器学习算法、图形分析技术,以及所有易于表现结果的可视化工具,实现对数据科学的概述。 本书对上一版内容进行了全面拓展和更新,涵盖新版的Jupyter Notebook、NumPy、pandas和Scikit-learn等的新改进。此外,还介绍了深度学习(借助在Theano和Tensorflow平台上运行的Keras库)、漂亮的可视化(使用Seaborn和 ggplot)和Web部署(使用bottle)等新内容。 本书行文过程以数据科学项目为主体,辅以整洁的代码和简化的示例,能帮助你理解与项目相关的潜在原理和实际数据集。
本书是畅销书《SQL基础教程》第 2版,介绍了关系数据库以及用来操作关系数据库的SQL语言的使用方法。书中通过丰富的图示、大量示例程序和详实的操作步骤说明,让读者循序渐进地掌握SQL的基础知识和使用技巧,切实提高编程能力。每章结尾设置有练习题,帮助读者检验对各章内容的理解程度。另外,本书还将重要知识点总结为 法则 ,方便读者随时查阅。第 2版除了将示例程序更新为对应**新的DB的SQL之外,还新增了一章,介绍如何从应用程序执行SQL。
暂无内容简介。。。。。。
本书是热销书《SQL基础教程》的作者MICK为志在向中级进阶的数据库工程师编写的一本SQL技能提升指南。全书可分为两大部分。第一部分介绍了SQL语言不同寻常的使用技巧,带领读者重新认识CASE表达式、窗口函数、自连接、EXISTS谓词、HAVING子句、外连接、行间比较、集合运算、数列处理等SQL常用技术,发掘它们的新用法。这部分不仅穿插讲解了这些技巧背后的逻辑和相关知识,而且辅以丰富的示例程序,旨在帮助读者从面向过程的思维方式转换为面向集合的思维方式。第二部分介绍了关系数据库的发展史,并从集合论和逻辑学的角度讲述了SQL和关系模型的理论基础,旨在帮助读者加深对SQL语言和关系数据库的理解。此外,本书很多节的末尾设置有练习题,并在书末提供了解答,方便读者检验自己对书中知识点的掌握程度。本书适合具有半年以上SQL使用经验、已掌握S
手机是人们的电子设备,手机上的各种应用程序可以帮助人们更好地生活和工作。其中,大部分应用程序都是通过网络传输各种数据,以实现各种功能。为了了解这些应用程序的工作状态,需要抓取传输的网络数据,然后通过分析数据,了解应用程序的工作模式,防范恶意程序,保护用户信息。本书共7章,主要内容包括抓包基础知识、手机直接抓包、模拟器抓包、外部抓包、基础数据分析、HTTP/HTTPS数据抓包和分析、数据快速分析。本书适合手机应用开发人员、渗透测试人员、网络维护人员和信息安全爱好者阅读。通过本书的学习,可以帮助读者了解和掌握手机数据抓包的各种方式,熟悉手机应用常用的网络协议,并掌握对应数据的分析方式,从而保障手机信息安全。
本书全面分析介绍了数字营销领域,不仅对新平台、新指标、新的度量方式进行了详细解析,而且通过多种数字营销案例对工具在解读消费者行为方面的全过程应用进行了详细地描述,同时对市场上不同类别的工具进行了简要推荐介绍。本书语言轻松自然、通俗易懂,适用于现代的、以数据为导向的市场营销从业人员,或市场营销专业的高校学生。
本书是目前有关数据挖掘在数据化运营实践领域比较全面和系统的著作,也是诸多数据挖掘书籍中为数不多的穿插大量真实的实践应用案例和场景的著作,更是创造性地针对数据化运营中不同分析挖掘课题类型,推出一一对应的分析思路集锦和相应的分析技巧集成,为读者提供“菜单化”实战锦囊的著作。作者结合自己数据化运营实践中大量的项目经验,用通俗易懂的“非技术”语言和大量活泼生动的案例,围绕数据分析挖掘中的思路、方法、技巧与应用,多方面整理、总结、分享,帮助读者深刻领会和掌握“以业务为核心,以思路为重点,以分析技术为辅佐”的数据挖掘实践应用宝典。 全书共19章,分为三个部分:基础篇(靠前~4章)系统介绍了数据分析挖掘和数据化运营的相关背景、数据化运营中“协调配合”的核心,以及实践中常见分析项目类型;实战篇(
本书以面向应用为原则,深入浅出的介绍了oracle平台上使用pl/sql语言进行数据库开发的技术。通过大量的示例,详细介绍了pl/sql的语言特性、使用技巧,同时配以2个在实际工作中的示例来深入的剖析了pl/sql进行oracle开发的方方面面。 本书附带1张dvd光盘,内容为作者为本书录制的全程语音教学视频及本书所涉及的源代码。 本书共分为20章,分为5大篇。涵盖的内容主要有pl/sql语言基础、开发环境、变量与类型、控制语句、数据表的管理和查询、数据表的操纵、使用pl/sql的记录与集合、各种内置函数、游标、事务处理、异常处理、子程序、包、面向对象的开发等等技术点。通过示例性的代码,由浅入深,详细介绍了每一个技术要点在实际工作中的应用,对于各种技术要点的应用场合进行了细致的分析。 本书适合于使用pl/sql进行应用程序开发的人员、对软件开发有兴趣
本书站在大数据落地应用的角度,系统阐述大数据从数据收集,到数据存储、分布式协调及资源管理、计算引擎、分析工具,再到数据可视化这一完整流程,本书既包含主要技术的实现原理及其框架,也包含了具体落地指导,是帮助企业和个人整体了解大数据框架的参考书。本章主要包括6个部分共16章的内容,其中:第壹部分介绍了大数据体系架构,以及Google和Hadoop技术栈;第二部分介绍大数据分析相关技术,主要涉及关系型数据收集工具Sqoop与Canel、非关系型数据收集系统Flume以及分布式消息队列Kafka;第三部分介绍大数据存储相关技术,涉及数据存储格式、分布式文件系统以及分布式数据库;第四部分介绍资源管理和服务协调相关技术,涉及资源管理和调度系统YARN以及资源协调系统ZooKeeper;第五部分介绍计算引擎相关技术,涉及批处理、交互式处理以及流式实时
本书完整全面地讲述数据挖掘的概念、方法、技术和近期新研究进展。本书对前两版做了全面修订,加强和重新组织了全书的技术内容,重点论述了数据预处理、频繁模式挖掘、分类和聚类等的内容,还全面讲述了OLAP和离群点检测,并研讨了挖掘网络、复杂数据类型以及重要应用领域。 本书是数据挖掘和知识发现领域内的所有教师、研究人员、开发人员和用户都的参考书,是一本适用于数据分析、数据挖掘和知识发现课程的优秀教材,可以用做高年级本科生或者一年级研究生的数据挖掘导论教材。
这是一部指导信贷业务如何用智能风控、反欺诈的技术和方法实现风险控制的著作。 作者是经验丰富的智能风控算法专家,先后就职于头部的互联网公司的金融部门以及头部的公募基金公司,致力于人工智能算法在信贷风控领域的应用。 本书不仅体系化地讲解了智能风控和反欺诈的体系、算法、模型以及它们在信贷风控领域实践的全流程,而且还从业务和技术两个角度讲解了传统的金融风控体系如何与智能风控方法实现双剑合璧。全书以实战为导向,辅以多个用Python实现的综合案例,便于读者理解和实操。 全书共10章,逻辑上分为四个部分: 第1~3章是风控业务的基础,首先介绍了什么是信用风险和欺诈风险,然后讲解了传统风险管理体系中搭建评分卡的思路,以及智能风控时代数据和模型的技术框架。 第4~6章集中讲述了智能风控中常见的特征工程、算法原理和建
本书概要介绍了如何使用Hadoop和Spark处理数据科学涉及的一系列主题:数据提取、数据再加工(datamunging,通常包含数据清洗和整合)、特征提取、机器学习、预测建模、异常检测和自然语言处理。整书侧重于具体的例子,并通过不同方式来提供对商业价值的洞察,全书共分三部分,第 一部分包括第1、2、3章,第二部分包括第4、5、6章,第三部分包括第7、8、9、10、11、12章,后在附录中提供了本书参考材料。