《数据分析思维:分析方法和业务知识》分为两大部分: 方法篇 和 实战篇 。 方法篇 介绍了数据分析中常用的业务指标、分析方法以及如何用数据分析解决问题的步骤。 实战篇 讲解了如何应用*篇的方法来解决工作中的问题,分享十二个行业(国内电商、跨境电商、金融信贷、金融第三方支付、家政、旅游、在线教育、运营商、内容、房产、汽车、零售)的业务知识,以及该行业内用数据分析解决问题的实例。每个行业都包括业务模式、业务指标、案例分析三方面的内容。 通过本书的学习,你会熟悉数据分析的方法,并将其灵活应用在自己所处的行业中。
《数字化生存》描绘了数字科技为我们的生活、工作、教育和娱乐带来的各种冲击和其中值得深思的问题,是跨入数字化新世界的*指南。英文版曾高居《纽约时报》畅销书排行榜。 信息的DNA 正在迅速取代原子而成为人类生活中的基本交换物。尼葛洛庞帝向我们展示出这一变化的巨大影响。电视机与计算机屏幕的差别变得只是大小不同而已。从前所说的 大众 传媒正演变成个人化的双向交流。信息不再被 推给 消费者,相反,人们或他们的数字勤务员将把他们所需要的信息 拿过来 并参与到创造它们的活动中。信息技术的革命将把受制于键盘和显示器的计算机解放出来,使之成为我们能够与之交谈,与之一道旅行,能够抚摸甚至能够穿戴的对象。这些发展将变革我们的学习方式、工作方式、娱乐方式 一句话,我们的生活方式。犀利的见解使尼葛洛庞帝成为《连线》
《人人会建的大数据可视化大屏》重点阐述数据可视化的重要性、基本概念、主要应用和意义,通过需求梳理、数据准备、屏幕测算、合理布局、图表颜色等方面的设计,呈现数据分析的关键指标,增强数据的可读性。同时,以海致科技集团自主研发的伏羲数据可视化平台应用为例,通俗易懂地介绍伏羲数据可视化大屏设计思路、组件功能和制作方法,举例说明公安、金融、交通、能源、司法等领域的数据大屏应用。 《人人会建的大数据可视化大屏》适于各行各业大数据可视化工程师、数据分析人员、大数据爱好者、人工智能从业人员、计算机软件应用专业的在读大学生等参阅。
《中文版 SPSS 28 统计分析从入门到精通(实战案例版)》详细介绍了 SPSS 28 在数据统计分析方面的使用方法 和应用技巧,它是一本 SPSS 基础教程,同时包含了大量的 SPSS 视频教程。 《中文版 SPSS 28 统计分析从入门到精通(实战案例版)》全书共 20 章,内容包括 SPSS 28 概述、初识 SPSS 28、SPSS 数据结构、数据管理、数据分类、数据清洗和数据加工、数据计算、数据分析图表、数据分布的特征分析、参数检验、非参数检验、均值分析、单因素方差分析、多因素方差分析、相关性分析、列联表相关性分析、回归分析、聚类分析、判别分析和电力中断数据分析实例等知识。通过丰富的实例,详细介绍了 SPSS 数据统计分析的全方位知识。本书在讲解过程中理论联系实际,并配有详细的操作步骤,图文对应,可以提高读者的动手能力,并加深对知识点的理解。 《中文版 SPSS 28
《Spark入门与大数据分析实战》基于Spark 3.3.1框架展开,系统介绍Spark生态系统各组件的操作,以及相应的大数据分析方法。《Spark入门与大数据分析实战》各章节均提供丰富的示例及其详细的操作步骤,并配套示例源码、PPT课件和教学大纲。 《Spark入门与大数据分析实战》共分11章,内容包括Scala编程基础、Spark框架全生态体验、Spark RDD、Spark SQL、Kafka、Spark Streaming、Spark ML、Spark GraphX、Redis等技术框架和应用,并通过广告点击实时大数据分析和电影影评大数据分析两个综合项目进行实战提升。 《Spark入门与大数据分析实战》适合Spark框架初学者,既可以作为大数据分析技术、大数据应用开发工程师的查询手册,也可以作为高等院校或高职高专计算机技术、软件工程、数据科学与大数据科学、智能科学与技术、人工智能等专业大数据课程的教材。
本书面向MATLAB的初、中级读者,在介绍MATLAB R2022a集成环境的基础上,对MATLAB使用中常用的知识和工具进行了详细的介绍。书中各章均提供了大量有针对性的示例,可供读者进行实战练习。 根据内容的侧重点不同,全书分为4部分,共20章:第1~5章为基础部分,第6~11章为数学应用部分,第12~16章为工程应用部分,第17~20章为高级应用部分。为了使读者能够更好地操作MATLAB,本书中示例的命令已记录在M文件及其他相关文件中,读者可以将相关的目录设置为工作目录,直接使用M文件进行操作,以便快速掌握MATLAB的使用方法。
本书以案例的形式,介绍从思维模型分析到场景实践的数据分析方法。全书围绕 数据分析 与 运营增长 两大关键要素,在系统介绍数据分析思维、数据分析方法、数据采集技能、数据清洗技能等基础知识的同时,以问题为导向,解读运营与增长的关键性业务内容,在获客、激活、留存、变现、自传播循环等各个核心运营环节展开数据分析实战。 本书提供案例相关数据集与源码包,适合数据分析、产品运营、市场营销等行业有数据分析具体业务需求的人士阅读,也适合相关专业的师生阅读。
"数据科学项目日益增多,每个项目在提出原型到生产的过程中都需要可靠的基础设施。使用《Effective数据科学基础设施》介绍的一些新技术和新工具,你将能建立一个适用于各类组织(无论是初创企业还是大型企业)的基础设施堆栈。 《Effective数据科学基础设施》可帮助你建立数据流程和项目工作流,为你开发项目带来强大动力。《Effective数据科学基础设施》呈现Netflix数据操作的**进工具和概念,并在此基础上介绍一种可定制的基于云的模型开发和MLOps方法,可轻松适应公司的特定需求。当团队把数据科学和机器学习应用于广泛的业务问题时,这些实用的数据流程将更高效地生成更完美的结果。 主要内容 ● 在云中处理计算和编排 ● 将基于云的工具耦合到一个内聚的数据科学环境中 ● 使用Metaflow、AWS和Python数据生态系统开发可复制的数据科学项目 ● 构建需要大型
基于内存的Redis数据库日趋红火,广受程序员关注。本书将以Redis6.2.0版本作为主讲版本,同时单独测试了Redis7.0.0版本新赠的主要功能。本书主要内容分基础篇、提高篇、实战篇,由浅入深、层层递进地进行介绍。基础篇重点介绍Redis的基础命令;提高篇主要介绍磁盘持久化、主从复制、分布式集群、事务、Lua脚本、管道、缓存、发布、订阅、Redis Stream消息队列、I/O线程、安全等各种高级技术;实战篇则介绍编程语言Java、Python、C、GO、PHP调用、大规模应用案例、实用辅助工具、电商应用实战案例。本书提供习题、实验及相关配套内容,即可供高校教学使用,又可供IT工程师自学使用。
在大数据爆发的短短10多年中,NoSQL成为处理大数据必须掌握的热门核心技术之一。《NoSQL数据库入门与实践(基于MongoDB、Redis)(第2版)》正是在这种背景下应运而生的,本书结合MongoDB、Redis和测试工具等全面介绍NoSQL数据库技术,是一本NoSQL数据库入门图书,也是初学者了解NoSQL 技术全貌的图书。全书包括3部分,其中NoSQL基础部分包括初识NoSQL、TRDB与NoSQL的技术比较、NoSQL数据存储模式;NoSQL实践部分(电商大数据)分别介绍了文档数据库MongoDB和键值数据库Redis 入门及提高知识,并通过两个电商平台综合案例详细介绍了MongoDB和Redis在实现不同业务(如日志存储、商品评价、订单信息记录、点击量存储、商品推荐、购物车、记录浏览商品行为等)功能模块开发过程中的具体应用;NoSQL提高部分(电商大数据〉介绍了大数据环境下MongoDB和Redis 在操作速度和数据存储方面的优化方法
《SAS数据分析》详细阐述了与SAS数据分析相关的基本解决方案,主要包括SAS编程入门,数据操控和转换,合并、索引、加密和压缩技术,统计、报表、转换过程和函数,高级编程技术:SAS宏,函数、选项和自动变量,Proc SQL高级编程技术,深入理解Proc SQL,数据可视化,报表机制和数据传输系统等内容。此外,本书还提供了相应的示例、代码,以帮助读者进一步理解相关方案的实现过程。 本书适合作为高等院校计算机及相关专业的教材和教学参考书,也可作为相关开发人员的自学用书和参考手册。
Hive是基于Hadoop的一个数据仓库工具,用来进行数据的提取、转换、加载,这是一种可以存储、查询和分析存储在Hadoop中的大规模数据的机制。Hive能将结构化的数据文件映射为一张数据库表,并能提供SQL查询分析功能,将SQL语句转换成MapReduce任务来执行,从而实现对数据进行分析的目的。本书配套示例源码、PPT课件、教学大纲。本书可作为Hive数据仓库初学者的入门书,也可作为Hive大数据分析与大数据应用开发工程师的指导手册,还可作为高等院校或者高职高专计算机技术、人工智能、大数据技术及相关专业的教材或教学参考书。 《Hive入门与大数据分析实战》共分11章,内容包括数据仓库与Hive、Hive部署与基本操作、Hive语法基础、Hive数据定义、Hive数据操作、Hive查询、Hive函数、Hive数据压缩、Hive调优、基于Hive的网站流量分析项目实战、旅游酒店评价大数据分析项
本书以 实战、实用、实效 为原则,充分考虑智慧公安、智慧交通、智慧金融、智慧城市等用户的大数据应用痛点,紧贴大数据实践的业务场景,汇集数据分析模型全生命 周期的关键应用技术,包括数据准备、工作表管理、可视化图表创建、数据大屏制作、数据模型创建和自定义算子设计等内容。 本书内容通俗易懂,案例丰富,图文并茂,同时配有教学视频和建模平台,适合初级、中级数据分析师和广大数据分析爱好者参考学习。通过本书,读者无须具备计算机、 软件开发等专业知识背景,即可熟练掌握大数据分析建模的基本方法和技巧。
《MySQL数据库开发与管理实战(微课视频版)》是一本系统讲解MySQL数据库开发与管理应用的实战教程、视频教程。该书从MySQL基础用法讲起,由浅入深地讲解了MySQL数据库开发与管理的各方面应用。全书共4篇,第1篇为MySQL基础篇,内容包括MySQL概述、MySQL安装;第2篇为必会SQL篇,内容包括数据库和表、数据查询、数据更新与删除、复杂查询、常用函数;第3篇为MySQL进阶篇,内容包括触发器、存储过程、索引、事务、性能优化、高可用MySQL、MySQL 8重要新特性;第4篇为MySQL管理篇,内容包括用户与权限、数据备份与恢复、日志管理、MySQL监控。技术学习必须理论与实践相结合,本书理论的讲解配备了大量的实例操作和视频讲解,实用性强,旨在帮助MySQL数据库的使用者快速掌握其用法,提升实战应用水平。 《MySQL数据库开发与管理实战(微课视频版)》适合学习MySQL的新
《Oracle PL/SQL从入门到精通》是一本 覆盖 OCP 认证内容、带有视频讲解、浅显易懂、幽默风趣、实例丰富、 可操作性很强 的Oracle PL/SQL程序设计入门用书,适用于Oracle 12c、Oracle 11g、Oracle 10g、Oracle 9i等多个版本。 《Oracle PL/SQL从入门到精通》主要内容有:Oracle的安装及相关配置,PL/SQL程序设计语言概述,Oracle SQL Developer简介,常用的SQL*Plus命令,PL/SQL变量的声明与使用,编写PL/SQL语言的可执行语句,PL/SQL与Oracle服务器之间的交互,分支(条件)语句,PL/SQL语言的循环语句,PL/SQL中常用的组合数据类型,SQL游标(cursor),显式cursor的高级功能,PL/SQL程序中的异常处理,过程的创建、维护和删除,函数的创建、维护和删除,PL/SQL软件包,PL/SQL软件包的高级特性和功能,数据库触发器,批量绑定及高级触发器特性, PL/SQL程序代码设计上的考虑、Oracle自带软件包及数据库
Apache Flink项目的资深贡献者Fabian Hueske和Vasiliki Kalavri展示了如何使用Flink DataStream API实现可伸缩的流式应用,以及怎样在业务环境中持续运行和维护这些应用。流处理的理想应用场景有很多,包括低延迟ETL、流式分析、实时仪表盘以及欺诈检测、异常检测和报警。你可以在任意类型的持续数据(包括用户交互、金融交易和物联网等数据)生成后,立即对它们进行处理。本书主要内容包括: 了解有关分布式状态化流处理的概念和挑战。 探索Flink的系统架构,包括事件时间处理模式和容错模型。 理解DataStream API的基础知识和构成要素,包括基于时间和有状态的算子。 以精确一次的一致性读写外部系统。 部署和配置Flink集群。 对持续运行的流式应用进行运维。
网络图的表征能力异常强大,它能够对事物之间任意类型的相互作用关系进行建模,因此网络图数据在生物信息、交通网络、科研合作、万维网和社交网络等领域的一系列实际场景中随处可见。图数据挖掘用于从图数据中发现有用的信息和知识。然而,网络中节点和链路及其半结构形式的复杂性在各种计算任务,如节点分类、链路预测和图分类等方面提出了挑战。在这一背景下,研究人员最近提出了各种前沿的图机器学习算法,包括图嵌入和图神经网络,显著地提升了图数据挖掘的性能。 《图数据挖掘:算法、安全与应用》提供了对图数据挖掘方法的**评述,在此基础上引申出一个前沿课题,即图数据挖掘的安全性问题,并介绍了一系列检测方法来识别图数据中的对抗样本。此外,它向读者介绍了图数据增强和子图网络以进一步增强模型,即提高其准确性和鲁
《专业SCRUM:敏捷要领与项目实践》分为8 章,分别介绍了如何持续改进Scrum 实践,如何打造坚实的团队基础、如何交付 完成 的产品增量、如何提高交付的价值、如何改进计划、如何帮助Scrum 团队改进和成长、组织如何改进以及如何实现业务敏捷。无论是Scrum Master、团队还是产品负责人,都可以借鉴书中提供的大量实用性建议,克服常见的难题,持续改进Scrum 实践。
本书系统地介绍了用户行为分析的理论基础和实施步骤,书中列举了大量翔实的应用案例。第1~2章概要介绍了用户行为分析的基础知识和应用场景。第3~4章详细介绍了基于大数据的用户行为数据的采集、存储和处理方法的技术原理和实施步骤,以及常用的采集与分析工具。第5~6章重点介绍了用户行为分析的常用指标和用户模型构建,以及用户行为分析在企业日常运营中的具体应用。书中详细阐述了用户行为全程追踪方法,介绍了转化分析、用户分群、用户生命周期、用户流失预警、用户价值管理等经典的精细化运营模型。第7~9章详细介绍了用户画像和标签体系的构建方法、步骤,阐述了用户画像在推荐系统和智能营销中的具体应用。第10章详细阐述了用户行为分析在若干个不同行业的经典应用案例,包括金融、电商、房地产、快销品、互联网媒体等行业。本
对数据生产和大数据处理带来的挑战,是当代社会和人工智能时代的重点。大数据的快速发展、信息共享和社交媒体的大众化带来了各方面的风险和挑战。我们需要遵循正确的流程、方法和沟通战略 且手头的数据必须准确,才能推演出高价值的结论。而数据越多,我们面临的陷阱可能就越深。在本书中,杰森?辛克从数据通用和收集的策略、数据分析的准则、数据展示的策略出发,讨论了应对数据挑战、获得和洞察数据的价值和内涵的可行方式。
Origin是国际科技出版界公认的标准作图软件,它功能强大、操作简单,被科研人员、工程技术人员、高校师生等广泛使用。Origin软件不仅具有强大的数据可视化功能,还具有统计分析、信号处理、函数拟合、峰值分析等功能,且支持多种格式的数据导入和导出。 本书基于Origin 2021和Origin 2022版本进行案例讲解,旨在帮助读者快速入门,并掌握Origin软件的使用技巧。本书由浅入深地讲解了Origin软件的功能和相关案例,涉及基础2D图、等高线图、3D图以及专业图的绘制,也涵盖了数学运算、拟合分析、信号处理、多峰分析等主题。 本书适用于Origin软件的初学者和希望提高科技绘图及数据分析处理能力的读者,尤其适用于大中专院校的师生以及广大科研工作者。