本书分12章重点阐述了数据管理的重要性,数据管理面临的挑战,DAMA的数据管理原则,数据伦理,数据治理,数据生命周期管理的规划及设计,数据赋能和数据维护,使用和增强数据,数据保护、隐私、安全和风险管理,元数据管理,数据质量管理,以及现在应该怎么办,能够帮助企业管理层在了解和执行数据管理的过程中不致迷失在技术术语的迷宫之中。本书可供非数据专业人士、企业管理者、数据行业研究者等读者学习和参考。
本书是为广大数据分析师量身定制的入门读物,它旨在帮助读者站在大数据时代的制高点。数据分析处于统计学、计算机信息科学、运筹学、数据库等多个领域的交叉地带,大数据时代的到来大大丰富了数据分析的内涵,数据分析师的职责与以往相比发生了巨大的改变。本书全面介绍了经典数据分析、模式识别、机器学习、深度学习、数据挖掘、商务智能等多个领域的数据分析算法,将大数据时代的数据分析热点技术一网打尽。本书为每个数据分析算法都搭配了一个经典案例,并按照由易到难的原则构建知识框架,充分照顾了不同水平读者的阅读习惯。通过阅读本书,读者将对大数据时代下的数据分析有一个全面的认识。无论是入门级的数据分析员还是有一定基础的数据分析师,都能通过本书完善、加深对数据分析的认识。
数据是数字经济的关键生产要素与核心资源。数据要素市场的培育是一个动态演化和持续迭代的过程,而信任的建立是市场建设的关键一步。本书通过“信任”这一视角,对数据流通进行全方位的解读,对中国数据要素市场的建设实践进行回顾与展望。基于“TIME”分析框架,对数据可信流通技术、数据流通机构、可信的数据流通模式以及促进数据可信流通的治理方案进行全面系统的介绍。本书旨在为数据要素市场参与者、数字经济从业者、数据治理人员以及关注数据流通交易的读者提供实用的参考,帮助他们理解数据流通的可行模式,破解数据要素市场发展难题,充分释放数据要素流通潜力,赋能实体经济高质量发展。
本书主要介绍大数据可视化的基本概念和相应的技术应用。全书内容共10章,分别为大数据可视化概述、大数据可视化原理、大数据可视化方法、数据可视化工具、Excel数据可视化、Tableau数据可视化、ECharts与pyecharts数据可视化、Python数据可视化、大数据可视化行业分析以及大数据可视化综合实训。 本书将理论与实践操作相结合,通过大量的案例帮助读者快速了解和应用大数据分析的相关技术,并且对于书中重要的、核心的知识点加大练习的比例,以使读者达到熟练应用的目的。 本书可作为大数据、云计算、软件技术、信息管理、计算机网络等专业的教材,可也作为大数据爱好者的自学参考书。
内容介绍 本书从业务、数据、运营3个维度为电商的经营和决策提供了科学的方法论,是一部电商运营真经,真正做到了“业务中有数据,数据中有运营”。作者是资深的电商行业专家,从事电商数据分析与数据化运营10余年,本书是他在多个知名电商品牌操盘多个千万级项目的经验总结。 为了增强本书的趣味性和读者的角色代入感,本书采用了纪实和叙事的写作手法,书中虚拟了3个核心人物: ?Alex:临危受命、勇挑重担、运筹帷幄的BI部门经理(资深数据分析师)。 ?叶子:有电商行业从业经验但是不懂数据分析的业务员。 ?大白:从其他行业转型到电商行业的数据分析师。 全书有两条主线: ?暗线:叶子和大白在Alex的指导和帮助下成长为“精业务、精数据、精运营”的“三精”数据分析师的经历,这对数据分析师的职业规划和成长有重要借鉴意义。 ?明线:Alex将
本书通过选购笔记本电脑的案例引入数据包络分析(dataenvelopmentanalysis,DEA)的基本概念和模型,并运用简单的EXCEL模型让读者更易理解和运用DEA。本书着重阐述如何将DEA作为一种运营分析工具,进行绩效评估,找出基准标杆。探讨的主题包括:平衡的基准,昀佳实践,相对效率的概念及绩效提升。特别地,本书探讨的数据分析方法能够帮助一个组织重新审视它对生产效率高低的已有观点是否合理,并为组织不断改进提供指导。本书是市面上唯一本不要求读者具备线性规划和线性代数知识,就可以熟练应用DEA方法的DEA方法指导用书。
本书从理论知识入手,结合数据仓库的概念帮助读者更好地理解Hive,在掌握Hive相关理论知识的基础上,逐步深入地学习Hive。 工欲善其事,必先利其器 ,首先从创建虚拟机并安装Linux操作系统开始逐步完成Hive的部署,然后在部署完成的Hive环境基础上,学习Hive数据定义语言、Hive数据操作语言和Hive数据查询语言的相关操作,在学习了上述三种语言之后,接下来深入学习Hive的其他功能,包括Hive内置函数、Hive自定义函数、Hive的新特性事务以及Hive的相关优化,从而帮助读者掌握Hive的强大功能和特性。后,本书通过一个综合项目 教育大数据分析平台,使读者对Hive数据仓库在实际应用中涉及的相关知识内容具有更深入的理解,在此项目中不仅会涉及使用Hive实现数据仓库分层、数据转换和数据分析的相关操作,而且还涉及使用Sqoop将数据仓库中的数据进行导出和导入,以
本书是中山大学重点学科建设成果,获中国矿物岩石地球化学协会大数据与数学地球科学专业委员会推荐,是我国*部地质科学大数据与机器学习教材。本书是中山大学研究生试用研究型教材,对运用大数据挖掘与机器学习算法解决地球科学问题大有裨益。适合地质科学领域研究生和高年级本科生做教材,也可供科研人员研究时参考。它系统地介绍了地球科学大数据挖掘与机器学习的基本框架与原理,重点分析高维数据的降维、分类与预测、大图形社区结构识别、无限流数据处理、机器学习及人工智能地质学的建模过程,对必要的应用场景,使用Python语言给出案例。
大数据系列丛书大数据导论周苏王文编著清华大学出版社北京内容简介这是一个大数据爆发的时代。面对信息的激流、多元化数据的涌现,大数据已经为个人生活、企业经营,甚至国家与社会的发展都带来了机遇和挑战,大数据已经成为IT信息产业中*潜力的蓝海。 大数据导论 是一门理论性和实践性都很强的课程。本教材针对信息管理、经济管理和其他相关专业学生的发展需求,系统、全面地介绍了关于大数据技术与应用的基本知识和技能,详细介绍了大数据与大数据时代、大数据的可视化、大数据的商业规则、大数据时代的思维变革、大数据促进医疗与健康、大数据激发创造力、大数据预测分析、大数据促进学习、大数据在云端、支撑大数据的技术、数据科学与数据科学家和大数据的未来等内容,具有较强的系统性、可读性和实用性。本书是为高等院校相关专业
生态学数据分析:方法生态学研究需要从原始数据出发,通过系列计算分析,最后作出具有生态意义的解释?本书主要介绍PCORDfor Windows?CanocoforWindows?CurveExpert?SPSS和PAST 等软件在生态学数据转换?标准化?函数拟合?遗传多样性?物种多样性?生态位?空间分布格局?聚类?排序和实验数据统计检验上的应用方法?应用QBASIC和R 语言对书中的部分方法编制程序?书中的每一种方法均提供模拟数据,介绍具体的操作步骤??程序与软件
随着互联网 下半场 的到来,企业经营思路发生了重大转变,由野蛮式增长逐步向精细化运营过渡,数据成为了各大企业制胜的法宝。与之对应的是,传统的以用户体验、产品功能为主要工作内容的产品经理市场饱和度越来越高,求职竞争越来越激烈,而壁垒却越来越弱,用数据赋能业务的产品经理则在招聘市场上供不应求,策略产品经理就是其中之一。本书主要从职业发展、技能体系、工作过程以及方法论沉淀等角度来生成策略产品经理的画像,旨在帮助有志成为一名策略产品经理的人士了解策略产品经理需要具备的基本素质与能力、他们是如何工作的,以及成为一名策略产品经理的学习路径。本书适合计划成为一名策略产品经理的在校生学习,也可以为想转型为策略产品经理的职场人士提供参考。另外,也很欢迎现阶段正在从事策略产品经理工作的同行阅读本
近些年,互联网促进经济迅速发展,越来越多的企业把互联网当作产品营销的重要渠道。网络营销依托着计算机设备和网络资源,凭借其优势成为这个时代高效的宣传推广方式。企业网站是在互联网上进行网络营销和形象宣传的平台,而本书从网站定位到数据化运营,贯穿整个网站的生命周期,研究网站定位、网站策划与布局、网站更新维护、网站数据挖掘及应用、数据驱动运营、移动网站运营的具体策略,涵盖了网站运营的精髓与核心内容,并结合企业实战经验,分析了大量的网站运营经典案例,为网站运营人员提供全面而科学的运营知识和策略。
本书共分14章,内容主要有R语言简介、数据读取与写入的方法,条件判断、循环等流程控制以及自定义函数,高级绘图、低级绘图、交互式绘图的说明,决策树、支持向量机、人工神经网络的介绍,基本统计、机器学习、数据挖掘、文本挖掘、大数据分析的应用,层次聚类法、K平均聚类算法、模糊C平均聚类算法、聚类指标、基因算法及人工蜂群算法的应用。本书适合没有程序设计经验、想要接触R语言的人以及对统计、机器学习、数据挖掘、文本挖掘、大数据分析有兴趣的人阅读。
这是一部教你如何从0到1架构与实现一个企业级大数据平台的著作,是作者在大数据和系统架构领域超过20000小时的经验总结。作者从横向视角出发,手把手教你如何拉通Hadoop体系技术栈,以此搭建一个真实可用、安全可靠的大数据平台。通过阅读本书,一定能从本书的内容中找到灵感和思路来应对实际工作中面对的问题。
本书详细介绍了数据可视化和数据挖掘技术研究现状,并以煤层气产业为例,介绍了煤层气田数据可视化与挖掘系统的应用与需求分析,详细描述了系统总体架构方案、功能模块设计、主要流程算法,以及系统开发成果等内容。
数据挖掘,继承和发展经典统计分析的理论成果,结合现代机器学习方法,借助大规模高性能计算不断逼近大数据规律真相,突破了传统数据分析方法的大数据应用局限;R语言,以其开源性、易用性、全面性、前沿性和可扩充性,是实现大数据分析实践的有效工具。《R语言数据挖掘》努力坚持:讲明白理论原理,讲明白案例问题,讲明白实现步骤,讲明白结果含义的写作风格,围绕大数据分析的四大核心问题:建立数据预测模型,揭示数据内在结构,探究数据关联性,诊断异常数据,以应用案例为线索,深入浅出地讨论了众多经典数据挖掘方法原理,完整详细地讲解了R语言实现过程。本书可作为高等院校统计学、数据科学和大数据技术、大数据管理等相关专业本科生和研究生数据挖掘、机器学习和其他数据分析课程的教材,也可作为科研机构、政府和企业经营管
卢辉编著的《数据挖掘与数据化运营实战(思路方法技巧与应用)》是目前有关数据挖掘在数据化运营实践领域比较全面和系统的著作,也是诸多数据挖掘书籍中为数不多的穿插大量真实的实践应用案例和场景的著作, 是创造性地针对数据化运营中不同分析挖掘课题类型,推出一一对应的分析思路集锦和相应的分析技巧集成,为读者提供“菜单化”实战锦囊的著作。作者结合自己数据化运营实践中大量的项目经验,用通俗易懂的“非技术”语言和大量活泼生动的案例,围绕数据分析挖掘中的思路、方法、技巧与应用, 整理、总结、分享,帮助读者深刻领会和掌握“以业务为核心,以思路为重点,以分析技术为辅佐”的数据挖掘实践应用宝典。 《数据挖掘与数据化运营实战(思路方法技巧与应用)》共19章,分为三个部分:基础篇( ~4章)系统介绍了数据分析
MTA国际认证系列教材针对微软MTA国际认证软件研发工程师、数据库管理工程师、MTA信息技术专业工程师三大方向,以MTA认证标准为指导、结合实际生产环境,在参考了大量相关资料的基础上,对MTA认证考试中的重点和难点进行深度分析,配以丰富的示例代码、习题等来模拟工作要求与环境,内容由浅入深、循序渐进,图文并茂、结构合理、可操作性强,希望帮助读者更好、更快地掌握核心知识及技能,顺利通过MTA认证考试,提升职业能力。 MTA数据库基础知识认证将提供成功考取MCDBA等高级认证必不可少的重要“起跑线”和基本知识。如果考生是一位商业方面的专业人员,希望培养或提高自身的数据库技能,MTA数据库基础知识培训和认证可为考生提供数据库方面的基础知识,帮助考生通过更有意义的方式制定有关数据库的业务及技术决策。除此之外,MTA数据
数据分析方法(第二版)
随着移动通信和行动装置普及、物联网和网络发 展,以及云端技术的不断进步,现今数据产生、搜集 和储存方式比以往*为方便。数据挖掘与大数据分析 可以从海量数据中,找到值得参考的样型或规则,转 换成有价值的信息、洞察或知识,创造*多新价值。 由简祯富、许嘉裕编*的《大数据分析与数据挖 掘》主要介绍数据挖掘与大数据分析的理论方法与实 践应用,并加入丰富的实务案例介绍,具体说明如何 应用数据挖掘与大数据分析技术以解决真实问题,深 入浅出地剖析从数据中掏金的秘诀。全书其分为13章 ,内容涵盖数据挖掘基本概念与数据准备、数据挖掘 的方法与实证、数据挖掘的进阶运用;书中也提供R 语言与编程实例辅以说明,使读者*能融会贯通地应 用数据挖掘方法,进而提升大数据分析和数字决策能 力。
医学科学直接关乎全人类生命健康,在大数据即将被纳入国家战略的今天,如何以数据创新探索未来的医学科学,如何在庞大的数据资源中快速获取信息、提升人类医疗集体经验,是亟待探讨的现实问题。 《医疗大数据》的编撰集结了中国医学科研先锋人才,首先从医疗信息化历史沿革入手,结合大数据时代下的国内外医疗现状,给出了医疗大数据的基本概念和变革内容。《医疗大数据》的主要内容包括定义、分类、描述、生命周期和技术;其次基于数据视角,研究了医疗大数据资源、医疗大数据安全等问题;然后针对不同场景,罗列了临床、药学、中医、针灸和公共卫生等多种大数据应用实例,解析了区域医疗和健康物联两大主题中的大数据服务问题,以此对未来医疗进行了全景式展望。 《医疗大数据》主要作为医学领域从事医疗大数据研究工作者的参考书
本书全面阐释了大数据的概念、相关的技术和应用的现状,使读者对大数据的相关技术、应用和产业链能有一个比较清晰的认识。 全书共 11 章,主要内容包括大数据概论、数据组织存储技术、NoSQL、Hadoop 和 MapReduce、数据查询和分析高级技术、数据挖掘技术、数据分析语言 R、大数据用于预测和决策、大数据与市场营销、大数据应用案例、大数据应用主流解决方案等。 本书在内容的选择上进行了深入的思考,不论是大数据领域的初学者还是具备一定相关专业知识的读者都能从书中得到一定的收获或启发,同时,本书还适合高等院校的计算机相关专业的本专科生、研究生以及IT行业的从业人员,和所有对大数据感兴趣的人士阅读。
本书详细介绍了一*大数据应用案例 电信用户行为分析,案例涉及数据预处理、数据存储与管理、数据分析和数据可视化等流程,涵盖Linux、MySQL、Hadoop、Spark、IntelliJ IDEA、Spring等系统和软件的安装与使用方法。案例采用的编程语言是Scala和Java。