内容介绍 本书从业务、数据、运营3个维度为电商的经营和决策提供了科学的方法论,是一部电商运营真经,真正做到了“业务中有数据,数据中有运营”。作者是资深的电商行业专家,从事电商数据分析与数据化运营10余年,本书是他在多个知名电商品牌操盘多个千万级项目的经验总结。 为了增强本书的趣味性和读者的角色代入感,本书采用了纪实和叙事的写作手法,书中虚拟了3个核心人物: ?Alex:临危受命、勇挑重担、运筹帷幄的BI部门经理(资深数据分析师)。 ?叶子:有电商行业从业经验但是不懂数据分析的业务员。 ?大白:从其他行业转型到电商行业的数据分析师。 全书有两条主线: ?暗线:叶子和大白在Alex的指导和帮助下成长为“精业务、精数据、精运营”的“三精”数据分析师的经历,这对数据分析师的职业规划和成长有重要借鉴意义。 ?明线:Alex将
数据湖仓是一个现代化的开放式架构,拥有当今热门的开源数据技术的广度和灵活性。本书从初学者的角度出发,通过对数据湖仓重要概念的剖析,对数据湖仓的相关知识进行深入浅出的讲解。全书共18章,对数据湖仓的基础知识、数据工程、业务价值、数据集成等方面进行深入探讨,同时展望数据架构的演化趋势,使读者能够领会数据湖仓的精髓,最终轻松、全面地管理数据湖仓项目。 本书适合数据架构师、业务人员和系统开发人员,以及对数据管理、数据分析感兴趣的读者阅读。
本书是为广大数据分析师量身定制的入门读物,它旨在帮助读者站在大数据时代的制高点。数据分析处于统计学、计算机信息科学、运筹学、数据库等多个领域的交叉地带,大数据时代的到来大大丰富了数据分析的内涵,数据分析师的职责与以往相比发生了巨大的改变。本书全面介绍了经典数据分析、模式识别、机器学习、深度学习、数据挖掘、商务智能等多个领域的数据分析算法,将大数据时代的数据分析热点技术一网打尽。本书为每个数据分析算法都搭配了一个经典案例,并按照由易到难的原则构建知识框架,充分照顾了不同水平读者的阅读习惯。通过阅读本书,读者将对大数据时代下的数据分析有一个全面的认识。无论是入门级的数据分析员还是有一定基础的数据分析师,都能通过本书完善、加深对数据分析的认识。
这是一部教你如何从0到1架构与实现一个企业级大数据平台的著作,是作者在大数据和系统架构领域超过20000小时的经验总结。作者从横向视角出发,手把手教你如何拉通Hadoop体系技术栈,以此搭建一个真实可用、安全可靠的大数据平台。通过阅读本书,一定能从本书的内容中找到灵感和思路来应对实际工作中面对的问题。
部分(第1~4章)为基础和背景部分,主要介绍数据分析挖掘和数据化运营的相关背景、数据化运营中“协调配合”的本质,以及实践中常见分析项目类型的介绍。第二部分(第6~13章)是数据分析挖掘中的具体技巧和案例分享部分,主要介绍实践中常见的分析挖掘技术的实用技巧,并对大量的实践案例进行了全程分享展示。第三部分(第5章,第14~19章)是有关数据分析师的责任、意识、思维的培养和提升的总结和探索,以及一些有效的项目质控制度和经典的方法论介绍。
人文社会科学和自然科学研究过程中积累了大量的研究数据,这些数据如何管理、共享、出版和引证?如何再次利用他人的数据?过程中牵涉到哪些知识产权?本书的几位作者不仅熟悉全球尤其欧美的研究数据管理的实践应用,而且在英国数据档案馆拥有多年数据相关专业工作的管理与实践经验,他们在本书中将多年积累的**数据管理实践建议、指导和培训倾囊呈现。本书前三章对研究数据管理和共享进行总括介绍,包括管理和共享的重要性、研究数据生命周期以及如何制订研究数据管理计划。第四章至第六章介绍了研究数据管理的具体方法,包括数据文档编制、数据格式与组织以及数据存储与传输。第七章至第十一章讨论了数据管理与共享所涉及的问题,包括法律和伦理、知识产权、合作研究、利用他人数据以及出版和引证。
《统计分析:以R语言为工具》围绕经典的统计方法与 R 语言工具,从基本的统计描述分析方法出发,讲解了参数估计与假设检验、线性回归、逻辑回归、降维分析方法,每一章重点介绍一种经典方法或统计模型,对其基本定义、模型形式、统计方法的推导与解读等都给出了细致的讲解。此外,为了将理论与实践紧密结合,《统计分析:以R语言为工具》每一章均提供了不同业务场景下的R语言编程实例,帮助读者练习巩固。《统计分析:以R语言为工具》适合相关学科本科生及研究生,以及对数据分析及建模感兴趣的读者。
基于国家973和863相关项目成果,采用汤森路透德温特世界专利创新索引数据库作为统计数据来源,对信息存储领域的专利文献进行检索分析,从存储器件、设备、系统等层面,选取了目前信息存储领域中的多项重要技术,利用专利统计分析的方法对其发展态势进行了研究,特别是对信息存储领域相关专利进行宏观统计分析以及核心专利的具体分析,可以全方位了解信息存储技术的发展历程、专利的国家或地区分布、重要专利权人的竞争态势,为制定相关战略提供决策参考。同时结合华为、中兴、联想、浪潮、IBM、EMC、三星、美光等国内外知名企业的实际案例,从中国本土和全球的布局两个角度分别分析了专利产出、主要竞争者、热点技术和研发重点以及竞争态势,力求找到信息存储技术专利申请对技术产业化与企业发展的作用,供信息存储研发人员、专利工作者和
本书是一本深入研究数据挖掘领域中关联规则挖掘和可变精度模糊粗糙集理论的著作,其中关联规则挖掘以频繁集挖掘为主要内容,研究包括如何充分利用模糊约束进行频繁集的挖掘,高效的**频繁集挖掘算法,以及可变精度模糊粗糙集的性质和算法。本书强调理论性和技术性的统一,在理论研究的同时提供了技术的实现。
本书采用案例和理论相结合的形式,以Anaconda和PyCharm为开发工具,系统地重点阐述了利用Python进行数据预处理、分析与可视化等相关知识,讲解了Python各种数据处理展示的函数方法的使用方法。全书共有6章,分别是数据分析概述、Python基础、利用Pandas进行数据预处理、利用Pandas进行数据分析、利用Matplotlib进行数据可视化、Python数据分析与综合应用。在教学设计中安排了知识图谱、学习目标、知识指南、任务实训、结果分析、巩固训练、每章测试等模块。本书既可以作为本科和高职院校各专业数据分析相关课程的教材,也可以作为企业电子商务、市场营销、数据分析人员的参考资料。
随着互联网 下半场 的到来,企业经营思路发生了重大转变,由野蛮式增长逐步向精细化运营过渡,数据成为了各大企业制胜的法宝。与之对应的是,传统的以用户体验、产品功能为主要工作内容的产品经理市场饱和度越来越高,求职竞争越来越激烈,而壁垒却越来越弱,用数据赋能业务的产品经理则在招聘市场上供不应求,策略产品经理就是其中之一。本书主要从职业发展、技能体系、工作过程以及方法论沉淀等角度来生成策略产品经理的画像,旨在帮助有志成为一名策略产品经理的人士了解策略产品经理需要具备的基本素质与能力、他们是如何工作的,以及成为一名策略产品经理的学习路径。本书适合计划成为一名策略产品经理的在校生学习,也可以为想转型为策略产品经理的职场人士提供参考。另外,也很欢迎现阶段正在从事策略产品经理工作的同行阅读本
本书通过大量的例题,讲解了Access数据库技术的相关知识以及使用Access 2016开发数据库应用系统的全部过程。全书分为9章,主要内容包括数据库基础知识、Access 2016数据库概述、数据库与数据表、数据查询、窗体、报表、宏的设计与应用、模块与VBA程序设计、VBA数据库编程等相关知识。全书以一个完整的数据库应用系统为基础,以例题贯穿始终,配备适量的习题,使读者能够在学习过程中提高操作能力和实际应用能力。 本书可作为高等学校非计算机专业计算机公共基础课程的教材,也可以作为全国计算机等级考试二级Access数据库程序设计的辅导与自学教材,还可以作为数据库开发人员的参考书。
本书是国内本系统介绍大数据算法设计与分析技术的教材,内容丰富,结构合理,旨在讲述和解决大数据处理和应用中相关算法设计与分析的理论和方法,切实培养读者设计、分析与应用算法解决大数据问题的能力。不仅适合计算机科学、软件工程、大数据、物联网等学科的本科生和研究生使用,而且可供其他相近学科的本科生和研究生使用。同时,该教材还可作为从事大数据相关领域工程技术人员的自学读物。 本书特点: 前沿、实用的内容。总结了大数据算法设计与分析的新技术和新理念,梳理了当前大数据相关应用中所需要的算法设计与分析的方法。书中的部分内容代表了学术界*的前沿技术,首次出现在国内外的教科书上。 清晰、严谨的叙述。针对大数据算法设计与分析中的主要方法,通过介绍原理、举例说明、算法分析等多个角度进行阐述,清晰地讲解算
"本书系统地介绍过程挖掘的原理、方法、技术及其在教育领域的应用,重点介绍基于Petri net 的形式化挖掘技术和基于语义的挖掘技术,并举一个完整的挖掘大学校园学生行为特征的 案例。本书既有完整的理论框架又有专门的教育领域实践应用,可供计算机、大数据、人工智 能等相关专业领域的学生和研究人员参考。"
本书是国家科技支撑计划“民族特需品数字化关键技术研究及示范应用”课题的成果。它以民族特需品多媒体数据库的建立为平台,利用文字、图片、音频、视频、动画、逆工程及虚拟现实技术为方法,讲述民族特需品数字化挖掘、整理及展示的技术与方法。书中内容涵盖了:民族特需品数字化解决方案、特需品多媒体数据库建设、特需品数字媒体技术、基于模式识别的特需品自动录入技术、特需品网站自动生成技术、特需品多媒体数据库自动检索技术、特需品多媒体数据库中的数字版权等问题。
对大数据的搜索、挖掘、可视化以及集群管理,在当今的 互联网 时代是很有必要的。本书的分布式大数据搜索、日志挖掘、可视化、集群监控与管理等方案是基于Elastic Stack 5而提出的,它能有效应对海量大数据所带来的分布式数据存储与处理、全文检索、日志挖掘、可视化、集群管理与性能监控等问题。构建在全文检索开源软件Lucene之上的Elasticsearch,不仅能对海量规模的数据完成分布式索引与检索,还能提供数据聚合分析;Logstash能有效处理来源于各种数据源的日志信息;Kibana是为Elasticsearch提供数据分析的Web接口,可使用它对数据进行高效的搜索、可视化、分析等操作;X Pack监控组件可通过Kibana监控集群的状态;Beats是采集系统监控数据的代理。了解基于Elastic Stack 5的各相关组件并掌握它们的基本使用方法和技巧,对于大数据搜索与挖掘及管理是很有必要的。