本书共13章,分三个部分:基础篇、实战篇、提高篇。 (1)基础篇(第1~5章),第1章的主要内容是数据挖掘概述;第2章对本书所用到的数据挖掘建模工具Python语言进行了简明扼要的说明;第3章、第4章、第5章对数据挖掘的建模过程,包括数据探索、数据预处理及挖掘建模的常用算法与原理进行了介绍。 (2)实战篇(第6~12章),重点对数据挖掘技术在金融、航空、零售、农业、制造和互联网等行业的应用进行了分析。在案例结构组织上,本书是按照先介绍案例背景与挖掘目标,再阐述分析方法与过程,最后完成模型构建的顺序进行的,在建模过程关键环节,穿插程序实现代码。最后通过上机实践,加深数据挖掘技术在案例应用中的理解。 (3)提高篇(第13章),围绕去编程化的TipDM大数据挖掘建模平台,先介绍了平台每个模块的功能,再以航空公司客户价值
本书以LabVIEW 2017为基础,讲述LabVIEW图形化编程语言的原理,以及如何利用LabVIEW完成虚拟仪器设计。全书共15章,分为两篇,分别是基础知识篇(第1~13章)和实际应用篇(第14、15章)。第1章,综述虚拟仪器技术的构建思想和方法论。第2~7章,讲述LabVIEW图形化编程语言的基本原理以及编程方法,内容包括LabVIEW入门、基本数据类型、程序结构、复合数据类型、文件I/O、图形显示及其他技巧。第8~12章,阐述如何利用LabVIEW去控制仪器硬件以实现对被测信号的数据采集,内容包括选择专用的数据采集卡进行数据采集; 利用计算机自带的声卡实现数据采集; 利用摄像头完成图像采集; 仪器控制和控制单片机。第13章,讲述用LabVIEW实现仪器应用的若干算法和信号分析处理的相关知识。第14、15章,介绍利用LabVIEW完成有实际应用背景的两个虚拟仪器项目,分别是用LabVIEW构建函
本书从Power BI的基础功能讲起,逐步深入到Power BI进阶实战,以业务案例为导向,以Power BI桌面版操作为基础进行讲解,深入讲述Power BI在各个业务部门的应用。本书包括7篇共21章内容,分业务场景进行讲解。第1篇用1章内容讲述Power BI基础操作,方便读者快速入门;第2篇用4章内容讲述如何用Power BI爬取天气、电影、销售、股票等数据;第3篇用4章内容讲述销售部门如何用Power BI分解销售目标,分析业绩达成、会员RFM和业绩构成;第4篇用5章内容讲述产品相关应用,包括存货分析、帕累托分析、关联分析、畅销款分析和数据化陈列;第5篇用2章内容讲述在财务方面的应用,包括盈亏平衡分析和上市公司利润表分析;第6篇用3章内容讲述人力资源应用,包括人员结构及离职率分析、新员工分析和考勤分析;第7篇用2章内容讲述简化报告的技巧。
面对小数据和大数据,数据分析师应该如何收集数据信息?传统的业务框架如何与统计学相关联?测量学扮演着什么角色?建模过程有哪些预分析技术和修正技术?建模工作完成后,如何解析?如何归因?如何预测?等等,这些数据分析能力构成了本书的分析框架。本书分为8章,小数据与大数据分析模式的动态切换贯穿全书,展示了数据分析案例的模块化分析思路。第1~3章为数据预分析部分,强调业务问题与统计问题的衔接;第4~6章为统计建模阶段,其中附有对行业案例和业务敏感度的训练、对统计和业务整合的审美建议,进而构造出一套具有灵活调校的数据分析模式。第7~8章解决的问题是,如何将晦涩难懂的统计解释转换成业务解释。由衷地希望本书能够成为数据运营人员与初中级数据分析师分析数据的行动指南。
随着中台概念被广泛讨论,其中数据中台又被赋予担任企业智能化任务的重任。当前,不仅是大企业,很多企业都在开始打造或者引入中台,用来解决企业面临的系统重复建设与数据孤岛的问题,在这个过程中,中台产品经理需要做什么事,解决什么问题,又会遇到怎样的困难与挑战? 本书第1~2章讲解了中台起源与数据中台产品需要什么样的能力;第3~6章主要讲解中台中的数据中台的建设与规划、数据分析的方法与策略、数据体系建设方法与应用和企业数据的价值等;第7~9章主要讲解数据平台的需求分析与数据知识、系统平台的建设实战和用户画像体系的建设等内容。
本书以当前稳定版 HBase 2.4.9 为基础,将 Hadoop 升级到 2.10.1 版本,并对客户端 API 进行升级。本书以精练的语言介绍 HBase 的基础知识,让初学者能够快速上手使用 HBase;深入分析 HBase 的核心思想(如数据读取和数据备份等)和 HBase 架构(如 B+树、LSM 树和 WAL 等),专注于 HBase 在线实时系统的调优,使 HBase 集群响应延迟更低,让有经验的 HBase 开发人员能循序渐进地理解 HBase 源代码,更好地调试和解决各种实际问题;本书从企业常见的“用户行为日志管理系统”着手,结合 HBase 的实际应用场景,让读者快速上手,真正做到从入门到实践。 本书非常适合作为有一定 Java 基础的开发人员的 HBase 入门教程,也适合作为HBase 运维人员部署和监控 HBase 的参考手册,还适合作为将 HBase 应用到在线生产环境中的开发人员进行 HBase 在线集群性能调优的技术指南。
内 容 简 介 本书针对未来想要从事数据分析工作的在校学生、想要转行做数据分析的在职人员,以及想要在数据分析领域提高自己或跳槽的从业人员,深入浅出地讲解了面试和未来实际工作中所需的知识与技能,让读者对数据分析师这个岗位有更为全面和深刻的了解。 全书主要分为面试前的准备、面试中的技巧、面试中所需的知识储备、编程技能、实战技能,以及进一步学习提高的方法几部分,内容涵盖数据分析师面试的全流程,全方位提高读者在未来面试中的竞争力。
本书系统地阐述信息传播问题中所涉及的各种传播模型、数学优化方法以及计算方法等,并通过对大量信息传播的实际问题进行了建模与分析。该著作将为人工智能、大数据、管理科学、运筹学、人文社会科学等领域开展相关研究的本科生、研究生以及学者提供重要的参考。
本书是围绕我国国民经济和社会发展第十四个五年规划和2035 年远景目标等重大要求, 由中国通信学 br 会、中国产业发展研究院联合组织编写的 新基建核心技术与融合应用丛书 之一。 br 大数据技术的战略意义不在于掌握庞大的数据信息, 而在于对这些含有意义的数据进行专业化处理。换 br 而言之, 如果把大数据比作一种产业, 那么这种产业实现盈利的关键在于提高对数据的 加工能力 , 通过 br 加工 实现数据的 增值 。本书立足数字经济浪潮, 以促进数据合规高效流通使用、赋能实体经济为主 br 线, 重点围绕大数据采集、流通、安全、治理及应用等全生命周期进行编写, 覆盖大数据存储、计算、管 br 理、安全与治理、资产管理与流通、分析、平台、产业与应用等环节, 对培育新质生产力, 推动我国数字经 br 济高质量发展具有重要参考价值。 br 本书适合IT、金融、研究
生态学数据分析:方法生态学研究需要从原始数据出发,通过系列计算分析,最后作出具有生态意义的解释?本书主要介绍PCORDfor Windows?CanocoforWindows?CurveExpert?SPSS和PAST 等软件在生态学数据转换?标准化?函数拟合?遗传多样性?物种多样性?生态位?空间分布格局?聚类?排序和实验数据统计检验上的应用方法?应用QBASIC和R 语言对书中的部分方法编制程序?书中的每一种方法均提供模拟数据,介绍具体的操作步骤??程序与软件
《谁说菜鸟不会数据分析(Python篇)》从解决工作实际问题出发,提炼总结工作中Python 常用的数据处理、数据分析实战方法与技巧。本书力求通俗易懂地介绍相关知识,在不影响学习理解的前提下,尽可能地避免使用晦涩难懂的Python 编程、统计术语或模型公式。 《谁说菜鸟不会数据分析(Python篇)》定位是带领Python 数据分析初学者入门,并能解决学习、工作中大部分的问题或需求。入门后如还需要进一步进阶学习,可自行扩展阅读相关书籍或资料,学习是永无止境的,正所谓 师傅领进门,修行在个人 。
Origin是国际科技出版界公认的标准作图软件,它功能强大、操作简单,被科研人员、工程技术人员、高校师生等广泛使用。Origin软件不仅具有强大的数据可视化功能,还具有统计分析、信号处理、函数拟合、峰值分析等功能,且支持多种格式的数据导入和导出。 本书基于Origin 2021和Origin 2022版本进行案例讲解,旨在帮助读者快速入门,并掌握Origin软件的使用技巧。本书由浅入深地讲解了Origin软件的功能和相关案例,涉及基础2D图、等高线图、3D图以及专业图的绘制,也涵盖了数学运算、拟合分析、信号处理、多峰分析等主题。 本书适用于Origin软件的初学者和希望提高科技绘图及数据分析处理能力的读者,尤其适用于大中专院校的师生以及广大科研工作者。
人文社会科学和自然科学研究过程中积累了大量的研究数据,这些数据如何管理、共享、出版和引证?如何再次利用他人的数据?过程中牵涉到哪些知识产权?本书的几位作者不仅熟悉全球尤其欧美的研究数据管理的实践应用,而且在英国数据档案馆拥有多年数据相关专业工作的管理与实践经验,他们在本书中将多年积累的**数据管理实践建议、指导和培训倾囊呈现。本书前三章对研究数据管理和共享进行总括介绍,包括管理和共享的重要性、研究数据生命周期以及如何制订研究数据管理计划。第四章至第六章介绍了研究数据管理的具体方法,包括数据文档编制、数据格式与组织以及数据存储与传输。第七章至第十一章讨论了数据管理与共享所涉及的问题,包括法律和伦理、知识产权、合作研究、利用他人数据以及出版和引证。
当数据存储在多个数据库中,如何查询数据?特别是当这些数据库是由不同的人分别设计。这是个全面介绍数据集成的书,由业界三个受人尊敬的专家撰写。这本书讲解数据集成技术的理论知识,使用大量实例来解释基本概念。数据集成是解决跨多个数据源(如数据库,网页)的问题。目前在多种环境中都涉及数据集成问题,包括企业信息集成,在网络上的查询处理,政府机构之间的协调和科学家之间的合作。在某些情况下,数据集成是某个领域取得进展的关键。本书提供了数据集成的概念和工具,可用于数据集成的具体实现。本书作者是威斯康星大学麦迪逊分校计算机科学副教授,同时在微软AdCenter实验室与雅虎研究实验室担任咨询顾问。
这是一本让人脑洞大开的内容玩法书,给新一代叙事者提供了十八般武器。清晰的构架、简洁的语言、坦率的态度,整本书无不流露着新一代互联网原住民颠覆传统的创新基因。运营无招,数据有度。握好数据的尺度,把数据做出角度、深度、温度、态度,这是整本书的核心。围绕 新消费、玩互动、融呈现、变模式 四个维度,本书从场景化叙事聊到用户激励和内容产品经理,分享了内容、传播、团队该如何迎接变革的心路历程。产品的玩法本身会经历兴衰,但只要人的创新精神在,就可以在新的场景下也能够持续玩好内容。作者的探索与思考,无疑可以给内容运营从业者带来多元的启发。推荐准备从事内容传播和广告策划工作的在校生、即将从事互联网产品运营的人、移动互联网内容创新研究者、企业市场和品牌传播从业者参考阅读。
Alluxio 这一以内存为中心的分布式虚拟文件系统,*初诞生于加州大学伯克利分校的 AMPLab,其开源社区在目前大数据生态系统中发展很快。本书以广泛使用的 Alluxio 1.8.1 版本为基础进行编写,是一本全面介绍 Alluxio 相关技术原理与实践案例的书籍。本书主要内容包括 Alluxio 系统快速入门、Alluxio 系统架构及读写工作机制、Alluxio 与底层存储系统的集成、Alluxio 与上层计算框架的集成、Alluxio 基本功能和高级功能的介绍与使用。此外,本书还详细介绍了 Alluxio 的应用案例与生产实践,并详细解读了 Alluxio 的核心框架和技术应用,旨在为大数据从业人员和大数据存储技术爱好者提供一个深入学习的平台,也可用作开源社区开发者指南。
全书分为:灵活的数据布局、应用感知及可视化存储智能、存储类芯片、储海钩沉、集群和多控制器、传统存储系统、新兴存储系统、大话光存储系统、体系结构、I/O协议栈及性能分析、存储软件、固态存储等,其中每章又有多个小节。每一个小节都是一个独立的课题。本书秉承作者一贯的写作风格,完全从读者角度来创作本书,语言优美深刻,包罗万象。另外,不仅阐释了存储技术,而且同时也加入了计算机系统技术和网格技术的一些解读,使读者大开眼界,茅塞顿开,激发读者的阅读兴趣。 本书适合存储领域所有从业人员阅读研习,同时可以作为《大话存储*版》的读者的延伸高新资源。
《Python数据可视化之matplotlib精进》使用大量的matplotlib实用案例讲解Python数据可视化在各个应用方向上的实现方法。通过学习这些实用案例,读者可以更好地掌握Python数据可视化的高级技能。本书主要由图形、元素、交互、探索和拓展5部分组成,每部分的实用案例都有利于拓展matplotlib的应用视野,而且案例中的示例代码只涉及Python的基础知识。这样,在Python数据可视化的实践中,有利于读者将时间和精力放在系统掌握matplotlib知识和技能上面,全面提高对matplotlib的理解程度及应用水平。
本书是AutoCAD 2021官方标准教程,主要讲解AutoCAD 2021的基本功能及实际应用。本书内容主要包括AutoCAD入门、创建和编辑二维图形对象、对象特性与图层、图纸布局、文字与表格、尺寸标注、图案填充、块的使用、创建复杂对象、打印出图、创建三维模型。通过对本书的学习,读者能够理解AutoCAD 2021的精髓,全面精通AutoCAD 2021,并能融合AutoCAD 2021的设计与管理思想,成为真正的AutoCAD 2021设计高手。本书可作为AutoCAD 2021培训的通用标准教材,也可作为高等院校相关专业的教材。
内容简介 全书规划上中下三篇,上篇将系统讲解数据挖掘涉及的各类技术,包括:数据挖掘基础知识(包括常用的概念、数学知识、数据挖掘流程,而不是通常的绪论或概论)、数据预处理方法和技术、关联技术、分类技术、聚类技术和数据立方技术等内容,每个部分都包含相关算法的讲解,包括算法理论基础、算法使用经验、应用案例,每个应用案例都将有Matlab源程序,以便读者通过模仿的方式来加深对知识的学习。中篇甄选几个典型的数据挖掘应用案例,包括搜索引擎文本挖掘、银行信用评级、电子商务精 确营销、广告投放、手机客户精准挖掘等。通过这些案例的介绍来加深读者对数据挖掘技术的理解和应用场景的熟悉,从而培养读者对数据挖掘的应用感或者说项目感。下篇将总结数据挖掘中的项目经验、心得和感悟,以
《大数据处理技术》介绍了大数据处理技术核心栈的全部内容。主要从大数据处理技术的流程出发,围绕大数据的获取、存储、分析到可视化展示的完整过程,以目前主流的Hadoop、Spark等开源大数据处理平台为核心内容,从大数据技术应用的角度,提供主流厂商的大数据平台的对比分析,并提供行业应用案例和大数据处理的完整实例,以帮助新手从零基础开始学习大数据技术。除此之外,在大数据分析部分,除常用数据分析算法外,特别增加了文本大数据分析、图像大数据分析和视频大数据分析等非结构化数据分析算法及应用场景。针对大型的大数据处理应用场景,增加了大数据集成、大数据治理、大数据安全等章节。*后对大数据处理技术的发展趋势做了介绍。
本书首先基于结构化国际科技资源信息数据库及非结构化国际科技资源信息,研究国际科技资源信息的数据抽取技术、学科与技术分类及数据库构建方法;其次,基于文献计量、专利计量、文本挖掘、研究价值图谱、技术路线图方法,研究构建国际科技资源监测分析方法和模型;再次,基于聚类分析、社会网络分析、地理信息系统等方法,研究国际科技资源信息监测分析的可视化方法和模型;后,介绍了国际科技合作资源监测系统和国际科技资源监测地理信息系统的开发及应用。