本书共8章,立足于能源大数据领域核心业务,介绍了世界及中国的能源格局及能源转型背景,阐述了大数据技术的基本原理及其在能源领域的规划、预测等应用中开展实践情况,系统阐明能源大数据中心建设关键问题,深入讲解碳核算方法学。同时向读者说明了能源大数据在服务于 双碳 管理、政府治理中起到的关键作用,展示了能源大数据领域的实践成果和经验。
本书全面介绍车辆轨迹数据的处理、分析与可视化方法,并深入探讨了基于Python的车辆轨迹数 据处理技术,旨在帮助读者快速掌握车辆时空轨迹数据处理的基本方法和编程技巧,同时提供丰富的实际案例和技术解决方案,覆盖了从数据采集到深入分析的完整技术链条,是交通时空大数据领域车辆轨迹数据处理分析的全面指南。 本书内容涵盖从车辆轨迹数据的基本特征、采集原理到预处理、质量分析、可视化,再到高级应用如路网匹配、排放计算、多智能体仿真,以及特定案例分析如电动汽车充电需求识别和无人机航拍轨迹数据分析。 本书适合计算机相关专业的学生、数据分析师、研究人员以及技术开发人员阅读。
数据、模型与决策是应用数学建模和计算机技术帮助决策者解决问题。作为国外一本优秀的数据、模型与决策的教材,本书具有以下特色: 1.对枯燥、复杂和技术化的数学问题用简明易懂的语言予以解释,兼顾严谨的数理逻辑。 2.突出建模分析框架和基础逻辑的讲授和训练,在某种程度上实现了艺术与科学的有机融合。 3.课后习题丰富,并配有网络题库,供自学者加强训练,及时检查对理论模型及其求解方法的掌握程度。 第12版把修订重点放在企业和组织的*技术发展上,增加了商业分析(第1章)、项目风险(第8章)以及数据挖掘(第14章)等内容。
数据是数字经济的关键生产要素与核心资源。数据要素市场的培育是一个动态演化和持续迭代的过程,而信任的建立是市场建设的关键一步。本书通过“信任”这一视角,对数据流通进行全方位的解读,对中国数据要素市场的建设实践进行回顾与展望。基于“TIME”分析框架,对数据可信流通技术、数据流通机构、可信的数据流通模式以及促进数据可信流通的治理方案进行全面系统的介绍。本书旨在为数据要素市场参与者、数字经济从业者、数据治理人员以及关注数据流通交易的读者提供实用的参考,帮助他们理解数据流通的可行模式,破解数据要素市场发展难题,充分释放数据要素流通潜力,赋能实体经济高质量发展。
《谁说菜鸟不会数据分析(Python篇)》从解决工作实际问题出发,提炼总结工作中Python 常用的数据处理、数据分析实战方法与技巧。本书力求通俗易懂地介绍相关知识,在不影响学习理解的前提下,尽可能地避免使用晦涩难懂的Python 编程、统计术语或模型公式。 《谁说菜鸟不会数据分析(Python篇)》定位是带领Python 数据分析初学者入门,并能解决学习、工作中大部分的问题或需求。入门后如还需要进一步进阶学习,可自行扩展阅读相关书籍或资料,学习是永无止境的,正所谓 师傅领进门,修行在个人 。
随着中台概念被广泛讨论,其中数据中台又被赋予担任企业智能化任务的重任。当前,不仅是大企业,很多企业都在开始打造或者引入中台,用来解决企业面临的系统重复建设与数据孤岛的问题,在这个过程中,中台产品经理需要做什么事,解决什么问题,又会遇到怎样的困难与挑战? 本书第1~2章讲解了中台起源与数据中台产品需要什么样的能力;第3~6章主要讲解中台中的数据中台的建设与规划、数据分析的方法与策略、数据体系建设方法与应用和企业数据的价值等;第7~9章主要讲解数据平台的需求分析与数据知识、系统平台的建设实战和用户画像体系的建设等内容。
随着互联网 下半场 的到来,企业经营思路发生了重大转变,由野蛮式增长逐步向精细化运营过渡,数据成为了各大企业制胜的法宝。与之对应的是,传统的以用户体验、产品功能为主要工作内容的产品经理市场饱和度越来越高,求职竞争越来越激烈,而壁垒却越来越弱,用数据赋能业务的产品经理则在招聘市场上供不应求,策略产品经理就是其中之一。本书主要从职业发展、技能体系、工作过程以及方法论沉淀等角度来生成策略产品经理的画像,旨在帮助有志成为一名策略产品经理的人士了解策略产品经理需要具备的基本素质与能力、他们是如何工作的,以及成为一名策略产品经理的学习路径。本书适合计划成为一名策略产品经理的在校生学习,也可以为想转型为策略产品经理的职场人士提供参考。另外,也很欢迎现阶段正在从事策略产品经理工作的同行阅读本
《IBM SPSS数据分析实战案例精粹(第2版)》以IBM SPSS Statistics 24为工具,提供了医疗、金融、保险、汽车、快速消费品、市场研究、互联网等多个行业的数据分析/挖掘案例,基于实战需求,详细讲解了整个案例的完整分析过程,并将模型和软件的介绍融于案例讲解之中,使读者在阅读时能突破方法和工具的限制,真正聚集于对数据分析精髓的领悟。本书还一并提供案例数据的下载,读者可完整重现全部的分析内容。 《IBM SPSS数据分析实战案例精粹(第2版)》适合从初学者到专家各个级别的数据分析人士阅读,包括需要提升实战能力的数据分析专业人士,在市场营销、金融、财务、人力资源管理中需要应用数据分析的人士,从事咨询、科研等工作的专业人士,同时也可以作为各专业的本科和研究生学习数据分析应用的参考书。
内 容 简 介 本书针对未来想要从事数据分析工作的在校学生、想要转行做数据分析的在职人员,以及想要在数据分析领域提高自己或跳槽的从业人员,深入浅出地讲解了面试和未来实际工作中所需的知识与技能,让读者对数据分析师这个岗位有更为全面和深刻的了解。 全书主要分为面试前的准备、面试中的技巧、面试中所需的知识储备、编程技能、实战技能,以及进一步学习提高的方法几部分,内容涵盖数据分析师面试的全流程,全方位提高读者在未来面试中的竞争力。
面对小数据和大数据,数据分析师应该如何收集数据信息?传统的业务框架如何与统计学相关联?测量学扮演着什么角色?建模过程有哪些预分析技术和修正技术?建模工作完成后,如何解析?如何归因?如何预测?等等,这些数据分析能力构成了本书的分析框架。本书分为8章,小数据与大数据分析模式的动态切换贯穿全书,展示了数据分析案例的模块化分析思路。第1~3章为数据预分析部分,强调业务问题与统计问题的衔接;第4~6章为统计建模阶段,其中附有对行业案例和业务敏感度的训练、对统计和业务整合的审美建议,进而构造出一套具有灵活调校的数据分析模式。第7~8章解决的问题是,如何将晦涩难懂的统计解释转换成业务解释。由衷地希望本书能够成为数据运营人员与初中级数据分析师分析数据的行动指南。
本书的主要内容包括网络数据的定义及相关指标、大规模网络中的链路预测、网络聚类分析、网络数据中的空间自回归模型、大规模网络数据中的模型估计方法、网络数据中的空间自回归模型的拓展及应用、网络中的空间自回归模型的其他研究方向等。本书关注大规模网络数据分析中的模型方法。除模型方法本身的理论拓展之外,在估计方法等方面会涉及大规模数据中的快速计算方法。由于网络分析本身的范围非常广泛,故本书涉及的内容仅局限于作者及团队研究工作中使用到的一部分。在本书的后,为了启发读者思路,对于部分已有网络研究进行了梳理。
本书内容围绕股票大数据分析技术展开,主要介绍从不同角度对股票数据进行深度分析并用于实战的方法。 本书首先介绍股票的基本知识以及传统的基本面和技术面分析方法; 之后在每章中结合不同的数据源,从不同角度对股票进行深度分析,介绍相关的数据挖掘算法; 针对数据的特点,提出新的分析思路和计算方法; 结合新方法在股票挖掘平台上的实现对股票的操作进行实战解析。具体内容包括: 基于技术分析指标的买卖点计算方法; 股票时间序列的特征表示方法; 聚类算法与资金流向及主力控盘分析; 筹码分布与筹码分析技术; 财务数据分析与股票的新估值策略; 券商研报评级及其有效性分析; 新闻文本分类和股吧情感分析; 行为金融学与股票行为数据分析; 股票交易决策模型与股票挖掘平台。
本书以LabVIEW 2017为基础,讲述LabVIEW图形化编程语言的原理,以及如何利用LabVIEW完成虚拟仪器设计。全书共15章,分为两篇,分别是基础知识篇(第1~13章)和实际应用篇(第14、15章)。第1章,综述虚拟仪器技术的构建思想和方法论。第2~7章,讲述LabVIEW图形化编程语言的基本原理以及编程方法,内容包括LabVIEW入门、基本数据类型、程序结构、复合数据类型、文件I/O、图形显示及其他技巧。第8~12章,阐述如何利用LabVIEW去控制仪器硬件以实现对被测信号的数据采集,内容包括选择专用的数据采集卡进行数据采集; 利用计算机自带的声卡实现数据采集; 利用摄像头完成图像采集; 仪器控制和控制单片机。第13章,讲述用LabVIEW实现仪器应用的若干算法和信号分析处理的相关知识。第14、15章,介绍利用LabVIEW完成有实际应用背景的两个虚拟仪器项目,分别是用LabVIEW构建函
本书的主要内容是作者及其合作者在复杂数据模型这一领域近些年的研究成果, 以及相关的最新进展. 全书共 6 章. 第 1 章简要介绍几类复杂数据模型和 bootstrap 等预备知识和相关研究问题. 第 2~6 章, 系统讨论各种复杂数据统计推断中的 bootstrap 基本理论、方法及其应用, 包括 Behrens-Fisher问题、异方差回归模型、异方差 ANOVA 和 MANOVA 模型、混合效应模型及高维数据分析中的 bootstrap 统计推断.
看似佛系,其实只是不思进取;在朋友圈假装热爱生活,真实的自我只敢去微博展露;年初列了无数计划,年底全成了打脸的笑话;人前装得无懈可击,活得却比谁都软弱无力 本书作者赵德昊, 毒鸡汤 公众号创始人,凭借《不会偷懒还假装勤奋,怪不得你又累又穷》《你这不是抑郁,是没钱和缺爱的正常表现》《就算朋友遍天下,你还是个nobody》等爆文圈粉无数。 这些热辣酸爽的金句,引起无数年轻人共鸣,也映照出他们在当下焦虑生活中无力挣扎的现实。61篇犀利扎心的硬核文章,不卖情怀只给解药,愿这些狠话能为你打破思维桎桔,重塑人生。 生活虽不易,但请你干万别假装。
从统计学科与计算机科学的性质认知,大数据是指那些超过传统数据系统处理能力、超出经典统计思想研究范围、不借用网络无法用主流软件工具及技术进行单机分析的复杂数据的集合,对于这一数据集合,在一定的条件下和合理的时间内,我们可以通过现代计算机技术和创新的统计方法,有目的地进行设计、获取、管理、分析,揭示隐藏在其中的有价值的模式和知识。 《大数据:统计理论、方法与应用》共分五章,其内容包括大数据下的统计理论体系、大数据下的数据集整合分析、大数据下的高维变量选择方法、大数据下的统计方法并行计算和大数据下的统计方法应用——网络舆情分析。 本书内容新颖,取材国内外资料,同时认真总结了作者近年来的科研成果,重点反映统计学对大数据发展的影响,突出五大特点: (1)充分体现学科融合; (2)
在传统的数据处理流程中,总是先收集数据,然后将数据放到DB中。当人们需要的时候通过DB对数据做query,得到答案或进行相关的处理。这样看起来虽然非常合理,但是结果却非常的紧凑,尤其是在一些实时搜索应用环境中的某些具体问题,类似于MapReduce方式的离线处理并不能很好地解决问题。这就引出了一种新的数据计算结构---流计算方式。它可以很好地对大规模流动数据在不断变化的运动过程中实时地进行分析,捕捉到可能有用的信息,并把结果发送到下一计算节点。本书讲解流计算原理。
这是一本让人脑洞大开的内容玩法书,给新一代叙事者提供了十八般武器。清晰的构架、简洁的语言、坦率的态度,整本书无不流露着新一代互联网原住民颠覆传统的创新基因。运营无招,数据有度。握好数据的尺度,把数据做出角度、深度、温度、态度,这是整本书的核心。围绕 新消费、玩互动、融呈现、变模式 四个维度,本书从场景化叙事聊到用户激励和内容产品经理,分享了内容、传播、团队该如何迎接变革的心路历程。产品的玩法本身会经历兴衰,但只要人的创新精神在,就可以在新的场景下也能够持续玩好内容。作者的探索与思考,无疑可以给内容运营从业者带来多元的启发。推荐准备从事内容传播和广告策划工作的在校生、即将从事互联网产品运营的人、移动互联网内容创新研究者、企业市场和品牌传播从业者参考阅读。
本书主要作为教育领域从事教育大数据研究工作者的参考用书。本书从教育大数据的重要意义、国内外教育大数据的研究现状以及政策支持出发,对教育大数据的相关概念和内涵做阐述说明,介绍了教育大数据的技术、技术标准、治理与开放、风险管理与法律政策,重点阐述了教育大数据在教育领域的典型应用,包括教育大数据在课堂教育、校园管理、在线教育、开放远程教育、教育培训行业以及学生综合素质评价等方面的应用,*后提出教育大数据的发展趋势和机遇挑战。
人文社会科学和自然科学研究过程中积累了大量的研究数据,这些数据如何管理、共享、出版和引证?如何再次利用他人的数据?过程中牵涉到哪些知识产权?本书的几位作者不仅熟悉全球尤其欧美的研究数据管理的实践应用,而且在英国数据档案馆拥有多年数据相关专业工作的管理与实践经验,他们在本书中将多年积累的**数据管理实践建议、指导和培训倾囊呈现。本书前三章对研究数据管理和共享进行总括介绍,包括管理和共享的重要性、研究数据生命周期以及如何制订研究数据管理计划。第四章至第六章介绍了研究数据管理的具体方法,包括数据文档编制、数据格式与组织以及数据存储与传输。第七章至第十一章讨论了数据管理与共享所涉及的问题,包括法律和伦理、知识产权、合作研究、利用他人数据以及出版和引证。
本书首先基于结构化国际科技资源信息数据库及非结构化国际科技资源信息,研究国际科技资源信息的数据抽取技术、学科与技术分类及数据库构建方法;其次,基于文献计量、专利计量、文本挖掘、研究价值图谱、技术路线图方法,研究构建国际科技资源监测分析方法和模型;再次,基于聚类分析、社会网络分析、地理信息系统等方法,研究国际科技资源信息监测分析的可视化方法和模型;后,介绍了国际科技合作资源监测系统和国际科技资源监测地理信息系统的开发及应用。
Alluxio 这一以内存为中心的分布式虚拟文件系统,*初诞生于加州大学伯克利分校的 AMPLab,其开源社区在目前大数据生态系统中发展很快。本书以广泛使用的 Alluxio 1.8.1 版本为基础进行编写,是一本全面介绍 Alluxio 相关技术原理与实践案例的书籍。本书主要内容包括 Alluxio 系统快速入门、Alluxio 系统架构及读写工作机制、Alluxio 与底层存储系统的集成、Alluxio 与上层计算框架的集成、Alluxio 基本功能和高级功能的介绍与使用。此外,本书还详细介绍了 Alluxio 的应用案例与生产实践,并详细解读了 Alluxio 的核心框架和技术应用,旨在为大数据从业人员和大数据存储技术爱好者提供一个深入学习的平台,也可用作开源社区开发者指南。
Python 是一种面向对象的脚本语言,其代码简洁优美,类库丰富,开发效率也很高,得到越来越多开发者的喜爱,广泛应用于Web 开发、网络编程、爬虫开发、自动化运维、云计算、人工智能、科学计算等领域。预测技术在当今智能分析及其应用领域中发挥着重要作用,也是大数据时代的核心价值所在。随着AI 技术的进一步深化,预测技术将更好地支撑复杂场景下的预测需求,其商业价值不言而喻。基于Python 来做预测,不仅能够在业务上快速落地,还让代码维护更加方便。对预测原理的深度剖析和算法的细致解读,是本书的一大亮点。本书共分为3 篇。第1 篇介绍预测基础,主要包括预测概念理解、预测方法论、分析方法、特征技术、模型优化及评价,读者通过这部分内容的学习,可以掌握预测的基本步骤和方法思路。第2 篇介绍预测算法,该部分包含多元回归分析、