国际大电网委员会(CIGRE)是全球专享一家近百年来一直致力于电力行业工作的国际组织。变电站专业委员会以技术报告、专题讨论会、论文的形式发布与高压变电站各方面相关的知识,其中大多数是通过CIGRE网站免费提供给其会员。然而,这些材料通常涉及特定的技术主题。如果想要了解高压变电站的全面知识,但从CIGRE网站并不容易找到相关材料。本书目的是汇集这些丰富的信息,以更加全面便捷的方式呈现,以便提供有关高压变电站各方面的参考,这对所有相关工作的决策者都具有重要的价值。本书提供了高压变电站从设计施工到维护管理等整个资产生命周期的全部知识。本书共9部分54章,包括变电站规划及设计、空气绝缘变电站、气体绝缘变电站、混合式开关设备变电站和气体绝缘线路特高压和海上变电站、二次系统、变电站与环境的相互影响、变电站管理
数据工作者在处理数据时,与其说像是手忙脚乱的猴子,不如说更像是神奇的魔法师。数据很少会以“准备就绪”的形态进入我们的世界,通常需要经过几个小时的清理、过滤和重塑才能被使用。Power Query可以加速整个数据处理过程,有时甚至只需简单地单击几个按钮就能完成。Excel用户可以仅仅通过学习Power Query配合Excel公式来导入数据、清理数据和转换数据,为后续分析数据做好准备,整个过程几乎零代码。我们相信Power Query将改变Excel用户处理数据的方式。如果你正在使用Excel,其实已经拥有Power Query,自Excel2016版本起,Power Query已内置到Excel中。这本书正是教你如何通过Power Query使用更多专业的数据处理技巧的指南。
Python是众多研究人员眼中的一流工具,主要原因在于它所提供的可用于存储、操作、洞察数据的各种库。数据科学堆栈的各个部分都存在多种资源,但只有本书的新版将它们汇集于一处,包括IPython、NumPy、pandas、Matplotlib、Scikit-Learn以及其他相关工具。熟悉阅读和编写Python代码的在职科技人员和数据处理人员会发现这份全面的案头参考书的第二版非常适合处理各种日常问题:数据的操作、转换、清理;不同类型数据的可视化;使用数据建立统计或机器学习模型。一句话,这是Python科学计算的推荐参考。
本书介绍Spark应用开发的面向对象和函数式编程概念,讨论RDD和DataFrame基本抽象,讲述如何使用SparkSQL、GraphX和Spark来开发可扩展的、容错的流式应用程序, 介绍监控、配置、调试、测试和开发等 主题。通过本书的学习,你将能使用SparkR和PySpark API开发Spark应用程序,使用Zeppelin进行交互式数据分析,使用Alluxio进行内存数据处理,将透彻理解Spark,并能对海量数据执行全栈数据分析, 终成为数据科学家。
本书按照需求规划、需求实现、可视化的流程进行编排,通过项目开发的主要流程,介绍数据仓库的搭建过程。在整个数据仓库的搭建过程中,本书介绍了主要组件的安装部署、需求实现的具体思路,以及各种问题的解决方案等,并在其中穿插了许多与大数据和数据仓库相关的理论知识,包括数据仓库的概念、电商业务概述、数据仓库理论和数据仓库建模等。 本书共14章,其中,第1~3章是项目的前期准备阶段,主要介绍了数据仓库的概念和搭建需求,并初步搭建了本数据仓库项目所需的基本环境;第4~7章是项目的核心部分,详细介绍了数据仓库的建模理论,并完成了数据从采集到分层搭建的全过程,是本书的重点部分;第8~14章是对数据治理各功能模块的实现,针对数据治理的不同功能需求分模块进行实现。 本书适合具有一定编程基础并对大数据感兴趣的读者
作为一名有抱负的数据科学家,你理解为什么组织机构的重要决策都依赖于数据一一无论是设计网站的公司、决定如何改善服务的城市,还是致力于阻止疾病传播的科学家组织。你需要具备将一堆杂乱的数据提炼成可操作的洞见所需的技能。我们称之为数据科学生命周期:收集、整理、分析数据并从中得出结论的过程。 本书是第一本兼顾编程和统计学基础技能的书籍,内容涵盖了整个数据科学生命周期。它面向那些希望成为数据科学家或与数据科学家合作的读者,以及希望跨越“技术/非技术”界限的数据分析师。如果具备基本的Pythons编程知识,你将学到如何使用像pandas这样的行业标准工具来处理数据。
本书从智能信用评价体系构建、大数据信用特征构造、智能信用评价模型设计、数据缺失与非均衡数据处理等方面系统地研究了大数据环境下的智能信用评价理论与方法。研究内容包括智能信用评价体系构建理论、基于文本信息的信用特征构造方法、基于关系网络的信用特征构造方法、基于社会资本的信用特征构造方法、动态信用评价模型构建方法、可解释智能信用评价模型构建方法、数据缺失与非均衡数据处理方法及信用评价系统的评估与优化方法等,并将研究成果运用到普惠金融和中小微企业信用风险管理实践中,较好地解决了大数据环境下普惠金融和中小微企业信用评价中的关键科学问题。本书可供相关领域的研究开发人员阅读,也可作为相关专业研究生的教学参考书。
本书深入探讨了云计算的关键基础设施——云数据中心的关键技术和智能管理方法。在国家重点研发计划项目、国家自然科学基金重点项目以及企事业单位研究所科技合作项目等多个层次的项目支持下,项目组攻克了一系列关键技术挑战。本书重点介绍了大规模云数据中心运行数据管理技术、大规模云数据中心运行能效评估与预测技术、大规模云数据中心资源智能管理与调度技术、大规模云工作流智能管理与调度技术。在上述关键技术攻关的基础上,本书介绍了云数据中心智能化管理与运维体系架构及相关子系统的设计与开发,并面向典型工业应用开展了应用示范。 本书可供计算机和自动化领域的工程师和研究人员参考,也可作为高等院校自动化、电子信息工程、计算机科学与技术、通信工程等相关专业的教师和研究生的教学参考书。
作为一名有抱负的数据科学家,你理解为什么组织机构的重要决策都依赖于数据一一无论是设计网站的公司、决定如何改善服务的城市,还是致力于阻止疾病传播的科学家组织。你需要具备将一堆杂乱的数据提炼成可操作的洞见所需的技能。我们称之为数据科学生命周期:收集、整理、分析数据并从中得出结论的过程。 本书是第一本兼顾编程和统计学基础技能的书籍,内容涵盖了整个数据科学生命周期。它面向那些希望成为数据科学家或与数据科学家合作的读者,以及希望跨越“技术/非技术”界限的数据分析师。如果具备基本的Pythons编程知识,你将学到如何使用像pandas这样的行业标准工具来处理数据。
本书由浅入深,层层深入,从基本原理着手,逐步过渡到大数据存储的新技术的发展。本书以扎实的理论分析为基础,系统、深入地介绍了分布式文件系统和分布式键值存储的基本原理及其关键问题与解决手段、大数据存储系统的关联技术与进展,包括基于群组的网络文件共享、存储系统的容灾、重复数据删除技术和大数据纠删码存储技术。对大数据存储技术的研究和应用有积极的促进作用。本书的读者对象主要为高等院校的学者和研究生,数据存储架构师、咨询顾问,以及企业内部的相关业务人员。
本书详细阐述了与Python数据预处理相关的基本解决方案,主要包括NumPy和Pandas简介、Matplotlib简介、数据、数据库、数据可视化、预测、分类、聚类分析、数据清洗、数据融合与数据集成、数据归约、数据转换等内容。此外,本书还提供了相应的示例、代码,以帮助读者进一步理解相关方案的实现过程。 本书适合作为高等院校计算机及相关专业的教材和教学参考书,也可作为相关开发人员的自学用书和参考手册。
本书在描述和探讨开放数据和数据治理定义、特点、类型及相关概念、基本理论基础上,探讨开放数据与数据安全的协同关系、协同模式及协同发展建议,以开放数据政策和数据安全政策内涵分析为引导解读国内外开放政府数据和数据安全的政策进展,既在理论上阐释基于证据的政府数据开放政策制定和我国数据安全政策评估,又展示开放数据与数据安全政策制定的实地实验分析,有创新性地构建开放数据与数据安全政策协同原理及框架、探析开放数据政策与数据安全政策协同环境及风险,重点开展基于政策扩散的开放数据与数据安全政策协同研究、基于语料库的开放数据与数据安全政策协同实证分析、基于知识图谱的开放数据与数据安全政策协同研究等。 本书可用作高等学校数据管理与数据治理、数据安全、信息资源管理、图书情报等相关学科专业博士研究生
《虚拟化高性能NoSQL存储案例精粹——Redis+Docker》主要介绍虚拟化平台Docker结合NoSQL、Redis开发的相关知识点。本书使用大量篇幅着重介绍Redis中的五大数据类型的使用方法,包括String、Hash、List、Set和Sorted Set,还介绍了使用Redis实现高可用的哨兵、复制、集群、高性能数据导入的流水线,以及保障数据操作原子性的事务。另外,本书对Redis中的数据持久化方案AOF和RDB也进行了详细介绍,并对HyperLogLog、GEO和Pub/Sub的相关知识进行了总结,结合实战经验丰富了与内存淘汰策略相关的内容。虚拟化技术使用Docker实现,包括Docker环境的搭建、常见命令的使用、对镜像和容器的操作,以及常见技术的容器的创建。 《虚拟化高性能NoSQL存储案例精粹——Redis+Docker》适合所有使用Redis进行编程的开发人员、服务器和数据存储系统开发人员、分布式系统架构师等互联网技术程序员阅
本书主要介绍虚拟化平台Docker结合NoSQL、Redis开发的相关知识点。本书使用大量篇幅着重介绍Redis中的五大数据类型的使用方法,包括String、Hash、List、Set和Sorted Set,还介绍了使用Redis实现高可用的哨兵、复制、集群、高性能数据导入的流水线,以及保障数据操作原子性的事务。另外,本书对Redis中的数据持久化方案AOF和RDB也进行了详细介绍,并对HyperLogLog、GEO和Pub/Sub的相关知识进行了总结,结合实战经验丰富了与内存淘汰策略相关的内容。虚拟化技术使用Docker实现,包括Docker环境的搭建、常见命令的使用、对镜像和容器的操作,以及常见技术的容器的创建。本书适合所有使用Redis进行编程的开发人员、服务器和数据存储系统开发人员、分布式系统架构师等互联网技术程序员阅读。
本书从智能信用评价体系构建、大数据信用特征构造、智能信用评价模型设计、数据缺失与非均衡数据处理等方面系统地研究了大数据环境下的智能信用评价理论与方法。研究内容包括智能信用评价体系构建理论、基于文本信息的信用特征构造方法、基于关系网络的信用特征构造方法、基于社会资本的信用特征构造方法、动态信用评价模型构建方法、可解释智能信用评价模型构建方法、数据缺失与非均衡数据处理方法及信用评价系统的评估与优化方法等,并将研究成果运用到普惠金融和中小微企业信用风险管理实践中,较好地解决了大数据环境下普惠金融和中小微企业信用评价中的关键科学问题。本书可供相关领域的研究开发人员阅读,也可作为相关专业研究生的教学参考书。
本书共分为八个章节,第一章主要介绍地理时空与遥感大数据分析计算的理论与方法框架,并对遥感大数据智能计算中图谱耦合的科学问题进行了凝练与提升;第二章结合地理空间认知中视觉模拟、符号推测与自组织优化等相互协同的计算机制,从视觉、时序与语义等维度构建一套地理图斑计算模型框架;第三、四章介绍机器学习方法,基于此研究地理图斑智能计算方法,研发精准LUCC生产线;第五、六、七、八章分别从城市、农业、生态以及地理综合应用等四个方面阐述地理图斑计算理论的应用价值,以期为地理大数据的智能计算和应用提供可行性方案。