本书主要介绍从高维数据中感知、处理、分析和学习低维结构的基本数学原理和高效计算方法,系统地归纳了建模高维空间中低维结构的数学原理,梳理了处理高维数据模型的可扩展高效计算方法,阐明了如何结合领域具体知识或考虑其他非理想因素来正确建模并成功解决真实世界中的应用问题。本书包括基本原理、计算方法和真实应用三个部分:基本原理部分系统地介绍稀疏、低秩和一般低维模型的基本性质和理论结果,计算方法部分介绍解决凸优化和非凸优化问题的有效算法,真实应用部分通过实例演示利用前两部分的知识改进高维数据处理和分析问题的解决方案。本书适合作为计算机科学、数据科学和电气工程专业的高年级本科生和研究生的教材,也适合学习稀疏性、低维结构和高维数据课程的学生参考。
本书是一本全面关注工业企业数据治理方面的工具书,主要内容分为概述篇、体系篇、工具篇、实施篇及案例篇。其中概述篇主要介绍工业企业数据治理的基础概念、主流数据治理标准及框架、数据治理的发展趋势等;体系篇主要介绍数据管控、数据战略、数据架构、主数据管理等的基本原理与管理体系;工具篇主要介绍主数据管理工具、数据模型管理工具、数据资产运营工具等;实施篇主要介绍具体实施策略及路径选择、顶层架构规划与设计、数据资产运营实施等;案例篇主要介绍电力、能源化工、钢铁、制造、战略投资等行业的数据治理案例,为读者提供专业、丰富、可信的数据治理实施范例。 本书是工业大数据应用技术国家工程实验室多年潜心研究的重要科研成果的总结和凝聚,既具有理论高度,也具备面向中国工业企业的可实操性。参与本书编著的作者均
Microsoft Excel 365功能卓越,全球无数企业和个人用户使用Excel365来收集、理解和解读数据。Excel办公系列书籍在广大读者中引起热烈反响,一直畅销不衰。本书对上一版做了全面细致的更新,娓娓道来,指引你创建和使用电子表格,编写公式和自定义函数,可视化数据,以及基于组织的数据创建报表和预测。本书既适合初级用户,也适合高级用户,将帮助你解锁数据的价值和潜力。
Python是一门开源的计算机编程语言,凭借其易学、灵活等特点,得到了越来越多人的认可和青睐。金融科技日新月异,金融行业的数字化、科技化和智慧化快速推进,Python在金融领域有着很好的应用现状和前景。 本书在上一版的基础上进行了内容升级,持续聚焦Python在金融分析与风险管理的应用,第2版从原先的12章扩充至15章,并依次划分为基础篇(共5章)、中阶篇(共5章)以及高阶篇(共5章),基础篇结合金融场景演示了Python语言以及NumPy、pandas、Matplotlib、SciPy以及statsmodel等金融领域常用的第三方模块的编程方法;中阶篇通过Python编程结合金融实例,依次探讨利率、汇率、债券、股票、互换合约、期货合约等产品的定价、风险测度以及风险管控等内容;高阶篇则融合Python与金融案例,探究了期权的定价、希腊字母、动态对冲、隐含波动率、交易策略及其他延
《图数据库+图算法+图计算(套装)(全4册)》由张宇等编著
《数据质量管理十步法:获取高质量数据和可信信息:原书第2版》本书是一部通过提供一套易于遵守及操作的方法论来实现高质量数据管理的实践指南。内容全面、详细,并有许多实用的建议和模板,第1版推出后,已成为全球信息质量实践者的推荐书籍,甚至已成为美国阿肯色大学信息质量研究生项目的教科书。本书共7章,内容包括数据质量和依赖于数据的世界、数据质量实践、关键概念、十步法流程、设计项目结构、其他技巧和工具,以及写在最后的话。作者将信息质量的概念框架与改善信息质量的技术、工具、操作指南相结合,提出并详细描述了获取高质量数据和可信信息的十步法。作为本书的近期新改版,作者进一步阐明并更新了流程步骤和支持模板,整合了一些有价值的示例和案例,说明了近些年技术和数据生产的演变。本书内容丰富,理论和实践相结合
本书共分为八个章节,第一章主要介绍地理时空与遥感大数据分析计算的理论与方法框架,并对遥感大数据智能计算中图谱耦合的科学问题进行了凝练与提升;第二章结合地理空间认知中视觉模拟、符号推测与自组织优化等相互协同的计算机制,从视觉、时序与语义等维度构建一套地理图斑计算模型框架;第三、四章介绍机器学习方法,基于此研究地理图斑智能计算方法,研发精准LUCC生产线;第五、六、七、八章分别从城市、农业、生态以及地理综合应用等四个方面阐述地理图斑计算理论的应用价值,以期为地理大数据的智能计算和应用提供可行性方案。
大数据作为新型生产要素,是数字经济高效发展的核心引擎。“数据二十条”搭建了中国特色数据产权制度框架,激活了数据要素价值,夯实了数据要素治理制度。本书从大数据理论、大数据战略、大数据技术、数字经济、数字金融、数据治理、大数据安全、数权法、大数据史九个部分对大数据名词条目进行了联合国工作语言的多语种翻译研究,提出了“以锚为准、轴为两翼,规范为主、兼顾描写”的系统性翻译原则,推进了数字中国、数字社会和数字生态等基础制度体系建设,有利于数据资源的整合、共享、开发和利用。本书服务于语言学研究和大数据研究,可供语言学、术语学、大数据等研究领域的读者参考。
本书是“鸢尾花数学大系——从加减乘除到机器学习”丛书的第三板块(实践板块)中的一本关于数据科学的分册。“实践”这个板块,我们将会把学到的编程、可视化,特别是数学工具应用到具体的数据科学、机器学习算法中,并在实践中加深对这些工具的理解。 本书可以归纳为7大板块——数据说、数据处理、时间数据、图论基础、图的分析、图与矩阵、图论实践。这7个板块(共25章内容)都紧紧围绕一个主题——数据! 本书以数据为名,以好奇心和疑问为驱动,主动使用“编程+可视化+数学”工具进行探索。本书将会回顾鸢尾花书前五本主要的工具,让大家对很多概念从似懂非懂变成如数家珍;同时,我们还会掌握更多工具,用来扩展大家的知识网络。 依照惯例,本书提供代码和视频教学。 本书读者群包括数据科学从业者、大数据从业者、高级数据分析师、机器
本书围绕着自然资源的遥感大数据监测方法展开,着重阐述了遥感大数据以及云计算在自然资源监测中的重要作用,通过运用海量遥感影像以及云计算的高速运算能力,结合机器学习与变化检测等算法,实现高时间分辨率和高空间分辨率的自然资源监测。本书针对不同自然资源要素开发出高效且实用的监测方法,通过案例介绍了各类方法在自然资源监测中的应用场景。 本书可供包括从事自然资源监测与管理、生态环境遥感监测、国土空间规划、国土整治与生态修复的科研和工作人员,以及国内外高校从事土地资源管理、遥感、资源、生态等相关专业的广大师生阅读参考。
《华为数字化转型之道》: 本书由华为公司质量与流程IT团队官方出品,从认知、理念、转型框架、规划和落地方法、业务重构、平台构建等多个维度全面总结和阐述了华为自身的数字化转型历程、方法和实践,能为准备开展或正在开展数字化转型的企业提供系统、全面的参考。 《精益数据方法论:数据驱动的数字化转型》: 这是一本用精益思想指导企业以数据为核心进行数字化转型的著作,它将帮助企业事半功倍地找到正确的数字化转型战略、方法与路径。 作者结合自己20余年的实战经验,将精益思想与数据利用深度融合,总结了一套从业务目标出发,以价值场景为抓手,以数据为驱动的精益数据方法论。进一步以该方法论为基础,衍生出精益数据花瓣模型、精益数字化转型三步法、数据驱动的六大能力模型,精益数字化转型共创工作坊,四大精益数据画布,
信息与网络用户爆炸式增长,促进了可视媒体大数据相关技术的高速发展。可视媒体的应用得到了广泛拓展,成为人类信息存储、承载、展现的重要方式。然而,存储空间、硬件设备、计算资源等不足,使得可视媒体大数据的发展亟需新技术支撑。本书面向可视媒体大数据的智能处理技术与系统,围绕智能压缩技术、画质增强技术、编辑与处理技术、质量评价、结构分析技术、人脸大数据分析与处理技术、智能服务技术以及人脸大数据智能处理等核心问题展开深入研究,重点介绍了可视媒体大数据应用的产学研重大创新与应用成果。本书的研究内容符合人们对网络可视媒体大数据深度开发的迫切需要和国家重大发展战略,对推动我国多媒体与影视文化内容产业的发展具有重大理论研究与应用意义。本书适合可视媒体领域的学者和技术人员参考,也可作为相关研究方
大数据正在成为人类社会最重要的生产要素和基础资产之一,并对管理决策理论与实践产生深远影响。本书汇编了国家自然科学基金“大数据驱动的管理与决策研究”重大研究计划的部分项目研究成果,就研究体系和重要研究方向上的新知贡献进行阐释与讨论。首先,本书系统性讨论了大数据管理决策研究挑战和应对,并介绍了顶层设计研究体系及凝练的全景式PAGE框架。进而结合重要研究方向,分别介绍了大数据决策范式、大数据分析技术、大数据资源治理、大数据使能创新等相关议题和若干前沿进展。
《数据中台:让数据用起来》 在数字中国这一国家战略的牵引下,数据要素和数字化转型的研究和落地如火如荼。数据中台是企业开展数据要素相关实践和数字化转型的关键基础设施,本书在这样的时代背景下,以帮助企业“管好数据、用好数据”为宗旨,内容围绕数据中台架构与建设方法论、数据中台建设流程和内容、数据中台工程化交付、数据中台行业解决方案4个维度全面、深度展开。 《华为数字化转型之道》 本书由华为公司质量与流程IT团队官方出品,从认知、理念、转型框架、规划和落地方法、业务重构、平台构建等多个维度全面总结和阐述了华为自身的数字化转型历程、方法和实践,能为准备开展或正在开展数字化转型的企业提供系统、全面的参考。
空间数据挖掘是数据科学研究的重要方向,旨在探测空间数据中隐含的知识和空间关系,发现有用的特征和模式。本书是作者团队在完成国家自然科学基金项目、郑州大学高层次人才项目基础上撰写而成,主要反映作者团队围绕空间聚类分析和变化检测、空间关联规则挖掘、互联网专题信息挖掘、轨迹数据挖掘以及气象数据流挖掘等方面所取得的一系列进展。书中详解空间数据挖掘方法创新和应用实践,为深化空间数据挖掘研究拓展新思路。 本书内容丰富,注重方法与实践相结合,是开展空间数据挖掘研究的第一手参考资料。本书可供从事地理学、测绘科学、数据科学等相关领域的科研教学人员使用,也可作为高等院校相关专业研究生、本科生的学习参考资料。
《大数据分析基础:概念、技术、方法和商务(英文版)》涵盖了大数据分析的四个基本方面:概念和基础,平台和工具,方法和算法,以及社会问题和好实践。
本书从智能信用评价体系构建、大数据信用特征构造、智能信用评价模型设计、数据缺失与非均衡数据处理等方面系统地研究了大数据环境下的智能信用评价理论与方法。研究内容包括智能信用评价体系构建理论、基于文本信息的信用特征构造方法、基于关系网络的信用特征构造方法、基于社会资本的信用特征构造方法、动态信用评价模型构建方法、可解释智能信用评价模型构建方法、数据缺失与非均衡数据处理方法及信用评价系统的评估与优化方法等,并将研究成果运用到普惠金融和中小微企业信用风险管理实践中,较好地解决了大数据环境下普惠金融和中小微企业信用评价中的关键科学问题。本书可供相关领域的研究开发人员阅读,也可作为相关专业研究生的教学参考书。
《华为数字化转型之道》 本书由华为公司质量与流程IT团队官方出品,从认知、理念、转型框架、规划和落地方法、业务重构、平台构建等多个维度全面总结和阐述了华为自身的数字化转型历程、方法和实践,能为准备开展或正在开展数字化转型的企业提供系统、全面的参考。 《内部审计数字化转型:方法论与实践》 这是一部从方法论和业务实操的角度讲解内部审计数字化转型的著作。 4位作者在内部审计和数字化转型领域有丰富的经验,既有在甲方企业的工作经历,又有在乙方咨询公司工作的经历,本书从双重视角对内部审计数字化转型的方法、工具、实施路径和业务实操等进行了系统的讲解,具有很高的参考价值。它将指导企业启动内部审计数字化转型的规划和实施,让内部审计赋能公司的治理和业务拓展。
大数据产业的发展改变了企业管理决策的过程和方式,极大地促进了信息产业的发展和商业模式的变革。单一企业越来越难以满足用户日益增长的对大数据全面化和个性化的需求,大数据联盟为企业提供了整合数据资源、提高服务能力和层次的有效途径。本书首先阐述大数据联盟的概念并揭示联盟合作机理,在此基础上,给出大数据联盟数据资源获取、数据产品及服务定价的机制和方法,最后系统介绍由数据聚合服务、数据挖掘服务、数据决策支持服务和数据推荐服务组成的大数据联盟数据服务模式体系。该体系可实现按需使用、易拓展、计费灵活的大数据服务,实现不同领域的数据资源重组、关联和共享,从而为用户提供不同层次的服务。本书具有较强的逻辑性和可读性,可供企业数据管理人员、高校科研人员和相关专业研究生阅读与参考。
《华为数据之道》是一部从技术、流程、管理等多个维度系统讲解华为数据治理和数字化转型的著作。华为是一家超大型企业,华为的数据底座和数据治理方法支撑着华为在全球170多个国家/地区开展多业态、差异化的运营。书中凝聚了大量数据治理和数字化转型方面的有价值的经验、方法论、规范、模型、解决方案和案例,不仅能让读者即学即用,还能让读者了解华为数字化建设的历程。 全书共10章,内容从逻辑上分为四个部分。 第一部分(第1~3章) 第1章以非数字原生企业在数字化转型方面面临的挑战开篇,介绍了华为在数据治理和数字化转型方面的目标、愿景、蓝图和框架;第2章从企业政策和架构协同的角度,介绍了企业级的数据综合治理体系,理顺了数据与变革、运营、IT之间的协同关系,明确了数据管理的责任主体在业务;第3章详细阐述了不同类型的数
使用R将数据转化为洞见、知识和理解。通过这本实践用书,有志成为数据科学家的读者将掌握如何使用R和RStudio从事数据科学,同时还会学习tidyverse,这是一组R软件包的集合,旨在协同工作,使数据科学变得快速、流畅、有趣。即使你没有编程经验,这本更新版也能让你快速上手。 你将学习如何导入、变换以及可视化你的数据,并传达结果。你将从宏观上全面了解数据科学周期以及管理细节所需的基本工具。全书根据近期新的tidyverse特性和很好实践进行了更新,新的章节向你展示了如何从电子表格、数据库和网站获取数据。书中提供的练习有助于你将理论应用于实践。 你将理解如何: ·可视化:创建用于数据探索和结果传达的图表 ·变换:发现变量类型及其处理工具 ·导入:将数据以便于分析的形式传给R ·编程:学习R工具,更清晰、更轻松地解决数据问题 ·交流
在大数据时代,数据的获取、传输和存储融入了人类生产生活的方方面面,而大数据核心价值体现为人们对数据的分析、理解与应用。面对如此海量、高速和异构的数据,仅靠人类的认知和理解能力远不能满足价值发现的需要。同时,计算机总是针对最细粒度数据进行迭代优化的求解模式在特定场景下也不能满足数据分析的时限需求。粒计算作为一种模拟人类知识表示和问题求解的近似数据分析范式,其优点在于解决问题时能够选择合适粒度,达到求解精度和计算时效的很好平衡。所以,粒计算通常能够以更高的效率获得“有效解”。本书以引领树和云模型作为数据多粒度表示的基本方法,系统地展示了引领树和云模型在大数据多粒度聚类、数据流即时聚类、半监督学习和时间序列预测等大数据分析场景中的理论研究成果及应用案例。 本书可供计算机科学与技术、
本书以国家高技术研究发展计划(863计划)“十二五”主题项目“面向对象的高可信SAR处理系统”为背景,针对合成孔径雷达数据在地貌地物、森林植被等方面的处理与解译难题,阐述利用多角度、多波段、多极化、极化干涉等多模式航空航天SAR数据,建立基于散射机理的地物特性知识库,构建地形辐射校正、极化干涉处理、立体测量、基于知识的地物解译等模型,开发高分辨率机载极化干涉SAR数据获取硬件系统与SAR影像高性能解译软件系统,实现以精度高、可靠性强、识别类型丰富为特征的SAR影像高可信处理与解译的原理、技术与方法,并对成果在测绘、林业等行业的应用示范效果进行了展示和分析。