本书主要介绍从高维数据中感知、处理、分析和学习低维结构的基本数学原理和高效计算方法,系统地归纳了建模高维空间中低维结构的数学原理,梳理了处理高维数据模型的可扩展高效计算方法,阐明了如何结合领域具体知识或考虑其他非理想因素来正确建模并成功解决真实世界中的应用问题。本书包括基本原理、计算方法和真实应用三个部分:基本原理部分系统地介绍稀疏、低秩和一般低维模型的基本性质和理论结果,计算方法部分介绍解决凸优化和非凸优化问题的有效算法,真实应用部分通过实例演示利用前两部分的知识改进高维数据处理和分析问题的解决方案。本书适合作为计算机科学、数据科学和电气工程专业的高年级本科生和研究生的教材,也适合学习稀疏性、低维结构和高维数据课程的学生参考。
本书是一部通过提供一套易于遵守及操作的方法论来实现高质量数据管理的实践指南。内容 全面、详细,并有许多实用的建议和模板,第1版推出后,已成为全球信息质量实践者的书 籍,甚至已成为美国阿肯色大学信息质量研究生项目的教科书。 本书共7章,内容包括数据质量和依赖于数据的世界、数据质量实践、关键概念、十步法流 程、设计项目结构、其他技巧和工具,以及写在最后的话。 作者将信息质量的概念框架与改善信息质量的技术、工具、操作指南相结合,提出并详细描 述了获取高质量数据和可信信息的十步法。作为本书的最新改版,作者进一步阐明并更新了流程 步骤和支持模板,整合了一些有价值的示例和案例,说明了近些年技术和数据生产的演变。 本书内容丰富,理论和实践相结合,易读性和可操作性强,可以作为数据质量管理的入门和 进阶用
《精益数据方法论:数据驱动的数字化转型》 这是一本用精益思想指导企业以数据为核心进行数字化转型的著作,它将帮助企业事半功倍地找到正确的数字化转型战略、方法与路径。 作者结合自己20余年的实战经验,将精益思想与数据利用深度融合,总结了一套从业务目标出发,以价值场景为抓手,以数据为驱动的精益数据方法论。进一步以该方法论为基础,衍生出精益数据花瓣模型、精益数字化转型三步法、数据驱动的六大能力模型,精益数字化转型共创工作坊,四大精益数据画布,数据驱动的成熟度评估模型,从认知到实践、从工具到方法,从路径到指南,全方位指导企业将数字化转型落地,在数字化转型大浪潮中有里程碑意义。 ========================== 《精益数据分析:数据驱动商业决策与业务增长》 这是一本能指导不同业态、不同阶段的产品、项目和企业
《Origin科技绘图与数据分析》内容简介 《Origin科技绘图与数据分析》以Origin 2023中文版为软件平台,结合编者多年的数据分析经验,通过大量应用实例详细介绍Origin在科研数据处理与数据作图中的使用方法与技巧。全书共13章:第1~6章主要讲解Origin的基础知识与科技绘图,包括Origin的操作界面、窗口类型、绘图基本设置、数据操作管理、二维及三维图的绘制、统计图形绘制等;第7~13章结合Origin数据处理与统计分析功能,分别讲解线性拟合、非线性拟合、数据操作与分析、基础统计分析、参数与非参数检验、数字信号处理等知识,最后介绍如何在Origin中进行版面设计与输出操作。通过阅读本书,可以帮助读者快速掌握Origin的应用,从而更好地处理和分析科研数据。 本书注重基础,内容翔实,突出示例讲解,既可以作为从事数据分析处理的科研工程技术人员的自学
本书是首本专注于利用R语言进行科研数据清洗的书籍,全书主要分为两大块,首块以简洁的内容向读者介绍R语言的入门知识,让读者了解并认识R语言,为后面的内容打下基础。全书大部分篇幅主要集中在第二块内容,即数据清洗的知识。作者从实际问题出发,详细的介绍了如何利用R语言处理科研中的数据,比如缺失值的插补,异常值的查找,长宽型数据结构的转换,时间日期数据的处理,文本数据的处理等,此外,作者也将数据清洗的内容进行了适当扩展,比如书中加入了R语言与数据库的连接方法,让大数据的处理更加得心应手。
《新编数据库原理习题与解析》根据计算机专业“数据库原理”课程的教学大纲编写,全书共分10章,分别介绍数据库的基础知识、关系数据库、sql语言、关系系统及其查询优化、关系数据理论、数据库设计、数据库保护、对象关系和面向对象数据库系统、分布式数据库系统以及数据仓库概述。每章由基本知识点和例题分析组成,前者高度概括和疏理本章应重点掌握的相关知识:后者则详尽地解析精选的典型习题。《新编数据库原理习题与解析》将使读者充分掌握“数据库原理”课程求解问题的技巧与方法,深化对基本概念的理解,切实提高分析问题和解决问题的能力。 《新编数据库原理习题与解析》内容丰富,习题覆盖面广,不仅可以作为计算机专业本、专科数据库原理课程的学习参考书,也是报考计算机专业硕士研究生的考生复习材料(复试),对数据库原
本书详细介绍了分布式数据库系统涉及的主要技术,包括分布式数据库设计、分布式查询处理和优化、分布式事务管理和恢复、分布式并发控制、分布式数据库的可靠性、分布式数据库的安全性等内容,同时介绍了分布式数据库系统的几个典型应用和发展趋势。本书在第二版的基础上做了一些修改和补充,增加或补充了数据库技术和计算机网络基础知识回顾、分布式数据库系统的主要应用、分布式数据库系统的发展趋势等内容,并结合当前流行的云计算技术增加了一些新的内容,如GFS、HDFS、BigTable、HBase等,以使读者对分布式数据库系统的未来发展有较为清晰的了解。本书对分布式数据库系统的基本内容进行了详实的讲解,对一些有争议的问题进行了开放式的讨论,但对深奥的理论没有采用繁琐的证明方式,而是采用大量的图示和实例做浅显的解释,从而增加了可
“入门很简单丛书”是由清华大学出版社精心打造的一套编程入门图书。丛书强调“零门槛学编程,看得懂,学得会,容易上手”的理念。目前已经出版了十几个品种,涵盖常见编程语言和技术。丛书中的每一本都由经验丰富的编程老手精心编写,讲解细腻,易学好用,视频教学,深受读者喜爱,居于同类图书的前列,是近年来不可多得的编程图书。可以说,这套丛书是编程新手上手的读物! 本书从初学者的角度出发,由浅入深,循序渐进地介绍了MariaDB数据库应用与开发的相关知识。书中提供了大量的MariaDB数据库操作示例,还提供了丰富的实例和上机实践内容,供读者演练。 本书共22章,分为5篇。篇介绍数据库的基础知识、在Windows平台下安装MariaDB数据库、在Linux平台