《多传感器数据融合系统:EKF及模糊决策应用分析》提供了一个新颖的方法来解决传感器数据融合问题,即在动态决策机制基础上建立了态势感知模型,并利用态势感知、个人和环境因素之间的关系做出的安全决策。重点阐述了融合系统中如何利用模糊逻辑来制定决策。原书作者详细介绍了扩展卡尔曼滤波(EKF)的应用分析及基于模糊决策的多传感器数据融合系统。在研究中,《多传感器数据融合系统:EKF及模糊决策应用分析》选择了几个相关的传感器(激光,声纳和射频传感器)监测多个动态代理区域的安全状态,这个系统利用了传感器的相性和互补性,尤其是当使用异构传感器时,在性能上有很大的改进。
聚类是数据挖掘领域的一个重要分支。 《数据聚类》全面系统地介绍聚类的主要方法。首先,对涉及聚类的各个方面进行简略的综述;然后,对各类聚类算法进行较详细的讨论。 《数据聚类》主要内容分为部分:部分是经典算法部分(第2~6章),讨论k-均值、DBSCAN等传统算法;第二部分是高级算法部分(第7~12章),讨论半监督聚类、高维数据聚类、不确定数据聚类等;第三部分是多源数据聚类部分(3章),主要讨论多视角聚类和多任务聚类。 《数据聚类》可供数据科学与人工智能等领域的研究人员、工程技术人员、相关学科研究生和基础较好的高年级本科生参考阅读。
本书介绍了 PostgreSQL 内部的工作原理,包括数据库对象的逻辑组织与物理实现,进程与内存的架构。并依次剖析了几个重要的子系统:查询处理、外部数据包装器、并发控制、清理过程、缓冲 区管理、WAL、备份及流复制。本书为 DBA 与系统开发者提供了一幅全景概念地图,有助于读者形 成对数据库实现的整体认识,亦可作为深入学习 PostgreSQL 源代码的导读手册,对于理解数据库原 理与 PostgreSQL 内部实现大有裨益。 本书适合数据库开发人员及相关领域的研究人员、数据库 DBA 及高等院校相关专业的学生阅读。
我们能相信统计么? 抛了5次硬币,结果都是正面,抛硬币是否肯定是正面?如何从高层的统计指标看透数据后面的本质?如何在大数据时代获取战略制高点,确定自己的职业发展定位?从一个互联网公司数据分析师的成长经历,为您娓娓道来,数据分析中的奇闻趣事、心得总结、方法技巧与哲学感悟。
本书介绍了 PostgreSQL 内部的工作原理,包括数据库对象的逻辑组织与物理实现,进程与内存的架构。并依次剖析了几个重要的子系统:查询处理、外部数据包装器、并发控制、清理过程、缓冲 区管理、WAL、备份及流复制。本书为 DBA 与系统开发者提供了一幅全景概念地图,有助于读者形 成对数据库实现的整体认识,亦可作为深入学习 PostgreSQL 源代码的导读手册,对于理解数据库原 理与 PostgreSQL 内部实现大有裨益。 本书适合数据库开发人员及相关领域的研究人员、数据库 DBA 及高等院校相关专业的学生阅读。
《MySQL从入门到精通》从初学者角度出发,通过通俗易懂的语言以及丰富多彩的实例,详细介绍了MySQL开发应该掌握的各方面技术。《MySQL从入门到精通》共分为4篇23章,包括数据库基础,初识MySQL,使用MySQL图形化管理工具,数据库操作,存储引擎及数据类型,操作数据表,MySQL基础,表数据的增、删、改操作,数据查询,常用函数,索引,视图,数据完整性约束,存储过程与存储函数,触发器,事务的应用,事件,备份与恢复,MySQL性能优化,权限管理及安全控制,PHP管理MySQL数据库中的数据,Apache PHP MySQL实现网上社区,Struts 2 Spring Hibernate MySQL实现网络商城等内容。所有知识都结合具体实例进行介绍,涉及的程序代码也给出了详细的注释,可以使读者轻松领会MySQL的精髓,快速提高开发技能。 《MySQL从入门到精通》内容详尽,实例丰富,非常适合作为编程初学者的
我们能相信统计么? 抛了5次硬币,结果都是正面,抛硬币是否肯定是正面?如何从高层的统计指标看透数据后面的本质?如何在大数据时代获取战略制高点,确定自己的职业发展定位?从一个互联网公司数据分析师的成长经历,为您娓娓道来,数据分析中的奇闻趣事、心得总结、方法技巧与哲学感悟。
Spark SQL 是 Spark 技术体系中较有影响力的应用(Killer application),也是 SQL-on-Hadoop 解决方案 中举足轻重的产品。《Spark SQL内核剖析》由 11 章构成,从源码层面深入介绍 Spark SQL 内部实现机制,以及在实际业务场 景中的开发实践,其中包括 SQL 编译实现、逻辑计划的生成与优化、物理计划的生成与优化、Aggregatio算子和 Joi算子的实现与执行、Tungste优化技术、生产环境中的一些改造优化经验等。
查询优化器是数据库中很重要的模块之一,只有掌握好查询优化的方法且了解查询优化的细节,在对数据库调优的过程中才能有的放矢,否则调优的过程就如无本之木、无源之水,虽上下求索而不得其法。本书揭示了PostgreSQL数据库中查询优化的实现技术细节,首先对子查询提升、外连接消除、表达式预处理、谓词下推、连接顺序交换、等价类推理等逻辑优化方法进行了详细描述,然后结合统计信息、选择率、代价对扫描路径创建、路径搜索方法、连接路径建立、Non-SPJ路径建立、执行计划简化与生成等进行了深度探索,使读者对PostgreSQL数据库的查询优化器有深层次的了解。本书适合数据库内核开发人员及相关领域的研究人员、数据库DBA、高等院校相关专业的本科生或者研究生阅读。
R语言作为如今热门的编程语言之一,它由统计学家开发,在解决数据分析问题时具有先天优势。它是一门新兴的语言,掌握它,就是掌握了一门高校的数据分析软件。随着大数据的轰炸,R语言的功能越来越丰富,越来越多的人对R语言产生了兴趣。R语言的特点主要是开源性、全面性、操作简便性、可扩展性等。《基于R语言数据挖掘的统计与分析》的编写是为了让对R语言有兴趣的读者能更加了解R语言,了解大数据时代的数据挖掘等。
Authorized translation from the English language edition, entitled Beyond Big Data: Using Social MDM to Drive Deep Customer Insight, 0 13 350980 X by Martin Oberhofer, published by Pearson Education, Inc, publishing as IBM, copyright ?i 2014.All Rights Reserved. No part of thiook may be reproduced or transmitted in any form or by any means, electronic or mechanical, including photocopying, recording or by any information storage retrieval system, without permission from Pearson education, Inc. CHINESE SIMPLIFIED language edition published by TSINGHUA UNIVERSITY PRESS Copyright ?i 2016.
本书主要探讨在这个演算时代,"身份”的意义为何:演算法如何运作,在哪些层面控制了我们的生活,我们又该如何抵抗?演算法无所不在,组织全世界的数据。我们每一次使用电脑搜寻、按赞、点击与购买都是一个数据。这些复杂的系统规则,不只塑造我们在网络与现实生活中的知识与人际关系,还决定了我们的现在与未来的样貌,无论是否在线。
Authorized translation from the English language edition, entitled Beyond Big Data: Using Social MDM to Drive Deep Customer Insight, 0 13 350980 X by Martin Oberhofer, published by Pearson Education, Inc, publishing as IBM, copyright ?i 2014.All Rights Reserved. No part of thiook may be reproduced or transmitted in any form or by any means, electronic or mechanical, including photocopying, recording or by any information storage retrieval system, without permission from Pearson education, Inc. CHINESE SIMPLIFIED language edition published by TSINGHUA UNIVERSITY PRESS Copyright ?i 2016.
本书主要探讨在这个演算时代,"身份”的意义为何:演算法如何运作,在哪些层面控制了我们的生活,我们又该如何抵抗?演算法无所不在,组织全世界的数据。我们每一次使用电脑搜寻、按赞、点击与购买都是一个数据。这些复杂的系统规则,不只塑造我们在网络与现实生活中的知识与人际关系,还决定了我们的现在与未来的样貌,无论是否在线。
本书主要探讨在这个演算时代,"身份”的意义为何:演算法如何运作,在哪些层面控制了我们的生活,我们又该如何抵抗?演算法无所不在,组织全世界的数据。我们每一次使用电脑搜寻、按赞、点击与购买都是一个数据。这些复杂的系统规则,不只塑造我们在网络与现实生活中的知识与人际关系,还决定了我们的现在与未来的样貌,无论是否在线。
《数据建模与DB设计》重点介绍数据建模与数据库设计的理论及应用。从数据模型的发展历程及其必要性引入,基于作者在研究和项目实践中积累的经验,让读者理解数据建模是业务负责人与数据设计者之间沟通的工具,数据模型决定数据处理性能与数据管理便利性。书中首先将数据建模划分为概念建模、逻辑建模、物理建模以及的数据库设计四个阶段,明确了导出实体、设定实体的重要关系、设定键的数据建模流程。为了提高数据整合性和业务流程性能,先后提出了范式化和反范式化过程,在构建理解的数据结构的同时兼顾数据库的访问成本,寻找盈亏平衡点。《数据建模与DB设计》无论对数据分析设计领域的初学者还是实际业务的实践者,都很有启发和指导作用。
本书采用了类设计模式的方式对数据模型进行高度抽象总结,同时作者对数据模型的抽象程度做了等级划分,对卷一提到的各种数据模型在不同的抽象程度下设计出来的数据模型做详细的分析。作者分享了一个非常宝贵的工具,任何人参与数据建模,从新手到专家。作者向你展示如何:最常见的数据模型构建模型等模型的作用、层次、分类、地位、沟通方式,和业务规则。使用一个强大的数据模型模式的数据建模。评估特定与广义模型的优缺点。有助于你改进逻辑和物理模型的质量和完整性。应用模式在许多类型的数据建模工作,如原型,应用程序,企业数据模型,数据仓库,和主数据管理工作。本书的重点是基本的模式,影响超过百分之50的数据建模工作。这些模式可以用来大大减少建模时间和成本,启动数据建模工作。本书作为经典的指导思想,大幅度提高了
《数据质量管理基础》正文由7章组成(重点考虑关系型结构化数据):章简介数据质量问题;第2章展开讨论条件依赖理论;第3章阐述发现条件依赖,以及基于发现条件依赖检测数据不一致、修复数据的实践技术;第4章介绍依赖匹配作为数据去重的匹配规则;第5章重温经典的两个信息完整性假定,即封闭世界假定和开放世界假定,并提出和研究相对信息完整性理论;第6章进行数据时效性建模,以便时间戳缺失情况下,在数据库中进行实体值辨别并基于此返回查询结果;第7章探索数据质量问题之间的交互作用。
本书重点介绍数据质量管理与安全管理的理论及应用。首先通过数据管理现况和问题的分析,提出数据质量管理的步必须是将各种来源的数据标准化,具有统一的数据格式和规则。书稿中强调了提高数据质量不仅可提高信息系统的质量,还可提高经营活动的质量。需要制定质量管理计划或执行具体的质量管理活动。定义了数据质量的准确性、一致性、可用性、可达性、及时性、安全性这6个标准以及对应的管理流程,划分了5个能力成熟度的等级,界定了从管理者到执行者等各个质量管理活动和责任。提出多项数据质量管理主要技术和各国实用案例,还进一步在Orange数据库中实践了数据质量诊断流程。书稿后半部针对日益增长的数据库安全性的需求,提出了安全管理系统构建、访问控制,数据伪装等具体可行的技术手段,最后还将数据安全技术推广到大数据的应用场景