医学数据仓库是数据仓库技术面向医学领域数据的具体实现。与其他企业数据仓库相比,医学数据仓库的数据来源、数据类型和数据特征都有其特殊之处。建立医学数据仓库是医学数据分析处理的基础,是医学信息技术发展的必然,对于医学、医疗卫生、药物学和医学管理等领域的研究与应用都有巨大的推动作用。医学数据挖掘所面临的数据对象类型十分丰富,包括文本、图形、图像等;数据来源也非常广泛。临床医疗和医学研究已积累了大量的信息,如何有效地存储、检索、处理和分析医学数据,为医学决策提供支持,已为医学工作者和信息技术工作者强烈关注。该领域的分析与挖掘技术极富前景,也极具挑战性。本书力图从两个角度观察和分析医学数据处理与分析技术。一方面从信息技术的角度介绍数据仓库及数据分析与挖掘的基本原理、技术和发展前景;另
本书系统介绍业务建模与数据挖掘技术。 内容涵盖了如何发现、构建和提炼在业务情景中有用的模型;如何设计、发现和开发挖掘所需的数据;如何提供为各种业务情景挖掘数据的实用的方法等。 本书适合从事业务建模和数据挖掘以及相关领域的专业技术人员参考。 本书展示了如何系统地表达现实世界中的业务问题,从而可以利用数据挖掘技术来解决。重点介绍如何将业务问题的口头表达或模糊的描述首先转换为定性的模型,然后再转换为定义明确的定量模型用于解决问题。最后描述了通过数据挖掘所发现的这些结论如何转换为战略的或技术的实现。 本书回答了各行各业各个层次的经营管理者,数据挖掘工具的真正用户所面临的许多非常切实的问题,例如,数据挖掘技术能够在哪些领域中最有效地应用?如何建立挖掘模型,从而把业务问题
Authorized translation from the English language edition, entitled Beyond Big Data: Using Social MDM to Drive Deep Customer Insight, 0 13 350980 X by Martin Oberhofer, published by Pearson Education, Inc, publishing as IBM, copyright ?i 2014.All Rights Reserved. No part of thiook may be reproduced or transmitted in any form or by any means, electronic or mechanical, including photocopying, recording or by any information storage retrieval system, without permission from Pearson education, Inc. CHINESE SIMPLIFIED language edition published by TSINGHUA UNIVERSITY PRESS Copyright ?i 2016.
本书重点介绍数据质量管理与安全管理的理论及应用。首先通过数据管理现况和问题的分析,提出数据质量管理的步必须是将各种来源的数据标准化,具有统一的数据格式和规则。书稿中强调了提高数据质量不仅可提高信息系统的质量,还可提高经营活动的质量。需要制定质量管理计划或执行具体的质量管理活动。定义了数据质量的准确性、一致性、可用性、可达性、及时性、安全性这6个标准以及对应的管理流程,划分了5个能力成熟度的等级,界定了从管理者到执行者等各个质量管理活动和责任。提出多项数据质量管理主要技术和各国实用案例,还进一步在Orange数据库中实践了数据质量诊断流程。书稿后半部针对日益增长的数据库安全性的需求,提出了安全管理系统构建、访问控制,数据伪装等具体可行的技术手段,最后还将数据安全技术推广到大数据的应用场景
《中国数据中心运维管理指针》主要针对数据中心运维管理、监控系统、基础设施管理技术,结合《数据中心设计规范》(GB50174-2013),总结了外数据中心技术发展情况,从技术、规范、设计及产品应用等方面进行了阐述。本书主要包括以下三个方面的内容:一、数据中心运维管理技术:数据中心运维白皮书简介、数据中心ITIL运维框架、数据中心运维组织架构、数据中心基础设施运维之监控系统、数据中心基础设施运维之日常工作、数据中心基础设施运维之应急处理、数据中心网络运维、数据中心客户服务、数据中心现场运维之基础工作、数据中心基础及应用平台运维、数据中心运维管理工具、数据中心运维质量保障体系、数据中心运维相关认证、数据中心运维之行业实例、数据中心能耗测评、数据中心运维之能效管理、数据中心测试验证和数据中心运维之供应商
《数据恢复技术深度揭秘》第二版是在版的基础之上增加和充实了服务器磁盘阵列(RAID)的恢复技术,新增了大量实战案例的分析和讲解,并精选书中的部分案例由作者制作成视频教学资料(DVD光盘)随书附赠。本书从逻辑类恢复和物理类恢复两个层面全面讲解当前最实用的数据恢复技术。在逻辑类数据恢复方面,内容包括MBR磁盘分区、动态磁盘分区、GPT磁盘分区、Solaris分区、APM分区、BSD分区的恢复技术;Windows平台的FAT32、FAT16文件系统、NTFS文件系统、ExFAT文件系统的恢复技术;UNIX平台的UFS1、UFS2文件系统恢复技术;Apple平台的HFS 文件系统恢复技术;Linux平台的EXT3、EXT4文件系统恢复技术;还包括Windows、UNIX、Apple、Linux平台的RAID-0、RAID-1、RAID -1E、RAID-5、RAID-5EE、RAID-6、HP双循环等磁盘阵列恢复技术。在物理类数据恢复方面,内容包括各大品牌硬盘出现电路故障、磁
本书是作者研究SQL Server 2005数据库系统管理的经验总结。 全书共分为15章,内容包括初学SQL Server 2005的问题,安装SQL Server 2005,配置SQL Server 2005网络,管理SQL Server 2005服务器,SQL Server 2005体系结构,管理SQL Server 2005数据库,管理SQL Server 2005表,Transact-SQL基础,用Transact-SQL操作数据、用Transact-SQL查询数据,管理SQL Server 2005索引,其他数据对象,数据完整性,管理SQL Server 2005安全,备份、恢复和维护等。 本书内容全面,思路流畅,实用性强,所有实例均经过上机反复实践。本书适合SQL Server 2005初学者阅读和参考,可作为SQL Server 2005数据库技术培训教材。 本书配套光盘包括各章标注的内容及作者亲自配音制作的多媒体视频。
医学数据仓库是数据仓库技术面向医学领域数据的具体实现。与其他企业数据仓库相比,医学数据仓库的数据来源、数据类型和数据特征都有其特殊之处。建立医学数据仓库是医学数据分析处理的基础,是医学信息技术发展的必然,对于医学、医疗卫生、药物学和医学管理等领域的研究与应用都有巨大的推动作用。医学数据挖掘所面临的数据对象类型十分丰富,包括文本、图形、图像等;数据来源也非常广泛。临床医疗和医学研究已积累了大量的信息,如何有效地存储、检索、处理和分析医学数据,为医学决策提供支持,已为医学工作者和信息技术工作者强烈关注。该领域的分析与挖掘技术极富前景,也极具挑战性。本书力图从两个角度观察和分析医学数据处理与分析技术。一方面从信息技术的角度介绍数据仓库及数据分析与挖掘的基本原理、技术和发展前景;另
特征选择是机器学习的重要研究内容,有着广泛的应用价值。特征选择主要从数据(尤其是高维数据)中选取有效特征来表示数据,从而提高机器学习算法的性能。《高维数据的特征选择:理论与算法》以重庆工商大学等单位的机器学习、图像处理课题为基础,系统地介绍特征选择的基本概念,以及相关的理论和算法,也对它的前沿研究(如无监督特征选择)和其在计算机视觉中的应用进行详细介绍,最后对特征选择的发展方向进行展望。 《高维数据的特征选择:理论与算法》理论联系实际,对教学、科研具有重要指导意义,可作为高等院校和科研机构从事机器学习的学者的参考书,亦可供从事大数据分析(如基因数据、计算机视觉)的专业技术人员参考。
《数据质量管理基础》正文由7章组成(重点考虑关系型结构化数据):章简介数据质量问题;第2章展开讨论条件依赖理论;第3章阐述发现条件依赖,以及基于发现条件依赖检测数据不一致、修复数据的实践技术;第4章介绍依赖匹配作为数据去重的匹配规则;第5章重温经典的两个信息完整性假定,即封闭世界假定和开放世界假定,并提出和研究相对信息完整性理论;第6章进行数据时效性建模,以便时间戳缺失情况下,在数据库中进行实体值辨别并基于此返回查询结果;第7章探索数据质量问题之间的交互作用。
postgresql是目前广泛应用的开源数据库管理系统。《PostgreSQL 数据库内核分析》从postgresql数据库的源代码入手,深入分析了该数据库管理系统的底层实现细节,揭示了数据库运行的基本原理。《PostgreSQL 数据库内核分析》的主要内容包括:postgresql数据库的体系结构、 存储管理、索引机制、查询编译、查询执行、并发控制机制以及安全等。每个主题都引用了大量的数据结构、图表等进行说明,使读者对实现过程和机理一目了然。 《postgresql数据库内核分析》适合从事数据库领域相关研究的技术人员、高等院校相关专业高年级本科生或研究生阅读,有助于读者进行数据库的高级开发、基于postgresql定制满足需求的数据库系统,或者在数据库内核中实现并验证数据库新技术。
本书系统介绍业务建模与数据挖掘技术。 内容涵盖了如何发现、构建和提炼在业务情景中有用的模型;如何设计、发现和开发挖掘所需的数据;如何提供为各种业务情景挖掘数据的实用的方法等。 本书适合从事业务建模和数据挖掘以及相关领域的专业技术人员参考。 本书展示了如何系统地表达现实世界中的业务问题,从而可以利用数据挖掘技术来解决。重点介绍如何将业务问题的口头表达或模糊的描述首先转换为定性的模型,然后再转换为定义明确的定量模型用于解决问题。最后描述了通过数据挖掘所发现的这些结论如何转换为战略的或技术的实现。 本书回答了各行各业各个层次的经营管理者,数据挖掘工具的真正用户所面临的许多非常切实的问题,例如,数据挖掘技术能够在哪些领域中最有效地应用?如何建立挖掘模型,从而把业务问题
计算和信息技术的飞速发展带来了医学、生物学、财经和营销等诸多领域的海量数据。理解这些数据是一种挑战,这导致了统计学领域新工具的发展,并延伸到诸如数据挖掘、机器学习和生物信息学等新领域。许多工具都具有共同的基础,但常常用不同的术语来表达。本书介绍了这些领域的一些重要概念。尽管应用的是统计学方法,但强调的是概念,而不是数学。许多例子附以彩图。本书内容广泛,从有指导的学习(预测)到无指导的学习,应有尽有。包括神经网络、支持向量机、分类树和提升等主题,是同类书籍中介绍得最全面的。 本书可作为高等院校相关专业本科生和研究生的教材,对于统计学相关人员、科学界和业界关注数据挖掘的人,本书值得一读。
本书是在作者多年从事数据挖掘行业实践和相关科学研究的基础上编写而成,书中包括数据挖据理论研究及实际应用的现状分析、研究内容的组织框架、研究方法与技术路线的描述、数据挖掘理论及应用的综述、不确定性理论、多目标优化的分类器方法、模糊多目标优化的分类器模型和算法、基于粗糙集和统计贡献度的特征选择算法、基于粗糙集预处理和粗近似的多目标优化的分类器模型和算法以及基于模糊化、核方法和惩罚因子的多目标优化的分类器模型和算法等内容。本书含有不确定性多目标优化的数据挖掘在信用评分、Web客户忠诚度分析、蛋白质交互的热点区域预测以及重大疾病的医疗诊断和预测等几个经典领域中的实际应用的描述。最后,通过对研究内容和实际应用效果的总结,展望了进一步研究和应用的方向。本书可供从事数据挖掘、机器学习与知识工
《数据质量管理基础》正文由7章组成(重点考虑关系型结构化数据):章简介数据质量问题;第2章展开讨论条件依赖理论;第3章阐述发现条件依赖,以及基于发现条件依赖检测数据不一致、修复数据的实践技术;第4章介绍依赖匹配作为数据去重的匹配规则;第5章重温经典的两个信息完整性假定,即封闭世界假定和开放世界假定,并提出和研究相对信息完整性理论;第6章进行数据时效性建模,以便时间戳缺失情况下,在数据库中进行实体值辨别并基于此返回查询结果;第7章探索数据质量问题之间的交互作用。
微软MVP倾情之作 管理SQL Server 2014的实践 《SQL Server 2014管理实践(第3版)/SQL Server 数据库经典译丛》丰富而全面的指南阐明了成功管理SQL Server所需的技能,包括变更管理、安全性、性能调整、监控和备份。本书的作者都是SQL Server的专家,他们将带领读者掌握SQL Server 2014的新功能,包括通过SQL Server Management Studio将云和本地管理更好地集成在一起、性能优化增强、新的基数估计器以及新的AlwaysOn可用性组功能。这本全面的指南将帮助读者提高SQL Server环境的效率、可扩展性和性能,从而花更少的时间,做更多的事情。 主要内容 概述了SQL Azure和AlwaysOn可用性组的新功能