本书提供了一种简单、高效、通用的关系型数据库索引设计方法。作者通过系统的讲解及大量的案例清晰地阐释了关系型数据库的访问路径选择原理,以及表和索引的扫描方式,详尽地讲解了如何快速地估算SQL运行的CPU时间及执行时间,帮助读者从原理上理解SQL、表及索引结构、访问方式等对关系型数据库造成的影响,并能够运用量化的方法进行判断和优化,指导关系型数据库的索引设计。
本书是针对于非统计科班出身的企业人员讲述数据分析和挖掘的著作,也是诸多数据挖掘书籍中为数不多的穿插大量真实实践应用案例和场景的著作。全书分为部分: 部分是基础篇(章和第2章),主要介绍数据分析的概念、术语、方法、模型等,为后续的内容展开奠定基础。 第二部分是制表篇(第3章~第5章),介绍数据的采集原则、数据整理以及常用数据报表的制作方法和技巧。 第三部分是数据分析篇(第6章~4章),这是本书的重点内容,囊括了从数据扫描、数据标注到异常值分析、回归等常用的、有代表性的功能,并以案例形式展示在数据分析过程中使用上述功能的思路、方法和技巧,指导读者进行实战操练。
本书提供了在线生产环境的PostgreSQL数据库的常见问题和故障快速解答,这些都基于作者作为PostgreSQL数据库培训师、用户和核心开发人员时的经验积累。每个技术都被拆分为小的方法或建议,先给出包含可工作代码的演示解决方案,然后解释这样做的原因及工作原理。本书意在成为新用户和技术专家的桌面参考手册。本书涵盖了PostgreSQL 9 所有的新功能。