本书是针对于非统计科班出身的企业人员讲述数据分析和挖掘的著作,也是诸多数据挖掘书籍中为数不多的穿插大量真实实践应用案例和场景的著作。全书分为部分: 部分是基础篇(章和第2章),主要介绍数据分析的概念、术语、方法、模型等,为后续的内容展开奠定基础。 第二部分是制表篇(第3章~第5章),介绍数据的采集原则、数据整理以及常用数据报表的制作方法和技巧。 第三部分是数据分析篇(第6章~4章),这是本书的重点内容,囊括了从数据扫描、数据标注到异常值分析、回归等常用的、有代表性的功能,并以案例形式展示在数据分析过程中使用上述功能的思路、方法和技巧,指导读者进行实战操练。
书中包含以下内容: ? 深入分析你已经在使用的系统,并学习如何更高效地使用和运维这些系统 ? 通过识别不同工具的优缺点,作出更明智的决策 ? 了解一致性、可伸缩性、容错性和复杂度之间的权衡 ? 理解分布式系统研究,这些研究是现代数据库构建的基石 ? 走到一些主流在线服务的幕后,学习它们的架构
教材紧紧围绕系统的开发过程,将开发过程中所涉及的知识点逐一分解成各个单元,只要学生顺利地完成各个单元中的任务,就完成了整个系统。初级篇项目选用"学生信息管理系统”,课堂举例和课堂练习围绕子系统"学生成绩管理系统”展开,拓展练习围绕子系统"学生住宿管理系统”展开,采用砌砖式逐步累加的方式完成。篇围绕"网上商城系统”数据库的设计、实施和管理维护展开。