本书主要内容包括:数据清洗在数据科学领域中的重要作用,文件格式、数据类型、字符编码的基本概念,组织和处理数据的电子表格与文本编辑器,各种格式数据的转换方法,解析和清洗网页上的HTML 文件的三种策略,提取和清洗PDF 文件中数据的方法,检测和清除RDBMS 中的坏数据的解决方案,以及使用书中介绍的方法清洗来自Twitter 和Stack Overflow 的数据。
本书是江苏省高等学校精品教材和“十二五”江苏省高等学校重点教材(编号:2015-1-072)。全书突出基础性、新颖性、实用性、操作性,系统全面、深入浅出、实例丰富,以关系数据库系统为核心,将数据库基本原理、方法和应用技术相结合。本书主要内容包括数据库系统概述、关系数据库、关系数据库标准语言SQL、关系规范化理论、数据库设计、数据库保护技术、SQL Server 2012的应用、数据库应用系统开发和数据库技术新进展等。每章均配有小结并附有适量的习题,便于读者巩固所学知识。书后所附习题答案可以帮助读者检验学习和练习效果。此外,本书配有教学课件及数据库应用系统开发源程序。本书可作为高等院校计算机科学与技术、软件工程、信息管理与信息系统、信息与计算科学以及相关专业的本科生教材,也可作为从事计算机软件工作的科技人员和工程
随着大数据研究热潮的兴起,各种数据可视化图表层出不穷,大数据生动呈现就成为了具有挑战性的工作,随之出现了大量的可视化软件。本书是基于行业占有率比较高的Microsoft Power BI近期新版本所编写的,详细介绍Microsoft Power BI的数据可视化功能,包括数据类型和运算符、软件的安装、连接数据源、数据基础操作、可视化设计原则、可视化图表、自定义可视化效果、报表、仪表板、查询编辑器、运行R脚本、数据不错操作、数据分析表达式、网页流量数据分析、超市运营数据分析、Power BI移动应用和Power BI应用开发等内容。
随着大数据研究热潮的兴起,各种数据可视化图表层出不穷,大数据生动呈现就成为了具有挑战性的工作,随之出现了大量的可视化软件。本书是基于行业占有率比较高的Microsoft Power BI近期新版本所编写的,详细介绍Microsoft Power BI的数据可视化功能,包括数据类型和运算符、软件的安装、连接数据源、数据基础操作、可视化设计原则、可视化图表、自定义可视化效果、报表、仪表板、查询编辑器、运行R脚本、数据不错操作、数据分析表达式、网页流量数据分析、超市运营数据分析、Power BI移动应用和Power BI应用开发等内容。
MongoDB如何帮你管理通过web应用收集的海量数据呢?《MongoDB指南(第2版)》由项目的核心人员霍多罗夫(Kristina Chodorow)编写,为你展示了使用基于文档的数据库的诸多优势,并且演示了这种可靠的、高性能的系统是如何允许接近无限的水平扩展性。 《MongoDB指南(第2版)》为数据库开发人员提供了指南,为系统管理员提供了配置向导,也为你的项目中的其他人员提供了概念和用例的概览。这本指南适合于NoSQL的初学者和有经验的MongoDB 用户,它提供了多种现实世界的模式设计样例。
本书是介绍大数据及其应用的著作,全书分为三篇共11章。上篇(1~2章)描述了大数据带来的冲击和它引爆的思维革命、社会变革,以及数据权在政治、经济、军事上的重要意义。中篇(3~6章),介绍了大数据的数理哲学原理和认识论原理,大数据在科学认识中的作用,以及大数据分析的社会意义。下篇(7~11章),是与大数据研究相关的一些应用成果,包括主动智能搜索、数据挖掘与创新、企业信誉与市场满意度调查、中国市场经济信息评估系统和智慧城市的规划与评估。
《高等院校计算机科学与技术规划教材:数据库原理及应用(第3版)》重点介绍了数据库系统的基本概念、基本原理和基本设计方法,同时基于SQLServer2005介绍了据库原理及应用。本书力求对传统的数据库理论和应用进行精炼。保留实用的部分。使其更为通俗易懂,更为简明实用。 《高等院校计算机科学与技术规划教材:数据库原理及应用(第3版)》共有7章,主要内容包括:数据库系统概述、数据模型、关系数据库理论、SQL语言、关系数据库设计理沦、数据库安全保护、数据库设计和SQLServer2005数据库管理系统等。 本书内容循序渐进、深入浅川,每章都给出了较多的示例,各章后均有适量的习题以便于渎者练习与巩固所学知识。 本书可作为汁算机各专业及信息类、电子类等相关专业的本科、专科“数据库原理及应用”类课程的教材,同时也可以供参
本书是一本独特的数据库入门书,以最有效的教学思路讲解数据库的每一个知识点,完全以初学者的思维方式提出疑问再深入答疑。这也许不是一本传统的教科书,但是自学数据库的书籍。本书采用 老田、小天 二人对话的形式讲解,其中不乏诙谐幽默的问题和解答,避免对知识点生搬硬套。 通过学习本书,你能够在嬉笑怒骂的环境中轻松掌握数据存储原理、数据库设计技巧以及大量数据库编程的实战经验,更重要的是能够掌握一种的学习方法、解决问题的思路和思考的方式。这些经验和技巧得益于我和邹老师两人加起来近25年的项目开发和教育培训经历。 本书部分对于数据库的创建、备份、配置、安全等做详细介绍,通过这部分学习,可以掌握关系数据库的基础,以及对数据库的日常维护操作;本书第二部分对于分析项目需求,创建表,然后使用T-SQL语