本书主要内容包括:数据清洗在数据科学领域中的重要作用,文件格式、数据类型、字符编码的基本概念,组织和处理数据的电子表格与文本编辑器,各种格式数据的转换方法,解析和清洗网页上的HTML 文件的三种策略,提取和清洗PDF 文件中数据的方法,检测和清除RDBMS 中的坏数据的解决方案,以及使用书中介绍的方法清洗来自Twitter 和Stack Overflow 的数据。
本书用最轻松的图解方式来讲解数据结构,全书采用丰富的图例阐述数据结构的基本概念及应用,并将重要理论、演算方法做最详细的诠释与举例,是一本兼具内容及专业的数据结构的教学用书。由于作者长期从事信息教育及写作,在文字的表达上简洁明了、逻辑清晰,并安排了大量的习题,供读者检验学习成果。
数据分析实战 由实战经验丰富的两位数据分析师执笔,数据分析实战 首先介绍了商业领域里通用的数据分析框架,然后根据该框架,结合8个真实的案例,详细解说了通过数据分析解决各种商业问题的流程,让读者在解决问题的过程中学习各种数据分析方法,包括柱状图、交叉列表统计、A B测试、多元回归分析、逻辑回归分析、聚类、主成分分析、决策树分析、机器学习等。特别是书中使用的数据都是未经清洗的原始数据,对如何加工数据以用于数据分析也进行了详细的介绍。读者可以使用R语言实际操作数据,体验真实的数据分析流程,避免纸上谈兵。
本手册主要讲解数据备份、恢复和数据加密解密等方面的内容。本手册从各种不同的用户角度出发,从问题本身着手,从数据恢复与加密技术基本知识,到一般数据文化丢失、损坏的拯救、硬盘系统的数据恢复、特殊文件丢失后的拯救、数据的备份、常用软件的备份和恢复、BIOS和注册的备份与恢复,再到具体的数据加密技巧和数据安全防范措施等。全手册贯穿数据安全这一主题,并从数据拯救与数据加密两个层面对其进行具体阐述、剖析与实用操作的介绍,力图让读者在了解相关知识的基础上,全面掌握各种操作实践与技巧经验,轻松搞定数据安全!
在本书中,作者将自己多年形成的编程习惯以及阅读既有代码的体验凝练成了编程中的价值观、原则和77种实现模式。 沟通、简单和灵活的价值观应当被所有开发人员所铭记。局部影响、化重复、将逻辑与数据捆绑等原则同样是通用性的指导思想,比价值观更贴近编程场景,在价值观和模式之间搭建了桥梁。在77种实现模式中,每一种模式都覆盖了编写简洁、清晰、易扩展、易维护的代码这一原则的某个方面。它们为日常的编程提供了丰富翔实的参考依据,并告诉大家这些代码如何为降低沟通成本和提高有效产出提供保障。 本书适用于各个阶段的开发者群体。刚刚涉足软件开发领域的新人能够透过大师的眼睛来看待编程,了解编程的价值观与原则;具有丰富经验的资深工程师则可以通过这些模式进行反思,探究成功实践背后的意义。把价值观、原则和开发
本书由汪萍、陆正福、彭程编著,围绕数据结构与算法内容汇集了约60个综合问题,各问题中包含了若干子问题,内容包括线性表、栈和队列、串、线性表的查找、二叉树、树表的建立与查找、图、数组与广义表;书中还选择了一批基础性问题,它们源自相关的后继课程或研究工作,作为数据结构与算法内容的扩展与延伸。全书内容大多采用了“问题描述”、“问题分析”、“算法步骤”、“程序代码”以及“运行结果”的形式给出,给读者提供了从问题分析到代码实现的一个相对完整过程。 本书可作为高等院校学习数据结构与算法的本科生辅导教材以及从事算法类研究工作的低年级研究生参考书,亦适合于相关工程技术人员参考。
本书对常用的数据结构做了系统的介绍,既注重原理又强调实践,配有大量的图表和习题,概念讲解清晰、逻辑性强、可读性好。主要内容包括:数据结构的基本概念;算法描述和算法分析初步;线性表栈、队列、串和广义表、树、图等结构:排序和查找的各种方法。每章均例举了典型应用实例,并配有算法和相应源程序以供教学和实践使用。另外还在附录中设计了上机实验题供读者独立完成,以加深读者对所学知识的理解和应用。 作为“21世纪计算机系列规划教材”之一,本书可作为高等院校应用型本科及高职高专院校计算机专业教材,也可以作为大学非计算机专业学生的选修课教材和广大从事计算机应用的科技人员的参考书。
数据分析实战 由实战经验丰富的两位数据分析师执笔,数据分析实战 首先介绍了商业领域里通用的数据分析框架,然后根据该框架,结合8个真实的案例,详细解说了通过数据分析解决各种商业问题的流程,让读者在解决问题的过程中学习各种数据分析方法,包括柱状图、交叉列表统计、A B测试、多元回归分析、逻辑回归分析、聚类、主成分分析、决策树分析、机器学习等。特别是书中使用的数据都是未经清洗的原始数据,对如何加工数据以用于数据分析也进行了详细的介绍。读者可以使用R语言实际操作数据,体验真实的数据分析流程,避免纸上谈兵。
数据结构是计算机专业教学计划中的一门核心课程,也是信息管理、通信电子、自动控制等与计算机技术关系密切的专业的一门基础课程。要从事和计算机科学与技术相关的工作,尤其是计算机应用领域的开发和研制工作,必须具备坚实的数据结构的基础。本书对C 语言作了简单介绍,叙述了抽象数据类型和面向对象的概念,介绍了线性表、栈、队列、数组、广义表、树和图等数据结构,并且介绍了查找和排序的方法。全书用C 语言描述并实现了所有数据结构的类和程序,并附有习题,便于教学。 本书是为高等院校开设“数据结构”课程编写的教材,可作为计算机专业本科生教材使用,也可供从事计算机软件开发和应用的工程技术人员阅读、参考。
本书概述了物联网(IoT)和M2M(机器到机器)通信及服务的背景知识和整体愿景,包括主要标准、关键技术,还讲述了从设备的物理仪器到用于收集数据的云基础设施。此外,讨论了如何导出信息与知识和如何将这些信息和知识集成到企业过程,以及系统架构和管理需求。同时,本书还举出了许多实际的服务案例来说明如何持续和高效地开发和实现物联网和M2M通信技术。
本书以当前主流的大型数据库管理系统SQL server 2014和数据库建模工具PowerDesigner 16.5为操作平台,精心组织设计了14个上机实验和1个课程设计。本书实验目的明确,实验步骤清晰,可操作性强,知识点编排循序渐进、由浅人深,使读者能够有效地将理论应用到实践当中,便于对数据库理论知识的巩固和加深。每个实验后均配有适量习题,便于学生课后练习。 本书可作为高等院校软件工程专业、计算机相关专业本科生数据库课程上机实验和课程设计的教材,也可作为数据库管理人员及数据库应用系统开发人员的参考用书。
本书针对spark从验证性环境迁移到实际生产环境时会遇到的各种问题给出了实际的帮助,涵盖了开发及维护生产级Spark应用的各种方法、组件与有用实践。全书分为6章, ~ 2章帮助读者深入理解Spark的内部机制以及它们在生产流程中的含义;第3章和第5章阐述了针对配置参数的法则和权衡方案,用来调优Spark,改善性能,获得高可用性和容错性;第4章专门讨论Spark应用中的安全问题;第6章则全面介绍生产流,以及把一个应用迁移到一个生产工作流中时所需要的各种组件,同时对Spark生态系统进行了梳理。
本书是一本数据库管理的教材,内容翔实,示例丰富,由浅入深。 本书从数据库管理环境、数据库分析、数据库设计、实现以及高级数据库五个方面全面介绍了数据库的知识。每章之后安排了大量的习题帮助读者梳理知识,掌握基本的概念、原理。 本书还包含一个贯穿始终的实例,让读者体验数据库开发的全过程。本书的网站(://.prenhall./hoffer)中还包含大量相关资源,有助于读者复习所学知识,拓展知识面。本书适合作为相关专业的本科生、研究生的教材,也适合作为从事数据库方面工作的人员和自学者的参考书。
空间数据库是近年的热点研究领域,是一门前沿的交叉学科。本书全面介绍了空间数据库的概念、应用领域、查询语言、空间数据的索引和存储机制、空间查询处理和优化等内容,对空间数据挖掘和空间数据仓库也有精彩的论述。本书条理清晰,叙述严谨,实例丰富,曾得到业内人士的赞誉。本书的每章之后都附有习题,帮助读者检验学习效果。本书既适合作为计算机及相关专业的本科生、研究生的教材,也适合IT业的研究人员、技术人员阅读。对于想了解空间数据库的初学者来说,本书也是一本极有价值的参考书。
本书是《数据库系统概论》一书的辅导和补充教材。 本书分为部分,部分是每章基本知识点的讲解、习题参考解答与解析,模拟试卷和答案。第二部分是三个附录,是《数据库系统概论》的补充教材。第三部分是一张随书的《数据库辅助教学软件》光盘,其中包括教师投影演示教案及文稿、学生课堂复习与练习解答两大部分。 本书是应广大读者和出版社的要求,为了配合《数据库系统概论》课程的学习而编写的。通过习题的练习和参考答案,读者可以进一步加深对数据库系统基本概念的理解,对基本技术的运用,对基本知识的掌握。 本书可以作为高等学校计算机有关专业的数据库课程参考书,特别是可以作为《数据库系统概论》一书的补充教材。