本书是数据挖掘精髓的浓缩。章用通俗易懂的语言回答五个基本问题,包括什么是数据,什么是大数据,什么是数据挖掘,以及数据挖掘能挖掘出哪些东西和会产生什么价值。然后用6章的篇幅介绍k-均值、k-近邻、朴素贝叶斯、决策树、回归分析和关联规则挖掘等6种方法。第8章介绍一些实际的应用,演示简单的数据挖掘方法如何产生巨大的价值。本书可供高校的数据科学与大数据、智能科学与技术、人工智能、计算机科学与技术和统计类、应用数学等相关专业的学生作为教材使用,也可供高校的商科大数据、金融等专业的学生、的中学生、科技企业的管理者和相关行业的投资人学习参考。
本书按照数据库应用(VFP)课程标准组织编写内容,每一个模块包含教学目标、目标双向细目表、典型题解及每一个任务的相应练习。题型有填空、选择、判断、连线、填表、填图和简答。附有5套综合练习,部分题目选自近年来的高职高考题,有较强的代表性。既可作为《数据库基础及应用》教材的同步练习,也可以作为强化数据库学习的好帮手。
《汇计划在行动》全面介绍了《上海市推进大数据研究与发展三年行动计划(2013-2015年)》的编制和实施过程。系统介绍了对大数据概念、内涵、技术和应用方面的认识,介绍了在上海信息化建设的基础和现状之上,如何让大数据在上海落地,并着力解决大数据应用过程中的关键问题,开展数据科学前瞻研究和人才培养;对三年行动计划进行了全面解读。《汇计划在行动》还介绍了“上海大数据产业技术创新战略联盟”发起、组建、运行方面的情况;介绍了“上海市数据科学重点实验室”的研究方向、管理模式和开放模式。
《数据工程实验指导书》涵盖了作战仿真数据规划、数据建模、数据集成、元数据集拟制、数据分析与数据挖掘、数据可视化、数据管理等方面的实验项目,实验内容饱满、步骤详细,有助于提高学生的实验效果。《数据工程实验指导书》可作为相关专业研究生和高年级本科生的实验教材,也可作为工程技术人员的参考书。
本书在简要回顾基本C 程序设计概念的基础上,全面系统地介绍了队列、堆栈、树、图等基本数据结构。本书将C 语言作为数据结构的算法描述语言。一方面对传统的数据结构内容进行了C 语言实现,另一方面将数据结构与面向对象技术结合起来,围绕抽象数据类型的概念来讨论每一种数据结构及算法。书中大量C 语言的程序实例既是数据结构的具体实现,又是面向对象技术的算法基础。本书理论与实践并重,每章都有大量的习题,强调数据结构的应用价值。 本书可作为计算机类及信息类相关专业的核心教材,也可供广大研究开发人员自学参考使用。
《数据工程实验指导书》涵盖了作战仿真数据规划、数据建模、数据集成、元数据集拟制、数据分析与数据挖掘、数据可视化、数据管理等方面的实验项目,实验内容饱满、步骤详细,有助于提高学生的实验效果。《数据工程实验指导书》可作为相关专业研究生和高年级本科生的实验教材,也可作为工程技术人员的参考书。
本书主要分为两大部分,基础篇和建模应用篇。基础篇介绍了有关Python开发环境的搭建、Python基础入门、函数、面向对象编程、实用模块和图表绘制等基础知识。建模应用篇主要介绍了目前在数据挖掘中的常用的建模方法在Python中的实现函数,并对输出结果进行了解释,有助于读者快速掌握应用Python进行分析挖掘建模的方法。本书配套提供了书中使用的示例代码及所用的数据,读者可通过上机实验,快速掌握书中所介绍的Python的使用方法。
本书主要分为两大部分,基础篇和建模应用篇。基础篇介绍了有关Python开发环境的搭建、Python基础入门、函数、面向对象编程、实用模块和图表绘制等基础知识。建模应用篇主要介绍了目前在数据挖掘中的常用
本书是“十三五”职业教育国家规划教材。本书分为理论篇、工具篇和实训篇。理论篇主要介绍数据挖掘的基础知识、基本任务和常用方法,侧重培养学生对于数据挖掘基本概念等理论知识的正确理解;工具篇主要介绍PMT这
《管理海量数据:压缩、索引和查询(第2版)(经典再现全新修订版)》是斯坦福大学信息检索和挖掘课程的教材之一,并已成为全球主要大学信息检索的主要教材。《管理海量数据--压缩、索引和查询(第2版)》理论和实践并重,深入浅出地给出了海量信息数据处理的整套解决方案,包括压缩、索引和查询的方方面面。其的特色在于不仅仅满足信息检索理论学习的需要,更重要的是给出了实践中可能面对的各种问题及其解决方法。 《管理海量数据:压缩、索引和查询(第2版)(经典再现全新修订版)》作为斯坦福大学信息检索课程的教材之一,具有的阅读难度,主要面向信息检索专业高年级本科生和研究生、搜索引擎业界的专业技术人员和从事海量数据处理相关专业的技术人员。
本书详细阐述了数据仓库与数据挖掘的基本原理,系统而全面地介绍了数据仓库与数据挖掘的概念、作用、算法和应用举例,并且给出了信息分析所涉及到的若干问题及框架。本书介绍了的信息分析技术研究成果,如小波分析、Rough分析、蚁群分析、分形技术、Agent、数据挖掘的进化算法、聚类分析、非结构数据的挖掘、离群数据挖掘,但并未详细描述,而将介绍重点放在其应用上,起到抛砖引玉的作用。本书既可以作为信息管理与信息系统、计算机应用、经济管理等专业的高年级本科生和研究生的教材,又可以作为有关在经济管理领域中应用信息分析技术提高决策人员的参考。
系统阐述空间数据库基本概念、原理、方法及技术的新发展,重点介绍空间现象抽象表达、空间数据模型、空间数据组织与管理、空间数据索引技术、空间数据查询与访问、时态空间数据库、空间数据元数据与空间数据共享、空间数据库设计、空间数据库新技术等内容。空间数据库是近年来热点研究领域,是一门前沿交叉学科。《空间数据库》内容全面、条理清晰、叙述严谨、实例丰富、针对性强,可作为地理信息系统、遥感、软件工程、测绘工程、通信工程等专业本科生和研究生教材,也可供地质矿产、地理信息、测绘遥感、城市规划、国土管理、环境科学及相关专业研究和开发人员参考和使用。