技术是把双刃剑,当我们在积极拥抱新技术的同时,也不能忽视其所带来的风险,比如当今大数据时代个人隐私和安全问题。本书是两位作者结合各自出色的专业知识和丰富的从业经验为大众倾力奉献的一本大数据时代隐私问题的普及读物。书中展示了我们在家庭和工作中的日常活动是如何成为大数据收集的一部分的。同时,列举大量的大数据应用以及安全和隐私相关案例,包括企业如何利用大数据进行营销、执法机构如何利用大数据执法等,也包括不法分子如何利用非法或合法的手段获取数据,如何利用社交网络进行犯罪。针对上述问题,本书也列出了一些工具、技巧用来检查和防范,这在当前很有现实意义。
本书是中山大学重点学科建设成果,获中国矿物岩石地球化学协会大数据与数学地球科学专业委员会推荐,是我国*部地质科学大数据与机器学习教材。本书是中山大学研究生试用研究型教材,对运用大数据挖掘与机器学习算法解决地球科学问题大有裨益。适合地质科学领域研究生和高年级本科生做教材,也可供科研人员研究时参考。它系统地介绍了地球科学大数据挖掘与机器学习的基本框架与原理,重点分析高维数据的降维、分类与预测、大图形社区结构识别、无限流数据处理、机器学习及人工智能地质学的建模过程,对必要的应用场景,使用Python语言给出案例。
本书是《实用数据结构基础(第四版)》(陈元春、王中华、张亮、王勇编著,中国铁道出版社出版) 的配套学习指导书。全书内容分为5部分:教学内容指导(包括对主教材第1~10章的知识点分析、典型 习题分析和各章习题解答);自主设计实验指导(对10个自主设计实验的设计思想、算法分析进行了详细 指导);模拟试卷;模拟试卷参考答案;数据结构课程设计报告样例。 本书对数据结构的概念和原理的阐述通俗易懂,例子翔实;习题难易适中,题型丰富;对数据结构 基本运算的分析注重实现的过程。本书以C/C++语言作为算法的描述语言,对于书中的实验和一些重要 的算法均给出了完整的C/C++语言源程序,并全部在Visual C++ 6.0环境下运行通过。 本书适合作为普通高等院校计算机类专业数据结构课程的教学辅导书,也可作为成
在新媒体时代,如果对新闻报道、网上搜索的结果或者所谓的 专家告知 不加思考地完全相信,那你就等着上当受骗吧! 本书围绕当今*受瞩目的大数据科学理论,通过日本政府公布的公开数据,集中针对访日游客的增加、舆论调查的可靠性、 安倍经济学 的成果、东日本大地震后的状况、相对贫困、失业率的下降、年轻人远离ХХ、全球变暖问题、减肥、恩格尔系数的上升等10个主题进行数据解读,帮助读者模拟体验数据读取方法,提高理解和分析数据的能力,挖掘出数据背后隐藏的真相。 作为 大数据分析 的超级入门书,即使不擅长数学、不了解统计学的人,读完本书也可以彻底掌握数据解读方法!
数据仓库与数据挖掘是决策支持的两项重要技术,它们共同的特点是都需要利用大量的数据资源,并从数据资源中提取信息和知识。由于数据资源丰富,因此数据仓库与数据挖掘的决策支持效果显著。 本书系统介绍数据仓库原理,联机分析处理,数据仓库设计与开发,数据仓库的决策支持,数据挖掘原理,基于信息论的决策树方法,基于集合论的粗糙集方法、k—均值聚类、关联规则挖掘,仿生物技术的神经网络,遗传算法,公式发现,知识挖掘,文本挖掘与web挖掘。 本书从数据仓库的兴起来说明决策支持的特点,从数据挖掘的理论基础来说明数据挖掘的方法,并通过实例来详细讲解。希望读者在学习之后,亲自在计算机上去实践,这样才能更有效地掌握数据挖掘的方法。
本书是在版的基础上修订而成的。 本书为清华大学出版社出版、由严蔚敏和吴伟民编著的《数据结构》(C语言版)(以下简称教科书)的学习辅导书。主要内容包括:教科书中的每一种数据存储结构的图示;教科书中每一种存储结构的基本操作函数及调用这些基本操作的主程序和程序运行结果;教科书中几乎每一种算法的实现。对于教科书中一些较复杂的算法,本书提供了详细的解析。有些在教科书中一带而过的存储结构(如第2章的静态链表和第6章的二叉树的三叉链表),本书也提供了完整的基本操作函数及主程序和程序运行结果。本书配有光盘,光盘中包括书中所有程序及用标准C语言改写的程序。所有程序均在计算机上运行通过。 本书适用于使用教科书的大中专学生和自学者。书中的基本操作函数也可供从事计算机工程与应用工作的科技人员参考和采
本书是一部关于现代数据库系统的基本原理与技术的教科书,本书突出了数据库和新技术的应用及教学的需要。在编写注重原理与技能的并重,传统与内容先进性实用内容并重以及课堂教学与实验并重,学生学后能掌握数据库的基本原理,熟练掌握一个数据库产品的操作并学会开发、设计与管理数据库的能力。 本书由16章构成,内容包括基本原理、基本操作、数据库设计及应用等,突出Web数据库交换等内容。本书各章均配有丰富的习题以及复习提纲,同时本书还附有实习指南供数据实验课之用。 本书结构清晰,概念准确,文字叙述简洁明了,既便于教师课堂讲授,又便于自学者阅读。 本书可作为普通高校计算机应用类及相关专业的本科“数据库课程”教材和教学参考书,同时也可作为数据库用开发人员的参考书。
本书采用图解形式对“大数据”这一概念进行了全新解读,将大数据从一个IT术语变成了人人能读懂的大众词汇。本书从大数据的“前世今生”讲起,通过列举各行各业应用大数据的案例,全面解读了大数据和个人的关系、如何利用大数据创业、大数据中隐藏了多少价值、大数据给我们带来了哪些冲击和变革、如何利用大数据进行精准营销等读者十分关心的热点问题。本书图文并茂,读者利用零散时间,就能迅速了解大数据知识。 本书适合企业管理者、创业者、投资者、高校相关专业师生等想运用大数据改变未来生活的人士阅读。
本书主要介绍数据仓库和数据挖掘技术的基本原理和应用方法,全书共分为12章,主要内容包括数据仓库的概念和体系结构、数据仓库的数据存储和处理、数据仓库系统的设计与开发、关联规则、数据分类、数据聚类、贝叶斯网络、粗糙集、神经网络、遗传算法、统计分析、文本和Web挖掘。 本书既重视理论知识的讲解,又强调应用技能的培养。每章首先介绍算法的主要思想和理论基础,之后利用算法去解决实例中给出的任务,而且对于数据仓库的组建方法和多数章节中的数据挖掘算法,本书都使用Microsoft SQL Server 2005进行了操作实现。本书通过对具体实例的学习和实践,使读者掌握数据仓库和数据挖掘中必要的知识点,达到学以致用的目的。 本书每章均配有习题,习题形式为选择题、简答题和操作题,可以帮助读者进一步巩固和掌握所学知识。此外,本书提供多媒
本书是一本全面介绍数据挖掘和知识发现技术的专业书籍,它系统地阐述了数据挖掘和知识发现技术的产生、发展、应用以及相关概念、原理和算法,对数据挖掘中的主要技术分支,包括关联规则、分类、聚类、序列、空间以及web挖掘等进行了理沦剖析和算法描述。本书的许多内容是作者们在攻读博士学位期间的工作总结,一方面,对于相关概念和技术的阐述尽量先从理论分析人手,在此基础上进行技术归纳;另一方面,为了保证技术的系统性,所有的挖掘模型和算法描述都在统一的技术归纳框架下进行。同时,为了避免抽象算法描述给读者带来的理解困难,本书的所有典型算法都通过具体跟踪执行实例来进一步说明。 本书共分8章,各章相对独立成篇,以利于读者选择性学习。在每章后面都设置专门一节来对本章内容和文献引用情况进行归纳,它不仅可以帮
本书对面向应用的数据挖掘方法进行了清晰的阐述,包括经典的多元统计方法、贝叶斯多元统计方法、基于机器学习的数据挖掘方法和基于计算的数据挖掘方法等。介绍了数据挖掘领域中许多*的研究成果,如关联规则、序列规则、图示马尔可夫模型、基于存储的推理、信用风险和Web挖掘等。并详细介绍了选自实际工业项目的6个应用实例,强调了数据挖掘方法的实用性。 本书主要面向计算机科学、信息管理、应用统计学和经济学等专业的高年级本科生和研究生。对实际从事海量数据分析和处理的技术人员也有很好的指导作用和参考价值。
本书系统讲解数据库的基本概念,数据库设计的基本方法和数据库应用开发的基本技术,并介绍了数据库技术新进展。本书强调理论与实践,技术与应用的结合。内容系统全面,深入浅出。 本书可作为高等学校计算机基础教学课程中数据库系统的教材,也可以供数据库应用部门,从事计算机应用系统设计和开发部门的工程技术人员参考。
本书是普通高等教育“十一五”国家规划教材。全书共分10章 ,内容包括:数据结构的概念,几种基本的线性结构(如线性表),栈和队列,串,几种非线性结构(如多维数组和广义表),树,图,常用的数据处理枝术(如排序),查找,文件的存储结构和组织方法等。在每一章中都收集了难度各异的习题和例题,全书采用C语言作为算法描述语言,并有详细的注释,书中全部程序均上机在TURBOC2.0环境下进行验证并调试通过,同时给发出部分程序的运行结果。各章中的“简单应用举例”,既是本章算法的综合应用,也可作为本章实训内容和课程设计的综合练习,全书有很强的实用性和可操作性。 本书可作为全日制高等院校计算机应用专业、微电子和信息工程专业、计算机信息管理和经济信息管理类专业普通本科学生的专业基础课教材,也可以作为上述专业高职高
随着Python应用领域的拓展,越来越多的人将Python用于处理大型数值数据集,使用标准格式来进行数据的存储和通信也显得越来越重要,而HDF5也正迅速成为人们存储科学数据的选择。本书向任何有Python数据分析基本背景的人介绍如何在Python下使用HDF5。 本书将着重于HDF5的本地功能集,而不是Python的高层抽象。熟悉Python和NumPy的读者,更容易阅读和掌握本书的内容。本书适合有一定基础的Python开发者,尤其适合要使用Python开发数据存储和处理等相关应用的读者阅读参考。
本书从理论知识入手,结合数据仓库的概念帮助读者更好地理解Hive,在掌握Hive相关理论知识的基础上,逐步深入地学习Hive。 工欲善其事,必先利其器 ,首先从创建虚拟机并安装Linux操作系统开始逐步完成Hive的部署,然后在部署完成的Hive环境基础上,学习Hive数据定义语言、Hive数据操作语言和Hive数据查询语言的相关操作,在学习了上述三种语言之后,接下来深入学习Hive的其他功能,包括Hive内置函数、Hive自定义函数、Hive的新特性事务以及Hive的相关优化,从而帮助读者掌握Hive的强大功能和特性。后,本书通过一个综合项目 教育大数据分析平台,使读者对Hive数据仓库在实际应用中涉及的相关知识内容具有更深入的理解,在此项目中不仅会涉及使用Hive实现数据仓库分层、数据转换和数据分析的相关操作,而且还涉及使用Sqoop将数据仓库中的数据进行导出和导入,以
你是否有过这样的经历:在项目的后一刻突然被要求在图中修改或添加某个数据点?这时为了完成项目,你将不得不冒着降低准确性的风险,然而,在Tableau中不会发生这种情况。Tableau是一个革命性的工具包,利用它可以简单、高效地创建高质量的数据可视化图形。本书通过大量的具体案例,详细讲解了如何利用Tableau软件进行数据可视化分析,包括基本使用方法、具体操作步骤、实现原理及一些实用技巧等,为快速掌握Tableau软件提供了翔实指导。 本书共9章,第1章讲解如何连接不同数据源,包括文本、Excel、Access数据库文件及服务器上的数据;第2~5章循序渐进讲解各种图形的创建方法,包括单变量图、双变量图、多变量图和地图;第7~8章详细讲解了如何自定义图中各个元素以及如何将做好的可视化图形打包分享;第6章和第9章主要介绍Tableau的高级功能,包括自
近年来,大数据成为学术界和工业界的热点,其 本质就是海量数据分析。海量数据的来源包括互联网 、传感器、生产生活、科学观测、科学实验等。海量 数据分析不仅可以帮助人们取得新的科学发现,也可 以推动技术的适应性、个性化和健壮性方面的进步。 海量数据分析是一个跨学科的研究领域,理解本书的 内容需要具备计算机科学、统计学和优化理论的基础 知识。美国国家学术院国家研究委员会编著的《海量 数据分析前沿》从计算和推理的角度分析了与海量数 据分析相关的前沿问题,重点介绍海量数据挖掘分析 以及流数据挖掘的进展,讨论了并行和分布式系统架 构方面的*发展,具体内容包括数据建模、任务建 模、计算复杂性问题分析、数据采样以及人工参与的 数据分析方法等。
《MySQL是怎样使用的:快速入门MySQL》采用通俗易懂的表达方式,对如何使用MySQL进行了详细的介绍。 《MySQL是怎样使用的:快速入门MySQL》完全从零基础用户的角度出发,依照用户认知习惯,从MySQL的安装开始,介绍了MySQL的服务器程序和客户端程序的使用、MySQL的数据类型、数据库和表的基本操作、列的属性、MySQL中的表达式和函数、简单和复杂的增删改查语句等入门知识,还介绍了视图、存储程序、备份与恢复、用户与权限管理等高级概念以及使用Java语言连接MySQL服务器等知识。 《MySQL是怎样使用的:快速入门MySQL》较好地契合了MySQL初学人员的学习曲线,内容深入浅出,通俗易懂,可帮助初学人员迅速入门MySQL。
本书针对计算机、信息管理和其他相关专业学生的发展需求,系统、全面地介绍了大数据技术与应用的基本知识和技能,详细介绍了大数据基础、大数据的行业应用、大数据的基础设施、大数据技术基础、Hadoop分布式架构、大数据管理、大数据分析、人工智能与机器学习、数据科学与数据科学家、开放数据的时代,以及大数据发展与展望等内容,具有较强的系统性、可读性和实用性。本书是为高等院校 大数据 相关课程全新设计编写、具有丰富实践特色的主教材,也可供有一定实践经验的软件开发人员和管理人员参考,或作为继续教育的教材。 本书配套授课电子课件,需要的教师可登录www.cmpedu.com免费注册、审核通过后下载,或联系编辑索取(微信:15910938545,QQ:2850823885,email:2308140194@qq.com,电话:010-88379739)另外,为方便任课教师进行交流,提供本科计算机
本书重点介绍数据质量管理与安全管理的理论及应用。首先通过数据管理现况和问题的分析,提出数据质量管理的步必须是将各种来源的数据标准化,具有统一的数据格式和规则。书稿中强调了提高数据质量不仅可提高信息系统的质量,还可提高经营活动的质量。需要制定质量管理计划或执行具体的质量管理活动。定义了数据质量的准确性、一致性、可用性、可达性、及时性、安全性这6个标准以及对应的管理流程,划分了5个能力成熟度的等级,界定了从管理者到执行者等各个质量管理活动和责任。提出多项数据质量管理主要技术和各国实用案例,还进一步在Orange数据库中实践了数据质量诊断流程。书稿后半部针对日益增长的数据库安全性的需求,提出了安全管理系统构建、访问控制,数据伪装等具体可行的技术手段,后还将数据安全技术推广到大数据的应用场景。
本书结合高职高专的教学特点,较系统地介绍了*基础、*必需掌握的数据库原理相关理论知识,在此基础上,通过大量实例着重讲解SQL Server 2014所提供的各种工具对数据库实施的操作与管理,并辅以某公司人事系统后台数据库设计项目作为实训练习贯穿全书,使得数据库原理的阐述与SQL Server 2014的实际应用融为一体,读者可以通过必要的基本理论指导其对数据库操作的实践,同时也能在实践中加深对数据库原理的理解。为方便读者更好掌握SQL Server 2014的使用,书中采用通俗易懂的方式介绍了有关操作步骤和原理,并辅以大量实例和插图。每章均配有相关内容的项目设计,便于读者进行实际操作和练习。本书共计三大部分,其中*部分(*章至第四章),主要介绍数据库基本概念和理论,第二部分(第五章至第七章),主要介绍SQL Server 2014的安装、管理和数据操作等,第
本书侧重于信息管理中信息组织与处理的技术,全面而系统地介绍了数据仓库与数据挖掘的基本概念、基本方法和基本技术,以及数据仓库与数据挖掘的应用领域与*进展。全书共分10章,包括概论,数据仓库的技术与开发,数据仓库的管理,联机分析处理,SQLServer数据仓库的应用与开发,数据挖掘与知识发现,统计类数据挖掘技术,知识类数据挖掘技术,21世纪的数据挖掘技术,数据仓库与数据挖掘的综合应用等内容。为了便于学习,每一章都有提要和小结,并配有一定数量的习题,以帮助读者对基本内容的理解和掌握。本书深入浅出,阐述清晰、理论与实际并重,可作为高等院校信息管理与信息系统等专业本科生、研究生的教材。