本书从初学者易于理解的角度,以通俗易懂的语言、丰富的实例、简洁的图表、传统和现代数据特征的对比,将大数据这一计算机前沿科学如数家珍地娓娓道来。既介绍了大数据和相关的基础知识,又与具体应用有机结合起来,并借助可视化图表的画面感立体地为读者剖析了大数据的技术和原理,非常便于自学。本书内容包括大数据概论、大数据采集及预处理、大数据分析、大数据可视化、Hadoop概论、HDFS和Common概论、MapReduce概论、NoSQL技术介绍、Spark概论、云计算与大数据、大数据相关案例等内容。本书既可以作为想了解大数据技术和应用的初学者的教材,也适合作为培训中心、IT人员、企业策划和管理人员的参考书。
本书主要介绍大数据可视化的基本概念和相应的技术应用。全书内容共10章,分别为大数据可视化概述、大数据可视化原理、大数据可视化方法、数据可视化工具、Excel数据可视化、Tableau数据可视化、ECharts与pyecharts数据可视化、Python数据可视化、大数据可视化行业分析以及大数据可视化综合实训。 本书将理论与实践操作相结合,通过大量的案例帮助读者快速了解和应用大数据分析的相关技术,并且对于书中重要的、核心的知识点加大练习的比例,以使读者达到熟练应用的目的。 本书可作为大数据、云计算、软件技术、信息管理、计算机网络等专业的教材,可也作为大数据爱好者的自学参考书。
《数据挖掘(概念与技术原书第3版)》完整全面地讲述数据挖掘的概念、方法、技术和 研究进展。本书对前两版做了全面修订,加强和重新组织了全书的技术内容,重点论述了数据预处理、频繁模式挖掘、分类和聚类等的内容,还全面讲述了OLAP和离群点检测,并研讨了挖掘网络、复杂数据类型以及重要应用领域。 《数据挖掘(概念与技术原书第3版)》是数据挖掘和知识发现领域内的所有教师、研究人员、开发人员和用户都 的参考书,是一本适用于数据分析、数据挖掘和知识发现课程的 教材,可以用做高年级本科生或者一年级研究生的数据挖掘导论教材。本书由韩家炜等著。
技术是把双刃剑,当我们在积极拥抱新技术的同时,也不能忽视其所带来的风险,比如当今大数据时代个人隐私和安全问题。本书是两位作者结合各自出色的专业知识和丰富的从业经验为大众倾力奉献的一本大数据时代隐私问题的普及读物。书中展示了我们在家庭和工作中的日常活动是如何成为大数据收集的一部分的。同时,列举大量的大数据应用以及安全和隐私相关案例,包括企业如何利用大数据进行营销、执法机构如何利用大数据执法等,也包括不法分子如何利用非法或合法的手段获取数据,如何利用社交网络进行犯罪。针对上述问题,本书也列出了一些工具、技巧用来检查和防范,这在当前很有现实意义。
这是一部从技术、流程、管理等多个维度系统讲解华为数据治理和数字化转型的著作。华为是一家超大型企业,华为的数据底座和数据治理方法支撑着华为在全球170多个国家/地区开展多业态、差异化的运营。书中凝聚了大量数据治理和数字化转型方面的有价值的经验、方法论、规范、模型、解决方案和案例,不仅能让读者即学即用,还能让读者了解华为数字化建设的历程。 全书共10章,内容从逻辑上分为四个部分。 第一部分(第1~3章) 第1章以非数字原生企业在数字化转型方面面临的挑战开篇,介绍了华为在数据治理和数字化转型方面的目标、愿景、蓝图和框架;第2章从企业政策和架构协同的角度,介绍了企业级的数据综合治理体系,理顺了数据与变革、运营、IT之间的协同关系,明确了数据管理的责任主体在业务;第3章详细阐述了不同类型的数据的管理方式和
《问卷数据分析:破解SPSS软件的六类分析思路(第2版)》系统介绍了使用SPSS软件进行问卷数据分析的思路及方法,分为四部分,分别是问卷设计、六类问卷分析思路、数据分析方法在SPSS软件中的操作和答疑解惑。其中问卷设计部分适用于所有读者,建议读者在设计问卷前详细阅读这部分内容。读者可以结合实际情况选读六类问卷分析思路部分的内容。数据分析方法在SPSS软件中的操作部分详细讲解了各类数据分析方法在SPSS软件中的操作细节,并且对输出结果进行说明。答疑解惑部分罗列了使用各类分析方法时常见的疑难杂症,并且提供了解决方法。本书侧重于问卷分析的应用性,力求让读者在最短的时间内掌握使用SPSS软件分析问卷数据的方法并完成高质量的问卷数据分析报告。 使用SPSS软件分析调查问卷数据常见于各类学术研究、论文写作、企业市场调研和各类
本书以图书馆信息化为基点,从理论与实际应用角度,介绍了数据仓库与数据挖掘的概念、方法及在图书馆的应用。主要内容包括:以图书馆自动化集成系统日常工作中产生的数据为基础,详细介绍了应用微软SQL Server 2012数据仓库与数据挖掘工具进行图书馆数据仓库开发、数据集成服务、联机分析处理及常见数据挖掘技术挖掘过程。本书注重实践性,可操作性强,可作为企事业单位数据仓库与数据挖掘工作人员、研究人员参考用书
本书围绕健康医疗大数据的理论与实践展开论述。全书共分为7章,第1章主要描述大数据的基础知识、通用技术以及技术发展趋势;第2章主要对健康医疗大数据的概念、特征、分类、主要应用技术、国内外发展现状以及应用需求进行系统阐述;第3章~第6章分别对临床大数据、精细化运营大数据、健康管理大数据以及基因检测大数据的应用实践案例进行详细论述;第7章对健康医疗大数据的未来发展趋势进行展望。本书是很多应用实例和经验的总结,案例丰富翔实,将理论与实际紧密结合,对互联网技术人员、健康医疗行业的从业人士,以及高等院校相关专业的学生均有很大帮助。
当前,全国首批已有38所高校开设“大数据”本科专业,预计在未来5年中开设“大数据”专业的本科和高职高专院校数量将超过500所,社会对大数据人才需求将达到100万人/年。案例教学是大数据人才培养的重要内容。 《大数据案例精析》以分析大数据在各个行业领域中的典型应用为主线,选取国际国内有代表性的近30个案例进行重点分析,行业包括政府大数据、金融大数据、医疗大数据、交通大数据、教育大数据、旅游大数据、通信大数据、电商大数据、工业大数据以及物流大数据等,每个行业平均选取3个案例进行分析,形成相对统一的案例分析体系,同时还提供相应的教学课件配套资源。
本书以实际数据的分析处理为例,介绍相应统计方法的运用,以及在EViews10.0中的实现。本书涉及处理以时间序列为主的多种类型的数据,包括描述统计、回归分析、传统时间序列等基本的数据分析以及建立条件异方差、向量自回归(包括非结构化和结构化模型)、向量误差修正模型、Panel Data模型、状态空间模型、混频数据模型等复杂的计量经济模型.本书为运用各种统计方法和经济计量方法处理数据的读者,提供了一个简便易学、易操作的工具。读者可以省去许多时间,很快就能够学习掌握该软件的运用。
本书按照简明、易读、突出实用的原则编写,书中所选案例均来自企业PDM项目实际,并在Siemens PLM Software Teamcenter 10平台上加以实现,同时由编者反复论证,全书图文并茂,并配以详尽准确的讲解步骤,使读者能够快速理解并掌握本书案例中所阐述的PDM实施方法和技巧。另外,本书每章都附有相应的练习题,供读者进行练习。读者通过学习本书,可以由浅入深、循序渐进地理解PDM的基本知识和原理,掌握企业PDM实施技能,逐步具有借助PDM平台提高企业研发核心能力,提升产品质量的工程素养。
本书全面阐述了新一代安全理论与安全架构,并结合作者自身经验层层剖析了包括Google公司在内的各大互联网企业所应用的各种关键安全技术的原理及具体实现。全书分为3部分,共15章。第一部分“安全理论体系”主要讲解了业界优选的安全架构体系(IPDRR模型、IACD、网络韧性架构)与安全体系(ISMS管理体系、BSIMM工程体系、Google技术体系)建设理念。第二部分“基础安全运营平台”的主要内容有威胁情报、漏洞检测、入侵感知、主动防御、后门查杀、安全基线、安全大脑等。第三部分“综合安全技术”主要讲解了安全开发生命周期、企业办公安全、互联网业务安全、全栈云安全等方面的内容,并展望了前沿安全技术。期待本书可以给读者带来不一样的互联网企业整体安全架构理论和安全建设视角,让读者获得自身职业发展所需的专业信息安全知识! 本书适
《大数据系统运维》是大数据应用人才培养系列教材中的一册,讲解了大数据系统运行维护过程中的各个主要阶段及其任务,包括配置管理、系统管理、故障管理、性能管理、安全管理、高可用性管理、应用变更管理、升级管理及服务资源管理,内容全面且翔实,兼具基础理论知识与运维实践经验,特别是重点介绍了大数据系统的运维特点及运维技能,以保障大数据系统的稳定可靠运行,更好地支撑大数据的商业应用价值。本书具有很强的系统性和实践指导性,可以作为培养应用型人才的课程教材,也同样适合于有意从事IT系统运维工作的广大从业者和爱好者作为参考书。
《谁说菜鸟不会数据分析》(入门篇)是一本有趣的数据分析书!本书基于通用的Excel工具,加上必知必会的数据分析概念,以小说般通俗易懂的方式讲解。本书基于职场三人行来构建内容,接近按照数据分析工作的完整流程来讲解。全书共8章,依次讲解数据分析必知必会知识、数据分析的结构化思维、数据处理技巧、数据展现的技术、提升图表之美的专业化视角,以及专业分析报告的撰写方法等内容。本书有足够的魅力让你一口气读下去,在无形之中掌握数据分析的技能,提升职场竞争能力。本书能有效帮助职场新人提升职场竞争力,也能帮助市场营销、金融、财务、人力资源管理人员及产品经理解决实际问题,还能帮助从事咨询、研究、分析行业的人士及各级管理人士提高专业水平。
本书旨在为数据分析生命周期提供一个全面和实用的指南,并着重于为组织打造行之有效的数据分析能力。全书分为三部分,第壹部分分析基础篇,讨论了如何通过整合组织的人员、流程、技术和数据等资源来实现这样的分析能力;第二部分分析生命周期*佳实践篇,介绍了不同种类的分析产品和服务,以及如何支持分析产品或服务的设计、开发和交付;第三部分分析能力 常青之道,围绕如何让分析产品对组织的完善和持续改进产生*大作用展开讨论,内容包括如何衡量分析项目的效率和效果两个方面,以及如何应用行为经济学、社会心理学和变革管理等其他学科的经验和知识改进和完善分析过程。
本书从解决工作实际问题出发,提炼总结工作中Python 常用的数据处理、数据分析实战方法与技巧。本书力求通俗易懂地介绍相关知识,在不影响学习理解的前提下,尽可能地避免使用晦涩难懂的Python 编程、统计术语或模型公式。本书定位是带领Python 数据分析初学者入门,并能解决学习、工作中大部分的问题或需求。入门后如还需要进一步进阶学习,可自行扩展阅读相关书籍或资料,学习是永无止境的,正所谓“师傅领进门,修行在个人”。
本书是从大数据和云计算相结合的视角,系统地介绍大数据云架构技术与实践的专业图书,全书分为五篇19章,分别介绍大数据云计算的概论、关键技术、体系架构、云架构实践与编程和安全。本书层次清晰,结构合理,主要内容包括大数据云计算关系、大数据应用价值、分布式计算、NoSQL数据库、机器学习、虚拟化、Docker容器、Web 2.0、绿色数据中心、基础设计即服务(IaaS)、平台即服务(PaaS)、软件即服务(SaaS)、容器即服务(CaaS)、大数据云架构搭建、Spark大数据编程、大数据和云计算面临的安全威胁、保障大数据安全、应用大数据保障安全等。本书可作为高年级本科生和研究生教材,也可作为广大科学技术人员和计算机爱好者的参考书。
《DB2设计、管理与性能优化艺术》内容严谨精细、生动活泼,从内容来看,共分为部分,共11章。部分包括章和第2章,提出了两种性能优化方法学,包括理想化的自上而下方法学和救急专用的自下而上方法学,随后通过一个真实的实战案例,阐述了如何灵活运用方法学。第二部分是设计部分,包括第3章、第4章和第5章,分别谈到了物理设计、基础逻辑设计和逻辑设计,这是设计一个高质量的数据库系统所必须掌握的内容。第三部分是性能优化部分,包括第6章、第7章、第8章和第9章,讲述了如何对DB2进行性能监控,如何调整参数和优化维护工具,如何调整锁和日志来优化高并发系统,如何来优化最耗资源的SQL语句。第四部分是有关设计与优化内容,包括0章和1章,讲述了如何设计和优化大容量数据仓库,讲述了如何设计和优化DB2 pureScale集群。
本书内容涵盖了目前使用*为广泛的大数据处理系统Hadoop生态圈中的几大核心软件系统:分布式大数据处理系统Hadoop、数据库HBase、数据仓库工具Hive、内存大数据计算框架Spark和Spark SQL,详细介绍了它们的架构、工作原理、部署方法、常用配置、常用操作命令、SQL引擎等内容。本书对上述几大系统的各种安装部署方式给出了详细步骤,常用命令也都有具体示例介绍,是一本实操性很强的工具书,能帮助初学者快速掌握这几款常用的大数据处理系统。 本书以浅显易懂的语言风格和图文并茂的操作示例引领读者迈入大数据实践之门,可以作为培养应用型人才的课程教材,也可作为开发人员的自学教材和参考手册。