本书内容共分为7章。 第1章介绍了数据分析的应用背景、研究内容和基本概念。第2章聚焦于数据的可视化方法,并例举了现有网络工具的使用方法,本章内容几乎不需要编程基础。第3章着眼于数据分析与数学优化建模的联系,并介绍了常用的梯度下降优化算法。第4章凸显了数据降维和特征提取的必要性,给出了一些常用的降维算法。第5章和第6章详述了无监督学习和有监督学习的典型算法及示例。第7章介绍了深度学习的鲁棒性问题,这是当前数据分析的前沿领域。本书 的附录部分简述了深度神经网络的基本原理以及PyTorch开发框架。
在全世界不同的文化中,数据的收集与组织都有着悠久的历史,甚至在计算机思想出现之前很久就已存在。但只是到了互联网时代,日常产生的数据量才开始变得 巨大,而且继续呈指数级增长,其中包括我们上传的文件、视频、照片、社交媒体信息、在线购物,甚至我们汽车的GPS导航数据。大数据这一术语所代表的不仅仅是一种量变,而是一种质变;其所指涉的不仅是新的技术,还有企业和政府利用它的方式。霍尔姆斯基于统计学、概率论和计算机科学,对大数据这一主题进行了概要性探讨,并强调指出,大数据不仅改变了商业的运营模式,而且改变了医疗研究的进行方式。与此同时,它也引起了一些重要的伦理问题,作者据此对斯诺登事件、数据安全,以及家庭智能设备可能被黑客挟持等实例进行了讨论。
本书是一本从理论到实践的全面且细致的企业数据驱动指南,作者见证并献身百度大数据的建设,毫无保留地将成败摸索实践的真实场景进行完整还原,并对近十年大数据从业经验与心得做了归纳和总结,同时详解大数据本质、理念与现状,并围绕数据驱动四环节——采集、建模、分析、指标,深入浅出地讲述企业如何从零到一将完整的数据驱动方案落地,全面展示大数据在各领域内的应用情况与趋势展望。
数据是什么?如何应用数据?如何把数据变成 有价值的东西?本书主要适合刚开始使用数据的读者,能让他们对数据的含义、价值及用途有清晰的认识和了解,本书目的是介绍数据的相关知识,同时鼓励人们参与到日益增多的与数据有关的对话中。 本书通过介绍简单数据相关知识,即从一个总体目标、两种思维系统、三大应用领域、四种数据尺度、五种数据分析方法、六种数据展现方式、七种数据活动、八个提前问的问题分别展开阐释数据和分析的方法和思维方式。
数据库云平台是当今乃至今后一段时期信息化领域普遍关注的一个热点领域。云技术的本质是分布式计算,而数据库云平台揭示的正是分布式计算在数据处理领域的本质问题。本书介绍了数据库的起源与发展,分析了关系型数据库与NoSQL数据库的适应场景,介绍了国产自主可控数据库云平台发展现状;针对云计算环境大数据时代对结构化和非结构化数据的管理需要,介绍了关系型数据库中的事务、数据恢复、SQL、分布式数据库和NoSQL数据库的一致性与事务等理论;针对越来越多的大数据业务,介绍了数据库应用系统的设计、优化和集成技术。结合发展趋势,重点介绍了当前流行的关系数据库和NoSQL数据库的编程技术;针对信息化建设演进式发展,介绍了数据库重构技术。 本书作为计算机、网络工程、信息管理院校研究生的高端教材,适合具有计算机基础知识的读
《高级数据结构(C++版)/青少年信息学奥林匹克竞赛实战辅导丛书》在基本数据结构的基础上,围绕一些常用的数据结构,结合大量实战例题,深入分析“数据结构是如何服务于算法的”。 《高级数据结构(C++版)/青少年信息学奥林匹克竞赛实战辅导丛书》主要内容包括:哈希表、树与二叉树、队列与堆、并查集、线段树、树状数组、伸展树、Treap、AVL树、红一黑树、SBT、块状链表与块状树、后缀树与后缀数组、树链剖分与动态树等。 《高级数据结构(C++版)/青少年信息学奥林匹克竞赛实战辅导丛书》的适用对象包括:中学信息学竞赛选手及辅导老师、大学ACM比赛选手及教练、高等院校计算机专业的师生、程序设计爱好者等。