数据是什么?如何应用数据?如何把数据变成更有价值的东西?本书主要适合刚开始使用数据的读者,能让他们对数据的含义、价值及用途有清晰的认识和了解,本书目的是介绍数据的相关知识,同时鼓励人们参与到日益增多的与数据有关的对话中。 本书通过介绍简单数据相关知识,即从一个总体目标、两种思维系统、三大应用领域、四种数据尺度、五种数据分析方法、六种数据展现方式、七种数据活动、八个提前问的问题分别展开阐释数据和分析的方法和思维方式。
Apache Flink项目的资深贡献者Fabian Hueske和Vasiliki Kalavri展示了如何使用Flink DataStream API实现可伸缩的流式应用,以及怎样在业务环境中持续运行和维护这些应用。流处理的理想应用场景有很多,包括低延迟ETL、流式分析、实时仪表盘以及欺诈检测、异常检测和报警。你可以在任意类型的持续数据(包括用户交互、金融交易和物联网等数据)生成后,立即对它们进行处理。本书主要内容包括: 了解有关分布式状态化流处理的概念和挑战。 探索Flink的系统架构,包括事件时间处理模式和容错模型。 理解DataStream API的基础知识和构成要素,包括基于时间和有状态的算子。 以精确一次的一致性读写外部系统。 部署和配置Flink集群。 对持续运行的流式应用进行运维。
数据科学伦理是关于人们在进行数据科学方面的行为的道德规范。到目前为止,数据科学主要应用于企业和社会并产生了积极成果。 然而,就像任何技术一样,数据科学也带来了一些负面后果:隐私侵犯的增加,对敏感群体的数据驱动的歧视以及使用不可解释的复杂模型做出决策。 没有哪个数据科学家和业务经理是天生不道德的,只是他们没有接受过培训来考虑他们在工作中的伦理问题 本书旨在填补这个越来越重要的空白和解释不同的概念和技术,帮助读者理解从k-匿名和差别隐私到同态加密和零知识证明等技术已可以解决隐私侵犯问题,消除敏感群体歧视和提供各种可解释的人工智能。 现实生活中的警世故事进一步说明了数据科学伦理的重要性和潜在影响,包括种族主义机器人的故事、搜索审查和人脸识别等。本书中穿插着结构化的练习,提供假设的场景和
本书系统地介绍了岩爆试验综述、大数据人工智能分析方法框架、数据采集与预处理技术、压缩算法、多源异构融合算法、大数据可视化分析,且结合实际工程介绍了岩爆实验大数据AI处理系统。本书深入探讨了岩爆试验大数据的人工智能分析方法,系统阐述了以人工智能方法研究岩爆机理,为读者提供了一种全新的视角和解决问题的思路,填补了国内外相关领域的空白。
本书重点介绍Amos、Mplus 和SmartPLS 统计软件里的结构方程分析方法。包括结构方程模型路径图的构建与数据的收集,结构方程模型的识别、分析结果评价及修正,反映型指标、形成型指标与二阶段分析,调节效应分析、中介效应分析、多群体差异分析与潜在平均分析,以及结构方程模型高级的分析方法即贝叶斯检验、混合回归分析、潜在成长模型、MTMM 模型等内容。没有复杂的理论推导,而是结合作者自身的教学与科研实践,以数据为依托,深入浅出,使读者能在短时间内理解并掌握结构方程模型分析方法,进而应用到自己的研究实践中。
随着云技术的迅猛发展和普及,商业组织正面临着满足用户需求的巨大挑战。本书深入探讨了云技术在数字化社会中的重要地位和创新应用。通过研究、创新和发展的视角,本书引领读者走进云技术的前沿,揭示了其在构建下一代卓越计算环境中的关键作用。书中汇集了多位专家学者的研究成果和实践经验,为读者提供了宝贵的洞察和指导。无论是对于云计算领域的专业人士,还是对于对数字化社会感兴趣的读者,本书都是一本不可或缺的参考书。通过阅读本书,您将深入了解云技术在数字化社会中的影响和价值,激发您的创新思维,为您在未来的技术革新中取得卓越成就打下坚实的基础。
对数据生产和大数据处理带来的挑战,是当代社会和人工智能时代的重点。大数据的快速发展、信息共享和社交媒体的大众化带来了各方面的风险和挑战。我们需要遵循正确的流程、方法和沟通战略 且手头的数据必须准确,才能推演出高价值的结论。而数据越多,我们面临的陷阱可能就越深。在本书中,杰森?辛克从数据通用和收集的策略、数据分析的准则、数据展示的策略出发,讨论了应对数据挑战、获得和洞察数据的价值和内涵的可行方式。
本书内容共分为7章。 第1章介绍了数据分析的应用背景、研究内容和基本概念。第2章聚焦于数据的可视化方法,并例举了现有网络工具的使用方法,本章内容几乎不需要编程基础。第3章着眼于数据分析与数学优化建模的联系,并介绍了常用的梯度下降优化算法。第4章凸显了数据降维和特征提取的必要性,给出了一些常用的降维算法。第5章和第6章详述了无监督学习和有监督学习的典型算法及示例。第7章介绍了深度学习的鲁棒性问题,这是当前数据分析的前沿领域。本书 的附录部分简述了深度神经网络的基本原理以及PyTorch开发框架。
C#语言已经成为.NET平台中*流行的编程语言。本书以Visual Studio 2012和SQL Server 2008为开发平台,从实际应用的角度出发,重点介绍了使用C#开发Windows应用程序的方法和技术。全书共9章内容,第1章为C#概述,介绍了Microsoft.NET平台概述、C#语言简介、Visual Studio集成开发环境和C#程序结构介绍;第2~3章为C#程序设计基础,通过实例以循序渐进的方式介绍了C#语言的各种语法、知识点和面向对象的基本思想;第4~5章介绍了使用C#语言开发Windows窗体应用程序,包括Windows窗体常用控件、菜单编程、对话框和多文档编程;第6章介绍了各种文件操作;第7章介绍了进程,包括线程和多线程编程;第8章介绍了数据库编程;第9章通过开发一个图书馆管理系统,全面介绍了软件开发流程,阐述了使用Visual C# 2012开发Windows应用程序的基本知识。本书内容立足于课堂教学和实际应用,各章均配有
《新编计算机专业重点课程辅导丛书:新编数据结构习题与解析》作者长期从事程序设计语言和数据结构课程的基础教学工作,《新编计算机专业重点课程辅导丛书:新编数据结构习题与解析》是在总结这些教学经验的基础上编写而成,全书分为12章,包括绪论、线性表、栈和队列、串、数组和稀疏矩阵、递归、树形结构、广义表、查找、内排序、外排序、文件,的两个附录给出几份试题和参考答案。 《新编计算机专业重点课程辅导丛书:新编数据结构习题与解析》强调数据结构中逻辑结构、存储结构和算法设计的层次思想,总结知识难点的求解方法,力求归纳各类算法设计的规律,并深人讨论递归算法的设计方法。 书中提供了大量例题,适合作为课程考试和研究生考试辅导用书,任课教师可以将其作为教学参考书使用,对于计算机专业的本科学生,可以
本书是首本专注于利用R语言进行科研数据清洗的书籍,全书主要分为两大块,首块以简洁的内容向读者介绍R语言的入门知识,让读者了解并认识R语言,为后面的内容打下基础。全书大部分篇幅主要集中在第二块内容,即数据清洗的知识。作者从实际问题出发,详细的介绍了如何利用R语言处理科研中的数据,比如缺失值的插补,异常值的查找,长宽型数据结构的转换,时间日期数据的处理,文本数据的处理等,此外,作者也将数据清洗的内容进行了适当扩展,比如书中加入了R语言与数据库的连接方法,让大数据的处理更加得心应手。
在全世界不同的文化中,数据的收集与组织都有着悠久的历史,甚至在计算机思想出现之前很久就已存在。但只是到了互联网时代,日常产生的数据量才开始变得 巨大,而且继续呈指数级增长,其中包括我们上传的文件、视频、照片、社交媒体信息、在线购物,甚至我们汽车的GPS导航数据。大数据这一术语所代表的不仅仅是一种量变,而是一种质变;其所指涉的不仅是新的技术,还有企业和政府利用它的方式。霍尔姆斯基于统计学、概率论和计算机科学,对大数据这一主题进行了概要性探讨,并强调指出,大数据不仅改变了商业的运营模式,而且改变了医疗研究的进行方式。与此同时,它也引起了一些重要的伦理问题,作者据此对斯诺登事件、数据安全,以及家庭智能设备可能被黑客挟持等实例进行了讨论。
《数据库设计与关系理论(影印版)》的每一章都包含一组练习,它或者展示了如何把理论知识应用到实践中,或者提供了更多的信息,或者要求你验证一些简单的理论结果。如果你非常熟悉数据库的关系模式,并且你希望深入了解数据库设计,那么这本书就完全适合你。
本书对当前数据库技术的各个领域进行了深入浅出的剖析,对传统的数据库理论和应用进行了精炼描述,对具有发展前景的数据库技术作了详细介绍,力求拓宽读者的知识面。 全书共分为7章:章介绍数据库的发展、数据库系统的特征、数据库技术的主要类型、数据库技术的发展趋势;第2章介绍数据库系统的核心和基础——数据模型;第3章介绍Access 2000数据库管理系统的使用方法;第 4章介绍Access数据库应用系统的规划设计、建库建表、窗体操作、利用宏来制作菜单、定义模块和用VB定义函数;第5章介绍sQL Server 2000数据库、数据表的管理,以及如何在数据库中创建及操作视图和索引;第6章通过一个网上查分系统的应用实例,讲述sQL Server 2000数据库中数据的处理方法;第7章介绍几种常用的大型关系数据库管理系统软件,包括Visual Foxpro、MySQL、Oracle、DB2的发展历史
本书是C程序设计的进阶书籍,在介绍C语言基础知识的同时,重点强调了软件设计的思想:共性与可变性分析、面向对象的编程思想等,并提供了详尽的范例程序。使读者体会到思想的重要性,面向对象编程并不局限于特定语言,使用C语言同样可以进行面向对象的编程。本书分为4章:章,主要介绍C语言的基础知识,并提及了共性与可变性分析;第2章,主要介绍C语言的进阶用法,特别是结构体及函数指针;第3章,主要介绍算法与数据结构,包含链表、哈希表、队列等;第4章,主要介绍面向对象的编程思想,包含面向对象的基础概念、虚函数的妙用、状态机设计等。本书既可作为高等院校本科、高职高专电子信息工程、自动化、机电一体化及计算机专业的,也可作为电子及计算机编程爱好者的自学用书,还可作为软件开发工程技术人员的参考书。
近年来,随着Web技术的发展和应用的普及,大量用户将线下行为转移到线上进行,并且通过各种社会媒体随时随地进行社会交互和情感表达。这些海量的社会行为形成的大数据,催生了社会计算这个新的跨学科的研究和应用领域。《清华学术专著·社会计算:用户在线行为分析与挖掘》在大数据的时代背景和社会计算的框架下,介绍从大量用户在线行为数据中发现其中隐含的用户行为模式和兴趣偏好的方法和技术。全书主要内容分为7个部分,分别介绍用户在线搜索行为、网上购物行为、浏览行为、社会标注行为、评论行为以及社交行为等方面的数据分析技术和方法,涉及搜索意图的分析、购物模式的发现、周期行为的挖掘、标签的有效聚类、评论意见的挖掘、用户偏好的发现、个性化推荐方法、链接分析以及社会网络的分析方法等研究内容。《清华学术专著·社会