数据科学伦理是关于人们在进行数据科学方面的行为的道德规范。到目前为止,数据科学主要应用于企业和社会并产生了积极成果。 然而,就像任何技术一样,数据科学也带来了一些负面后果:隐私侵犯的增加,对敏感群体的数据驱动的歧视以及使用不可解释的复杂模型做出决策。 没有哪个数据科学家和业务经理是天生不道德的,只是他们没有接受过培训来考虑他们在工作中的伦理问题 本书旨在填补这个越来越重要的空白和解释不同的概念和技术,帮助读者理解从k-匿名和差别隐私到同态加密和零知识证明等技术已可以解决隐私侵犯问题,消除敏感群体歧视和提供各种可解释的人工智能。 现实生活中的警世故事进一步说明了数据科学伦理的重要性和潜在影响,包括种族主义机器人的故事、搜索审查和人脸识别等。本书中穿插着结构化的练习,提供假设的场景和
基于内存的Redis数据库日趋红火,广受程序员关注。本书将以Redis6.2.0版本作为主讲版本,同时单独测试了Redis7.0.0版本新赠的主要功能。本书主要内容分基础篇、提高篇、实战篇,由浅入深、层层递进地进行介绍。基础篇重点介绍Redis的基础命令;提高篇主要介绍磁盘持久化、主从复制、分布式集群、事务、Lua脚本、管道、缓存、发布、订阅、Redis Stream消息队列、I/O线程、安全等各种高级技术;实战篇则介绍编程语言Java、Python、C、GO、PHP调用、大规模应用案例、实用辅助工具、电商应用实战案例。本书提供习题、实验及相关配套内容,即可供高校教学使用,又可供IT工程师自学使用。
本书介绍了智能化海洋物联网云服务体系架构、云服务模式以及基于云服务的海洋物联网典型业务应用。本书以智能化海洋物联网应用系统关键技术研究与应用示范项目为支撑,通过科研实践,将海洋物联网与云计算技术融合运用,构建了智能化海洋物联网云服务体系,拓展了海洋物联网ICT资源共享和云服务模式。其中,在资源共享内容中将海洋物联网感知设施、通信设施与云计算设施统筹运用,提供了泛在的海洋物联网基础设施即服务(IaaS);在云计算服务内容中根据海洋物联网业务应用需求,提供了更为丰富的服务模式,包括海洋物联网跨域通信服务,简称通信即服务(CaaS);岸海孪生数据服务,简称数据即服务(BaaS);基于区块链技术的海洋信息安全服务,简称区块链即服务(BaaS)等多种服务。本书能够为海洋信息化领域相关研究提供一定的帮助,也能
对数据生产和大数据处理带来的挑战,是当代社会和人工智能时代的重点。大数据的快速发展、信息共享和社交媒体的大众化带来了各方面的风险和挑战。我们需要遵循正确的流程、方法和沟通战略 且手头的数据必须准确,才能推演出高价值的结论。而数据越多,我们面临的陷阱可能就越深。在本书中,杰森?辛克从数据通用和收集的策略、数据分析的准则、数据展示的策略出发,讨论了应对数据挑战、获得和洞察数据的价值和内涵的可行方式。
本书共包括7章,涵盖了从基础理论到实际应用的 内容。第1章深入探讨了大模型的基础理论。第2章和第3章专注于Llama 2大模型的部署和微调,提供了一系列实用的代码示例、案例分析和 实践。第4章介绍了多轮对话难题,这是许多大模型开发者和研究人员面临的一大挑战。第5章探讨了如何基于Llama 2 行业大模型,以满足特定业务需求。第6章介绍了如何利用Llama 2和LangChain构建高效的文档问答模型。第7章展示了多语言大模型的技术细节和应用场景。本书既适合刚入门的学生和研究人员阅读,也适合有多年研究经验的专家和工程师阅读。通过阅读本书,读者不仅能掌握Llama 2大模型的核心概念和技术,还能学会如何将这些知识应用于实际问题,从而在这一快速发展的领域中取得优势。
随着云技术的迅猛发展和普及,商业组织正面临着满足用户需求的巨大挑战。本书深入探讨了云技术在数字化社会中的重要地位和创新应用。通过研究、创新和发展的视角,本书引领读者走进云技术的前沿,揭示了其在构建下一代卓越计算环境中的关键作用。书中汇集了多位专家学者的研究成果和实践经验,为读者提供了宝贵的洞察和指导。无论是对于云计算领域的专业人士,还是对于对数字化社会感兴趣的读者,本书都是一本不可或缺的参考书。通过阅读本书,您将深入了解云技术在数字化社会中的影响和价值,激发您的创新思维,为您在未来的技术革新中取得卓越成就打下坚实的基础。
《数字化生存》描绘了数字科技为我们的生活、工作、教育和娱乐带来的各种冲击和其中值得深思的问题,是跨入数字化新世界的 指南。英文版曾高居《纽约时报》畅销书排行榜。“信息的DNA”正在迅速取代原子而成为人类生活中的基本交换物。尼葛洛庞帝向我们展示出这一变化的巨大影响。电视机与计算机屏幕的差别变得只是大小不同而已。从前所说的“大众”传媒正演变成个人化的双向交流。信息不再被“推给”消费者,相反,人们或他们的数字勤务员将把他们所需要的信息“拿过来”并参与到创造它们的活动中。信息技术的革命将把受制于键盘和显示器的计算机解放出来,使之成为我们能够与之交谈,与之一道旅行,能够抚摸甚至能够穿戴的对象。这些发展将变革我们的学习方式、工作方式、娱乐方式―― 一句话,我们的生活方式。犀利的见解使尼葛洛庞
本书系“中国STEM教育2029行动计划”阶段性研究成果,以中国教育科学研究院STEM教育研究中心“STEM教师能力等级标准(试行)”为编写指导,致力于提升我国初中STEM相关学科教师的跨学科课程教学设计和实施能力。它从我国初中教师开展STEM教育教学的困境出发,帮助教师解决当下存在的问题。本书共2章:第1章围绕我国初中开展STEM教育所面临的8个主要问题,由本书作者集体讨论后撰写,给出可供参考的思路和解决方案;第2章是可供我国初中教师借鉴的15个STEM项目课例,课例来自中国教育科学研究院STEM教育研究中心的试验区征集作品和第四届中国STEM教育发展大会中的 作品。 ??本书适合我国初中理科教师、科学教师及所有跨学科教学研究者使用。
本书通过大量案例研究介绍数据可视化的基础知识,以及如何利用数据创造出吸引人的、信息量大的、有说服力的故事,进而达到有效沟通的目的。具体内容包括:如何充分理解上下文,如何选择合适的图表,如何消除杂乱,如何聚焦受众的视线,如何像设计师一样思考,以及如何用数据。
中国数据中心发展蓝皮书(2022)是对中国数据中心的历史沿革、行业状况、发展趋势进行阶段性系统回顾和深入剖析,该书聚焦于2019年-2022年四年间数据中心领域相关技术的发展及应用的情况,以主题报告的形式展现内容,分为17个报告,分别阐述数据中心领域的标准、 计算数据中心、液冷技术、安全保护、节能技术等的现状及趋势。
本书针对近几年全国计算机学科专业综合考试大纲的“数据结构”部分进行了深入解读,以一种独创的方式对考试大纲中的知识点进行了讲解,即从考生的视角剖析知识难点;以通俗易懂的语言取代晦涩难懂的专业术语;以成功考生的亲身经历指引复习方向;以风趣幽默的笔触缓解考研压力。考生对书中的知识点讲解有任何疑问都可与作者进行在线互动,解决复习中的疑难点,提高复习效率。 根据计算机专业研究生入学考试形势的变化,书中对大量非统考知识点进行了讲解,使本书所包含的知识点除覆盖统考大纲的内容外,还包括了各自主命题高校所要求的知识点。 本书可作为计算机专业研究生入学考试的复习指导用书(包括统考和非统考),也可作为全国各大高校计算机专业或非计算机专业的学生学习“数据结构”课程的辅导用书。 (编辑邮箱:
近年来,生物医学和健康科学中大数据的使用得到了广泛关注。这些数据为改进各种疾病诊断、治疗和预防以及改善健康干预措施提供了重要的机会。然而,这些敏感信息的隐私和安全,也存在一定风险。本书简要概述了大数据的一些机遇和挑战,以及随着这一领域的发展,需要解决或调查的一些关键问题。
本书从需求规划、需求实现到可视化展示等,遵循项目开发的主要流程,全景介绍了金融租赁行业离线数据仓库的搭建过程。在整个数据仓库的搭建过程中,介绍了主要组件的安装部署、需求实现的具体思路、问题的解决方案等,并在其中穿插了许多大数据和数据仓库相关的理论知识,包括数据仓库的概念介绍、金融租赁业务概述、数据仓库理论介绍和数据仓库建模等。本书的第1章至第3章是项目前期准备阶段,主要为读者介绍了数据仓库的概念、应用场景和搭建需求等,并初步搭建了数据仓库项目所需的基本环境;第4章至第5章是数据仓库搭建的核心部分,详细为读者讲解了数据仓库建模理论和数据从采集到分层搭建的全过程,是本书的重点;第6章至第7章介绍了全流程调度和指标可视化。
数据是什么?如何应用数据?如何把数据变成 有价值的东西?本书主要适合刚开始使用数据的读者,能让他们对数据的含义、价值及用途有清晰的认识和了解,本书目的是介绍数据的相关知识,同时鼓励人们参与到日益增多的与数据有关的对话中。 本书通过介绍简单数据相关知识,即从一个总体目标、两种思维系统、三大应用领域、四种数据尺度、五种数据分析方法、六种数据展现方式、七种数据活动、八个提前问的问题分别展开阐释数据和分析的方法和思维方式。
本书将为大家全面而深入地介绍Hadoop、Spark和NoSQL平台的构建,深入浅出地讲解Hadoop、Spark和NoSQL的基础知识、架构方案与实战技巧等。通过阅读本书,读者可以对大数据平台架构有一个明确、清晰的认识,掌握Hadoop、Spark、NoSQL平台的使用技巧,从而搭建一个安全可靠的大数据集群平台,来满足企业的实际需求。 本书共15章,可分为五大部分。 部分(第1章)为大数据平台架构概述,讲述大数据平台的基本概念与实际应用;第二部分(第2章~第6章)主要讲解Hadoop的基本使用方法,以及Hadoop生态圈的其他组件;第三部分(第7章)主要介绍NoSQL;第四部分(第8章~ 0章)主要介绍Spark生态圈与Spark实战案例;第五部分( 1章~ 5章)讲解如何构建大数据平台,阐述大数据平台的几个核心模块,以及大数据平台的未来发展趋势。 本书可作为各类IT企业和研发机构的大数据工程
本书系统论述了openGauss数据库理论、技术及应用。本书共11章,首先介绍数据库发展历史,包括传统的网状数据库、层次数据库、关系数据库、NoSQL数据库、NewSQL数据库、云数据库、多模数据库、
内容简介这是一本能帮助读者快速掌握图数据库的原理、架构、算法、扩展、规划、测评、优化以及实战应用的著作,书中的理论和实践均来自 的图数据库企业Ultipa的科研成果和实践经验,由Ultipa的创始人兼CTO孙宇熙领衔撰写。 该书内容全面、体系完整、循序渐进、深入浅出、图文并茂,兼具理论性、实战性、趣味性。用通俗的语言将抽象的图数据库技术具体化、形象化,将带领读者经历一次非凡的“图数据之旅”。通过本书,你将掌握以下内容:?图数据库、图计算的概念与区别;?图计算、图存储、图查询语言的原理;?高性能图存储架构、计算架构;?图数据库查询与分析框架的设计;?度计算、中心性计算、相似度计算、连通性计算等图算法;?可扩展的图数据库设计;?高可用分布式设计;?图数据库在决策智能、反欺诈、反洗钱、智能 、流动性风险管理等多