数据是什么?如何应用数据?如何把数据变成更有价值的东西?本书主要适合刚开始使用数据的读者,能让他们对数据的含义、价值及用途有清晰的认识和了解,本书目的是介绍数据的相关知识,同时鼓励人们参与到日益增多的与数据有关的对话中。 本书通过介绍简单数据相关知识,即从一个总体目标、两种思维系统、三大应用领域、四种数据尺度、五种数据分析方法、六种数据展现方式、七种数据活动、八个提前问的问题分别展开阐释数据和分析的方法和思维方式。
Apache Flink项目的资深贡献者Fabian Hueske和Vasiliki Kalavri展示了如何使用Flink DataStream API实现可伸缩的流式应用,以及怎样在业务环境中持续运行和维护这些应用。流处理的理想应用场景有很多,包括低延迟ETL、流式分析、实时仪表盘以及欺诈检测、异常检测和报警。你可以在任意类型的持续数据(包括用户交互、金融交易和物联网等数据)生成后,立即对它们进行处理。本书主要内容包括: 了解有关分布式状态化流处理的概念和挑战。 探索Flink的系统架构,包括事件时间处理模式和容错模型。 理解DataStream API的基础知识和构成要素,包括基于时间和有状态的算子。 以精确一次的一致性读写外部系统。 部署和配置Flink集群。 对持续运行的流式应用进行运维。
数据科学伦理是关于人们在进行数据科学方面的行为的道德规范。到目前为止,数据科学主要应用于企业和社会并产生了积极成果。 然而,就像任何技术一样,数据科学也带来了一些负面后果:隐私侵犯的增加,对敏感群体的数据驱动的歧视以及使用不可解释的复杂模型做出决策。 没有哪个数据科学家和业务经理是天生不道德的,只是他们没有接受过培训来考虑他们在工作中的伦理问题 本书旨在填补这个越来越重要的空白和解释不同的概念和技术,帮助读者理解从k-匿名和差别隐私到同态加密和零知识证明等技术已可以解决隐私侵犯问题,消除敏感群体歧视和提供各种可解释的人工智能。 现实生活中的警世故事进一步说明了数据科学伦理的重要性和潜在影响,包括种族主义机器人的故事、搜索审查和人脸识别等。本书中穿插着结构化的练习,提供假设的场景和
随着云技术的迅猛发展和普及,商业组织正面临着满足用户需求的巨大挑战。本书深入探讨了云技术在数字化社会中的重要地位和创新应用。通过研究、创新和发展的视角,本书引领读者走进云技术的前沿,揭示了其在构建下一代卓越计算环境中的关键作用。书中汇集了多位专家学者的研究成果和实践经验,为读者提供了宝贵的洞察和指导。无论是对于云计算领域的专业人士,还是对于对数字化社会感兴趣的读者,本书都是一本不可或缺的参考书。通过阅读本书,您将深入了解云技术在数字化社会中的影响和价值,激发您的创新思维,为您在未来的技术革新中取得卓越成就打下坚实的基础。
对数据生产和大数据处理带来的挑战,是当代社会和人工智能时代的重点。大数据的快速发展、信息共享和社交媒体的大众化带来了各方面的风险和挑战。我们需要遵循正确的流程、方法和沟通战略 且手头的数据必须准确,才能推演出高价值的结论。而数据越多,我们面临的陷阱可能就越深。在本书中,杰森?辛克从数据通用和收集的策略、数据分析的准则、数据展示的策略出发,讨论了应对数据挑战、获得和洞察数据的价值和内涵的可行方式。
《新编计算机专业重点课程辅导丛书:新编数据结构习题与解析》作者长期从事程序设计语言和数据结构课程的基础教学工作,《新编计算机专业重点课程辅导丛书:新编数据结构习题与解析》是在总结这些教学经验的基础上编写而成,全书分为12章,包括绪论、线性表、栈和队列、串、数组和稀疏矩阵、递归、树形结构、广义表、查找、内排序、外排序、文件,的两个附录给出几份试题和参考答案。 《新编计算机专业重点课程辅导丛书:新编数据结构习题与解析》强调数据结构中逻辑结构、存储结构和算法设计的层次思想,总结知识难点的求解方法,力求归纳各类算法设计的规律,并深人讨论递归算法的设计方法。 书中提供了大量例题,适合作为课程考试和研究生考试辅导用书,任课教师可以将其作为教学参考书使用,对于计算机专业的本科学生,可以
本书是首本专注于利用R语言进行科研数据清洗的书籍,全书主要分为两大块,首块以简洁的内容向读者介绍R语言的入门知识,让读者了解并认识R语言,为后面的内容打下基础。全书大部分篇幅主要集中在第二块内容,即数据清洗的知识。作者从实际问题出发,详细的介绍了如何利用R语言处理科研中的数据,比如缺失值的插补,异常值的查找,长宽型数据结构的转换,时间日期数据的处理,文本数据的处理等,此外,作者也将数据清洗的内容进行了适当扩展,比如书中加入了R语言与数据库的连接方法,让大数据的处理更加得心应手。
数据结构是计算机专业的重要专业基础课,对培养学生的软件素质,提高学生的软件开发能力与软件项目管理能力具有重要的意义。 《数据结构学习指导与习题解答(Java语言版)(第2版)》系统地介绍了数据结构的基础知识,内容实用而丰富。 《数据结构学习指导与习题解答(Java语言版)(第2版)》特点是,详细说明重要知识点,用丰富的例子,让读者全面透彻地理解和掌握概念。每章都有大量习题,覆盖面广,难易适中,并给出详尽答案,使读者能举一反三,全面透彻地理解概念,灵活运用理论知识解决实际问题,并检验知识的掌握程度。
近年来,随着Web技术的发展和应用的普及,大量用户将线下行为转移到线上进行,并且通过各种社会媒体随时随地进行社会交互和情感表达。这些海量的社会行为形成的大数据,催生了社会计算这个新的跨学科的研究和应用领域。《清华学术专著·社会计算:用户在线行为分析与挖掘》在大数据的时代背景和社会计算的框架下,介绍从大量用户在线行为数据中发现其中隐含的用户行为模式和兴趣偏好的方法和技术。全书主要内容分为7个部分,分别介绍用户在线搜索行为、网上购物行为、浏览行为、社会标注行为、评论行为以及社交行为等方面的数据分析技术和方法,涉及搜索意图的分析、购物模式的发现、周期行为的挖掘、标签的有效聚类、评论意见的挖掘、用户偏好的发现、个性化推荐方法、链接分析以及社会网络的分析方法等研究内容。《清华学术专著·社会
《MariaDB必知必会》是首本关于MariaDB的中文版书籍,由书作者BenForta亲笔撰写,MariaDB和MySQL创始人Michael”Monty”Widenius作序,内容全面,讲解系统,为快速而全面地掌握MariaDB提供实用指南。 本书与作者福达另一本书《SamsTeachYourselfSQLinTenMinutes》(该书是常用的SQL参考手册之一)的撰写风格类似,首先从简单的数据检索开始,然后逐步深入到复杂的主题,包括连接、子查询、正则表达式和全文本搜索、存储过程、游标、触发器、表约束条件等。《MariaDB必知必会》系统讲解了SQL、MariaDB和MySQL的基本概念,并通过紧凑的章节设计,详细介绍MariaDB的基本操作语句及使用MariaDB进行应用开发的各种实用技术和方法。
《智慧云数据中心》对现阶段转型大背景下数据中心的部署、运营、管理和演进进行了清晰的阐述,并结合IBM公司大量的一线实践案例,分析、总结了在数据中心整个生命周期内的常见问题,提出了对应的解决方案,而且在前一本《智慧数据中心》的基础上充实了云数据中心、技术发展趋势、数据中心基础设施可靠运营和管理服务等内容,具有很高的理论和实践价值。《智慧云数据中心》帮助企业管理人员和技术人员,在资源有限的情况下化地利用好数据中心,引进新技术和新的运营模式,提高效率,灵活支撑业务发展,并帮助他们更透彻地理解数据中心未来的发展趋势,及早做出积极的准备。
世界上的大部分领域实际上都可以建模成图,而软件开发人员或是数据库管理人员却在辛辛苦苦地将这些图转化成关系型数据库中的表。想象一下,假如你再也不用去做这样的转化,假如数据库的迁移可以变得轻松简单,你愿意去接受一个全新的数据库吗?图数据库就是这样一个完全不同于关系型数据库的新型数据库,它处理的是大规模的数据和不断变化的需求,并且拥抱它们。本书系统地介绍了图数据库的历史由来、建模方法、工作原理和一些真实的用户用例,详细地说明了图数据解决的是什么样的问题,并以Neon4j数据库和Cypher查询语言为例,阐述了图数据库的建模方法和领域用例,最后还介绍了图数据库的工作原理以及一些实用的图论算法。本书的三位作者均为Neo4jTechnology公司的技术高手,分别为工程师、CTO和CEO。他们对图数据库及其解决方案有丰富的经验,
本书介绍了CrystalReportsⅪ水晶报表的版本,主要介绍了根据各种数据源制作和发布专业品质报表的技术,涉及的数据源包括:关系型和OLAP数据库、BusinessObjectsUniverses、SAPBW、SAPR3、PeopleSoft、Siebel、JavaBeans、.NET/对象、Web日志以及许多其他数据源。通过本书的学习,读者可以了解第Ⅺ版新增的功能,包括动态和级联参数,用鼠标拖放图表和交叉表,CrystalReports工作台和对“最前N个”报表的参数化控制。按照书中提供的详细示例、提示和技巧,读者还能学到报表设计的高级技能,例如子报表、层次分组、公式创建、外部超级链接和格式化技术。本书适合于水晶报表的程序设计师、各类企业的专业报表设计员、财会人员、公司经营者和企业管理人员阅读,也可以作为大专院校师生的参考读物。
《洞见数据价值:大数据挖掘要案纪实》是国际知名咨询公司毕马威的大数据团队的集大成之作,内容丰富,观点新颖,贴近大众生活、工作与学习实际场景,内容不拘泥于技术阐释,通过寓教于乐的方式,以丰富翔实的案例来解析大数据挖掘,尽量通过常见的场景来阐述数据的价值与意义。章介绍大数据在银行业、征信业、审计、传统制造业、互联网行业、舆情监控、影视业、环保产业以及体育产业等多个领域的应用方案和前景。第2章重点介绍大数据分析在商业工作和营销推广中的作用。第3章介绍大数据挖掘过程中涉及的数据的前期准备工作,重点介绍数据准备工作的要点和诀窍。第4章结合业务、生活、娱乐,寓教于乐,介绍大数据的实际应用方式。附录部分介绍一位数据工作者的成长之路,向感兴趣的读者介绍从事数据工作应该具备的素质和掌握的技能。《
本书主要介绍了数据库系统的基本概念,包括数据库设计、数据库语言和系统实现。第4版中扩展了ER模型、SQL、数据仓库、OLAP、数据挖掘的内容,新增了XML、数据库管理、应用开发等章节,更新并扩展了信息检索部分。本书可作为三、四年级本科生一年级研究生的数据库课程的教材,同时,可供数据库领域的技术人员参考。涵盖了数据模型、基本对象的系统和XML、数据库存储和检索、事务处理、数据库系统体系结构等多方面的内容,采用直观的方式描述所有概念,并以结构清晰的图示和例子代替形式化的证明,以银行数据库实例生动地解释重要概念,增强了本书的易读性。