了解数据结构与算法是透彻理解计算机科学的前提。随着Python日益广泛的应用,Python程序员需要实现与传统的面向对象编程语言相似的数据结构与算法。本书是用Python描述数据结构与算法的开山之作,汇聚了作者多年的实战经验,向读者透彻讲解在Python环境下,如何通过一系列存储机制有效地实现各类算法。通过本书,读者将深刻理解Python数据结构、递归、搜索、排序、树与图的应用,等等。这一版重写了书中的示例代码,并对诸多内容做了修正。
《深入浅出数据分析》以类似"章回小说”的活泼形式,生动地向读者展现出色的数据分析人员应知应会的技术:数据分析基本步骤、实验方法、优化方法、假设检验方法、贝叶斯统计方法、主观概率法、启发法、直方图法、回归法、误差处理、相关数据库、数据整理技巧;正文之后,意犹未尽地以三篇附录介绍数据分析十大要务、R工具及ToolPak工具,在充分展现目标知识以外,为读者搭建了走向深入研究的桥梁。
商业分析有用吗?当然有用!商业分析是行走职场、创业启航的一项推荐技能。作者结合自己多年的工作经验,用生动的语言介绍如何用数据分析解决商业问题。本书分为6篇,共17章,其中第1篇是概念篇,讲述商业分析的基本概念;第2篇是基础篇,讲述如何用基础的分析方法评估企业经营状况;第3篇是进阶篇,讲述如何构建分析体系解决较复杂的问题;第4篇是高阶篇,讲述如何应对复杂的商业难题;第5篇是基础实践篇,通过案例讲述如何解决更复杂的商业问题;第6篇是高阶实践篇,通过案例讲述如何解决商业分析中的疑难杂症。本书的讲解思路是层层递进的,从简单场景到复杂场景,从基础的方法到复杂的方法。因此,无论读者是否有数据分析基础和经验,都建议从头开始阅读,这样可以一步步提升认知,更快地掌握商业分析的方法。
本书提供了学习大数据技术及架构的一站式解决方案,覆盖了大数据生态圈中的完整技术体系,包括数据采集、数据存储、分布式资源管理、数据计算、数据分析、任务调度、数据检索、大数据底层基础技术和大数据集群安装与管理。 本书还介绍了多个企业级大数据应用案例(包括海量数据采集、“双十一”数据大屏、海量数据全文搜索系统等)和大数据平台架构案例(包括离线数据仓库架构、实时数据仓库架构、批流一体化数据仓库架构、数据中台架构、直播大数据平台架构、电商大数据平台架构等),可以帮助读者从全局角度理解大数据。 在本书中,技术内容基本上都是从零讲起的,结合原理和架构,以“图解+实战”的形式帮助读者轻松理解复杂的知识。 本书适合对大数据感兴趣的开发人员。无论读者是否接触过大数据开发,只要具备一定的Java开发
这是一本关于如何更好、更有效地进行数据可视化的书。本书分为3个部分。第1部分是创建有效可视化的通用指导原则,我们将了解受众的重要性,以及思考哪类图表能更好地契合他们的需求。第2部分是本书的核心部分,我们将定义和讨论80多张图表,这些图表分为八大类:比较、时间、分布、地缘、关系、构成、定性和表格。我们将看到各类图表是如何起作用的,以及它们的优缺点。第3部分整合了两块内容,一是构建数据可视化样式指南,二是如何结合不同的经验对图表进行重新设计。本书将指导你选择最适合展示相关数据的图表,并有效地传递你想传达的信息。
本书介绍了数字孪生的概念和流程,帮助读者了解当前数字化的环境和趋势,并快速建立MicroStation直觉式绘图环境。本书分为13章,从数字孪生基础概念讲到数字孪生生态环境,然后进一步讲述如何使用MircoStation。内容包括使用方法、工作环境、空间定位、对象创建与修改、视图、三维操作、引用、单元对象、图纸输出、注释对象、打印输出。本书不仅适合作为广大学习、使用MicroStation软件人员的参考书,而且也可作为建筑行业的专业人员、研究人员、软件开发工程师、BIM爱好者及高校师生的常备参考书。
Python是一种面向对象的脚本语言,其代码简洁优美,类库丰富,开发效率也很高,得到越来越多开发者的喜爱,广泛应用于Web开发、网络编程、爬虫开发、自动化运维、云计算、人工智能、科学计算等领域。预测技术在当今智能分析及其应用领域中发挥着重要作用,也是大数据时代的核心价值所在。随着AI技术的进一步深化,预测技术将更好地支撑复杂场景下的预测需求,其商业价值不言而喻。基于Python来做预测,不仅能够在业务上快速落地,还让代码维护更加方便。对预测原理的深度剖析和算法的细致解读,是本书的一大亮点。本书共分为3篇。第1篇介绍预测基础,主要包括预测概念理解、预测方法论、分析方法、特征技术、模型优化及评价,读者通过这部分内容的学习,可以掌握预测的基本步骤和方法思路。第2篇介绍预测算法,该部分包含多元回归分析、复杂
本书详细介绍了Oracle、MySQL、PostgreSQL、SQL Server、DB2等各种关系数据库的SQL查询技巧和一些基础的SQL查询语句,并且通过短小精悍的实例,不仅讲解了如何插入、更新和删除数据,还介绍了如何检索记录、为查询结果排序、同时操作多张数据库表、查询元数据、处理涉及字符串和数值的操作、根据时间数据和日期数据进行运算、执行层次查询和区间查询等。随着多种SQL实现大量采用窗口函数,本书第2版针对相关实例做了优化,还新增了为数据科学家和算法工程师量身定制的实例。本书适合数据分析师、数据库管理员以及与SQL打交道的数据科学家和算法工程师阅读。
本书分为以下几个主要部分:第1-3章介绍方法和技术。在这些章节中,我们描述了一种性能调优方法。还提供了一些关于MongoDB架构和MongoDB提供的用于调查、监控和诊断MongoDB性能的工具的背景知识。第4章和第5章介绍应用程序和数据库设计。第6-10章介绍应用程序代码的优化。第11-14章讨论MongoDB服务器及其运行硬件的优化。
本书分为两部分。第一部分为第1~7章,介绍了Python的语法、编程基础和对常见错误的处理。第二部分为第8~14章,介绍了Python的各种实践应用,分别是对目录和文件的操作,对Excel、Word和PDF文件的操作,在图像处理、网络爬虫领域的应用,以及Python的图形用户接口编程。本书以实践应用为目的,希望读者能够前后对应,根据例题举一反三。 本书可供Python爱好者和技术人员参考和自学,也非常适于用作高等院校的自动化类、电子信息类、机械类、计算机类等相关专业的教材。
本书全面介绍了预测性分析相关方法,不仅直观地阐述了相关概念,还给出了现实的示例问题和真实的案例研究—包括从失败项目获得的经验教训。本书理论和实践内容相对平衡,便于读者加深理解。全书共9章,外加一个附录。第1章为分析导论,第2章为预测性分析和数据挖掘导论,第3章介绍预测性分析的标准流程,第4章介绍预测性分析的数据和方法,第5章介绍预测性分析算法,第6章探讨预测性建模中的高阶主题,第7章介绍文本分析、主题建模和情感分析,第8章介绍预测性分析使用的大数据,第9章介绍深度学习和认知计算,附录展望了商业分析和数据科学工具的前景。本书适合计算机科学、数据科学和商业分析领域的相关从业人员阅读。
本书介绍了如何使用 Python 实现企业级的大数据全栈式开发、设计和编程工作,涉及的知识点包括数据架构整体设计、数据源和数据采集、数据同步、消息队列、关系数据库、NoSQL 数据库、批处理、流处理、图计算、人工智能、数据产品开发。 本书既深入浅出地介绍了不同技术组件的基本原理,又通过详细对比介绍了如何根据不同场景选择很好实践技术方案,并通过代码实操帮助读者快速掌握常用技术的应用过程,最后通过项目案例介绍了如何将所学知识应用于实际业务场景中。
《数据库系统概念》是数据库系统方面的经典教材之一,本书基于该书第7版进行改编,保留其中的基本内容,压缩或删除了一些高级内容,使其体系更符合国内本科数据库课程教学要求。本书第1章概述数据库系统,第一部分(包括第2~6章)讲述关系语言的基本概念,第二部分(包括第7~9章)介绍数据库设计与应用程序开发技术,第三部分(包括第10~14章)介绍数据库管理系统实现的核心技术,第四部分(包括第15~17章)介绍大数据分析、区块链数据库、高级应用开发等高级话题。 本书既可作为高等院校计算机及相关专业本科生的数据库课程教材,也可供数据库领域的技术人员参考。
《基于大数据卫勤循证决策研究》旨在完善大数据理论和方法在“平战非”卫勤循证决策中的应用,应用“卫勤决策支持”全国重点实验室中的调研、建模与干预实验技术,将大数据引人循证决策,改变了证据分析方法,实现了数据信息实时化、全面化、科学化,从而为决策者提供快速、准确的大数据支持,提升了循证决策效率与质量,为后期“平时、战时、非战争”决策提供了坚实的理论依据。
本书提供了对当代计算机算法研究的一个全面、综合性的介绍。全书共八部分,内容涵盖基础知识、排序和顺序统计量、数据结构、高级设计和分析技术、高级数据结构、图算法、算法问题选编,以及数学基础知识。书中深入浅出地介绍了大量的算法及相关的数据结构,以及用于解决一些复杂计算问题的高级策略(如动态规划、贪心算法、摊还分析等),重点在于算法的分析与设计。对于每一个专题,作者都试图提供目前近期新的研究成果及样例解答,并通过清晰的图示来说明算法的执行过程。此外,全书包含957道练习和158道思考题,并且作者在网站上给出
本书提供了对当代计算机算法研究的一个全面、综合性的介绍。全书共八部分,内容涵盖基础知识、排序和顺序统计量、数据结构、高级设计和分析技术、高级数据结构、图算法、算法问题选编,以及数学基础知识。书中深入浅出地介绍了大量的算法及相关的数据结构,以及用于解决一些复杂计算问题的高级策略(如动态规划、贪心算法、摊还分析等),重点在于算法的分析与设计。对于每一个专题,作者都试图提供目前近期新的研究成果及样例解答,并通过清晰的图示来说明算法的执行过程。此外,全书包含957道练习和158道思考题,并且作者在网站上给出
本书提供了对当代计算机算法研究的一个全面、综合性的介绍。全书共八部分,内容涵盖基础知识、排序和顺序统计量、数据结构、高级设计和分析技术、高级数据结构、图算法、算法问题选编,以及数学基础知识。书中深入浅出地介绍了大量的算法及相关的数据结构,以及用于解决一些复杂计算问题的高级策略(如动态规划、贪心算法、摊还分析等),重点在于算法的分析与设计。对于每一个专题,作者都试图提供目前近期新的研究成果及样例解答,并通过清晰的图示来说明算法的执行过程。此外,全书包含957道练习和158道思考题,并且作者在网站上给出
内容简介本书是Python数据分析与挖掘领域的公认的事实标准,前两版销售超过15万册,被国内100余所院校采用为教材,同时也被广大数据科学工作者奉为经典。本书以真实项目案例为驱动,以真实的行业应用为依托,帮助读者快速掌握数据分析与挖掘的相关技术、流程与方法。本书精选了7个经典实战案例,涵盖了房地产、零售、互联网等多个领域,将Python编程知识、数据分析与挖掘知识和行业知识融合,让读者在实践中快速地掌握针对不同行业的数据挖掘方法。本书不仅适合零基础的读者自学,还适合作为相关专业的教材。为了帮助读者更加高效地掌握本书的内容,本书提供了以下附加价值:(1)上机环境:提供相关工具的环境配置文件,省去配置环境的烦琐操作,方便省心。(2)数据文件:提供各个案例配套的数据文件,开箱即用,增强实操性。(3)程序代码
《DAMA数据管理知识体系指南(原书第2版)》是DAMA国际(DAMA International)组织专家对过去30多年数据管理领域知识和实践的总结,是一部综合了数据管理方方面面具有权威性的基础工具书。本书从数据治理、数据架构、数据质量、数据安全、主数据管理、参考数据管理、元数据管理、商务智能和数据参考管理、数据建模设计、数据存储和操作、数据集成和互操作、文档和内容管理、大数据、数据管理人员的道德要求等方面介绍了数据管理的知识体系。DMBOK已经成为数据管理领域的“圣经”,是指导个人知识体系完善和企业数据管理能力建设的重要文献。本书适合各种组织负责信息化和数字化转型的领导(如CIO、CDO),从事数据管理的各种技术及业务人员,工作中涉及数据的会计、法律、咨询、教育、政务等领域的人士阅读。同时,也可作为高校MBA和计算机专业教学用
《DAMA数据管理知识体系指南(原书第2版)》是DAMA国际(DAMA International)组织专家对过去30多年数据管理领域知识和实践的总结,是一部综合了数据管理方方面面具有权威性的基础工具书。本书从数据治理、数据架构、数据质量、数据安全、主数据管理、参考数据管理、元数据管理、商务智能和数据参考管理、数据建模设计、数据存储和操作、数据集成和互操作、文档和内容管理、大数据、数据管理人员的道德要求等方面介绍了数据管理的知识体系。DMBOK已经成为数据管理领域的“圣经”,是指导个人知识体系完善和企业数据管理能力建设的重要文献。本书适合各种组织负责信息化和数字化转型的领导(如CIO、CDO),从事数据管理的各种技术及业务人员,工作中涉及数据的会计、法律、咨询、教育、政务等领域的人士阅读。同时,也可作为高校MBA和计算机专业教学用
本书详细介绍了大数据工程师在实际工作中应该熟练掌握的大数据技术。全书共8章,分别是大数据技术概述、搭建IDEA开发环境及Linux虚拟机、基于Hadoop构建大数据平台、基于HBase和Kafka构建海量数据存储与交换系统、用户行为离线分析——构建日志采集和分析平台、基于Spark的用户行为实时分析、基于Flink的用户行为实时分析、用户行为数据可视化。本书以一个完整的大数据项目为主线,涵盖Hadoop、Spark、Flink等主流大数据技术,按照大数据工程师的项目开发流程,理论与实践结合,逐步推进,使读者在学习大数据核心技术的同时,也能掌握开发大数据项目的完整流程,从而获得大数据项目开发经验。本书既可以作为大数据工程师的推荐开发手册,也可以作为高校大数据及相关专业的教材或实验手册。
本书详细介绍了大数据工程师在实际工作中应该熟练掌握的大数据技术。全书共8章,分别是大数据技术概述、搭建IDEA开发环境及Linux虚拟机、基于Hadoop构建大数据平台、基于HBase和Kafka构建海量数据存储与交换系统、用户行为离线分析——构建日志采集和分析平台、基于Spark的用户行为实时分析、基于Flink的用户行为实时分析、用户行为数据可视化。本书以一个完整的大数据项目为主线,涵盖Hadoop、Spark、Flink等主流大数据技术,按照大数据工程师的项目开发流程,理论与实践结合,逐步推进,使读者在学习大数据核心技术的同时,也能掌握开发大数据项目的完整流程,从而获得大数据项目开发经验。本书既可以作为大数据工程师的推荐开发手册,也可以作为高校大数据及相关专业的教材或实验手册。
本书详细介绍了大数据工程师在实际工作中应该熟练掌握的大数据技术。全书共8章,分别是大数据技术概述、搭建IDEA开发环境及Linux虚拟机、基于Hadoop构建大数据平台、基于HBase和Kafka构建海量数据存储与交换系统、用户行为离线分析——构建日志采集和分析平台、基于Spark的用户行为实时分析、基于Flink的用户行为实时分析、用户行为数据可视化。本书以一个完整的大数据项目为主线,涵盖Hadoop、Spark、Flink等主流大数据技术,按照大数据工程师的项目开发流程,理论与实践结合,逐步推进,使读者在学习大数据核心技术的同时,也能掌握开发大数据项目的完整流程,从而获得大数据项目开发经验。本书既可以作为大数据工程师的推荐开发手册,也可以作为高校大数据及相关专业的教材或实验手册。
随着互联网的发展,越来越来的企业采用Spring Boot来完成Web项目的开发。本书专门为Spring Boot企业项目开发者量身定制,内容涉及Spring Boot的理论基础、源码解析和项目开发中的各种技巧。 本书分为10章。第1章介绍Spring、Spring MVC的理论基础,同时搭建Spring开发环境;第2章介绍Spring Boot入门知识,包括Restful API、Jersey、Postman、Swagger2 UI和Lombok等;第3章介绍Spring Data JPA和Validate等;第4章介绍使用Spring Boot进行Web开发的具体方法,另外还会介绍Redis的使用;第5章介绍Spring Security的原理;第6章介绍Spring Boot框架的扩展,包括日志、定时任务、邮件的发送、Web Service和Web Socket等;第7章介绍单元测试、集成测试和性能测试等;第8章介绍Jeecg Boot的功能、环境、配置和源码等;第9章是项目实战,全面展示一个销售管理系统的完整开发过程;第10章介绍项目的打包、热部署和监控等
这是一本从点、线、面、体4个维度深度解读分布式系统性能优化方法的专业工具书,更是一套全栈性能优化解决方案。其中,“点”指的是代码中的单个语句或函数,“线”指的是代码中的执行路径,“面”则上升到模块、子系统级别,“体”则指的是整个系统。4个维度对应4个不同的优化层次,只有这4个维度配合,才可以真正实现分布式系统的整体性优化。 全书融合了5位长期(最长有近30年工作经验)从事软件开发及优化工作的一线专家的实践经验和深刻理解,不仅从理论层面深入解读了性能优化的本质,还从软件开发整体流程的角度构建性能优化体系和评估策略。全书本着“没有jue对的好设计,只有适合的设计”的理念展开介绍,不仅提供可落地的技巧,还直指本质,让读者知其然并知其所以然,从而设计出适合自己的性能优化方案。 本书共分为17章。 第1~4