本书是一本基于 Python 实现全部例题计算的统计学教材,书中例题解答均给出了详细的实现代码和结果。全书共 11 章,第1章和第2章介绍数据、Python 的下载与安装、Python的数据类型和基本操作、Python 绘图基础等。第3章和第4章介绍数据的描述性分析方法,包括数据可视化和描述统计量。第5~7章介绍数据的推断性分析方法,包括概率分布、参数估计和假设检验。第8~11章介绍实际中常用的一些统计方法,包括类别变量分析、方差分析、回归分析、时间序列分析等。 本书可作为高等院校各专业开设统计学课程的教材,也可作为数据分析工作者、Python 数据分析和可视化爱好者的参考书。
教材系统地介绍文本数据挖掘的相关概念,利用Python作为工具进行相关试验,其内容主要包括:文本挖掘产生的背景及发展;文本挖掘的概念、文本模型表示、文本内容的预处理,包括分词、去停用词以及特征抽取;文本相似度的概念等。介绍文本分类的概念及常用方法,如KNN算法、SVM算法等,并对分类结果进行评价;在介绍文本聚类聚类的概念时是,同样介绍聚类常用算法,如K均值算法、层次聚类法、密度聚类法等,作为有文本分类、文本聚类的应用,*后给出了信息抽取、社会网络中的实体关系抽取和事件抽取。
本书与以往统计学中的概率论略有不同,添加了一些复杂数据类型的概率基础知识和模拟计算中的相关概率知识。具体安排如下所述。本书共分6章。第1章为概率与计数,基本内容是随机事件、概率空间、计数方法、概率的确定方法。第2章为条件概率,基本内容是条件概率与乘法公式、事件的独立性、全概率公式与贝叶斯公式。第3章为随机变量,基本内容是随机变量及其分布函数、随机变量的分类、二维随机向量、随机变量的独立性、随机变量函数的分布。第4章为常用的概率分布,基本内容是常用的离散型随机变量、常用的连续型随机变量、随机数的产生。第5章为随机变量的数字特征,基本内容是数学期望、方差和协方差、矩和矩母函数、条件期望。第6章为不等式和极限定理,基本内容是概率不等式、大数定律及其应用、中心极限定理。
在云计算和互联网快速发展的驱动下,分布式技术领域产生了很多新的热点,分布式数据库就是其中之一。但是,目前对分布式数据库的理解和研究多停留在理论层面,本书以Greenplum分布式数据库为例,深入剖析分布式技术在工业级产品里的实现细节,为读者呈现从理论到实践的 全景图 。 本书共3篇:第1篇主要介绍分布式数据库基础理论,包括经典的CAP理论、一致性算法相关的理论、并发控制相关的理论等;第2篇具体介绍Greenplum数据库,从分布式事务、分布式计算和分布式存储3个方面,深入代码层级,讲述分布式理论在工业上的实现;第3篇是总结和展望,介绍云原生数据库和新技术带给Greenplum和数据库管理系统的机遇和挑战。 本书打破以理论介绍和架构介绍为主的思路,深入分析工业化的实现,实践性强。本书主要面向数据库领域的科研工作者
Power BI是微软推出的商业智能分析工具,它融合了数据准备、数据分析、数据可视化到报告协作分享的整个数据处理流程,帮助用户上手数据分析。 本书从实用的角度出发,结合作者本人的学习经验,从*基础的Power BI架构和操作界面开始,先通过一个小示例体验Power BI的强大和便捷,然后按照数据处理的流程和难易程度,分别介绍数据准备模块Power Query、数据建模以及Power BI数据分析语言DAX、可视化图表制作、丰富的交互方式和报表设计,*后用一个完整的分析示例带读者全面认识Power BI数据处理流程。 不论读者是学生、职场人士还是自由职业者,不论从事的领域是运营、财务、人力、管理还是电商,只要在平时的学习和工作中需要处理大量信息,分析各种数据,你就适合阅读本书学习Power BI,即使之前没有任何基础,它也可以帮你快速上手,提升自身竞争力。
本书介绍了数据链的基本概念、发展历程和趋势,重点分析了Link-4、Link-11、Link-16和Link-22数据链的系统组成、工作模式、技术特点等内容,并以Link-16数据链为重点,全面阐述了该数据链的信道共享机制、时间同步技术、传输消息类型、封装结构、信号波形等内容,给出了多网、导航、中继、距离扩展等功能实现方法;以数据链关键技术为主线,详细论述了数据链的消息格式、信息传输、网络协议、通信安全等方面相关知识,剖析了数据链的本质。
本书是普通高等教育 十一五 *规划教材。本书全面系统地介绍了数据挖掘和知识发现领域的基本原理、研究方法、部分产品和工业标准。全书共15章,其中,第1章介绍数据分析技术的发展历程,KDD与数据挖掘的概念、对象、过程、方法、相关领域和应用范围。第2章介绍关联规则基本模型和Apriori等经典算法。第3章在介绍距离概念的基础上,讨论包括划分、层次、密度等聚类方法。第4章介绍ID3、CART等决策树算法。第5章介绍图方法实现贝叶斯分类。第6章介绍VC维、支持向量机。第7章介绍人工神经网络。第8章介绍近期热点技术 深度学习。第9章介绍不平衡数据学习。第10章讨论过拟合、模型选择、模型评估等内容。第11、12章是不确定性、模糊性方法,分别介绍粗糙集和模糊集。第13章是Web挖掘,介绍Web链接分析、推荐系统和社交网络挖掘。第14章介绍数据预处理和可视
本书系统地介绍了大数据相关理论知识,重点阐述了大数据的基本原理、技术、平台和不同领域的应用案例。全书共分为8章:第1章为引论,介绍大数据背景、应用价值和基本概念;第2章到第7章为技术章节,分别介绍大数据获取、大数据管理、大数据处理、大数据分析与学习、大数据隐私保护和大数据治理等内容;第8章介绍大数据在行业中的典型应用案例,反映了大数据在社会经济生活中的重要价值。每个章节均设有习题。 本书既可作为高等学校大数据相关专业的教学用书,也可作为大数据领域相关技术人员的参考用书。
MySQL作为一款开源的关系型数据库管理系统,有着强大的功能和广泛的应用领域,对促进信息化建设、推动数字经济发展起着重要的作用。本书全面介绍了MySQL数据库的技术原理、应用场景和开发实践,帮助读者掌握MySQL数据库的基本概念和高级特性,提升数据库设计与开发的能力。全书共11章,从数据库基础知识讲起,包括数据库概述、关系型数据库设计原则、SQL语言基础等内容,逐步深入介绍MySQL数据库的高级特性和应用技巧,如查询优化、事务管理、索引优化,延伸学习在数字经济发展情境下,数据库的发展趋势和应用等内容。此外,本书最后一章还通过两个综合应用项目将理论知识与实际应用结合在一起。 《MySQL数据库管理与应用》内容深入浅出,理论结合实际,可作为高等院校计算机、信息技术及相关专业数据库课程的教材,也可作为数据库初学者、软件
大数据审计已经成为目前审计领域研究与应用的热点。本书按照从常用电子数据审计方法到大数据审计方法的思路,不仅系统地分析了电子数据审计的理论知识(特别是大数据审计),还重点结合实际案例和具体操作,从审计数据采集、审计数据预处理和审计数据分析等电子数据审计的关键步骤出发,系统地分析了如何开展电子数据审计(特别是大数据审计)。附录中设计了9个实验模块(包括3个大数据审计实验模块),满足了开设实验课程的需要。 本书可作为高等院校审计、会计和信息管理等专业的教材,也可作为审计从业人员的专业培训教材和业务学习资料。
学习指导书的结构与教程1-1对应,共分为8章。在每一章中都给出了该章的学习要求与重点,典型例题分析和教程习题参考答案。在此基础上,还给出了一个标准试题库,包括填空题、判断题、选择题、简答题和综合题等,同时给出了标准试题库的参考答案, 最后给出了一套模拟试题和参考答案。
如今,推荐算法已经普遍应用于在线各个领域和场景,越来越多的商品、服务、用户通过推荐算法高效地连接彼此,每个人都享受到更加个性化的内容和服务。推荐已深刻地改变了我们与世界连接的方式。 本书聚焦在产品运营的角色上,探讨产品运营人员应该如何理解推荐算法,如何在不同的功能场景下应用推荐算法,如何从平台业务的角度对算法结果进行干预和再平衡。此外,本书着重于阐述不同功能场景下推荐的应用,辅以内容、电商、社交等业务下的应用实例。在每个章节中,都会枚举市面上已有产品功能或作者本人经历过的业务实践,以期给读者提供可以实操落地的借鉴。
本教材的第1版于2007年被评为北京市精品教材。自出版以来得到广大读者的青睐,被数百所高校选为教材,两次再版。本书本着与时俱进的原则,根据数据库技术目前发展的前沿和教学需要,在多年教学、研究以及实际工程中积累的经验的基础上,借鉴了国外数据库课程的安排方法,采用了 应用、原理和提高的三段式 讲解法进行组织和编著的,书中内容由浅入深,便于学生对数据库学习的接受和理解。本教材以案例为线索,系统地介绍了数据库管理系统Access 2010的应用;数据库设计的理论和方法;以及以SQL Server 2008为背景,以T\|SQL为重点介绍了SQL语言的使用。本书还对数据库安全和数据库的发展进行了较为详细的阐述。本教材各章具有大量的习题,书后还提供了相应的上机实验和综合训练题,便于读者进一步理解和掌握各章所学到的知识,同时也便于组织教学。为
本书内容紧扣国家对高等学校培养高级应用型、复合型人才的技能水平和知识结构的要求,采用全新的Web标准编写,内容包括HTML5、CSS3、JavaScript、jQuery开发技术基础和典型HTML5网站实例。本书以模块化的结构来组织章节,以 鲜品园 网站的开发为主线,通过对模块中每个任务相应知识点的讲解,引导学生学习Web前端开发的基本知识,以及项目开发、测试的完整流程。 本书分为13章,主要内容包括:HTML5基础,编辑网页元素,网页的布局与交互,CSS3基础,CSS3的属性,盒模型与页面布局,JavaScript编程基础,对象模型及事件处理,CSS3变形、过渡和动画属性,HTML5的API应用,jQuery基础,jQuery动画与UI插件和鲜品园综合案例网站。 本书条理清晰、内容完整、实例丰富、图文并茂、系统性强,适合作为高等学校计算机及相关专业课程的教材,也可以作为网站建设、相关软件开发
在数字化浪潮中,大数据技术无处不在,包括互联网、体育、工业、医疗、交通等在内的社会各行各业,都融入了大数据的印迹,大数据对人类的社会生产和生活产生了重大而深远的影响。一早醒来,多篇你感兴趣的推送文章早已占领手机屏幕;走在路上,智能手环实时监测着你的健康信息;想点外卖,小程序优先推荐最符合你口味的商家;骑车出行,导航系统会提供实时路况和最优路线避开拥堵;晚上回家,收到工厂根据你的身材比例剪裁制作的个性化服装。这些现象的背后,其实都和大数据息息相关。大数据技术正在不断与人类生产生活进行交汇与融合,并潜移默化地改变着世界的运作模式。本教材将从大数据的基本概念讲起,追溯大数据发展历程,并围绕大家身边的大数据应用,包含大数据在互联网、体育、工业、医疗、交通等方面的应用,以及大数据共享
`
本书是MySQL数据库初学者的入门教材,书中以通俗易懂的语言、丰富实用的案例,详细讲解了MySQL的开发和管理技术。 本书是新型活页式教材,包含8个项目20个任务,以及1个附录。8个项目分别是MySQL实训环境配置,MySQL数据类型,创建与管理数据库及数据表,MySQL查询,创建与管理索引及视图,事务、存储过程与触发器,安全管理与维护数据库,综合案例开发。附录中给出了课证融通1 X大数据分析与应用考证的相关内容。 本书是双高建设项目支撑材料之一,配有丰富的教学资源(包括教学微课视频、教学课件、课时安排、教案、任务测试模拟试卷及答案),以帮助读者更方便地学习和使用本书,有需要的读者,可扫描书中二维码观看,或登录出版社网站下载。 本书可作为各类院校及计算机教育培训机构的专用教材,也可作为数据库开发爱好者的参考用书,还可以作
本书以信息交互设计为研究对象,思考在设计学视野下的信息交互设计理论本体并进行 四维一体 的模型建构,比较系统的梳理信息交互设计的发展历程,并着重对发展趋势进行展望。本书以信息交互设计为研究目标进行了系统性、逻辑性的设计理论研究,力求综合、深刻地把握与探索信息交互设计的本体与趋势,并对今后的信息交互设计实践活动提供一定参考与启示。
本书系统地介绍了图数据库的历史由来、建模方法、工作原理和一些真实的用户用例,详细地说明了图数据解决的是什么样的问题,并以Neo4j数据库和Cypher查询语言为例,阐述了图数据库的建模方法和领域用例,还介绍了图数据库的工作原理以及一些实用的图论算法。本书适合开发人员和数据库管理人员了解和学习图数据库时阅读,作为一门新的知识和独特的数据库领域来拓宽视野,也适合提供解决方案的负责人了解行业动向和新的解决问题的方式。通过阅读本书,读者可以对图数据库这一领域有一个透彻的了解。