本书是一本数据科学的入门与提升教程,全书共5篇,按照由浅入深、循序渐进的方式介绍R语言的基本语法与实际应用,并结合现实数据进行实战操作。内容涵盖R语言的安装与运行、数据对象的创建与编程、R语言初级与高级绘图、数据的管理与清洗、统计分析与数据降维、无监督与有监督学习、利用R Markdown创建动态报告和制作幻灯片等。本书为读者提供了相关案例的源码(获取方式见封底)。 本书适合对数据可视化、统计建模、数据分析、数据挖掘感兴趣的研究人员和工程技术人员阅读,也可作为高等院校数学、统计学、数据科学、计算机科学、人工智能、云计算、大数据分析、生物医学、工业统计等方向本科生或研究生的参考教程。
本书介绍可以帮助读者处理真实数据分析挑战的概念和技能。它涵盖了概率论、统计推断、线性回归和机器学习等概念。它还帮助读者提升如下技能:R编程、数据清洗、数据可视化、预测算法构建、使用UNIX/Linux shell组织文件、使用Git和GitHub进行版本控制以及可复制的文档准备。全书分为六个部分,分别为R、数据可视化、统计与R、数据清洗、机器学习和生产力工具。
作为数据仓库和商业智能(DW/BI)行业中有影响力的领军人物,RalphKimball、MargyRoss得到了世界范围内的认可和尊重,他们在《数据仓库与商业智能宝典(第1版)》中确立了行业标准。现在,在《数据仓库与商业智能宝典(第2版)成功设计、部署和维护DW/BI系统》中已经更新了65篇DesignTip和白皮书,从而汇集了DW/BI技术创新前沿的著作。 从项目规划和需求收集,到维度建模、ETL和BI应用,《数据仓库与商业智能宝典(第2版):成功设计、部署和维护DW/BI系统》涵盖了你在数据仓库和商业智能中将会遇到的所有内容。这些无与伦比的文章提供了成功地设计、部署和维护DW/BI系统的重要建议。 启动DW/BI项目和收集需求的注意事项 集成式企业数据仓库的要素,其中包括总线架构和矩阵 事实表的粒度性和三种基本类型 渐变维度技术 星型模式、
智慧城市是5G和人工智能(artificialintelligence,AI)等前沿科技密集应用的新兴领域,也是我国实现可持续发展的重大战略选择。城市大数据的分析与应用是构建智慧城市的关键技术。城市大数据不仅具有典型的海量、异构和高价值密度的特点,还具有独特的时空感知特征和社会感知特征,这为数据建模带来了全新的挑战,但也为构建从微观到宏观的智慧城市应用带来了前所未有的机遇。本书系统地介绍了城市大数据的概念及其核心建模方法,并以作者及其所带领的科研团队近年来的研究成果为例,围绕智能预测与规律探索两类典型智慧城市应用场景,详细地阐述了国内外在该领域的前沿热点和发展趋势。本书共分7章,内容包括城市大数据概述,基于城市大数据的城市人口管理、交通管理与位置服务等微观问题,以及基于城市大数据的城市规划管理、经济发展、战略
本书涵盖了使用统计分析和数据科学方法对财务数据进行建模和分析的方法。第1章概述了金融市场,描述了市场运作并使用探索性数据分析来说明金融数据的性质。第2章介绍了探索性数据分析的方法,尤其是图形方法,并在实际财务数据上进行了说明。第3章介绍了可用于财务分析的概率分布,特别是重尾分布,并介绍了计算机模拟财务数据的方法。第4章介绍了统计推断的基本方法,尤其是在分析中使用线性模型,第5章介绍了时间序列的方法,其中特别强调了适用于财务数据分析的模型和方法。附录还描述了如何使用R从互联网获取当前财务数据。
看似佛系,其实只是不思进取;在朋友圈假装热爱生活,真实的自我只敢去微博展露;年初列了无数计划,年底全成了打脸的笑话;人前装得无懈可击,活得却比谁都软弱无力 本书作者赵德昊, 毒鸡汤 公众号创始人,凭借《不会偷懒还假装勤奋,怪不得你又累又穷》《你这不是抑郁,是没钱和缺爱的正常表现》《就算朋友遍天下,你还是个nobody》等爆文圈粉无数。 这些热辣酸爽的金句,引起无数年轻人共鸣,也映照出他们在当下焦虑生活中无力挣扎的现实。61篇犀利扎心的硬核文章,不卖情怀只给解药,愿这些狠话能为你打破思维桎桔,重塑人生。 生活虽不易,但请你干万别假装。
特征选择是机器学习的重要研究内容,有着广泛的应用价值。特征选择主要从数据(尤其是高维数据)中选取有效特征来表示数据,从而提高机器学习算法的性能。《高维数据的特征选择:理论与算法》以重庆工商大学等单位的机器学习、图像处理课题为基础,系统地介绍特征选择的基本概念,以及相关的理论和算法,也对它的前沿研究(如无监督特征选择)和其在计算机视觉中的应用进行详细介绍,最后对特征选择的发展方向进行展望。 《高维数据的特征选择:理论与算法》理论联系实际,对教学、科研具有重要指导意义,可作为高等院校和科研机构从事机器学习的学者的参考书,亦可供从事大数据分析(如基因数据、计算机视觉)的专业技术人员参考。
本书旨在为包括研究生和工业从业者在内的研究人员提供有关为数据驱动的进化优化而开发的方法的全面描述。本书共分12章,~4章简要介绍了优化、进化计算和机器学习中精心挑选的重要主题和方法。第5章提供了数据驱动优化的基础知识,包括启发式算法和基于获取函数的代理模型管理。第6章介绍使用多个代理模型进行单目标优化的方法。第7~8章中描述用于求解多目标和多目标优化算法的代表性进化算法以及代理模型辅助数据驱动的进化多目标和多目标优化。第9章详细阐述了高维数据驱动优化的方法。0章描述迁移学习和迁移优化。1章讨论离线数据驱动的进化优化,以翼型设计优化等实际优化问题为例、原油蒸馏优化和急救系统优化。最后,2章强调了深度神经架构搜索作为数据驱动的昂贵优化问题。
《空间数据挖掘及其相关问题研究》围绕空间数据挖掘的相关技术进行了卓有成效的研究。首先,研究了数据聚类有关问题;接着,提出了一个改进的支持大的数据集和任意形状聚类、且具有良好的抗噪性能和能满足高维数据要求的算法;然后,分析了与空间数据挖掘和分析相关的空间索引及查询技术;最后,设计了一个融合神经网络、模糊集和遗传算法的空间数据挖掘系统。 《空间数据挖掘及其相关问题研究》可作为人工智能、模式识别、空间数据库、统计学、空间信息系统和网络等学科相关专业学生的教材及参考资料。
《化学数据挖掘方法与应用》主要介绍了化学常用数据挖掘方法和技术的基本原理,并重点介绍了模式识别、支持向量机、集成学习方法在材料设计、工业优化、构效关系、生物信息学等领域的应用研究实例。书中所有应用研究实例全部取自作者的应用研究课题,有关算法程序可采用作者开发的应用软件HyperMiner(见附录1)。 《化学数据挖掘方法与应用》可供化学、化工及相关领域的科研人员和工程技术人员阅读,亦可作为高等学校的教学参考书。