数据、模型与决策是应用数学建模和计算机技术帮助决策者解决问题。作为国外一本优秀的数据、模型与决策的教材,本书具有以下特色: 1.对枯燥、复杂和技术化的数学问题用简明易懂的语言予以解释,兼顾严谨的数理逻辑。 2.突出建模分析框架和基础逻辑的讲授和训练,在某种程度上实现了艺术与科学的有机融合。 3.课后习题丰富,并配有网络题库,供自学者加强训练,及时检查对理论模型及其求解方法的掌握程度。 第12版把修订重点放在企业和组织的*技术发展上,增加了商业分析(第1章)、项目风险(第8章)以及数据挖掘(第14章)等内容。
从统计学科与计算机科学的性质认知,大数据是指那些超过传统数据系统处理能力、超出经典统计思想研究范围、不借用网络无法用主流软件工具及技术进行单机分析的复杂数据的集合,对于这一数据集合,在一定的条件下和合理的时间内,我们可以通过现代计算机技术和创新的统计方法,有目的地进行设计、获取、管理、分析,揭示隐藏在其中的有价值的模式和知识。 《大数据:统计理论、方法与应用》共分五章,其内容包括大数据下的统计理论体系、大数据下的数据集整合分析、大数据下的高维变量选择方法、大数据下的统计方法并行计算和大数据下的统计方法应用——网络舆情分析。 本书内容新颖,取材国内外资料,同时认真总结了作者近年来的科研成果,重点反映统计学对大数据发展的影响,突出五大特点: (1)充分体现学科融合; (2)
本书的主要内容包括网络数据的定义及相关指标、大规模网络中的链路预测、网络聚类分析、网络数据中的空间自回归模型、大规模网络数据中的模型估计方法、网络数据中的空间自回归模型的拓展及应用、网络中的空间自回归模型的其他研究方向等。本书关注大规模网络数据分析中的模型方法。除模型方法本身的理论拓展之外,在估计方法等方面会涉及大规模数据中的快速计算方法。由于网络分析本身的范围非常广泛,故本书涉及的内容仅局限于作者及团队研究工作中使用到的一部分。在本书的后,为了启发读者思路,对于部分已有网络研究进行了梳理。
《数据挖掘导论(完整版)》涵盖五个主题:数据、分类、关联分析、聚类和异常检测。除异常检测外,每个主题都包含两章:前面一章讲述基本概念、代表性算法和评估技术,后面一章较深入地讨论高级概念和算法,目的是使读者在透彻地理解数据挖掘基础的同时,还能了解更多重要的高级主题。《大数据:互联网大规模数据挖掘与分布式处理(第2版)》 源自斯坦福大学 海量数据挖掘 (CS246: Mining Massive Datasets)课程,主要关注极大规模数据的挖掘。主要内容包括分布式文件系统、相似性搜索、搜索引擎技术、频繁项集挖掘、聚类算法、广告管理及推荐系统。两本书都提供了大量示例、图表和习题。
本书以当前热点的数据挖掘应用贯穿全书,通过详解大数据挖掘技术在系统日志、工作票、可持续性研究、推荐系统、智能问答系统、社交媒体、生物信息学与健康医疗、隐私保护等方面的实际应用案例,阐述了如何更好地应用和学习数据挖掘技术。本书融入了数据挖掘前沿技术和典型应用,不仅适合热爱和关心数据挖掘技术的学术界和工业界人士阅读,还适合作为各大高校的数据挖掘和机器学习课堂的实践教材和参考书籍。本书有助于读者更好地理解数据挖掘技术背后的根源和本质。
本书以数据挖掘为应用载体,按应用频率的高低,系统地介绍分治算法、贪心算法、搜索算法和动态规划算法。同时,介绍算法分析所用的渐近符号及常用的分析方法,包括递归分析方法、非递归分析方法。本书的特点是结合作者及其团队研究的数据挖掘问题,注重介绍算法的基本思想及算法应用的启发性。
互联网思维、大数据、云计算 今天,这些名词术语正在对我们的感官与心智进行着前所未有的冲击。本书作者对大数据和云计算并没有一味称好,而是批判地审视它们带来的冲击,为读者提供了全面广阔的视野。 作者探索了 云端 从何而来、意味着什么以及它对商业、政府、公民的重要性。他描述了云端公司的激烈竞争,如亚马逊和谷歌;云端科技向政府的扩散,如备受争议的美国国家安全局;他也剖析了如黑云般隐约存在,由 云端 而产生的问题,诸如环境问题、隐私问题、就业问题,等等。云技术这一早就承诺的信息应用是否会解决世界上的政治和社会问题呢?抑或,它仅仅是一种市场化的大肆宣传?本书提供了冷静彻底的分析,并且指出技术的问题也许会破坏整个世界。
从数据中心机房监控系统的自定制技术、监控系统可信方法等方面,综述国内外研究进展,确定研究内容。第1章,主要讲述智能绿色数据中心机房监控系统的内涵;第2章,主要讲述基于大批量定制的绿色数据中心机房的自定制机理与方法;第3章,主要讲述绿色数据中心机房的用户身份认证、完整性等可信方法;第4章,给出了绿色数据中心机房智能监控技术应用,研制绿色智能机房监控系统,在该绿色智能机房监控系统架构上实施用户自定制技术、可信增强技术模块功能,并测试各项技术及整个系统的应用效果。 本书是作者长期从事数据中心机房监控系统,特别是数据中心机房监控系统自定制、可信性研究工作的方法和应用成果的总结,本书所研究技术应用到实际数据中心机房运行,这些实践工作对本书的形成具有十分重要的意义。
当下,大数据是一个热门的话题,很多领域的学者,从不同的角度进行了深入的讨论。本书从大数据的历史、内涵、哲学和技术四个角度,全面解析大数据,让读者对大数据有更深入的了解。 《品味大数据》共11章,大致分为4块:第1-3章主要漫谈了大数据的有趣的历史,包括数据的启蒙、信息载体的演变和数据管理的发展脉络。第4-6章主要聊聊大数据的内涵,包括大数据与哲学及第四科学范式的关联。第7-9张是大数据的杂谈,包括大数据的用途、可能面临的陷阱以及通过小故事对大数据进行一些烦死,第10-11章主要涉及大数据的技术,包括100余篇大数据论文的漫读及Hadoop的初级实战篇。 图书结构完整,行文幽默,并以图文并茂、通俗易懂的方式力图让读者心有余地品味大数据。图书援引了数以百计大家牛人的观点,或褒或贬,高手过招,精彩纷呈,是一
《从零开始学Power BI商业数据分析(视频教学版)》从Power BI的基础知识讲起,然后逐步深入Power BI的进阶提升知识,最后配合项目实战案例,展示如何使用Power BI进行数据清洗、数据统计和数据可视化等相关操作,从而帮助零基础的数据分析人员快速上手。 《从零开始学Power BI商业数据分析(视频教学版)》共10章,分为3篇。第1篇 基础知识 ,主要介绍Power BI的下载和注册方法,以及相关组件的用法和数据导入方法,并详细介绍Power Query的基础知识。第2篇 进阶提升 ,主要介绍数据建模、度量值、常用的度量值应用案例、可视化看板的制作和Power BI在线版等相关知识。第3篇 项目案例实战 ,主要介绍如何用Power BI制作数据大屏、多页面交互式可视化看板和分析报告3个实战案例,展现数据清洗、数据统计和数据可视化的整个流程。 《从零开始学Power BI商业数据分析(
本书紧扣“大数据”这一时代主题,着眼于侦查领域大数据运用在法律研究方面的空白,构建起包括思维、模式、方法等全方位的大数据侦查体系,同时对大数据侦查可能产生的法律问题进行探讨,为侦查实务中大数据的运用提供方法、法律理论及程序上的指导。
《数典 : 大数据标准术语体系 : 汉、阿、英、法、德、》名《数典》,定义为大数据标准术语体系,是迄今为止全球全面系统研究大数据标准术语的多语种专业工具书。《数典 : 大数据标准术语体系 : 汉、阿、英、法、德、》以全球语境和未来视角,对大数据知识体系进行了全面梳理,提出了九个方面的术语架构,并以十一种语言对照编纂,形成了统一规范、符合国际通用规则的多语种学术话语体系和术语标准体系。
《如虎添翼!数据处理的 SAS EG 实现》作为 SAS EG 模块的中文教材,并非单纯的逐个讲解菜单的操作,而是将数据分析的基本思路、流程融入到软件的操作之中。每章通过设置商业背景,配以 SAS 理论的讲解形式更贴近读者的实际工作,使读者真正理解数据分析、数据处理的精髓。本书除讲解软件操作,还同时介绍了对应菜单操作的 SAS 程序语言实现过程,读者可以根据自己的需要逐步学习,进而走进用 SAS 程序处理数据的大门。 《如虎添翼!数据处理的 SAS EG 实现》适合那些想了解数据预处理,或者被数据的预处理占去大部分时间而想提高效率,或者囿于菜单操作的局限性而希望通过程序实现的数据分析人员。
测试驱动开发(TDD)的实践已经帮助众多软件开发人员提高了软件开发的质量、敏捷性、生产力和速度,《测试驱动数据库开发》将展示如何对TDD进行调整,以便在数据库设计与开发工作中获得同样强大的优势。《测试驱动数据库开发》共4个部分,全面介绍测试驱动数据库开发(TDDD)技术。第1章至~第4章重点讨论数据库的类的基本概念,第5章至第9章讨论如何用面向对象的方式来精益地做数据库的类的设计以及修复设计的错误,第10章至第13章讨论使用mocking和重构来应对由传统方法开发出来的遗留数据库的两种方法,第14章和第15章讨论如何使一个数据库应用系统能够满足不同客户的不同需求,以及如何将本书的技术运用到其他数据持久化方案之中。 《测试驱动数据库开发》适合没有接触过测试驱动开发且正在开发规模较大、需求多变的数据库应用系统的开发
本书共 17 章。第 1 章是概述,阐述数据挖掘的意义与实际应用。第 2 ~ 8 章介绍网络和数据技术基础知识。这一部分内容涉及互联网上通信、交换、保存和显示信息的基础技术(如 HTTP 、 HTML 、 XML 、 JSON 、 AJAX 、 SQL 等),并讲解用于查询网络文档和数据集的基本技术( XPath 和正则表达式)。第 9 ~ 11 章介绍网络抓取和文本挖掘的实用工具箱。这一部分由三个核心章节组成:第 9 章讲解多种网络抓取技术,涉及正则表达式的使用、 XPath 、各类 API 接口、其他数据类型以及开源社区相关的技术;第 10 章深入介绍用于统计性文本处理的技术;第 11 章给出关于用 R 管理数据的项目中常见问题的一些见解。第 12 ~ 17 章介绍实际案例分析,涉及美国参议院里的合作网络、从半结构化文档解析信息、利用 Twitter 预测 2014 年奥斯卡奖、绘制姓氏地理分布图、采集关于手机的
本书以数据为研究对象,论述了从数据起源到数据未来的全过程,通过对数据的研究,揭示了物质、数据与信息之间的深刻关系,构建了一门独立的数据科学体系。本书对数据与数据科学的基本原理与规律、数据的基本定律与基础问题、数据与数据科学的基本方法等做了全面、细致的探索,提出了物质定义数据、数据定义信息等重要观点。
《数据挖掘技术及其应用(精)》(作者杨杰、姚莉秀)系统地讲述了数据挖掘的基本概念和基本原理,并列举了在相应领域具有参考价值的算法及其改进和应用,是作者多年来从事教学和科研实践的成果。全书共9章,主要内容有:数据挖掘的基本概念和原理,数据预处理,各种分类、聚类和关联规则提取算法,以及在生物信息学、材料学中的实际应用案例。 《数据挖掘技术及其应用(精)》可用作计算机专业本科高年级学生或研究生的教材或参考书,也可供从事计算机信息处理、数据挖掘、工业优化等有关方面工作的科技人员参考。
在Web2.0技术与应用不断深化以及移动应用不断产生的新时代,互联网已成为社会民意与民声的重要来源。利用互联网中用户产生的各种数据进行社会舆情分析,已成为当前信息检索与情报获取的一个重要研究方向。人们深刻地认识到,网络信息不仅有研究与应用价值,而且是保证国家或企业安全的重要基础,具有重要的战略意义与社会经济价值。本书对2014年天涯论坛网民在经济、政治、民生、生态以及国际与军事等几个关键领域的网络民意,从网络文本数据挖掘的角度进行了初步分析。此外,应用社会网络分析方法直观地展示了一些与内容分析相符的结论。通过这些相关的分析,反映出热点事件以及相关民意,期望为相关机构和部门信息决策提供参考。
Microsoft强大的大数据平台 Windows Azure HDInsight 和 Hortonworks Data Platform for Windows 改变了企业处理、存储和管理数据的方式。 Microsoft 的大数据解决方案套件被设计用于与公司现有的数据基础设施以及 SQL Server 、 Hadoop 等产品进行无缝集成,使客户不必中断工作流或关键流程即可实施这些方案。假如需要设计和实施全面部署的大数据解决方案的详明规划蓝图,《微软大数据解决方案》一书无疑是*选择。 主要内容 ◆ 使用 Windows Azure HDInsight 、 Hortonworks Data Platformfor Windows 和开源工具将大数据解决方案集成到企业中 ◆ 在企业内部存储、管理、分析和共享大数据 ◆ 安装和配置 Hortonworks Data Platform for Windows ◆ 学习大数据与 SQL Server 及 Hadoop 的整合 ◆ 使用 Microsoft 和 Hadoop BI 工具呈现数据 ◆ 为企业创建和执行综合性大数据战略 ◆ 直接获取 Microsoft 大数据产品团
本书是根据CDA数据分析基础和CDA数据分析实务编写的考试大纲, 该大纲是关于考试科目、 提醒设置及知识点要求的指导性文件, 目的是让学生便于了解数据分析基础的大数据概念, 基本理论, 基本模型的建立、 操作, 分析的技能、 技巧等, 同时便于报考者准备和参加CDA数据分析员的考试。 本书适合数据分析零基础群体读者阅读, 也可供大学生、 初入数据分析职场人员、 参与CDA考试的人员学习使用。
????????????????????????????????????????????????????????????????????????????????????????????????????????????Google ??????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????