一本书如果没有作者自己的观点,而只是知识的堆叠,那么这类书是没有太大价值的。尤其在当前网络发达的时代,几乎任何概念和知识点都可以从网络上查到。但是有一点你很难查到,那就是统计分析的思路和观点。比如,你可以很容易地在网上查到什么是线性回归,但你却查不到怎么 做 线性回归分析,在你遇到实际数据时仍然不知道如何分析。在《白话统计》中,你可以获得这些思路和观点。尽管这些观点未必是所有人都认可的,但根据笔者多年的分析经验,它们在实践中通常是奏效的。《白话统计》凝结了作者十多年来对统计分析的理解,对各种方法的介绍采用全新的理念和思路,不再是介绍方法本身,而是试图将各种方法之间的联系阐述清楚;不再是介绍方法如何计算出结果,而是尽量说明方法背后的思想。当然,本书同时提供了如何实现结果的软件(
《问卷数据分析:破解SPSS软件的六类分析思路(第2版)》系统介绍了使用SPSS软件进行问卷数据分析的思路及方法,分为四部分,分别是问卷设计、六类问卷分析思路、数据分析方法在SPSS软件中的操作和答疑解惑。其中问卷设计部分适用于所有读者,建议读者在设计问卷前详细阅读这部分内容。读者可以结合实际情况选读六类问卷分析思路部分的内容。数据分析方法在SPSS软件中的操作部分详细讲解了各类数据分析方法在SPSS软件中的操作细节,并且对输出结果进行说明。答疑解惑部分罗列了使用各类分析方法时常见的疑难杂症,并且提供了解决方法。本书侧重于问卷分析的应用性,力求让读者在*短的时间内掌握使用SPSS软件分析问卷数据的方法并完成高质量的问卷数据分析报告。 使用SPSS软件分析调查问卷数据常见于各类学术研究、论文写作、企业市场调研和各类
《谁说菜鸟不会数据分析》(入门篇)是一本有趣的数据分析书!本书基于通用的Excel工具,加上必知必会的数据分析概念,以小说般通俗易懂的方式讲解。本书基于职场三人行来构建内容,完全按照数据分析工作的完整流程来讲解。全书共8章,依次讲解数据分析必知必会知识、数据分析的结构化思维、数据处理技巧、数据展现的技术、提升图表之美的专业化视角,以及专业分析报告的撰写方法等内容。本书有足够的魅力让你一口气读下去,在无形之中掌握数据分析的技能,提升职场竞争能力。本书能有效帮助职场新人提升职场竞争力,也能帮助市场营销、金融、财务、人力资源管理人员及产品经理解决实际问题,还能帮助从事咨询、研究、分析行业的人士及各级管理人士提高专业水平。
本书的主要内容是作者及其合作者在复杂数据模型这一领域近些年的研究成果, 以及相关的最新进展. 全书共 6 章. 第 1 章简要介绍几类复杂数据模型和 bootstrap 等预备知识和相关研究问题. 第 2~6 章, 系统讨论各种复杂数据统计推断中的 bootstrap 基本理论、方法及其应用, 包括 Behrens-Fisher问题、异方差回归模型、异方差 ANOVA 和 MANOVA 模型、混合效应模型及高维数据分析中的 bootstrap 统计推断.
本书介绍了数据工程的基本概念和理论基础,围绕数据资源建设的规划和管理问题,介绍数据资源规划和管理的概念、特征、作用和功能,系统介绍了数据资源规划理论的发展过程、核心思想基础、主流方法体系和具体实施步骤,以及数据资源管理涉及的治理、质量、集成等理论知识、支撑平台、关键技术和主流工具。本书内容划分为数据工程基础篇、数据资源规划篇、数据资源管理篇三个部分,其中数据工程基础篇涵盖数据工程概述、数据标准、数据模型等内容,数据资源规划篇涵盖数据资源规划理论、规划方法、需求分析、模型构建、实践与工具等内容,数据资源管理篇涵盖数据治理、数据质量管理、数据集成、数据中台等内容。 本书既可以作为高等院校信息管理与信息系统、信息资源管理、大数据工程以及计算机信息管理等专业本科生的教材,还
数据清洗是大数据领域不可缺少的环节,用来发现并纠正数据中可能存在的错误,针对数据审查过程中发现的错误值、缺失值、异常值、可疑数据,选用适当方法进行 清理 ,使 脏 数据变为 干净 数据。本书共分为8章:第1章主要介绍数据清洗的概念、任务和流程,数据标准化概念及数据仓库技术等;第2章主要介绍Windows和类UNIX操作系统下的数据常规格式、数据编码及数据类型转换等;第3章介绍ETL概念、数据清洗的技术路线、ETL工具及ETL子系统等;第4章介绍Excel、Kettle、OpenRefine、DataWrangler和Hawk的安装及使用等;第5章介绍Kettle下文本文件抽取、Web数据抽取、数据库数据抽取及增量数据抽取等;第6章介绍数据清洗步骤、数据检验、数据错误处理、数据质量评估及数据加载;第7章介绍网页结构,利用网络爬虫技术进行数据采集,利用JavaScript技术进行行为日志数据采集
本书融入了PingCAP公司在开源领域的七年探索经验,以及在分布式数据库领域的研究成果,对开源的历史发展、分布式数据库的变迁演进、TiDB的框架设计、应用实践以及开源与商业化的连接进行了深入剖析。 开篇首先以PingCAP公司的创业故事为主线,讲述公司为何选择开源作为核心战略,以及主要产品TiDB的研发、运营和国际化历程。然后介绍PingCAP在成长为国内开源厂商的探索者的过程中,在技术路线选择和社区生态中的重要贡献和发展经验。最后介绍了PingCAP对未来基础软件的技术、开源趋势的思考与展望。全书以从参与者到贡献者再到探索者的视角,细致而全面地讲述了关于开源技术和开源文化对于当代技术驱动型企业的生存与发展的重要意义和影响。 本书适合所有技术驱动型的企事业成员,以及正在学习、已经从业或有志于投入IT产业的广大读者阅读。
本书紧扣“大数据”这一时代主题,着眼于侦查领域大数据运用在法律研究方面的空白,构建起包括思维、模式、方法等全方位的大数据侦查体系,同时对大数据侦查可能产生的法律问题进行探讨,为侦查实务中大数据的运用提供方法、法律理论及程序上的指导。
本书介绍了数据挖掘的基本概念,包括数据挖掘的常用算法、常用工具、用途和应用场景及应用状况,讲述了常用数据挖掘方法,如分类、聚类、关联规则的概念、思想、典型算法、应用场景等。此外,本书还从实际应用出发,讲解了基于日志的大数据挖掘技术的原理、工具、应用场景和成功案例。日志挖掘技术现在已得到了广泛的运用。通过以上内容的学习,读者将了解数据挖掘的基本概念、思想和算法,并掌握其应用要领。本书可以作为培养应用型人才的课程教材,也可作为相关开发人员的自学教材和参考手册。
该书主要面向关系数据库,按照 基础知识 逻辑设计 系统管理与应用 的顺序来组织。内容全面,叙述循序渐进,配备大量图例和用例,直观简洁。多个主要案例与问题贯穿全书,是一本很好的学习数据库开发的教材,适合作为高等院校本科生或专科生学习数据库应用与开发的教学参考书,也可作为从事相关研究或开发工作的专业技术人员的参考资料。
本书通过选购笔记本电脑的案例引入数据包络分析(dataenvelopmentanalysis,DEA)的基本概念和模型,并运用简单的EXCEL模型让读者更易理解和运用DEA。本书着重阐述如何将DEA作为一种运营分析工具,进行绩效评估,找出基准标杆。探讨的主题包括:平衡的基准,昀佳实践,相对效率的概念及绩效提升。特别地,本书探讨的数据分析方法能够帮助一个组织重新审视它对生产效率高低的已有观点是否合理,并为组织不断改进提供指导。本书是市面上唯一本不要求读者具备线性规划和线性代数知识,就可以熟练应用DEA方法的DEA方法指导用书。
本书主要介绍大数据概论,内容包括大数据概述、科学研究第四范式、分布系统设计的CAP理论、NoSQL数据库、复杂网络、MapReduce分布编程模型、大数据存储、大数据分析、大数据挖掘、大数据可视化、大数据安全、大数据机器学习、大数据推荐技术,以及数据科学与数据思维。全书对上述内容概念性地介绍,语言精练、内容全面。
以非线性动力学的观点看来,现代金融理论中金融系统的不确定性恰恰源于其自身就是一个受多种因素综合影响的具有开放性质的复杂巨系统,相应地,作为系统观测值的金融时序数据则从形式上表现了该系统的复杂运动规律。基于此,本书借鉴复杂系统视角建模的思想,结合智能计算、计算实验金融、数据挖掘及控制论等相关领域的最新研究成果,“自底向上”地展开金融时序数据经验知识融合下的机器学习预测建模创新研究,以探索金融系统的复杂演化规律。
Oracle 11g是目前很流行的数据库开发平台之一,拥有较大的市场占有率和众多的高端用户,是大型数据库应用系统的优选后台数据库系统。Oracle数据库管理和应用系统开发已经成为靠前外高校计算机专业和许多非计算机专业的必修或选修课程。 本教程结合大量的实例,介绍如何利用Oracle 11g来管理和维护数据,以及使用Visual C#和ASP等开发工具开发C/S(Client/Server)模式和B/S(Browser/Server)模式网络数据库应用程序。 本书可以作为大学本科有关课程的教材,也可供大专、高职使用,也可作为广大Oracle数据库管理员和数据库应用程序开发人员的参考资料。
社交网络融合为社会计算等各项研究提供更充分的用户行为数据和更完整的网络结构,从而更有利于人们通过社交网络认识和理解人类社会,具有重要的理论价值和实践意义。社交网络中的关联用户挖掘旨在通过挖掘不同社交网络中属于同一自然人的不同账号,从而实现社交网络的深度融合。因此,关联用户挖掘是大型社交网络融合的基础问题,近年来已引起人们的广泛关注。考虑真实世界的朋友圈极具个性化,即现实中没有两个人具有完全一致的朋友圈,同时,相同的用户在不同的社交网络中往往具有部分相同的好友关系。本书基于社交网络的好友关系,充分利用好友关系的唯一性、稳定性和一致性,探索关联用户挖掘的方法。
本书是按照*高等教育司组织制定的《高等学校文科类专业大学计算机教学基本要求》中有关数据库技术的教学基本要求编写的。以MicrosoftAccess2010关系数据库为背景,以作者精心设计的“教学管理”数据库案例贯串全书,系统地介绍了数据库基础知识、Access2010数据库的六大对象以及数据库管理与安全等内容。教学案例中精选的10个基本表,覆盖了双字段组合和三字段组合主键,其表间关联复杂但表述清晰、层次分明、结构严谨,突破了现有教材教学案例的瓶颈制约,彰显了主键与表间关系的重要性。重点章节中精选的具有极强实用性和连贯性的教学例题,从不同角度和深度挖掘了查询、窗体、报表和宏对象设计的操作技巧。根据各章的重要程度安排了个数不等的实验项目,练习内容丰富且重点明确。本书的突出特色是:教学案例数据翔实逼真、基本表结构设计严谨
本教材依据普通高校信管类专业的培养目标,按学科的课程设置要求,突出应用型、实践性和立体化的特点编写。全书以数据库系统基本概念、关系代数、SQL语言、设计理论与工程设计、实施、维护、、应用发展和系统实例为主线,强调在网络环境、知识经济和信息经济环境下数据库系统所表现出的特点。本书结构新颖,内容详实,案例丰富,实用性较强,既可作为普通高校信息管理与信息系统、管理科学与工程、工商管理等经管类相关专业的教材,也可供企事业单位和信息系统相关人员作为参考书使用。随书配备的光盘包含丰富的习题与案例,电子教案、课程设计、优秀作业展示等资料,便于教学和自学。
本书分10章,全面介绍了Hadoop云技术及其在光网络研究方面的真实案例。读者通过本书的学习,可以掌握搭建及维护Hadoop平台的相关知识和技术。
《Hive编程指南》是一本Apache Hive的编程指南,旨在介绍如何使用Hive的SQL方法——HiveQL来汇总、查询和分析存储在Hadoop分布式文件系统上的大数据集合。全书通过大量的实例,首先介绍如何在用户环境下安装和配置Hive,并对Hadoop和MapReduce进行详尽阐述,最终演示Hive如何在Hadoop生态系统进行工作。 《Hive编程指南》适合对大数据感兴趣的爱好者以及正在使用Hadoop系统的数据库管理员阅读使用。
本书以应用为目的,以案例为引导,系统地介绍了Access 2016的主要功能和使用方法。全书共有9章,包括Access基础、数据库的创建和操作、表的建立和管理、查询的创建和使用、窗体的设计和应用、报表的创建和使用、宏的创建和使用、Access的编程工具VBA以及数据库应用系统的创建方法等内容。为了使读者能够 好地掌握本书知识点,及时检查自己的学习效果,每章后均配有习题和实验,并在配套的实验教材中对其进行分析和讲解。本书内容充实、实例丰富,突出操作性和实践性,可以使学生尽快掌握Access的基本功能和操作方法,掌握Access的编程功能和技巧,能够完成小型数据库应用系统的开发。本书既可作为普通高等学校非计算机专业本、专科学生的计算机课程教材,也可作为相关培训的培训教材,还可作为读者自学的参考资料。