一本书如果没有作者自己的观点,而只是知识的堆叠,那么这类书是没有太大价值的。尤其在当前网络发达的时代,几乎任何概念和知识点都可以从网络上查到。但是有一点你很难查到,那就是统计分析的思路和观点。比如,你可以很容易地在网上查到什么是线性回归,但你却查不到怎么 做 线性回归分析,在你遇到实际数据时仍然不知道如何分析。在《白话统计》中,你可以获得这些思路和观点。尽管这些观点未必是所有人都认可的,但根据笔者多年的分析经验,它们在实践中通常是奏效的。《白话统计》凝结了作者十多年来对统计分析的理解,对各种方法的介绍采用全新的理念和思路,不再是介绍方法本身,而是试图将各种方法之间的联系阐述清楚;不再是介绍方法如何计算出结果,而是尽量说明方法背后的思想。当然,本书同时提供了如何实现结果的软件(
《问卷数据分析:破解SPSS软件的六类分析思路(第2版)》系统介绍了使用SPSS软件进行问卷数据分析的思路及方法,分为四部分,分别是问卷设计、六类问卷分析思路、数据分析方法在SPSS软件中的操作和答疑解惑。其中问卷设计部分适用于所有读者,建议读者在设计问卷前详细阅读这部分内容。读者可以结合实际情况选读六类问卷分析思路部分的内容。数据分析方法在SPSS软件中的操作部分详细讲解了各类数据分析方法在SPSS软件中的操作细节,并且对输出结果进行说明。答疑解惑部分罗列了使用各类分析方法时常见的疑难杂症,并且提供了解决方法。本书侧重于问卷分析的应用性,力求让读者在*短的时间内掌握使用SPSS软件分析问卷数据的方法并完成高质量的问卷数据分析报告。 使用SPSS软件分析调查问卷数据常见于各类学术研究、论文写作、企业市场调研和各类
《谁说菜鸟不会数据分析》(入门篇)是一本有趣的数据分析书!本书基于通用的Excel工具,加上必知必会的数据分析概念,以小说般通俗易懂的方式讲解。本书基于职场三人行来构建内容,完全按照数据分析工作的完整流程来讲解。全书共8章,依次讲解数据分析必知必会知识、数据分析的结构化思维、数据处理技巧、数据展现的技术、提升图表之美的专业化视角,以及专业分析报告的撰写方法等内容。本书有足够的魅力让你一口气读下去,在无形之中掌握数据分析的技能,提升职场竞争能力。本书能有效帮助职场新人提升职场竞争力,也能帮助市场营销、金融、财务、人力资源管理人员及产品经理解决实际问题,还能帮助从事咨询、研究、分析行业的人士及各级管理人士提高专业水平。
本书的主要内容是作者及其合作者在复杂数据模型这一领域近些年的研究成果, 以及相关的最新进展. 全书共 6 章. 第 1 章简要介绍几类复杂数据模型和 bootstrap 等预备知识和相关研究问题. 第 2~6 章, 系统讨论各种复杂数据统计推断中的 bootstrap 基本理论、方法及其应用, 包括 Behrens-Fisher问题、异方差回归模型、异方差 ANOVA 和 MANOVA 模型、混合效应模型及高维数据分析中的 bootstrap 统计推断.
本书介绍了数据工程的基本概念和理论基础,围绕数据资源建设的规划和管理问题,介绍数据资源规划和管理的概念、特征、作用和功能,系统介绍了数据资源规划理论的发展过程、核心思想基础、主流方法体系和具体实施步骤,以及数据资源管理涉及的治理、质量、集成等理论知识、支撑平台、关键技术和主流工具。本书内容划分为数据工程基础篇、数据资源规划篇、数据资源管理篇三个部分,其中数据工程基础篇涵盖数据工程概述、数据标准、数据模型等内容,数据资源规划篇涵盖数据资源规划理论、规划方法、需求分析、模型构建、实践与工具等内容,数据资源管理篇涵盖数据治理、数据质量管理、数据集成、数据中台等内容。 本书既可以作为高等院校信息管理与信息系统、信息资源管理、大数据工程以及计算机信息管理等专业本科生的教材,还
数据清洗是大数据领域不可缺少的环节,用来发现并纠正数据中可能存在的错误,针对数据审查过程中发现的错误值、缺失值、异常值、可疑数据,选用适当方法进行 清理 ,使 脏 数据变为 干净 数据。本书共分为8章:第1章主要介绍数据清洗的概念、任务和流程,数据标准化概念及数据仓库技术等;第2章主要介绍Windows和类UNIX操作系统下的数据常规格式、数据编码及数据类型转换等;第3章介绍ETL概念、数据清洗的技术路线、ETL工具及ETL子系统等;第4章介绍Excel、Kettle、OpenRefine、DataWrangler和Hawk的安装及使用等;第5章介绍Kettle下文本文件抽取、Web数据抽取、数据库数据抽取及增量数据抽取等;第6章介绍数据清洗步骤、数据检验、数据错误处理、数据质量评估及数据加载;第7章介绍网页结构,利用网络爬虫技术进行数据采集,利用JavaScript技术进行行为日志数据采集
本书以应用为目的,以案例为引导,系统地介绍了Access 2016的主要功能和使用方法。全书共有9章,包括Access基础、数据库的创建和操作、表的建立和管理、查询的创建和使用、窗体的设计和应用、报表的创建和使用、宏的创建和使用、Access的编程工具VBA以及数据库应用系统的创建方法等内容。为了使读者能够 好地掌握本书知识点,及时检查自己的学习效果,每章后均配有习题和实验,并在配套的实验教材中对其进行分析和讲解。本书内容充实、实例丰富,突出操作性和实践性,可以使学生尽快掌握Access的基本功能和操作方法,掌握Access的编程功能和技巧,能够完成小型数据库应用系统的开发。本书既可作为普通高等学校非计算机专业本、专科学生的计算机课程教材,也可作为相关培训的培训教材,还可作为读者自学的参考资料。
当下,由于强大的数据挖掘软件平台很容易获得,草率地使用数据挖掘方法和技术将导致挖掘的结果混淆难解。这种失误往往源自盲目使用“黑盒子”方法进行数据挖掘,而好的避免途径就是使用“自盒子”方法,理解隐藏在软件背后的算法和统计模型结构。 本书分为7章,第l章是对降维方法的介绍,这是数据挖掘技术的一个先决条件;第2章至第6章为经典的数据挖掘算法和技术,包括一元回归模型、多元回归模型、逻辑回归模型、贝叶斯网络分析以及遗传算法,通过实际案例引导读者由已预处理的数据使用不同的挖掘技术从而得出所需结论;第7章为基于数据挖掘过程模型上的多个案例研究,通过多个领域的案例来阐述算法和技术是如何被运用的。 本书可作为数据挖掘课程教学用书,适用于高年级本科生和研究生的教学,也可供科研人员参考使用。
本书融入了PingCAP公司在开源领域的七年探索经验,以及在分布式数据库领域的研究成果,对开源的历史发展、分布式数据库的变迁演进、TiDB的框架设计、应用实践以及开源与商业化的连接进行了深入剖析。 开篇首先以PingCAP公司的创业故事为主线,讲述公司为何选择开源作为核心战略,以及主要产品TiDB的研发、运营和国际化历程。然后介绍PingCAP在成长为国内开源厂商的探索者的过程中,在技术路线选择和社区生态中的重要贡献和发展经验。最后介绍了PingCAP对未来基础软件的技术、开源趋势的思考与展望。全书以从参与者到贡献者再到探索者的视角,细致而全面地讲述了关于开源技术和开源文化对于当代技术驱动型企业的生存与发展的重要意义和影响。 本书适合所有技术驱动型的企事业成员,以及正在学习、已经从业或有志于投入IT产业的广大读者阅读。
大数据管理与应用主要以信息科学、计算机科学和管理科学等学科为理论基础,其研究内容包括大数据科学基础理论、大数据预处理、大数据计算、大数据管理和分析等。本书力图通过对大数据科学相关数据管理方面内容的综合介绍,面向大数据时代的电子商务智能数据计算领域,从大数据采集、大数据预处理、大数据存储与计算、多源异构大数据分析、大数据知识融合技术和大数据的应用管理等方面说明大数据管理与应用的主要研究内容和应用方向。
本教材依据普通高校信管类专业的培养目标,按学科的课程设置要求,突出应用型、实践性和立体化的特点编写。全书以数据库系统基本概念、关系代数、SQL语言、设计理论与工程设计、实施、维护、、应用发展和系统实例为主线,强调在网络环境、知识经济和信息经济环境下数据库系统所表现出的特点。本书结构新颖,内容详实,案例丰富,实用性较强,既可作为普通高校信息管理与信息系统、管理科学与工程、工商管理等经管类相关专业的教材,也可供企事业单位和信息系统相关人员作为参考书使用。随书配备的光盘包含丰富的习题与案例,电子教案、课程设计、优秀作业展示等资料,便于教学和自学。
《Hive编程指南》是一本Apache Hive的编程指南,旨在介绍如何使用Hive的SQL方法——HiveQL来汇总、查询和分析存储在Hadoop分布式文件系统上的大数据集合。全书通过大量的实例,首先介绍如何在用户环境下安装和配置Hive,并对Hadoop和MapReduce进行详尽阐述,最终演示Hive如何在Hadoop生态系统进行工作。 《Hive编程指南》适合对大数据感兴趣的爱好者以及正在使用Hadoop系统的数据库管理员阅读使用。
社交网络融合为社会计算等各项研究提供更充分的用户行为数据和更完整的网络结构,从而更有利于人们通过社交网络认识和理解人类社会,具有重要的理论价值和实践意义。社交网络中的关联用户挖掘旨在通过挖掘不同社交网络中属于同一自然人的不同账号,从而实现社交网络的深度融合。因此,关联用户挖掘是大型社交网络融合的基础问题,近年来已引起人们的广泛关注。考虑真实世界的朋友圈极具个性化,即现实中没有两个人具有完全一致的朋友圈,同时,相同的用户在不同的社交网络中往往具有部分相同的好友关系。本书基于社交网络的好友关系,充分利用好友关系的唯一性、稳定性和一致性,探索关联用户挖掘的方法。
以非线性动力学的观点看来,现代金融理论中金融系统的不确定性恰恰源于其自身就是一个受多种因素综合影响的具有开放性质的复杂巨系统,相应地,作为系统观测值的金融时序数据则从形式上表现了该系统的复杂运动规律。基于此,本书借鉴复杂系统视角建模的思想,结合智能计算、计算实验金融、数据挖掘及控制论等相关领域的最新研究成果,“自底向上”地展开金融时序数据经验知识融合下的机器学习预测建模创新研究,以探索金融系统的复杂演化规律。
本书主要介绍大数据概论,内容包括大数据概述、科学研究第四范式、分布系统设计的CAP理论、NoSQL数据库、复杂网络、MapReduce分布编程模型、大数据存储、大数据分析、大数据挖掘、大数据可视化、大数据安全、大数据机器学习、大数据推荐技术,以及数据科学与数据思维。全书对上述内容概念性地介绍,语言精练、内容全面。
SQL Server 2016数据库案例教程(第2版)在设计上采用 大型案例,一案到底 的思路,以SQL Server 2016数据库管理系统为平台,选用 学生选课系统 为案例贯穿始终。全书以 学生选课系统 的数据库设计与管理为主线,详细介绍了SQL Server 2016中实现该系统数据库的应用与维护,主要内容包括数据库建模、数据库对象创建、数据查询、查询优化、面向数据库编程、模块化编程、数据库的高可靠性和安全性等。本书可以作为计算机、电子商务和信息管理等相关专业的教学用书,也可以作为相关领域的培训教材,适合各个层次的数据库学习人员和广大程序员阅读。
本书在基本数据结构的基础上,围绕一些常用的高级数据结构,结合大量实战例题,深入分析 数据结构是如何服务于算法的 ,这也是本书编写的一个核心理念:学习数据结构是为了 用好 数据结构。本次修订除了改错,主要是更换全书的程序代码为(C )。本书的适用对象包括:中学信息学竞赛SHOU*选手及辅导老师、大学ACM比赛SHOU*选手及教练、高等院校计算机专业的师生、程序设计爱好者等。
Oracle 11g是目前很流行的数据库开发平台之一,拥有较大的市场占有率和众多的高端用户,是大型数据库应用系统的优选后台数据库系统。Oracle数据库管理和应用系统开发已经成为靠前外高校计算机专业和许多非计算机专业的必修或选修课程。 本教程结合大量的实例,介绍如何利用Oracle 11g来管理和维护数据,以及使用Visual C#和ASP等开发工具开发C/S(Client/Server)模式和B/S(Browser/Server)模式网络数据库应用程序。 本书可以作为大学本科有关课程的教材,也可供大专、高职使用,也可作为广大Oracle数据库管理员和数据库应用程序开发人员的参考资料。
该书主要面向关系数据库,按照 基础知识 逻辑设计 系统管理与应用 的顺序来组织。内容全面,叙述循序渐进,配备大量图例和用例,直观简洁。多个主要案例与问题贯穿全书,是一本很好的学习数据库开发的教材,适合作为高等院校本科生或专科生学习数据库应用与开发的教学参考书,也可作为从事相关研究或开发工作的专业技术人员的参考资料。
本书通过选购笔记本电脑的案例引入数据包络分析(dataenvelopmentanalysis,DEA)的基本概念和模型,并运用简单的EXCEL模型让读者更易理解和运用DEA。本书着重阐述如何将DEA作为一种运营分析工具,进行绩效评估,找出基准标杆。探讨的主题包括:平衡的基准,昀佳实践,相对效率的概念及绩效提升。特别地,本书探讨的数据分析方法能够帮助一个组织重新审视它对生产效率高低的已有观点是否合理,并为组织不断改进提供指导。本书是市面上唯一本不要求读者具备线性规划和线性代数知识,就可以熟练应用DEA方法的DEA方法指导用书。