一本书如果没有作者自己的观点,而只是知识的堆叠,那么这类书是没有太大价值的。尤其在当前网络发达的时代,几乎任何概念和知识点都可以从网络上查到。但是有一点你很难查到,那就是统计分析的思路和观点。比如,你可以很容易地在网上查到什么是线性回归,但你却查不到怎么 做 线性回归分析,在你遇到实际数据时仍然不知道如何分析。在《白话统计》中,你可以获得这些思路和观点。尽管这些观点未必是所有人都认可的,但根据笔者多年的分析经验,它们在实践中通常是奏效的。《白话统计》凝结了作者十多年来对统计分析的理解,对各种方法的介绍采用全新的理念和思路,不再是介绍方法本身,而是试图将各种方法之间的联系阐述清楚;不再是介绍方法如何计算出结果,而是尽量说明方法背后的思想。当然,本书同时提供了如何实现结果的软件(
本书是一本基于 Python 实现全部例题计算的统计学教材,书中例题解答均给出了详细的实现代码和结果。全书共 11 章,第1章和第2章介绍数据、Python 的下载与安装、Python的数据类型和基本操作、Python 绘图基础等。第3章和第4章介绍数据的描述性分析方法,包括数据可视化和描述统计量。第5~7章介绍数据的推断性分析方法,包括概率分布、参数估计和假设检验。第8~11章介绍实际中常用的一些统计方法,包括类别变量分析、方差分析、回归分析、时间序列分析等。 本书可作为高等院校各专业开设统计学课程的教材,也可作为数据分析工作者、Python 数据分析和可视化爱好者的参考书。
本书介绍了数据链的基本概念、发展历程和趋势,重点分析了Link-4、Link-11、Link-16和Link-22数据链的系统组成、工作模式、技术特点等内容,并以Link-16数据链为重点,全面阐述了该数据链的信道共享机制、时间同步技术、传输消息类型、封装结构、信号波形等内容,给出了多网、导航、中继、距离扩展等功能实现方法;以数据链关键技术为主线,详细论述了数据链的消息格式、信息传输、网络协议、通信安全等方面相关知识,剖析了数据链的本质。
数据建模指的是对现实世界各类数据的抽象组织,确定数据库需管辖的范围、数据的组织形式等直至转化成现实的数据库。而数据模型是构建应用系统的核心,是尽可能精准地表示业务运转的概念性框架。本书通过平实的语言,对数据模型及建模过程进行了深入浅出的介绍。全书内容分为5个部分,对数据建模简介、数据模型要素,概念、逻辑和物理数据模型、数据模型质量以及数据建模的进阶内容等方面进行讲解,全面细致地为读者解答与数据建模相关的知识点和疑问。除此之外,本书的zui后还对各类专业术语进行了细致的解释,方便读者参考。本书是一本经典的数据建模指南,非常适合对数据建模感兴趣的读者以及从事数据科学等相关工作的专业人士参考阅读。
MySQL作为一款开源的关系型数据库管理系统,有着强大的功能和广泛的应用领域,对促进信息化建设、推动数字经济发展起着重要的作用。本书全面介绍了MySQL数据库的技术原理、应用场景和开发实践,帮助读者掌握MySQL数据库的基本概念和高级特性,提升数据库设计与开发的能力。全书共11章,从数据库基础知识讲起,包括数据库概述、关系型数据库设计原则、SQL语言基础等内容,逐步深入介绍MySQL数据库的高级特性和应用技巧,如查询优化、事务管理、索引优化,延伸学习在数字经济发展情境下,数据库的发展趋势和应用等内容。此外,本书最后一章还通过两个综合应用项目将理论知识与实际应用结合在一起。 《MySQL数据库管理与应用》内容深入浅出,理论结合实际,可作为高等院校计算机、信息技术及相关专业数据库课程的教材,也可作为数据库初学者、软件
在云计算和互联网快速发展的驱动下,分布式技术领域产生了很多新的热点,分布式数据库就是其中之一。但是,目前对分布式数据库的理解和研究多停留在理论层面,本书以Greenplum分布式数据库为例,深入剖析分布式技术在工业级产品里的实现细节,为读者呈现从理论到实践的 全景图 。 本书共3篇:第1篇主要介绍分布式数据库基础理论,包括经典的CAP理论、一致性算法相关的理论、并发控制相关的理论等;第2篇具体介绍Greenplum数据库,从分布式事务、分布式计算和分布式存储3个方面,深入代码层级,讲述分布式理论在工业上的实现;第3篇是总结和展望,介绍云原生数据库和新技术带给Greenplum和数据库管理系统的机遇和挑战。 本书打破以理论介绍和架构介绍为主的思路,深入分析工业化的实现,实践性强。本书主要面向数据库领域的科研工作者
本书主要介绍了数据可视化的基础知识、可视化工具的入门和应用、使用Python流行的库创建美观的数据可视化效果,并总结了了7大类40种不同的可视化图形,从基本信息、构成与视觉通道、适用数据、使用场景、注意事项、变体等多方面详细介绍了每种可视化图形的使用权方法,可作为常用可视化图形的使用手册。本书还提供了6个贴近大学生学习生活的可视化案例,为读者自由灵活应用可视化参考提供了有力的参考。 本书可作为高等院校数据科学与大数据技术、统计学及其相关专业的本科课程教材,也可供有一定实践经验的软件开发人员、管理人员作为自学和参考用书。
本书重点介绍Amos、Mplus 和SmartPLS 统计软件里的结构方程分析方法。包括结构方程模型路径图的构建与数据的收集,结构方程模型的识别、分析结果评价及修正,反映型指标、形成型指标与二阶段分析,调节效应分析、中介效应分析、多群体差异分析与潜在平均分析,以及结构方程模型高级的分析方法即贝叶斯检验、混合回归分析、潜在成长模型、MTMM 模型等内容。没有复杂的理论推导,而是结合作者自身的教学与科研实践,以数据为依托,深入浅出,使读者能在短时间内理解并掌握结构方程模型分析方法,进而应用到自己的研究实践中。
内容提要:随着数据采集技术以及存储技术的不断进步,现代科学研究和实践中需要处理和分析的数据已经从单一来源向多个来源转变。在医学研究、生物信息、市场研究、金融风险管理、气象环境科学等诸多重要领域,多源数据的现象普遍存在,在带来巨大机遇的同时也给统计分析建模带来了全新的挑战。针对这一国际前沿问题,本书主要介绍作者最近几年在两大方面的主要工作:一是多源碎片化数据的建模和预测,二是有效利用多源外部数据的统计推断。读者对象:统计及其相关专业的本科生、研究生,相关领域的科研工作人员。
在数字化浪潮中,大数据技术无处不在,包括互联网、体育、工业、医疗、交通等在内的社会各行各业,都融入了大数据的印迹,大数据对人类的社会生产和生活产生了重大而深远的影响。一早醒来,多篇你感兴趣的推送文章早已占领手机屏幕;走在路上,智能手环实时监测着你的健康信息;想点外卖,小程序优先推荐最符合你口味的商家;骑车出行,导航系统会提供实时路况和最优路线避开拥堵;晚上回家,收到工厂根据你的身材比例剪裁制作的个性化服装。这些现象的背后,其实都和大数据息息相关。大数据技术正在不断与人类生产生活进行交汇与融合,并潜移默化地改变着世界的运作模式。本教材将从大数据的基本概念讲起,追溯大数据发展历程,并围绕大家身边的大数据应用,包含大数据在互联网、体育、工业、医疗、交通等方面的应用,以及大数据共享
本书紧密围绕商业运作的需要来强调数据在经营活动中的实践应用,采用项目驱动方式,通过实训为指导来强化数据库相关知识点的深入学习。全书始终围绕网络书店销售管理系统为例子,通过共9章内容系统展示了从系统应用需求分析开始到数据库设计、数据库实现、网络数据库开发、数据库管理程序开发等一系列以满足商业需求为发端的、以数据库开发应用为线索的相关工作。这种一以贯之的学习方式提高了学习的成就感与目标性,有助于提高对于新管理实践和新技术发展的理解和掌握。
本书介绍了数据工程的基本概念和理论基础,围绕数据资源建设的规划和管理问题,介绍数据资源规划和管理的概念、特征、作用和功能,系统介绍了数据资源规划理论的发展过程、核心思想基础、主流方法体系和具体实施步骤,以及数据资源管理涉及的治理、质量、集成等理论知识、支撑平台、关键技术和主流工具。本书内容划分为数据工程基础篇、数据资源规划篇、数据资源管理篇三个部分,其中数据工程基础篇涵盖数据工程概述、数据标准、数据模型等内容,数据资源规划篇涵盖数据资源规划理论、规划方法、需求分析、模型构建、实践与工具等内容,数据资源管理篇涵盖数据治理、数据质量管理、数据集成、数据中台等内容。 本书既可以作为高等院校信息管理与信息系统、信息资源管理、大数据工程以及计算机信息管理等专业本科生的教材,还
本书结合现代IT技术、地理信息系统软件新技术、云计算、大数据、物联网等先进技术,详细介绍时空大数据概念与发展,基于云环境的时空大数据平台体系T-C-V软件结构和组成,重点阐述时空大数据中心、时空信息云服务中心和云应用集成管理中心三大部件,*后以全空间一张图平台为例,介绍该平台的实践情况。
大数据审计已经成为目前审计领域研究与应用的热点。本书按照从常用电子数据审计方法到大数据审计方法的思路,不仅系统地分析了电子数据审计的理论知识(特别是大数据审计),还重点结合实际案例和具体操作,从审计数据采集、审计数据预处理和审计数据分析等电子数据审计的关键步骤出发,系统地分析了如何开展电子数据审计(特别是大数据审计)。附录中设计了9个实验模块(包括3个大数据审计实验模块),满足了开设实验课程的需要。 本书可作为高等院校审计、会计和信息管理等专业的教材,也可作为审计从业人员的专业培训教材和业务学习资料。
本书是 十三五 国家重点图书 大数据科学 丛书著作。本书运用辩证发展科研创新法,通过对话、分析、游戏原创性地阐述和研究计算理论和大数据图灵机。全书共7章,主要内容包括:计算模型、可计算性、计算复杂性、图灵机的大数据应用和大数据图灵机等。本书内容深入浅出、通俗易懂,是一本对话式的著作,并将游戏穿插其中,妙趣横生,适合高等院校 计算理论 课程教学使用,也可作为研究院所的科研参考用书。 大数据科学 丛书涉及大数据理论、技术、产业和管理的方方面面,旨在帮助相关领域的学者,特别是产业界了解世界大数据研究和应用的前沿,也可以作为教学之用。
本书以小说的形式展开,讲述了主人公?l太从大学文科专业毕业后进入征信所,从零开始学习数据分析的故事。书中以主人公就职的征信所所在的商业街为舞台,选取贴近生活的案例,将平均值、t检验、卡方检验、相关、回归分析、文本挖掘以及时间序列分析等数据分析的基础知识融入到了生动有趣的侦探故事中,讲解由浅入深、寓教于乐,没有深奥的理论和晦涩的术语,同时提供了大量实际数据,使用免费自由软件RStudio引 领读者进一步体验数据分析,实践性非常强。本书适合所有对数据分析感兴趣但又苦于无从下手的读者阅读。
数据清洗是大数据领域不可缺少的环节,用来发现并纠正数据中可能存在的错误,针对数据审查过程中发现的错误值、缺失值、异常值、可疑数据,选用适当方法进行 清理 ,使 脏 数据变为 干净 数据。本书共分为8章:第1章主要介绍数据清洗的概念、任务和流程,数据标准化概念及数据仓库技术等;第2章主要介绍Windows和类UNIX操作系统下的数据常规格式、数据编码及数据类型转换等;第3章介绍ETL概念、数据清洗的技术路线、ETL工具及ETL子系统等;第4章介绍Excel、Kettle、OpenRefine、DataWrangler和Hawk的安装及使用等;第5章介绍Kettle下文本文件抽取、Web数据抽取、数据库数据抽取及增量数据抽取等;第6章介绍数据清洗步骤、数据检验、数据错误处理、数据质量评估及数据加载;第7章介绍网页结构,利用网络爬虫技术进行数据采集,利用JavaScript技术进行行为日志数据采集
大数据导论是了解和学习大数据的基础,本书系统地讲解了大数据基本概念、大数据的架构、大数 据的采集方式和预处理、数据仓库的构建模式、大数据的存储,数据挖掘的方法及大数据的可视化技术, 从而更好地将大数据技术应用在各行业领域,更深入地开展大数据技术的应用研究。从基础开始,由浅 入深进行学习,逐步理清大数据的核心技术和发展趋势。 本书系统地讲解了大数据基本概念,尽可能希望通过理论与实际案例相结合,寻找合适的切入点, 让读者对理论知识的掌握更直接、更快速。可以作为培养应用型人才的课程教材,也适用于大数据初学 者对大数据基础理论有需求的广大读者。
本书以常见的数据分析与大数据应用方法为主线,按照数据采集、数据存储与管理、数据预处理、数据分析与挖掘的逻辑关系分析大数据时代应如何采用量化方法分析经济问题。本书在定性分析的基础上,采用大量的实例和软件操作插图来直观地解释大数据分析方法的原理和应用,为读者提供“一站式”服务。同时,通过对线性回归、逻辑回归等计量方法,主成分分析、聚类分析等统计方法,以及神经网络、决策树、随机森林等机器学习方法的学习,实现大数据背景下传统计量、统计学数据分析方法向人工智能、机器学习方法的过渡。
李军编著的《数据采集系统整体设计与开发(附光盘)》围绕农田远程病虫害监测预警系统,完整地描述网络采集系统硬件设计、芯片固件程序、网络通信、数据服务器、数据库关键技术、Web服务器整个采集过程的工作原理和设计思路。 全书共分8章,主要内容有采集板硬件电路设计分析、虫情采集传感器设计、采集器芯片程序设计、采集系统通信整体设计、数据服务器软件设计、采集系统数据库设计、上位机应用软件设计等。 《数据采集系统整体设计与开发(附光盘)》可供高等院校嵌入式软硬件系统专业师生作为辅导教材使用,也可供有关科技人员和软硬件产品开发人员参考。