本书是一本基于 Python 实现全部例题计算的统计学教材,书中例题解答均给出了详细的实现代码和结果。全书共 11 章,第1章和第2章介绍数据、Python 的下载与安装、Python的数据类型和基本操作、Python 绘图基础等。第3章和第4章介绍数据的描述性分析方法,包括数据可视化和描述统计量。第5~7章介绍数据的推断性分析方法,包括概率分布、参数估计和假设检验。第8~11章介绍实际中常用的一些统计方法,包括类别变量分析、方差分析、回归分析、时间序列分析等。 本书可作为高等院校各专业开设统计学课程的教材,也可作为数据分析工作者、Python 数据分析和可视化爱好者的参考书。
教材系统地介绍文本数据挖掘的相关概念,利用Python作为工具进行相关试验,其内容主要包括:文本挖掘产生的背景及发展;文本挖掘的概念、文本模型表示、文本内容的预处理,包括分词、去停用词以及特征抽取;文本相似度的概念等。介绍文本分类的概念及常用方法,如KNN算法、SVM算法等,并对分类结果进行评价;在介绍文本聚类聚类的概念时是,同样介绍聚类常用算法,如K均值算法、层次聚类法、密度聚类法等,作为有文本分类、文本聚类的应用,*后给出了信息抽取、社会网络中的实体关系抽取和事件抽取。
本书从初学者易于理解的角度,以通俗易懂的语言、丰富的实例、简洁的图表、传统和现代数据特征的对比,将大数据这一计算机前沿科学如数家珍地娓娓道来。既介绍了大数据和相关的基础知识,又与具体应用有机结合起来,并借助可视化图表的画面感立体地为读者剖析了大数据的技术和原理,非常便于自学。本书内容包括大数据概论、大数据采集及预处理、大数据分析、大数据可视化、Hadoop概论、HDFS和Common概论、MapReduce概论、NoSQL技术介绍、Spark概论、云计算与大数据、大数据相关案例等内容。本书既可以作为想了解大数据技术和应用的初学者的教材,也适合作为培训中心、IT人员、企业策划和管理人员的参考书。
本书主要介绍大数据可视化的基本概念和相应的技术应用。全书内容共10章,分别为大数据可视化概述、大数据可视化原理、大数据可视化方法、数据可视化工具、Excel数据可视化、Tableau数据可视化、ECharts与pyecharts数据可视化、Python数据可视化、大数据可视化行业分析以及大数据可视化综合实训。 本书将理论与实践操作相结合,通过大量的案例帮助读者快速了解和应用大数据分析的相关技术,并且对于书中重要的、核心的知识点加大练习的比例,以使读者达到熟练应用的目的。 本书可作为大数据、云计算、软件技术、信息管理、计算机网络等专业的教材,可也作为大数据爱好者的自学参考书。
MySQL数据库是以 客户端/服务器 模式实现的,是一个多用户、多线程的小型数据库。MySQL因其稳定、可靠、快速、管理方便以及支持众多系统平台的特点,成为世界范围内流行的开源数据库之一。 《MySQL数据库入门/国家信息技术紧缺人才培养工程指定教材》就是面向数据库初学者特地推出的一本进阶学习的入门教材,《MySQL数据库入门/国家信息技术紧缺人才培养工程指定教材》站在初学者的角度,以形象的比喻、丰富的图解、实用的案例、通俗易懂的语言详细讲解了MySQL的开发和管理技术。全书共8章,第1~5章主要讲解了MySQL中的基础操作,包括数据库基础知识、MySQL的安装配置及使用、数据库和表的基本操作、单表中数据的增删改查操作以及多表中数据的增删改查操作。第6~8章则围绕数据库开发的一些知识展开讲解,包括事务与存储过程、视图、数据的
《数据挖掘(概念与技术原书第3版)》完整全面地讲述数据挖掘的概念、方法、技术和 研究进展。本书对前两版做了全面修订,加强和重新组织了全书的技术内容,重点论述了数据预处理、频繁模式挖掘、分类和聚类等的内容,还全面讲述了OLAP和离群点检测,并研讨了挖掘网络、复杂数据类型以及重要应用领域。 《数据挖掘(概念与技术原书第3版)》是数据挖掘和知识发现领域内的所有教师、研究人员、开发人员和用户都 的参考书,是一本适用于数据分析、数据挖掘和知识发现课程的 教材,可以用做高年级本科生或者一年级研究生的数据挖掘导论教材。本书由韩家炜等著。
大数据审计已经成为目前审计领域研究与应用的热点。本书按照从常用电子数据审计方法到大数据审计方法的思路,不仅系统地分析了电子数据审计的理论知识(特别是大数据审计),还重点结合实际案例和具体操作,从审计数据采集、审计数据预处理和审计数据分析等电子数据审计的关键步骤出发,系统地分析了如何开展电子数据审计(特别是大数据审计)。附录中设计了9个实验模块(包括3个大数据审计实验模块),满足了开设实验课程的需要。 本书可作为高等院校审计、会计和信息管理等专业的教材,也可作为审计从业人员的专业培训教材和业务学习资料。
本书是由斯普林格出版社2018年出版的介绍物联网雾计算前沿技术的书籍,全书详细介绍了物联网雾计算发展的背景及驱动因素,系统分析了雾计算的计算服务、存储服务和通信服务;从雾层管理方面,阐述了雾计算中物联网资源评估所面临的挑战及模型,分析了雾计算的分层处理在物联网超大规模系统中的作用;从雾层服务方面,阐述了雾计算隐私保护的现状和未来,描绘了隐私保护领域自感知雾计算的发展,探讨了城市物联网边缘计算;以信息物理能源系统、医疗保健领域为例分析了雾计算应用实践。
本书定位是HBase从入门到应用的简明教程,特色是以实战案例为主,内容系统全面,讲解深入浅出,操作步骤清晰明了。本书配套示例源码、PPT课件、开发环境、教学视频、习题及答案以及其他丰富的教学 资源。 本书共分为8章,内容包括NoSQL数据库、HBase体系架构、HBase的接口、MapReduce与HBase、HBase表设计、HBase和Hive、HBase深入剖析、论坛日志分析实战。 本书既适合HBase初学者、大数据分析与挖掘初学者阅读,也适合作为高等院校和培训机构人工智能、大数据等相关专业师生的教学参考书。
数据清洗是大数据领域不可缺少的环节,用来发现并纠正数据中可能存在的错误,针对数据审查过程中发现的错误值、缺失值、异常值、可疑数据,选用适当方法进行 清理 ,使 脏 数据变为 干净 数据。本书共分为8章:第1章主要介绍数据清洗的概念、任务和流程,数据标准化概念及数据仓库技术等;第2章主要介绍Windows和类UNIX操作系统下的数据常规格式、数据编码及数据类型转换等;第3章介绍ETL概念、数据清洗的技术路线、ETL工具及ETL子系统等;第4章介绍Excel、Kettle、OpenRefine、DataWrangler和Hawk的安装及使用等;第5章介绍Kettle下文本文件抽取、Web数据抽取、数据库数据抽取及增量数据抽取等;第6章介绍数据清洗步骤、数据检验、数据错误处理、数据质量评估及数据加载;第7章介绍网页结构,利用网络爬虫技术进行数据采集,利用JavaScript技术进行行为日志数据采集
在大数据时代背景下,本书以培养数据管理应用型人才为目标,系统全面地讲述了数据库系统的基础理论知识、基本方法与应用技术。本书总共包含4篇17章,第1篇为基础篇,包括绪论、关系模型数据库、关系代数。第2篇为设计及应用篇,包括使用实体 联系模型进行数据建模、扩展的实体 联系模型、实体 联系模型到关系模型的转换、UML类图建模、关系数据理论、关系数据库标准语言SQL、数据库编程、数据库设计。第3篇为管理篇,包括并发控制、数据库存储技术、关系查询优化、数据库安全、数据库恢复。第4篇为新技术篇,包括数据库的发展及新技术。
SQL Server 2016数据库案例教程(第2版)在设计上采用 大型案例,一案到底 的思路,以SQL Server 2016数据库管理系统为平台,选用 学生选课系统 为案例贯穿始终。全书以 学生选课系统 的数据库设计与管理为主线,详细介绍了SQL Server 2016中实现该系统数据库的应用与维护,主要内容包括数据库建模、数据库对象创建、数据查询、查询优化、面向数据库编程、模块化编程、数据库的高可靠性和安全性等。本书可以作为计算机、电子商务和信息管理等相关专业的教学用书,也可以作为相关领域的培训教材,适合各个层次的数据库学习人员和广大程序员阅读。
技术是把双刃剑,当我们在积极拥抱新技术的同时,也不能忽视其所带来的风险,比如当今大数据时代个人隐私和安全问题。本书是两位作者结合各自出色的专业知识和丰富的从业经验为大众倾力奉献的一本大数据时代隐私问题的普及读物。书中展示了我们在家庭和工作中的日常活动是如何成为大数据收集的一部分的。同时,列举大量的大数据应用以及安全和隐私相关案例,包括企业如何利用大数据进行营销、执法机构如何利用大数据执法等,也包括不法分子如何利用非法或合法的手段获取数据,如何利用社交网络进行犯罪。针对上述问题,本书也列出了一些工具、技巧用来检查和防范,这在当前很有现实意义。
本书分为:语言学如何从0到1进行理论创新、如何建构理论体系、如何验证理论、如何进行理论批判、理论整合的前提是什么、语言学与哲学的关系是什么、语言学与认知科学相关学科是什么关系、语言科学研究方法论模型、认知科学超学科视域下的语言学发展趋势和研究生课程设置的构想、结语等10个章节。是对如何进行语言学的理论体系创新进行的系统的方法论反思、使读者从中学会科学的语言学研究方法论,懂得什么是正确的批判方法、如何开展多学科交叉的创新研究等。有助于提升语言学和认知科学研究者的基础理论的原创能力。
大数据导论是了解和学习大数据的基础,本书系统地讲解了大数据基本概念、大数据的架构、大数 据的采集方式和预处理、数据仓库的构建模式、大数据的存储,数据挖掘的方法及大数据的可视化技术, 从而更好地将大数据技术应用在各行业领域,更深入地开展大数据技术的应用研究。从基础开始,由浅 入深进行学习,逐步理清大数据的核心技术和发展趋势。 本书系统地讲解了大数据基本概念,尽可能希望通过理论与实际案例相结合,寻找合适的切入点, 让读者对理论知识的掌握更直接、更快速。可以作为培养应用型人才的课程教材,也适用于大数据初学 者对大数据基础理论有需求的广大读者。
本书以实际数据的分析处理为例,介绍相应统计方法的运用,以及在EViews10.0中的实现。本书涉及处理以时间序列为主的多种类型的数据,包括描述统计、回归分析、传统时间序列等基本的数据分析以及建立条件异方差、向量自回归(包括非结构化和结构化模型)、向量误差修正模型、Panel Data模型、状态空间模型、混频数据模型等复杂的计量经济模型.本书为运用各种统计方法和经济计量方法处理数据的读者,提供了一个简便易学、易操作的工具。读者可以省去许多时间,很快就能够学习掌握该软件的运用。
本书从人力资源管理的战略转型谈起,使大家进一步理解和把握人力资源发展的趋势,进而提出什么是人力资源大数据,如何在海量数据中挖掘出有用的数据,如何将大数据、人工智能与企业人力资源管理实践有机结合,如何在企业内部建立人力资源大数据分析模型和分析平台,如何形成企业人力资源报表体系和指标体系,从科学到实践、从理念到案例,深入浅出地给出了详尽的答案。为eHR、HRD、HRVP及企业CEO等高管进行人力资源大数据分析提供模型、技术方法及可借鉴的典型应用场景,为数据分析师进入人力资源领域提供了人力资源前沿理论及实践,为所有人力资源管理者及爱好者提供了崭新的理念、可操作性的技术方法及典型案例。
MICK著的《SQL基础教程( 数据库工程师写给初学者的实用指南第2版)》是畅销书《SQL基础教程》的第2版,介绍了关系数据库以及用来操作关系数据库的SQL语言的使用方法。书中通过丰富的图示、大量示例程序和详实的操作步骤说明,让读者循序渐进地掌握SQL的基础知识和使用技巧,切实提高编程能力。每章结尾设置有练习题,帮助读者检验对各章内容的理解程度。另外,本书还将重要知识点总结为“法则”,方便读者随时查阅。第2版除了将示例程序 新为对应 的DB的SQL之外,还新增了一章,介绍如何从应用程序执行SQL。 本书适合数据库和SQL语言的初学者阅读,也可作为大中专院校的教材及企业新人培训用书。
强化学习是一类重要的机器学习方法,在很多领域得到了成功的应用,*近几年与深度学习结合起来,进一步推动了人工智能的发展?本书首先介绍了强化学习的基本原理,然后介绍典型的强化学习算法,包括时序差分? SARSA? Q-Learning? DeepQ-network? Double DQN?竞争网络结构? Rainbow? Actor-Critic? A2C? A3C? TRPO和PPO等,每种算法基本上利用了主流的开源机器学习框架TensorFlow,使用Python编程进行实现?此外,还介绍了一些上述算法的应用?本书可以使读者快速理解强化学习的基本知识,并通过简单的案例加深对算法的理解?本书适合对强化学习感兴趣的普通高校师生以及相关专业人员阅读? Copyright ? Packt Publishing 2018First published in the English language under the title “Deep Learning with TensorFlow-SecondEdition- ( 9781788831109)” Copyright in the Chinese language( simplified characters) ? 2020 China Machine PreesThis title is published in China b