本书从初学者易于理解的角度,以通俗易懂的语言、丰富的实例、简洁的图表、传统和现代数据特征的对比,将大数据这一计算机前沿科学如数家珍地娓娓道来。既介绍了大数据和相关的基础知识,又与具体应用有机结合起来,并借助可视化图表的画面感立体地为读者剖析了大数据的技术和原理,非常便于自学。本书内容包括大数据概论、大数据采集及预处理、大数据分析、大数据可视化、Hadoop概论、HDFS和Common概论、MapReduce概论、NoSQL技术介绍、Spark概论、云计算与大数据、大数据相关案例等内容。本书既可以作为想了解大数据技术和应用的初学者的教材,也适合作为培训中心、IT人员、企业策划和管理人员的参考书。
本书借助大数据技术、统计学方法、人工智能技术对社会热点事件展开情感实证分析。以技术为主、分析为此、情感为辅。通过先进的技术分析情感的发展。本研究以微博平台作为切入口获取情感挖掘的大数据来源,通过构建一个较为全面的社会性事件情感分类词典,对社交网络中微博用户情感进行挖掘与可视化。通过对公众情感类型的多维度解析,从情感传播环境、情感传播方式、社会网络结构和用户行为模式四个方面探索社交网络中的舆情传播特征,由此提出合理引导网络舆情的相关对策建议。
本书是《实用数据结构基础(第四版)》(陈元春、王中华、张亮、王勇编著,中国铁道出版社出版) 的配套学习指导书。全书内容分为5部分:教学内容指导(包括对主教材第1~10章的知识点分析、典型 习题分析和各章习题解答);自主设计实验指导(对10个自主设计实验的设计思想、算法分析进行了详细 指导);模拟试卷;模拟试卷参考答案;数据结构课程设计报告样例。 本书对数据结构的概念和原理的阐述通俗易懂,例子翔实;习题难易适中,题型丰富;对数据结构 基本运算的分析注重实现的过程。本书以C/C++语言作为算法的描述语言,对于书中的实验和一些重要 的算法均给出了完整的C/C++语言源程序,并全部在Visual C++ 6.0环境下运行通过。 本书适合作为普通高等院校计算机类专业数据结构课程的教学辅导书,也可作为成
本书采用了众多流行的数据挖掘算法,如利用K-means算法进行信息聚类和网页自动抽取,利用贝叶斯分类器实现信息过滤与分类,将知识组织与网站优化有机地结合起来,使得主题、目录组织的思想融合贯通在智能网站设计当中。全书共分6章,主要介绍了网络日志的数据来源、类型及其预处理技术;用户信息行为,包括网络用户行为的构成因素、分类,信息行为模型;用户行为数据的提取和分析,用户个性化知识服务需求的影响因素;网站优化算法的设计;智能技术在网站开发中的应用;机器学习的实现原理与训练模型,利用贝叶斯分类算法对垃圾信息进行自动过滤。最后,还对网站导航优化效果进行了调试与展示,并给出了实现的核心代码。 本书涉及数据挖掘、计算机编程、知识组织等多门学科的知识,理论性强。全书内容深入浅出,既有较深的理论分析,也有
大数据分布式计算课程是大数据方向应用统计专业硕士学生的专业必修课,通过本课程的学习使学生能够掌握目前大数据挖掘领域常用的并行计算方法,加深学生对统计并行计算的理解,培养学生使用在现代并行架构下利用统计方法深入挖掘大数据中的数据结构并能解决一些实际问题的能力。
本书详尽地讲述了数据仓库的基本概念、基本原理,以及建立数据仓库的方法和过程。主要内容包括决策支持系统的发展、数据仓库环境结构、数据仓库设计、数据仓库粒度划分、数据仓库技术、分布式数据仓库、EIS系统和数据仓库的关系、外部和非结构化数据与数据仓库的关系、数据装载问题、数据仓库与WEB、ERP与数据仓库以及数据仓库的复查要目。 本书是数据仓库的创始人撰写的关于数据仓库的最著作,这个新版本收录了该领域的经典理论和前沿发展。本书既可以作为相关专业的研究生教材,也是数据仓库的研究、开发和管理人员的指南。
全书以SQL Server 2008分析服务为主题,按照由浅入深的逻辑共分为4个部分,第Ⅰ部分介绍商业智能、多维分析和OLAP,说明分析服务是如何实现OLAP的优势的。第Ⅱ部分介绍如何设计数据源、度量值和多维数据集。第Ⅲ部分介绍如何使用多维表达式和聚合函数来执行复杂的计算以及创建关键绩效指标。第Ⅳ部分介绍如何使用安全性来控制对多维数据集的访问,唱定特定用户可以看到的数据,如何设计分区以管理数据库可扩展性,以及如何管理并监控分析服务数据库。 《SQL Server 2008分析服务从入门到精通》内容丰富,并含有大量实例操作指导、技巧提示等,方便读者的学习。 《SQL Server 2008分析服务从入门到精通》适合SQL Server 2008的应用和开发人员阅读,尤其适合于工作重心是数据分析的人员。
我们能相信统计么? 抛了5次硬币,结果都是正面,抛硬币是否肯定是正面?如何从高层的统计指标看透数据后面的本质?如何在大数据时代获取战略制高点,确定自己的职业发展定位?从一个互联网公司数据分析师的成长经历,为您娓娓道来,数据分析中的奇闻趣事、心得总结、方法技巧与哲学感悟。
《中等职业学校计算机应用专业教学改革实验教材·数据库应用基础:Access2010(第3版)》是中等职业学校计算机应用专业教学改革实验教材。《中等职业学校计算机应用专业教学改革实验教材·数据库应用基础:Access2010(第3版)》从认识数据库系统入手,通过使用Access2010开发与职业需求实际紧密相关的关系型数据库系统,全面讲述数据库系统设计、管理和应用的全过程。《中等职业学校计算机应用专业教学改革实验教材·数据库应用基础:Access2010(第3版)》内容包括:认识数据库系统、建立和维护数据表、使用查询、设计报表、设计窗体、使用宏及VBA、管理和维护Access数据库。 《中等职业学校计算机应用专业教学改革实验教材·数据库应用基础:Access2010(第3版)》充分体现“做中学、做中教”的职业教育教学特色,采用项目驱动的模式合理选择教学数据库
本书引入真实的案例, 以提供优质的数据分析服务、 撰写高质量的数据分析报告为目标。在阐述数据分析时, 力求以系统的观念从所研究主题的整体着眼, 综合不同的分析角度、 数据处理方式、 分析方法和分析工具, 以揭示数据更本质的特点和更深层次的规律。书中以实际案例为背景, 说明综合采用统计方法、 数据挖掘方法进行数据分析的主要问题。 本书适合学过数据分析基础知识的读者阅读,也可供大学生、初入数据分析职场人员、参与CDA考试的人员学习使用。
《教学成果奖配套教材:数据结构》的主要任务是介绍并探讨有关数据组织、算法设计、时间和空间效率的概念和通用分析方法,帮助读者理解数据的组织方法和现实世界问题在计算机内部的表示方法,针对问题的具体应用背景进行分析,进而选择合适的数据结构,从而培养高级程序设计技能。 本书章介绍了数据结构与算法的基本概念;第2章基本上是对C语言关键内容的复习,为后续章节理解数据结构的实现作准备;第3章至第7章分别介绍了线性表、树、散列表、图、排序算法等经典数据结构与算法;最后在第8章通过对两个实际生活中提炼出的问题的解答,帮助读者更深刻体会数据结构的应用。 本书可作为高等学校计算机类专业的专业基础课“数据结构”的教材。
本书是根据CDA数据分析基础和CDA数据分析实务编写的考试大纲, 该大纲是关于考试科目、 提醒设置及知识点要求的指导性文件, 目的是让学生便于了解数据分析基础的大数据概念, 基本理论, 基本模型的建立、 操作, 分析的技能、 技巧等, 同时便于报考者准备和参加CDA数据分析员的考试。 本书适合数据分析零基础群体读者阅读, 也可供大学生、 初入数据分析职场人员、 参与CDA考试的人员学习使用。
《数据结构例题详解与课程设计指导》力求对每题严格按照知识点全面分析并详细解答。本书由两部分组成:部分是典型例题详解和习题解答,基本上涵盖了数据结构的所有知识点;第2部分通过经典的课程设计案例详解给出课程设计的实践指导。 《数据结构例题详解与课程设计指导》希望通过对基础理论和概念的归纳总结、典型例题的详细分析、课后习题的详尽解答、课程设计的实例分析,帮助读者深化对基本概念的理解,熟练掌握数据结构基本原理,进一步提高算法设计和分析能力。 本书语言流畅,内容通俗易懂,例题经典,解答详尽。本书是《数据结构(C语言版)》(秦锋主编,清华大学出版社出版,ISBN:978-7-302-24603-9)的配套教材,同时又自成体系。本书可作为高等学校计算机信息类专业的学习辅导书,也可作为研究生入学考试的复习参考书。本书由秦锋教授和
本书以任务驱动为主线,围绕企业级应用进行项目任务设计,主要内容包括数据采集与预处理准备、网络爬虫实践、日志数据采集实践和数据预处理实践,全面地讲述了Scrapy、Flume、Pig、Kettle、Pandas、OpenRefine等技术,以及urllib、Selenium基本库和BeautifulSoup解析库的相关知识与应用案例。 本书内容实用,可操作性强,语言精练、通俗易懂,可作为高等院校计算机应用技术、大数据技术与应用、软件技术、云计算技术与应用等计算机相关专业的教材,也可作为大数据分析、云计算应用领域技术人员的参考用书。
本书全面介绍云计算与大数据的基础知识、主要技术、基于集群技术的资源整合型云计算技术和基于虚拟化技术的资源切分型云计算技术。全书共10章,主要内容包括云计算基础与大数据基础、虚拟化技术和平台、MPI、Hadoop、HBase、Hive、Storm和云存储系统Swift。本书以理论够用为主,注重实用,实验丰富,将实验内容融合在课程内容中,使理论紧密联系实际。
本书是一本系统介绍大数据可视化技术的图书。书中首先阐述了大数据的可视化技术的基本概念以及相关的基础理论知识,然后采用理论与实践相结合的方式,针对实际应用中的各种不同类型的数据,包括时间数据,比例数据,关系数据,文本数据,复杂数据,介绍相应的可视化理论和操作方法,最后,介绍了数据可视化在各个领域中的应用。 本书实例丰富,图文并茂,叙述简明,重点突出。作者专门收集和整理了相关的课程案例、典型数据和实验指导手册,帮助读者深入学习大数据可视化中的各种技术知识。 本书可以作为高校计算机、数据分析、大数据等相关专业学生的教学用书,对于从事数据可视化、数据分析的技术人员也有较大的参考价值。