本书是为广大数据分析师量身定制的入门读物,它旨在帮助读者站在大数据时代的制高点。数据分析处于统计学、计算机信息科学、运筹学、数据库等多个领域的交叉地带,大数据时代的到来大大丰富了数据分析的内涵,数据分析师的职责与以往相比发生了巨大的改变。本书全面介绍了经典数据分析、模式识别、机器学习、深度学习、数据挖掘、商务智能等多个领域的数据分析算法,将大数据时代的数据分析热点技术一网打尽。本书为每个数据分析算法都搭配了一个经典案例,并按照由易到难的原则构建知识框架,充分照顾了不同水平读者的阅读习惯。通过阅读本书,读者将对大数据时代下的数据分析有一个全面的认识。无论是入门级的数据分析员还是有一定基础的数据分析师,都能通过本书完善、加深对数据分析的认识。
在新媒体时代,如果对新闻报道、网上搜索的结果或者所谓的 专家告知 不加思考地完全相信,那你就等着上当受骗吧! 本书围绕当今*受瞩目的大数据科学理论,通过日本政府公布的公开数据,集中针对访日游客的增加、舆论调查的可靠性、 安倍经济学 的成果、东日本大地震后的状况、相对贫困、失业率的下降、年轻人远离ХХ、全球变暖问题、减肥、恩格尔系数的上升等10个主题进行数据解读,帮助读者模拟体验数据读取方法,提高理解和分析数据的能力,挖掘出数据背后隐藏的真相。 作为 大数据分析 的超级入门书,即使不擅长数学、不了解统计学的人,读完本书也可以彻底掌握数据解读方法!
这是一部从技术、流程、管理等多个维度系统讲解华为数据治理和数字化转型的著作。华为是一家超大型企业,华为的数据底座和数据治理方法支撑着华为在全球170多个国家/地区开展多业态、差异化的运营。书中凝聚了大量数据治理和数字化转型方面的有价值的经验、方法论、规范、模型、解决方案和案例,不仅能让读者即学即用,还能让读者了解华为数字化建设的历程。 全书共10章,内容从逻辑上分为四个部分。 部分(~3章) 章以非数字原生企业在数字化转型方面面临的挑战开篇,介绍了华为在数据治理和数字化转型方面的目标、愿景、蓝图和框架;第2章从企业政策和架构协同的角度,介绍了企业级的数据综合治理体系,理顺了数据与变革、运营、IT之间的协同关系,明确了数据管理的责任主体在业务;第3章详细阐述了不同类型的数据的管理方式和要点。 第二
本书围绕健康医疗大数据的理论与实践展开论述。全书共分为7章,第1章主要描述大数据的基础知识、通用技术以及技术发展趋势;第2章主要对健康医疗大数据的概念、特征、分类、主要应用技术、国内外发展现状以及应用需求进行系统阐述;第3章~第6章分别对临床大数据、精细化运营大数据、健康管理大数据以及基因检测大数据的应用实践案例进行详细论述;第7章对健康医疗大数据的未来发展趋势进行展望。本书是很多应用实例和经验的总结,案例丰富翔实,将理论与实际紧密结合,对互联网技术人员、健康医疗行业的从业人士,以及高等院校相关专业的学生均有很大帮助。
本书借助大数据技术、统计学方法、人工智能技术对社会热点事件展开情感实证分析。以技术为主、分析为此、情感为辅。通过先进的技术分析情感的发展。本研究以微博平台作为切入口获取情感挖掘的大数据来源,通过构建一个较为全面的社会性事件情感分类词典,对社交网络中微博用户情感进行挖掘与可视化。通过对公众情感类型的多维度解析,从情感传播环境、情感传播方式、社会网络结构和用户行为模式四个方面探索社交网络中的舆情传播特征,由此提出合理引导网络舆情的相关对策建议。
本书全面地讲述数据挖掘领域的重要知识和技术创新。在版内容相当全面的基础上,第2版展示了该领域的研究成果,例如挖掘流、时序和序列数据以及挖掘时间空间、多媒体、文本和Web数据。本书可作为数据挖掘和知识发现领域的教师、研究人员和开发人员的一本书。 本书版曾是受读者欢迎的数据挖掘专著,是一本可读性极佳的教材。第2版充实了数据挖掘领域研究新进展的题材,增加了讲述的数据挖掘方法的若干章节。本书适合作为高等院校计算机及相关专业高年级本科生的选修课教材,特别适合作为研究生的专业课教材。
多年来,SOA一直只是个美好的愿景。通过描述在实践中实现和运行SOA所碰到的问题,《SOA实践指南:分布式系统设计的艺术》让SOA走入凡尘,真正能被大家所用。通过介绍SOA的方方面面,分析典型的使用模式,并探究松耦合如何帮助构筑更强大的应用,《SOA实践指南:分布式系统设计的艺术》提出了一个框架,帮助你决定何时,以及如何利用SOA获益。在《SOA实践指南:分布式系统设计的艺术》中,你将:直接聚焦于真实的技术和部署,而不是仅仅关注若干标准在应用SOA解决方案之前,先检查业务问题,确定哪些业务问题适用SOA方法找到建立解决方案的清晰路径,而不是陷入不断变化的Web Services细节泥潭之中分享资深SOA系统架构师的实战经验“《SOA实践指南:分布式系统设计的艺术》描述的原则和经验,在使T-Mobile公司成功建立SOA上扮演了重要角色,公司的SOA每天要
本书围绕经典的统计方法与R语言工具,从基本的统计描述分析方法出发,讲解了参数估计与假设检验、线性回归、逻辑回归、降维分析方法,每一章重点介绍一种经典方法或统计模型,对其基本定义、模型形式、统计
本书不讲具体语法,只是以案例的形式介绍各种查询语句的用法。靠前~4章是基础部分,讲述了常用的各种基础语句,以及常见的错误和正确语句的写法,应熟练掌握这部分内容,因为在日常查询和优化改写中都要用到;第5~12章是提高部分,讲解了正则表达式、分析函数、树形查询及汇总函数的用法,这部分内容常用于一些复杂需求的实现及优化改写;很后两章介绍日常的优化改写案例,这部分内容是前面所学知识的扩展应用。如果您是开发人员,经常与Oracle打交道,那么本书可以帮助您处理复杂的需求,写出高性能的语句。如果您是运维人员,则本书可以帮助您更快地完成慢语句的改写优化。
《Access2010数据库应用》针对微软公司数据库软件Access 2010,从数据库使用的实际需要出发,将基础知识与基本技能相结合,按照“以服务为宗旨,以就业为导向”的指导思想,采用“行动导向,任务驱动”的方法,将知识穿插在“学生信息管理系统”实例制作的操作过程中,介绍数据库应用软件开发的实际流程与制作技巧。 《Access2010数据库应用》共6个项目,围绕一个“学生信息管理系统”实例建设展开,按照系统开发的一般步骤,详细讲解学生信息系统的开发过程,坚持“在做中学,在学中做”学用结合,在不断的实践中,通过实现系统掌握数据库基础知识。每个项目有若干任务,每个任务由“任务描述”“做一做”“学一学”“试一试”“小本子”5个模块组成。其中“任务描述”是对任务所要达到的效果进行分析,对完成本任务后应该掌握的知识加以描述;
本书分12章重点阐述了数据管理的重要性,数据管理面临的挑战,DAMA的数据管理原则,数据伦理,数据治理,数据生命周期管理的规划及设计,数据赋能和数据维护,使用和增强数据,数据保护、隐私、安全和风险管理,元数据管理,数据质量管理,以及现在应该怎么办,能够帮助企业管理层在了解和执行数据管理的过程中不致迷失在技术术语的迷宫之中。本书可供非数据专业人士、企业管理者、数据行业研究者等读者学习和参考。