在新媒体时代,如果对新闻报道、网上搜索的结果或者所谓的 专家告知 不加思考地完全相信,那你就等着上当受骗吧! 本书围绕当今*受瞩目的大数据科学理论,通过日本政府公布的公开数据,集中针对访日游客的增加、舆论调查的可靠性、 安倍经济学 的成果、东日本大地震后的状况、相对贫困、失业率的下降、年轻人远离ХХ、全球变暖问题、减肥、恩格尔系数的上升等10个主题进行数据解读,帮助读者模拟体验数据读取方法,提高理解和分析数据的能力,挖掘出数据背后隐藏的真相。 作为 大数据分析 的超级入门书,即使不擅长数学、不了解统计学的人,读完本书也可以彻底掌握数据解读方法!
本书展示了如何验证自己的设想、找到真正的客户、打造能赚钱的产品,以及提升企业知名度。30多个案例分析,全球100多位知名企业家的真知灼见,为你呈现来之不易、经过实践检验的创业心得和宝贵经验,值得每位创业家和企业家一读。 深入理解精益创业、数据分析基础,和数据驱动的思维模式 如何将六个典型的商业模式应用到各种规模的新企业 找到你的关键指标 确定底线,找到出发点 在大企业中应用精益分析,打造新产品
技术是把双刃剑,当我们在积极拥抱新技术的同时,也不能忽视其所带来的风险,比如当今大数据时代个人隐私和安全问题。本书是两位作者结合各自出色的专业知识和丰富的从业经验为大众倾力奉献的一本大数据时代隐私问题的普及读物。书中展示了我们在家庭和工作中的日常活动是如何成为大数据收集的一部分的。同时,列举大量的大数据应用以及安全和隐私相关案例,包括企业如何利用大数据进行营销、执法机构如何利用大数据执法等,也包括不法分子如何利用非法或合法的手段获取数据,如何利用社交网络进行犯罪。针对上述问题,本书也列出了一些工具、技巧用来检查和防范,这在当前很有现实意义。
本书结合理论和实践,由浅入深,多方面介绍了Hadoop这一高性能的海量数据处理和分析平台。全书5部分24章,第Ⅰ部分介绍Hadoop基础知识,主题涉及Hadoop、MapReduce、Hadoop分布式文件系统、YARN、Hadoop的I/O操作。第Ⅱ部分介绍MapReduce,主题包括MapReduce应用开发;MapReduce的工作机制、MapReduce的类型与格式、MapReduce的特性。第Ⅲ部分介绍Hadoop的运维,主题涉及构建Hadoop集群、管理Hadoop。第Ⅳ部分介绍Hadoop相关开源项目,主题涉及Avro、Parquet、Flume、Sqoop、Pig、Hive、Crunch、Spark、HBase、ZooKeeper。第Ⅴ部分提供了三个案例,分别来自医疗卫生信息技术服务商塞纳(Cerner)、微软的人工智能项目ADAM(一种大规模分布式深度学习框架)和开源项目Cascading(一个新的针对MapReduce的数据处理API)。本书是一本很好不错、全面的Hadoop参考书和工具书,阐述了Hadoop生态圈的很新发展和应用,程序员可以
《商业智能工具应用及数据可视化》一书聚焦商业智能与数据可视化主题,从概念、价值、方法、工具等理论基础出发,以实际场景为参考,分入门、进阶两大阶段,以帆软FineBI为例从商业智能工具的基本知识,商业应用场景,数据可视化案例等方面,介绍了商业智能工具和各种常规和高级可视化图形的使用方法,重点介绍了商业智能工具FineBI的数据分析与可视化应用实践。本书内容层层递进,体系完善,可使读者对商业智能工具的运用有一个全面、系统、深入的了解。
《MySQL从入门到精通》从初学者角度出发,通过通俗易懂的语言以及丰富多彩的实例,详细介绍了MySQL开发应该掌握的各方面技术。《MySQL从入门到精通》共分为4篇23章,包括数据库基础,初识MySQL,使用MySQL图形化管理工具,数据库操作,存储引擎及数据类型,操作数据表,MySQL基础,表数据的增、删、改操作,数据查询,常用函数,索引,视图,数据完整性约束,存储过程与存储函数,触发器,事务的应用,事件,备份与恢复,MySQL性能优化,权限管理及安全控制,PHP管理MySQL数据库中的数据,Apache PHP MySQL实现网上社区,Struts 2 Spring Hibernate MySQL实现网络商城等内容。所有知识都结合具体实例进行介绍,涉及的程序代码也给出了详细的注释,可以使读者轻松领会MySQL的精髓,快速提高开发技能。 《MySQL从入门到精通》内容详尽,实例丰富,非常适合作为编程初学
本书结合理论和实践,由浅入深,多方面介绍了Hadoop这一高性能的海量数据处理和分析平台。全书5部分24章,第Ⅰ部分介绍Hadoop基础知识,主题涉及Hadoop、MapReduce、Hadoop分布式文件系统、YARN、Hadoop的I/O操作。第Ⅱ部分介绍MapReduce,主题包括MapReduce应用开发;MapReduce的工作机制、MapReduce的类型与格式、MapReduce的特性。第Ⅲ部分介绍Hadoop的运维,主题涉及构建Hadoop集群、管理Hadoop。第Ⅳ部分介绍Hadoop相关开源项目,主题涉及Avro、Parquet、Flume、Sqoop、Pig、Hive、Crunch、Spark、HBase、ZooKeeper。第Ⅴ部分提供了三个案例,分别来自医疗卫生信息技术服务商塞纳(Cerner)、微软的人工智能项目ADAM(一种大规模分布式深度学习框架)和开源项目Cascading(一个新的针对MapReduce的数据处理API)。本书是一本很好不错、全面的Hadoop参考书和工具书,阐述了Hadoop生态圈的很新发展和应用,程序员可以
本书引入真实的案例, 以提供优质的数据分析服务、 撰写高质量的数据分析报告为目标。在阐述数据分析时, 力求以系统的观念从所研究主题的整体着眼, 综合不同的分析角度、 数据处理方式、 分析方法和分析工具, 以揭示数据更本质的特点和更深层次的规律。书中以实际案例为背景, 说明综合采用统计方法、 数据挖掘方法进行数据分析的主要问题。 本书适合学过数据分析基础知识的读者阅读,也可供大学生、初入数据分析职场人员、参与CDA考试的人员学习使用。
该书基于通用的Excel、 SPSS工具, 加上必知必会的数据分析概念, 以图文并茂、 理论与实操相结合的方式, 按照CDA人才培养考核要求进行编写。全书分为6章, 分别为数据分析概述、 数据收集与导入、 数据的清洗与预处理、 数据可视化呈现、 基础数据分析、 综合分析。本书适合数据分析零基础群体读者阅读, 也可供大学生、 初入数据分析职场人员、 参与CDA考试的人员学习使用。
当今世界,科技进步日新月异,互联网、大数据、云计算等现代信息技术深刻改变着人类的思维、生产、生活、学习方式,深刻展示了世界发展的前景。大数据是工业社会的 自由 资源,谁掌握了数据,谁就掌握了主动权。本书通过介绍45家国际知名公司在利用大数据方面的成功经验,为企业、政府和其他单位利用大数据进行有效决策,推动技术革新和更有效谋划企业战略定位及发展提供非常有价值的参考,以大数据信息流带动技术流、资金流、人才流、物资流融合发展。
对于各个行业,OLAP是一种非常重要的主流技术。本书是对OLAP的全面分析:从OLAP的定义、由来、基本要求,以及它是如何结合到整个企业信息架构中的,到如何在N维空间中进行思考,进而设计和使用多维信息系统;从多维技术的特点、概念到多维信息系统的设计使用实践。每一步都是从最简单的问题出发,使用具体生动的实例进行详细讲解的,使得读者可以很容易理解多维信息系统的设计原则,并提高多维信息系统的使用技巧。 本书主要是商业分析师、面向OLAP应用开发者、IT工作者,以及计算机科学、面向技术的大学生而编写的,同时本书多层次的编写风格使得IT经理和管理人员也能从中获益。
本书系统论述了openGauss数据库理论、技术及应用。本书共11章,首先介绍数据库发展历史,包括传统的网状数据库、层次数据库、关系数据库、NoSQL数据库、NewSQL数据库、云数据库、多模数据库、分布式数据库等。其次介绍结构化查询语言(SQL)、SQL语法、存储过程、触发器、游标、数据库设计规范和E-R 模型等数据库基础知识。再次介绍数据库未来发展趋势,包括新硬件、不同部署形态、新应用对数据库的影响。最后重点介绍openGauss的核心技术,包括openGauss的核心架构、面向鲲鹏和昇腾等新硬件的优化技术、SQL引擎、执行器技术、数据库存储技术、数据库事务机制、数据库安全、数据库自治技术等。为方便读者掌握数据库教学内容,本书每章都提供了小结和习题(含答案)。通过阅读本书,读者可以深入了解数据库的发展历史与未来趋势、数据库系统架构、鲲鹏和昇腾优化技术、
多年来,SOA一直只是个美好的愿景。通过描述在实践中实现和运行SOA所碰到的问题,《SOA实践指南:分布式系统设计的艺术》让SOA走入凡尘,真正能被大家所用。通过介绍SOA的方方面面,分析典型的使用模式,并探究松耦合如何帮助构筑更强大的应用,《SOA实践指南:分布式系统设计的艺术》提出了一个框架,帮助你决定何时,以及如何利用SOA获益。在《SOA实践指南:分布式系统设计的艺术》中,你将:直接聚焦于真实的技术和部署,而不是仅仅关注若干标准在应用SOA解决方案之前,先检查业务问题,确定哪些业务问题适用SOA方法找到建立解决方案的清晰路径,而不是陷入不断变化的Web Services细节泥潭之中分享资深SOA系统架构师的实战经验“《SOA实践指南:分布式系统设计的艺术》描述的原则和经验,在使T-Mobile公司成功建立SOA上扮演了重要角色,公司的SOA每天要
本书从一个Access数据库应用系统实例——学生管理系统入手,系统地介绍数据库的基本原理与Access各种主要功能的使用,主要包括数据库的基本原理和相关概念,关系数据库的基本设计方法,数据库的建立,表、查询、SQL语言、窗体、报表、页、宏的创建和应用,以及VBA程序设计。 ????本书内容全面,结构完整,深入浅出,图文并茂,通俗易懂,可读性、可操作性强,既适合作为各类高校学生学习数据库原理及应用的教材,也可作为相关领域技术人员的参考用书或培训教材。
《数据库技术丛书:高并发Oracle数据库系统的架构与设计》是一本深度讲解如何架构与设计高并发Oracle数据库系统的著作,也是一本系统讲解内存数据库Times Ten的专著。作者是拥有10余年Oracle从业经验的资深数据库架构师,《数据库技术丛书:高并发Oracle数据库系统的架构与设计》的内容也得到了业界以盖国强为代表的数位数据库专家的一致认可。《数据库技术丛书:高并发Oracle数据库系统的架构与设计》秉承大道至简的思想,技术与艺术并重,从技术、方法论、原理和思想等角度讲解了如何架构与设计高并发Oracle数据库系统。 《数据库技术丛书:高并发Oracle数据库系统的架构与设计》主要内容从三个维度展开:首先是内部扩展的维度,深入探讨了高效B树索引、高效表设计、查询优化器等数据库架构设计与优化的核心技术,以及高并发Oracle数据库系统架构与设
数据融合是许多传统学科和新兴工程领域相结合而产生的一个新的前沿技术领域,是现代C3I系统的重要组成部分。本书是我国本关于多传感器数据融合理论的专著。 全书共分12章。章阐述数据融合的意义、理论基础、实现技术和研究现状;第二章和第三章研究多传感器目标检测理论和性能评估;第四章至第八章论述数据关联和目标跟踪的算法与理论;第九章介绍身份估计的基本思想与方法;第十章至第十二章介绍态势评估和威胁估计的基本理论,以及在这一领域有广泛应用前景的条件事件代数理论和规划识别理论。 本书适用于通信、控制和信号处理等领域的大学生、研究生和相关领域的科研、工程技术人员。
本书共11章,主要内容包括:章讨论如何从不同种类数据源中读入数据。第2章提供标准化数据、修正拼写错误和使用大数据集的策略和实现。第3章包含Clojure的并发特性和如何通过这些特性简化程序。第4章包含使用Clojure的并行处理能力提高处理数据的速度。第5章包含在Hadoop和Cascading库上使用Cascalog处理分布在多台计算机上的大量数据。第6章包含使用Incanter数据集的基础知识。第7章包含在数据分析中用到的一系列统计处理过程和测试。有此很简单,例如生成汇总统计。第8章讲解如何配置Clojure以便与Mathematica和R交互。第9章包含更多高级的机器学习技术。0章展示如何在Incanter中生成图和进行可视化。1章展示如何安装一个简单的网页应用来展现数据分析的发现。
本书系统地介绍了知识图谱的相关概念、技术要素与应用,不仅涵盖了知识图谱技术的发展历程与特点,也涵盖了当前阶段知识图谱的主要应用,并分析了未来的发展趋势与挑战。本书从理论综述、技术解读、应用场景、实战分析等多个角度进行了阐述,内容全面且易于理解。 本书是一本入门级图书,面向具备计算机知识但没有知识图谱构建经验的读者,旨在帮助他们掌握知识图谱构建的专业知识。同时,本书还面向渴望了解知识图谱应用的各行业人员,旨在帮助他们拓展视野、开阔思路。相信所有对知识图谱感兴趣的读者通过阅读本书都能有所收获。
《Visual FoxPro程序设计习题与实验指导》是与《Visual FoxPro程序设计》配套使用的教学参考书。内容包括四个部分:部分为Visual FoxPro上机指导;第二部分为综合实训;第三部分为章节练习;第四部分为模拟真题。《Visual FoxPro程序设计习题与实验指导》最后附有章节练习和模拟真题的参考答案。 《Visual FoxPro程序设计习题与实验指导》中的实验和习题答案都在Visual FoxPro 6.0环境下运行通过,书中的习题大部分来自历年全国计算机等级考试二级Visual FoxPro的考试真题,实验都是经过精心设计和安排的,具有较强的启发性和代表性。 《Visual FoxPro程序设计习题与实验指导》是学习Visual FoxPro和上机实验的参考书,可以作为高等院校计算机应用中Visual FoxPro程序设计实验教学用书,也可以作为备考全国计算机等级考试二级VisualFoxPro的参考书。
《Pentaho Kettle解决方案:使用PDI构建开源ETL解决方案》主要介绍如何使用开源ETL工具来完成数据整合工作。 《Pentaho Kettle解决方案:使用PDI构建开源ETL解决方案》介绍的PDI(Kettle)是一种开源的 ETL 解决方案,书中介绍了如何使用PDI来实现数据的剖析、清洗、校验、抽取、转换、加载等各类常见的ETL类工作。 除了ODS/DW类比较大型的应用外,Kettle 实际还可以为中小企业提供灵活的数据抽取和数据处理的功能。Kettle除了支持各种关系型数据库、HBase、MongoDB这样的NoSQL数据源外,它还支持Excel、Access这类小型的数据源。并且通过插件扩展,Kettle 可以支持各类数据源。本书详细介绍了Kettle可以处理的数据源,而且详细介绍了如何使用Kettle抽取增量数据。 Kettle 的数据处理功能也很强大,除了选择、过滤、分组、连接、排序这些常用的功能外,Kettle 里的Java表达式、正则