在新媒体时代,如果对新闻报道、网上搜索的结果或者所谓的 专家告知 不加思考地完全相信,那你就等着上当受骗吧! 本书围绕当今*受瞩目的大数据科学理论,通过日本政府公布的公开数据,集中针对访日游客的增加、舆论调查的可靠性、 安倍经济学 的成果、东日本大地震后的状况、相对贫困、失业率的下降、年轻人远离ХХ、全球变暖问题、减肥、恩格尔系数的上升等10个主题进行数据解读,帮助读者模拟体验数据读取方法,提高理解和分析数据的能力,挖掘出数据背后隐藏的真相。 作为 大数据分析 的超级入门书,即使不擅长数学、不了解统计学的人,读完本书也可以彻底掌握数据解读方法!
技术是把双刃剑,当我们在积极拥抱新技术的同时,也不能忽视其所带来的风险,比如当今大数据时代个人隐私和安全问题。本书是两位作者结合各自出色的专业知识和丰富的从业经验为大众倾力奉献的一本大数据时代隐私问题的普及读物。书中展示了我们在家庭和工作中的日常活动是如何成为大数据收集的一部分的。同时,列举大量的大数据应用以及安全和隐私相关案例,包括企业如何利用大数据进行营销、执法机构如何利用大数据执法等,也包括不法分子如何利用非法或合法的手段获取数据,如何利用社交网络进行犯罪。针对上述问题,本书也列出了一些工具、技巧用来检查和防范,这在当前很有现实意义。
当今世界,科技进步日新月异,互联网、大数据、云计算等现代信息技术深刻改变着人类的思维、生产、生活、学习方式,深刻展示了世界发展的前景。大数据是工业社会的 自由 资源,谁掌握了数据,谁就掌握了主动权。本书通过介绍45家国际知名公司在利用大数据方面的成功经验,为企业、政府和其他单位利用大数据进行有效决策,推动技术革新和更有效谋划企业战略定位及发展提供非常有价值的参考,以大数据信息流带动技术流、资金流、人才流、物资流融合发展。
本书分为部分,分别为大数据基础理论分析、基于海量语意规则的大数据流处理技术及大数据应用。 部分介绍大数据领域的主要基础理论,包括大数据基本概念、可编程数据中心、云文件系统、云数据库系统、大数据并行编程与分析模型、大数据智能计算算法、基于大数据的数据仓库技术、大数据安全与隐私保护,以及基于大数据的语意软件工程方法等。 第二部分介绍基于海量语意规则的大数据流处理技术,包括基于规则的大数据流处理介绍、语意规则描述模型、海量语意规则网及优化、海量语意规则处理算法及海量语意规则并行处理等。 第三部分主要介绍大数据的一些典型应用,包括:文化大数据、医疗健康大数据、互联网金融大数据、教育大数据、电子商务大数据、互联网大数据、能源大数据、交通大数据、宏观经济大数据、进出口食品安全监管大数据、基
《城市发展的数据逻辑》通过对城市空间数据和非空间数据(如地形数据、建筑物数据、城市环境数据等)反映城市发展现状和历史的数据进行分析、挖掘,论述城市发展的规律和内在逻辑,为城市发展提供了重要的分析工具和科学依据。 《城市发展的数据逻辑》系统、全面地介绍了与城市发展有关的各种空间数据。在此基础上介绍了国内外对城市生产的研究现状,总结了目前国内外城市大数据研究的形成和发展、城市生长模型及其新方法,并借助一些典型案例,介绍应用城市生长技术的流程与方法。《城市发展的数据逻辑》还介绍了GIS、RS、GPS等新技术在城市发展及城市规划中的应用,以及如何使用新的信息技术方法揭示城市发展过程中诸如道路交通、城市建筑、公共设施等城市因子与城市发展的内生联系。 《城市发展的数据逻辑》的读者对象是城市发展领域
进入大数据时代,让数据开口说话将成为司空见惯的事情,本书将从大数据时代的前因后果讲起,全面分析大数据时代的特征、企业实践的案例、大数据的发展方向、未来的机遇和挑战等内容,展现一个客观立体、自由开放的大数据时代。
本书以大数据为研究背景,系统分析了传统数据技术当前存在的问题以及面临的挑战,并对比了当前主流的面向大数据的数据库解决方案,在此基础上阐述了笔者的研究工作:基于MapReduce平台高处处理大数据的OLAP研究。书中反应了当前大规模数据仓库研究的热点和成果,值得大数据研究的人员参考和应用。
随着信息技术特别是网络技术的飞速发展,人们收集、存贮、传输数据的能力不断提高。数据出现了爆炸性增长,与此形成鲜明对比的是:对决策有价值的知识却非常匮乏。知识发现与数据挖掘技术正是在这一背景下诞生的一门新学科。数据挖掘要在实际应用中发挥作用,高性能挖掘算法和数据挖掘软件平台是重要的技术基础。本书以数据挖掘基本问题、频繁模式与关联规则挖掘为切入点,研究高时间效率、高空间可伸缩性的挖掘算法和分布,异质、海量数据的协同挖掘软件模型,并探讨了数据挖掘过程中的隐私保护问题。 本书首先发现了基于树表示形式的虚拟投影方法,用于按深度优先挖掘密集型数据集;提出了稀疏型数据集表示形式及非过滤投影方法;进_步提出了基于伺机投影的思想,设计并实现了基于伺机投影的全新算法OpportuneProject,对比实验表明,该
《大数据测评》一书介绍了大数据的概念和特征,各国大数据发展的战略、发展趋势及其标准化情况,以及对于软件测试带来的挑战。 在此基础上,《大数据测评》在面向大数据处理框架、大数据基础算法、应用系统、系统安全和隐私泄露的测评技术 等方面展开了分析和讨论。以Hadoop为主线开展大数据测试的探讨。在底层支撑框架层聚焦于单元测试和框架基准测试;在基本算法中涵盖了聚类、分类及其个性化推荐;在应用层,介绍了其性能测试中若干问题,重点阐述数据集的设计与分析。 后,《大数据测评》讨论了大数据的安全和隐私问题,突出介绍由于大数据所引发的新安全问题及其对策。 本书的读者对象是从事大数据或者软件测评的学者、软件工程研究人员、高校研究生、大数据产业人员。
笔者认为数据挖掘的出现,正是统计学适应这一变化的新的发展方向,数据挖掘并不是为了替代传统的统计分析技术,而是统计分析方法的延伸和扩展。本书从统计学视角研究数据挖掘,以期从统计学角度对数据挖掘理论的研究有所突破和创新,同时对统计学理论在数据挖掘方向的发展做出探索。
本书覆盖了数据仓储构建的所有主要领域,包括数据仓储的定义和环境;数据仓储的4个类型、对数据仓储的5类共15个要求;2个方法论的总结及3个构建方法。本书给出了一个高性能的参照系统结构。基于此参照系统结构,本书系统地讨论了大量设计议题、并包括21个设计建议、8个实践建议、7个设计原则、27个通用算法和技术、12个元数据驱动的通用操作符、7个工作过程、4个范式基础及范式原则。
《数据密集型计算和模型》一书涵盖了数据密集型计算的体系结构、计算模型和编程方法,内容系统全面,着重介绍原理和方法。并配以图片,便于读者理解。 《数据密集型计算和模型》一书前半部分,重点介绍了数据密集型计算的概况,及其与高性能计算和云计算的异同、应用领域以及面临的挑战问题;巨量数据时代的计算机组织体系和技术;内存计算组织体系和技术;等等。后半部分重点介绍了几个常见的计算模型,如MapReduce模型、BSP模型和Dryad模型,并综合介绍了一些专门领域的计算模型,如All-Pairs模型等。 数据密集型计算是大数据时代的标志。《数据密集型计算和模型》一书借鉴了近年来在该领域的研究成果,有一定的创新,其出版较好地弥补了市场空白。
《汇计划在行动》全面介绍了《上海市推进大数据研究与发展三年行动计划( 2013-2015 年)》的编制和实施过程。系统介绍了对大数据概念、内涵、技术和应用方面的认识,介绍了在上海信息化建设的基础和现状之上,如何让大数据在上海落地,并着力解决大数据应用过程中的关键问题,开展数据科学前瞻研究和人才培养;对三年行动计划进行了全面解读。《汇计划在行动》还介绍了“上海大数据产业技术创新战略联盟”发起、组建、运行方面的情况;介绍了“上海市数据科学重点实验室”的研究方向、管理模式和开放模式。 《汇计划在行动》可供大数据及相关产业的从业人员,以及政府相关部门的决策、管理人员参考。