本书是中山大学重点学科建设成果,获中国矿物岩石地球化学协会大数据与数学地球科学专业委员会推荐,是我国*部地质科学大数据与机器学习教材。本书是中山大学研究生试用研究型教材,对运用大数据挖掘与机器学习算法解决地球科学问题大有裨益。适合地质科学领域研究生和高年级本科生做教材,也可供科研人员研究时参考。它系统地介绍了地球科学大数据挖掘与机器学习的基本框架与原理,重点分析高维数据的降维、分类与预测、大图形社区结构识别、无限流数据处理、机器学习及人工智能地质学的建模过程,对必要的应用场景,使用Python语言给出案例。
数据建模指的是对现实世界各类数据的抽象组织,确定数据库需管辖的范围、数据的组织形式等直至转化成现实的数据库。而数据模型是构建应用系统的核心,是尽可能精准地表示业务运转的概念性框架。本书通过平实的语言,对数据模型及建模过程进行了深入浅出的介绍。全书内容分为5个部分,对数据建模简介、数据模型要素,概念、逻辑和物理数据模型、数据模型质量以及数据建模的进阶内容等方面进行讲解,全面细致地为读者解答与数据建模相关的知识点和疑问。除此之外,本书的zui后还对各类专业术语进行了细致的解释,方便读者参考。本书是一本经典的数据建模指南,非常适合对数据建模感兴趣的读者以及从事数据科学等相关工作的专业人士参考阅读。
技术是把双刃剑,当我们在积极拥抱新技术的同时,也不能忽视其所带来的风险,比如当今大数据时代个人隐私和安全问题。本书是两位作者结合各自出色的专业知识和丰富的从业经验为大众倾力奉献的一本大数据时代隐私问题的普及读物。书中展示了我们在家庭和工作中的日常活动是如何成为大数据收集的一部分的。同时,列举大量的大数据应用以及安全和隐私相关案例,包括企业如何利用大数据进行营销、执法机构如何利用大数据执法等,也包括不法分子如何利用非法或合法的手段获取数据,如何利用社交网络进行犯罪。针对上述问题,本书也列出了一些工具、技巧用来检查和防范,这在当前很有现实意义。
在新媒体时代,如果对新闻报道、网上搜索的结果或者所谓的 专家告知 不加思考地完全相信,那你就等着上当受骗吧! 本书围绕当今*受瞩目的大数据科学理论,通过日本政府公布的公开数据,集中针对访日游客的增加、舆论调查的可靠性、 安倍经济学 的成果、东日本大地震后的状况、相对贫困、失业率的下降、年轻人远离ХХ、全球变暖问题、减肥、恩格尔系数的上升等10个主题进行数据解读,帮助读者模拟体验数据读取方法,提高理解和分析数据的能力,挖掘出数据背后隐藏的真相。 作为 大数据分析 的超级入门书,即使不擅长数学、不了解统计学的人,读完本书也可以彻底掌握数据解读方法!
基于国家973和863相关项目成果,采用汤森路透德温特世界专利创新索引数据库作为统计数据来源,对信息存储领域的专利文献进行检索分析,从存储器件、设备、系统等层面,选取了目前信息存储领域中的多项重要技术,利用专利统计分析的方法对其发展态势进行了研究,特别是对信息存储领域相关专利进行宏观统计分析以及核心专利的具体分析,可以全方位了解信息存储技术的发展历程、专利的国家或地区分布、重要专利权人的竞争态势,为制定相关战略提供决策参考。同时结合华为、中兴、联想、浪潮、IBM、EMC、三星、美光等国内外知名企业的实际案例,从中国本土和全球的布局两个角度分别分析了专利产出、主要竞争者、热点技术和研发重点以及竞争态势,力求找到信息存储技术专利申请对技术产业化与企业发展的作用,供信息存储研发人员、专利工作者和
《数据密集型计算和模型》一书涵盖了数据密集型计算的体系结构、计算模型和编程方法,内容系统全面,着重介绍原理和方法。并配以图片,便于读者理解。 《数据密集型计算和模型》一书前半部分,重点介绍了数据密集型计算的概况,及其与高性能计算和云计算的异同、应用领域以及面临的挑战问题;巨量数据时代的计算机组织体系和技术;内存计算组织体系和技术;等等。后半部分重点介绍了几个常见的计算模型,如MapReduce模型、BSP模型和Dryad模型,并综合介绍了一些专门领域的计算模型,如All-Pairs模型等。 数据密集型计算是大数据时代的标志。《数据密集型计算和模型》一书借鉴了近年来在该领域的研究成果,有一定的创新,其出版较好地弥补了市场空白。
SQL 是计算机世界的语言,在用关系数据库开发报表时,将数据放入数据库以及从数据库中取出来,都需要SQL 的知识。很多人以一种马马虎虎的态度在使用SQL,根本没有意识到自己掌握着多么强大的武器。本书的目的是打开读者的视野,看看SQL 究竟能干什么,以改变这种状况。 本书是一本指南,其中包含了一系列SQL 的常用问题以及它们的解决方案,希望能对读者的日常工作有所帮助。本书将相关主题的小节归成章,如果读者遇到不能解决的SQL 新问题,可以先找到最可能适用的章,浏览其中各小节的标题,希望读者能从中找到解决方案,至少可以找到点灵感。 在这本书中有150 多个小节,这还仅仅是SQL 所能做的事情的一鳞半爪。解决日常编程问题的解决方案的数量仅取决于需要解决的问题的数量,本书没有覆盖所有问题,事实上也不可能覆盖;然而从中可以
《城市发展的数据逻辑》通过对城市空间数据和非空间数据(如地形数据、建筑物数据、城市环境数据等)反映城市发展现状和历史的数据进行分析、挖掘,论述城市发展的规律和内在逻辑,为城市发展提供了重要的分析工具和科学依据。 《城市发展的数据逻辑》系统、全面地介绍了与城市发展有关的各种空间数据。在此基础上介绍了国内外对城市生产的研究现状,总结了目前国内外城市大数据研究的形成和发展、城市生长模型及其新方法,并借助一些典型案例,介绍应用城市生长技术的流程与方法。《城市发展的数据逻辑》还介绍了GIS、RS、GPS等新技术在城市发展及城市规划中的应用,以及如何使用新的信息技术方法揭示城市发展过程中诸如道路交通、城市建筑、公共设施等城市因子与城市发展的内生联系。 《城市发展的数据逻辑》的读者对象是城市发展领域
本书以笔者多年积累的实际经验分析数据库管理员的工作职责。详细介绍Oracle数据库的运作原理与组成架构;针对常用的“基本对象”及延伸应用的“高可用性对象”提供详尽说明;详解Oracle数据库的安装、建置,以及安全认证方式;深入剖析Oracle的网络联机架构与设定,包含各类“网络服务组态文件”;详细介绍Oracle数据库的备份与恢复,并列举多项功能强大的复原管理工具;针对数据库、实体结构与Instance讲解效能调校的重要性,并以实例示范;解析Oracle Statspack及Oracle Optimizer;完整说明索引与SQL语法的有效运用。 本书适合数据库开发人员参考学习,也可作为高等院校相关师生的参考书。
《大数据测评》一书介绍了大数据的概念和特征,各国大数据发展的战略、发展趋势及其标准化情况,以及对于软件测试带来的挑战。 在此基础上,《大数据测评》在面向大数据处理框架、大数据基础算法、应用系统、系统安全和隐私泄露的测评技术 等方面展开了分析和讨论。以Hadoop为主线开展大数据测试的探讨。在底层支撑框架层聚焦于单元测试和框架基准测试;在基本算法中涵盖了聚类、分类及其个性化推荐;在应用层,介绍了其性能测试中若干问题,重点阐述数据集的设计与分析。 后,《大数据测评》讨论了大数据的安全和隐私问题,突出介绍由于大数据所引发的新安全问题及其对策。 本书的读者对象是从事大数据或者软件测评的学者、软件工程研究人员、高校研究生、大数据产业人员。
《新编计算机专业重点课程辅导丛书:新编数据结构习题与解析》作者长期从事程序设计语言和数据结构课程的基础教学工作,《新编计算机专业重点课程辅导丛书:新编数据结构习题与解析》是在总结这些教学经验的基础上编写而成,全书分为12章,包括绪论、线性表、栈和队列、串、数组和稀疏矩阵、递归、树形结构、广义表、查找、内排序、外排序、文件,最后的两个附录给出几份试题和参考答案。 《新编计算机专业重点课程辅导丛书:新编数据结构习题与解析》强调数据结构中逻辑结构、存储结构和算法设计的层次思想,总结知识难点的求解方法,力求归纳各类算法设计的规律,并深人讨论递归算法的设计方法。 书中提供了大量例题,适合作为课程考试和研究生考试辅导用书,任课教师可以将其作为教学参考书使用,对于计算机专业的本科学生,
信息不对称,是引起人类困局的根源所在,这也是人类千年难以破解的难题。物理世界中,由于时空的限制,人类无法获得有效的数据信息,因此,信息不对称的人类困局无法获得根本性解决。 技术的进步,物理世界中所产生大量数据突然呈现在我们面前,我们面对海量数据感觉惶惶然和蠢蠢然的同时,物理世界、网络世界、数据世界等三个并行的 多维世界 已经悄然构建起来,如何思维和行为,取决于我们处于哪个世界。 数据乃至大数据并不是一个新鲜的事物,只不过信息技术让其更加清晰的展现并实际走入和影响我们每个人的生活罢了,只要你洞悉大势,只要你亲昵数据,只要你拥有大数据的灵魂 相关性思维,你也可以成为数据领袖。
《汇计划在行动》全面介绍了《上海市推进大数据研究与发展三年行动计划( 2013-2015 年)》的编制和实施过程。系统介绍了对大数据概念、内涵、技术和应用方面的认识,介绍了在上海信息化建设的基础和现状之上,如何让大数据在上海落地,并着力解决大数据应用过程中的关键问题,开展数据科学前瞻研究和人才培养;对三年行动计划进行了全面解读。《汇计划在行动》还介绍了“上海大数据产业技术创新战略联盟”发起、组建、运行方面的情况;介绍了“上海市数据科学重点实验室”的研究方向、管理模式和开放模式。 《汇计划在行动》可供大数据及相关产业的从业人员,以及政府相关部门的决策、管理人员参考。
本书主要介绍数据库的基本原理,并以MySQL数据库为平台,讲解关系型数据库基本原理在MySQL数据库中的应用,是数据库原理学习和MySQL数据库应用学习的基础教材。本书共16章,第1章介绍数据库基本概念;第2章介绍概念模型设计;第3章介绍逻辑模型设计;第4章介绍MySQL数据库环境;第5章介绍MySQL数据库的创建与管理;第6章介绍数据表的创建与管理;第7章介绍数据输入与维护相关的DML语句及其用法;第8章单独介绍数据查询语句及其用法;第9章介绍Sql编程基础,如MySQL常用函数、游标等;第10章介绍视图的定义与使用;第11章介绍索引的定义与使用;第12章介绍存储过程的定义与使用;第13章介绍触发器的定义与使用;第14章介绍MySQL数据库的安全管理;第15章介绍MySql高级应用分布式部署;第16章使用Java语言开发了个MySQL数据库应用案例,以此介绍Java操作MySQL数据库的
制定多种匿名化解决方案,覆盖多种应用场景,满足对可识别性的不同要求。 解决方案跟所用数据、数据接收方和分析目标相匹配。 为数据采集模式量身定制匿名化流水线,覆盖不同业务需求。 为原始数据生成匿名化版本或用分析平台生成匿名化输出。 检查匿名数据使用的伦理问题。
朱景德、余蝶琼主编的《SQL Server2012数据 库实训教程(计算机类专业人才培养内涵建设项目系 列教材)》从导入Access数据库和Excel数据信息开始 实训,降低学习门槛,同时结合实际需求开展后续相 关实训。书中以导入的图书馆数据库和提供的证券交 易数据库为主要训练内容,不断拓展读者的思路,引 导其向企业进销存数据库应用迁移,特别是对证券交 易数据库配备了网上应用环境,可以使读者在学习数 据库时通过证券交易的模拟操练了解相关的业务需求 ,激发读者对数据库操作和管理的欲望,促进其尽快 进入角色。 本书共分12个项目对SQL,Server 2012数据库 进行实训,每个项目*后均配备实训任务、拓展任务 、项目小结和课外练习。侧重于为读者求职数据库管 理员或者网络和数据兼管的管理员提供一定的指导, 在数据库的建立、数据的备份恢复、数据库用户和
本书以实例分析为主线,结合SQL Server2016,系统地阐述了数据库系统的基本原理、基本技术、基本方法及其应用。全书共11章,主要内容包括:概述、关系代数、数据完整性、SQL Server、概念模型和逻辑模型、关系规范化、数据安全、数据并发、数据恢复、数据库设计、数据仓库和大数据等。本书内容丰富、深入浅出、通俗易懂、结构严谨、注重实用,同时提供取材新颖、实用的例题和习题,便于读者巩固所学知识
《金融数据挖掘:基于大数据视角的展望》结构分为五个篇章。*篇介绍了数据挖掘方法。第二篇是银行数据挖掘篇,介绍了基于神经网络和支持向量机的信用评分方法。第三篇是证券数据挖掘篇,探讨了基于多种数据挖掘方法的股票价格预测、金融市场价格预测及股票自动交易系统。第四篇是保险及其他数据挖掘篇,研究了基于数据挖掘的保险欺诈监测、企业破产预测、财务报表欺诈监测等问题。第五篇从大数据的视角对金融数据挖掘进行了扩展和展望。 《金融数据挖掘:基于大数据视角的展望》的读者可以是对数据挖掘算法感兴趣的计算机专业人士或是对金融信息挖掘感兴趣的领域专家,也可作为金融信息工程方向的工程硕士教材或参考书。