数据建模指的是对现实世界各类数据的抽象组织,确定数据库需管辖的范围、数据的组织形式等直至转化成现实的数据库。而数据模型是构建应用系统的核心,是尽可能精准地表示业务运转的概念性框架。本书通过平实的语言,对数据模型及建模过程进行了深入浅出的介绍。全书内容分为5个部分,对数据建模简介、数据模型要素,概念、逻辑和物理数据模型、数据模型质量以及数据建模的进阶内容等方面进行讲解,全面细致地为读者解答与数据建模相关的知识点和疑问。除此之外,本书的zui后还对各类专业术语进行了细致的解释,方便读者参考。本书是一本经典的数据建模指南,非常适合对数据建模感兴趣的读者以及从事数据科学等相关工作的专业人士参考阅读。
本书从初学者易于理解的角度,以通俗易懂的语言、丰富的实例、简洁的图表、传统和现代数据特征的对比,将大数据这一计算机前沿科学如数家珍地娓娓道来。既介绍了大数据和相关的基础知识,又与具体应用有机结合起来,并借助可视化图表的画面感立体地为读者剖析了大数据的技术和原理,非常便于自学。本书内容包括大数据概论、大数据采集及预处理、大数据分析、大数据可视化、Hadoop概论、HDFS和Common概论、MapReduce概论、NoSQL技术介绍、Spark概论、云计算与大数据、大数据相关案例等内容。本书既可以作为想了解大数据技术和应用的初学者的教材,也适合作为培训中心、IT人员、企业策划和管理人员的参考书。
本书是中山大学重点学科建设成果,获中国矿物岩石地球化学协会大数据与数学地球科学专业委员会推荐,是我国*部地质科学大数据与机器学习教材。本书是中山大学研究生试用研究型教材,对运用大数据挖掘与机器学习算法解决地球科学问题大有裨益。适合地质科学领域研究生和高年级本科生做教材,也可供科研人员研究时参考。它系统地介绍了地球科学大数据挖掘与机器学习的基本框架与原理,重点分析高维数据的降维、分类与预测、大图形社区结构识别、无限流数据处理、机器学习及人工智能地质学的建模过程,对必要的应用场景,使用Python语言给出案例。
技术是把双刃剑,当我们在积极拥抱新技术的同时,也不能忽视其所带来的风险,比如当今大数据时代个人隐私和安全问题。本书是两位作者结合各自出色的专业知识和丰富的从业经验为大众倾力奉献的一本大数据时代隐私问题的普及读物。书中展示了我们在家庭和工作中的日常活动是如何成为大数据收集的一部分的。同时,列举大量的大数据应用以及安全和隐私相关案例,包括企业如何利用大数据进行营销、执法机构如何利用大数据执法等,也包括不法分子如何利用非法或合法的手段获取数据,如何利用社交网络进行犯罪。针对上述问题,本书也列出了一些工具、技巧用来检查和防范,这在当前很有现实意义。
本书围绕健康医疗大数据的理论与实践展开论述。全书共分为7章,第1章主要描述大数据的基础知识、通用技术以及技术发展趋势;第2章主要对健康医疗大数据的概念、特征、分类、主要应用技术、国内外发展现状以及应用需求进行系统阐述;第3章~第6章分别对临床大数据、精细化运营大数据、健康管理大数据以及基因检测大数据的应用实践案例进行详细论述;第7章对健康医疗大数据的未来发展趋势进行展望。本书是很多应用实例和经验的总结,案例丰富翔实,将理论与实际紧密结合,对互联网技术人员、健康医疗行业的从业人士,以及高等院校相关专业的学生均有很大帮助。
《数据库原理及应用--SQLServer2012》在全面、准确地讲述数据库原理、数据库血用技术的基础上,着重讨论数据库系统的设计原理、设计方法和开发技术。本书案例全面,配以图表和准确的代码,采用*的数据库软件SQLserver2012作为应用学习的基础,并以模拟实现ATM系统为例,详细讨论复杂数据库系统的设计与开发。后介绍数据访问技术,以人事管理系统、公交网站和物流管理系统的开发为例,分别详细介绍如何使用C#,Java、PHP语青和SOLserver数据库实现3个大型数据库系统软件。 全书共分3篇:第1篇(第l~3章)为原理篇,着重介绍数据库系统构建的历史背景、原理干¨理论基础;第2篇(第4~13章)为应用篇,着重介绍如何使用SSMS创建数据库,全面的SOL语言语法,视图、事务、触发器等高级数据库对象在SQLserver2012中的使用,以及一个复杂的数据库系统的设汁与
在新媒体时代,如果对新闻报道、网上搜索的结果或者所谓的 专家告知 不加思考地完全相信,那你就等着上当受骗吧! 本书围绕当今*受瞩目的大数据科学理论,通过日本政府公布的公开数据,集中针对访日游客的增加、舆论调查的可靠性、 安倍经济学 的成果、东日本大地震后的状况、相对贫困、失业率的下降、年轻人远离ХХ、全球变暖问题、减肥、恩格尔系数的上升等10个主题进行数据解读,帮助读者模拟体验数据读取方法,提高理解和分析数据的能力,挖掘出数据背后隐藏的真相。 作为 大数据分析 的超级入门书,即使不擅长数学、不了解统计学的人,读完本书也可以彻底掌握数据解读方法!
数据结构教程(第3版) 第3版第2次印刷
《数据密集型计算和模型》一书涵盖了数据密集型计算的体系结构、计算模型和编程方法,内容系统全面,着重介绍原理和方法。并配以图片,便于读者理解。 《数据密集型计算和模型》一书前半部分,重点介绍了数据密集型计算的概况,及其与高性能计算和云计算的异同、应用领域以及面临的挑战问题;巨量数据时代的计算机组织体系和技术;内存计算组织体系和技术;等等。后半部分重点介绍了几个常见的计算模型,如MapReduce模型、BSP模型和Dryad模型,并综合介绍了一些专门领域的计算模型,如All-Pairs模型等。 数据密集型计算是大数据时代的标志。《数据密集型计算和模型》一书借鉴了近年来在该领域的研究成果,有一定的创新,其出版较好地弥补了市场空白。
本书较系统地阐述了数据库系统的基础理论、基本技术和基本方法,并以当前流行的Microsoft SQL Server 2005作为平台,介绍了Microsoft SQL Server 2005的基础和典型应用。全书共分两部分:数据库基础和SQL Server 2005实验。第1部分为数据库基础,包括绪论、SQL Server 2005基础与环境、SQL Server 2005操作、关系数据库标准语言SQL、数据库的视图、T-SQL语言程序设计、索引与数据完整性、存储过程和触发器、数据库系统安全管理、SQL Server 2005备份恢复与导入导出、关系数据库规范化理论、数据库设计;第2部分包括9个SQL Server 2005的实验。每章都配有小结和习题。 本书重点突出、面向实用,并为教师配有教学课件,方便教学。本书适合作为高等院校计算机及相关专业数据库原理课程的教材,也可供广大技术人员及自学者参考。
本书借鉴了目前流行的认证考试教材编写的成功经验,强调理论知识以够用为度,以介绍数据库应用程序的开发技能为主线,全面、系统地介绍了关系数据库的基本原理和SQL Server 2012数据库应用系统的开发技术。全书共11章,包括:关系数据库的基本原理、SQL Server 2012基础、数据库的创建与管理、数据表的创建与管理、数据查询、视图与索引、规则与默认值、T-SQL编程、存储过程与触发器、SQL Server 2012安全管理及SQL Server 2012综合应用实例。每章以类型丰富的习题和课外实践的形式配备了大量的来自工程实践领域的应用实例。 本书可作为高职高专院校计算机及相关专业的数据库技术教材,也可供SQL Server数据库应用系统开发人员使用。
本书以目前广泛使用的sql server2008数据库管理系统作为数据库系统基本操作应用平台,全面而又系统地介绍了数据库技术基础理论、数据库系统设计方法、现代数据库系统开发应用等,还分别介绍了transact-sql编程、网络数据库系统安全、面向对象数据库技术,并行数据库系统和分布式数据库系统、数据仓库、数据挖掘等。本书第3版以sqlserver 2008作为基本操作应用环境,通过可以调用的数据库系统案例,介绍了odbc和ado等数据库访问技术。 本书内容系统全面、重点突出、新颖实用、可读性强,可作为高等学校学生系统学习和掌握现代数据库技术的教材或参考书,也可供相关技术人员参考。
这是一部从技术、流程、管理等多个维度系统讲解华为数据治理和数字化转型的著作。华为是一家超大型企业,华为的数据底座和数据治理方法支撑着华为在全球170多个国家/地区开展多业态、差异化的运营。书中凝聚了大量数据治理和数字化转型方面的有价值的经验、方法论、规范、模型、解决方案和案例,不仅能让读者即学即用,还能让读者了解华为数字化建设的历程。 全书共10章,内容从逻辑上分为四个部分。 部分(~3章) 章以非数字原生企业在数字化转型方面面临的挑战开篇,介绍了华为在数据治理和数字化转型方面的目标、愿景、蓝图和框架;第2章从企业政策和架构协同的角度,介绍了企业级的数据综合治理体系,理顺了数据与变革、运营、IT之间的协同关系,明确了数据管理的责任主体在业务;第3章详细阐述了不同类型的数据的管理方式和要点。 第二
制定多种匿名化解决方案,覆盖多种应用场景,满足对可识别性的不同要求。 解决方案跟所用数据、数据接收方和分析目标相匹配。 为数据采集模式量身定制匿名化流水线,覆盖不同业务需求。 为原始数据生成匿名化版本或用分析平台生成匿名化输出。 检查匿名数据使用的伦理问题。
本书主要介绍数据库的基本原理,并以MySQL数据库为平台,讲解关系型数据库基本原理在MySQL数据库中的应用,是数据库原理学习和MySQL数据库应用学习的基础教材。本书共16章,第1章介绍数据库基本概念;第2章介绍概念模型设计;第3章介绍逻辑模型设计;第4章介绍MySQL数据库环境;第5章介绍MySQL数据库的创建与管理;第6章介绍数据表的创建与管理;第7章介绍数据输入与维护相关的DML语句及其用法;第8章单独介绍数据查询语句及其用法;第9章介绍Sql编程基础,如MySQL常用函数、游标等;第10章介绍视图的定义与使用;第11章介绍索引的定义与使用;第12章介绍存储过程的定义与使用;第13章介绍触发器的定义与使用;第14章介绍MySQL数据库的安全管理;第15章介绍MySql高级应用分布式部署;第16章使用Java语言开发了个MySQL数据库应用案例,以此介绍Java操作MySQL数据库的
《Oracle11g数据库应用与开发》属于校企协同软件工程应用型专业实训系列丛书,是天津工业大学计算机科学与技术学院和融创软通公司教育培训部的多位教师在近12年的校企协同育人过程中的经验总结和经过不断改进后的成果。 《Oracle11g数据库应用与开发》编写背景 数据库技术是计算机科学技术中发展迅速的领域之一,也是应用广泛的技术之一。信息技术的飞速发展大大地推动了社会的进步,也逐渐改变了人们的生活、工作和学习方式。因此,数据库系统已成为计算机信息系统与应用系统的核心技术和重要基础。Oracle数据库是目前优秀的数据库之一,具有较高的市场占有率,而Oraclellg是Oracle数据库的新版本。Oraclellg为各类用户提供了完整的数据库解决方案,可以帮助用户建立自己的电子商务系统,从而增强用户对外界变化的敏捷反应能力,提升用户
本课程的教学内容主要包括聚类、关联、降维、变量选择、分类与预测、集成算法、图模型与推荐系统等。每一部分都是本课程授课的主要内容,都力求深入浅出,精讲细讲,不光讲解各种方法的过程与原理,还要加强学生对各种方法的深入理解。
本书以实例分析为主线,结合SQL Server2016,系统地阐述了数据库系统的基本原理、基本技术、基本方法及其应用。全书共11章,主要内容包括:概述、关系代数、数据完整性、SQL Server、概念模型和逻辑模型、关系规范化、数据安全、数据并发、数据恢复、数据库设计、数据仓库和大数据等。本书内容丰富、深入浅出、通俗易懂、结构严谨、注重实用,同时提供取材新颖、实用的例题和习题,便于读者巩固所学知识
本书是面对当前大数据应用、可视分析研究和应用的新形势,专门为数据科学与大数据技术、智能科学与技术、计算机、数据处理等专业本科生开设数据可视化课程而编写的一本教材。该书将教学之严谨和科研之创新有机地结合,全面诠释了大数据可视化的内涵与外延,详细介绍了大数据可视化概述、可视化的类型与模型、数据可视化基础、数据可视化的常用方法、大数据可视化的关键技术、可视化交互、大数据可视化工具、大数据可视化系统 魔镜以及大数据可视化的行业案例等内容。为了便于学习,每章都附有习题。
什么是 管理大数据 :管理大数据是指企业发展过程中不断出现和积累的,涉及战略、组织、人力资源、企业文化等专业领域的各项管理数据。众多企业的管理数据整合到一起,可以形成多生态跨产业链的垂直整合、横向共享的完整生态体系,具有 海量、人工智能 的特征。 管理大数据的优势:丰富性,管理数据覆盖行业范围广,维度丰富,数据量巨大。完整性,管理数据涵盖企业战略描述、组织信息、管理制度、企业文化、管理变革过程记录等,数据完整。连续性,管理数据记录周期长、延续性好。实效性,管理数据为组织变革提供及时有效的支撑。 出版背景:2017年3月27日, 运筹帷幄,全球共享 中源数聚管理大数据(RBD)发布会在北京中关村创业大街3W咖啡隆重举行。来自管理咨询行业、互联网领域、创投界、政商界的一百多位精英齐聚一堂,共同见证全球