数据湖仓是一个现代化的开放式架构,拥有当今热门的开源数据技术的广度和灵活性。本书从初学者的角度出发,通过对数据湖仓重要概念的剖析,对数据湖仓的相关知识进行深入浅出的讲解。全书共18章,对数据湖仓的基础知识、数据工程、业务价值、数据集成等方面进行深入探讨,同时展望数据架构的演化趋势,使读者能够领会数据湖仓的精髓,最终轻松、全面地管理数据湖仓项目。 本书适合数据架构师、业务人员和系统开发人员,以及对数据管理、数据分析感兴趣的读者阅读。
本书从初学者易于理解的角度,以通俗易懂的语言、丰富的实例、简洁的图表、传统和现代数据特征的对比,将大数据这一计算机前沿科学如数家珍地娓娓道来。既介绍了大数据和相关的基础知识,又与具体应用有机结合起来,并借助可视化图表的画面感立体地为读者剖析了大数据的技术和原理,非常便于自学。本书内容包括大数据概论、大数据采集及预处理、大数据分析、大数据可视化、Hadoop概论、HDFS和Common概论、MapReduce概论、NoSQL技术介绍、Spark概论、云计算与大数据、大数据相关案例等内容。本书既可以作为想了解大数据技术和应用的初学者的教材,也适合作为培训中心、IT人员、企业策划和管理人员的参考书。
本书是中山大学重点学科建设成果,获中国矿物岩石地球化学协会大数据与数学地球科学专业委员会推荐,是我国*部地质科学大数据与机器学习教材。本书是中山大学研究生试用研究型教材,对运用大数据挖掘与机器学习算法解决地球科学问题大有裨益。适合地质科学领域研究生和高年级本科生做教材,也可供科研人员研究时参考。它系统地介绍了地球科学大数据挖掘与机器学习的基本框架与原理,重点分析高维数据的降维、分类与预测、大图形社区结构识别、无限流数据处理、机器学习及人工智能地质学的建模过程,对必要的应用场景,使用Python语言给出案例。
技术是把双刃剑,当我们在积极拥抱新技术的同时,也不能忽视其所带来的风险,比如当今大数据时代个人隐私和安全问题。本书是两位作者结合各自出色的专业知识和丰富的从业经验为大众倾力奉献的一本大数据时代隐私问题的普及读物。书中展示了我们在家庭和工作中的日常活动是如何成为大数据收集的一部分的。同时,列举大量的大数据应用以及安全和隐私相关案例,包括企业如何利用大数据进行营销、执法机构如何利用大数据执法等,也包括不法分子如何利用非法或合法的手段获取数据,如何利用社交网络进行犯罪。针对上述问题,本书也列出了一些工具、技巧用来检查和防范,这在当前很有现实意义。
本书围绕健康医疗大数据的理论与实践展开论述。全书共分为7章,第1章主要描述大数据的基础知识、通用技术以及技术发展趋势;第2章主要对健康医疗大数据的概念、特征、分类、主要应用技术、国内外发展现状以及应用需求进行系统阐述;第3章~第6章分别对临床大数据、精细化运营大数据、健康管理大数据以及基因检测大数据的应用实践案例进行详细论述;第7章对健康医疗大数据的未来发展趋势进行展望。本书是很多应用实例和经验的总结,案例丰富翔实,将理论与实际紧密结合,对互联网技术人员、健康医疗行业的从业人士,以及高等院校相关专业的学生均有很大帮助。
在新媒体时代,如果对新闻报道、网上搜索的结果或者所谓的 专家告知 不加思考地完全相信,那你就等着上当受骗吧! 本书围绕当今*受瞩目的大数据科学理论,通过日本政府公布的公开数据,集中针对访日游客的增加、舆论调查的可靠性、 安倍经济学 的成果、东日本大地震后的状况、相对贫困、失业率的下降、年轻人远离ХХ、全球变暖问题、减肥、恩格尔系数的上升等10个主题进行数据解读,帮助读者模拟体验数据读取方法,提高理解和分析数据的能力,挖掘出数据背后隐藏的真相。 作为 大数据分析 的超级入门书,即使不擅长数学、不了解统计学的人,读完本书也可以彻底掌握数据解读方法!
《数据库系统:基础、设计及应用》系统地介绍了数据库系统的基础知识、设计方法以及应用技术,内容包括数据库系统基本概念,关系数据库基础知识,创建数据库的一般方法,SQL语言及其使用方法,数据库完整性与安全性知识,数据库应用程序设计的一般方法以及事务管理基础知识。 《数据库系统:基础、设计及应用》将知识讲解与实验指导融为一体,着重于讲解数据库系统的核心知识和常用技术,对于学习和实验过程中所涉及的语言(SQL语言等)与软件(SQLServer等)的介绍也力求准确、清晰,便于读者的学习和运用。 《数据库系统:基础、设计及应用》适用于高等院校本科生数据库课程的教学,也可供数据库爱好者或工程技术人员自学与参考。
《数据密集型计算和模型》一书涵盖了数据密集型计算的体系结构、计算模型和编程方法,内容系统全面,着重介绍原理和方法。并配以图片,便于读者理解。 《数据密集型计算和模型》一书前半部分,重点介绍了数据密集型计算的概况,及其与高性能计算和云计算的异同、应用领域以及面临的挑战问题;巨量数据时代的计算机组织体系和技术;内存计算组织体系和技术;等等。后半部分重点介绍了几个常见的计算模型,如MapReduce模型、BSP模型和Dryad模型,并综合介绍了一些专门领域的计算模型,如All-Pairs模型等。 数据密集型计算是大数据时代的标志。《数据密集型计算和模型》一书借鉴了近年来在该领域的研究成果,有一定的创新,其出版较好地弥补了市场空白。
《数据链技术及应用》是一本全面介绍数据链系统概念、原理、组成、功能、集成及作战应用的教科书。全书共分7章,围绕数据链系统这一核心概念,主要介绍了数据链系统的基本概念、组成及工作原理,详细阐述了数据链系统的信息传输、信息安全、网络管理以及数据链与平台的集成,最后介绍了数据链在作战中的应用。《数据链技术及应用》可作为军队院校通信工程和指挥信息系统工程等相关专业的本科生教材,也可作为地方高等院校国防生相关专业教材和各类军队干部培训(轮训)教材,还可以作为国防科技人员和军事爱好者的参考资料。
本书从一个Access数据库应用系统实例——学生管理系统入手,系统地介绍数据库的基本原理与Access各种主要功能的使用,主要包括数据库的基本原理和相关概念,关系数据库的基本设计方法,数据库的建立,表、查询、SQL语言、窗体、报表、页、宏的创建和应用,以及VBA程序设计。 ????本书内容全面,结构完整,深入浅出,图文并茂,通俗易懂,可读性、可操作性强,既适合作为各类高校学生学习数据库原理及应用的教材,也可作为相关领域技术人员的参考用书或培训教材。
本书分12章重点阐述了数据管理的重要性,数据管理面临的挑战,DAMA的数据管理原则,数据伦理,数据治理,数据生命周期管理的规划及设计,数据赋能和数据维护,使用和增强数据,数据保护、隐私、安全和风险管理,元数据管理,数据质量管理,以及现在应该怎么办,能够帮助企业管理层在了解和执行数据管理的过程中不致迷失在技术术语的迷宫之中。本书可供非数据专业人士、企业管理者、数据行业研究者等读者学习和参考。
《Microsoft SQL Server 2005技术内幕:查询、调整和优化》是Inside Microsoft SQL Server 2000的作者KaleDelaney的又一经典著作,是Inside Microsoft SQL Server 2005系列四本著作中的一本。书中详细介绍了如何使数据查询更加高能高效,同时使现有资源化的方法。本书还包含了大量的代码示例和表示例以帮助数据库开发人员和管理员理解复杂的逻辑并掌握查询调整和优化。通过阅读本书,数据库开发人员将能够加深对查询优化背景的理解和应用,并开发和调整优化出反应速度更快的数据库。 本书适合于专业数据库开发者、BI开发者、DBA和以SQL Server作为后台数据库的一般应用程序开发者,读者可以通过书中的实践、高级技巧和代码示例来掌握查询调整和优化的技巧,以针对不同问题开发出切合实际的高效能的方案。
《玩转TOPPER》用专业的视角和通俗的语言,介绍了驰名世界的Topper小帆船的构造特点和使用技巧。初学者通过阅读《玩转TOPPER》并进行实践练习,可以掌握基本的帆船驾驶技能,并逐步提高到参加比赛和获胜的水平。作者出身中学老师并且有近三十年的帆船教练经验,在《玩转TOPPER》中呈现了系统而深入的Topper小帆船训练方法。 《玩转TOPPER》适合青少年及成年帆船爱好者阅读,也是供帆船教练使用的一本出色的教学参考书。