《Web数据管理:概念与技术》介绍Web数据管理技术,包括:Web数据抽取(数据型页面和文档型页面的抽取方法、基于视觉信息的抽取方法、包装器生成与维护及实体识别),Web数据集成(查询接口集成、模式匹配、查询转换、数据库采样、数据库大小估计及集成系统实现),数据空间(数据空间的模型、索引、查询及系统实现),以及Web数据管理新技术(Web信息可信性、移动Web搜索、移动应用集成、大规模知识库构建及社交媒体)。
本书介绍Web数据管理技术 ,包括:Web数据抽取(数据型页面和文档型页面的 抽取方法、基于视觉信息的抽取方法、包装器生成与 维护及实体识别),Web数据集成(查询接口集成、 模式匹配、查询转换、数据库采样、数据库大小估计 及集成系统实现),数据空间(数据空间的模型、索 引、查询及系统实现),以及Web数据管理新技术 (Web信息可信性、移动Web搜索、移动应用集成、大 规模知识库构建及社交媒体)。 本书适合作为Web数据管理的教科书,也可以作 为相关领域研究人员和开发人员的参考书。
“入门很简单丛书”是由清华出版社精心打造的一套编程入门图书。丛书强调“零门槛学编程,看得懂,学得会,容易上手”的理念。目前已经出版了十几个品种,涵盖常见编程语言和技术。丛书中的每一本都由经验丰富的编程老手精心编写,讲解细腻,易学好用,视频教学,深受读者喜爱,居于同类图书的前列,是近年来不可多得的编程图书。可以说,这套丛书是编程新手上手的读物!本书从初学者的角度出发,由浅入深,循序渐进地介绍了MariaDB数据库应用与开发的相关知识。书中提供了大量的MariaDB数据库操作示例,还提供了丰富的实例和上机实践内容,供读者演练。本书共22章,分为5篇。篇介绍数据库的基础知识、在Windows平台下安装MariaDB数据库、在Linux平台下安装MariaDB数据库;第2篇介绍MariaDB数据类型、创建和删除数据库、数据库存储引擎、创建表、修改表
《Web数据管理:概念与技术》介绍Web数据管理技术,包括:Web数据抽取(数据型页面和文档型页面的抽取方法、基于视觉信息的抽取方法、包装器生成与维护及实体识别),Web数据集成(查询接口集成、模式匹配、查询转换、数据库采样、数据库大小估计及集成系统实现),数据空间(数据空间的模型、索引、查询及系统实现),以及Web数据管理新技术(Web信息可信性、移动Web搜索、移动应用集成、大规模知识库构建及社交媒体)。
阿里巴巴云上数据中台正服务着阿里生态中的数十个业务板块、百余家公司、千万级客户,在帮助决策层看清甚至决定业态走向的同时,在上万个业务场景中应用并催生创新。 本书基于作者在阿里巴巴的十年大数据从业经历,精彩演绎云上数据中台之道。全书基于大数据探索的大趋势,讲述阿里巴巴云上数据中台顶层设计,再以实际案例详述阿里巴巴云上数据中台建设及其业务模式的形成过程,总结云上数据中台沉淀的独特价值,并开诚布公地分享阿里巴巴以赋能为本质的大数据战略。 作者希望通过一名老数据人发自肺腑的分享,帮助尽可能多的有志于大数据构建、应用与创新者,构建自己的云上数据中台,从而拥有既“准”且“快”的“全”“统”“通”的智能大数据体系,以驱动各类业务数据化与数据业务化创新!
《Spark大数据商业实战三部曲:内核解密|商业案例|性能调优》基于Spark 2.2.X,以Spark商业案例实战和Spark在生产环境下几乎所有类型的性能调优为核心,以Spark内核解密为基石,分为上篇、中篇、下篇,对企业生产环境下的Spark商业案例与性能调优抽丝剥茧地进行剖析。上篇基于Spark源码,从一个动手实战案例入手,循序渐进地全面解析了Spark 2.2新特性及Spark内核源码;中篇选取Spark开发中拥有有代表的经典学习案例,深入浅出地介绍,在案例中综合应用Spark的大数据技术;下篇性能调优内容基本接近覆盖了Spark在生产环境下的所有调优技术。
阿里巴巴云上数据中台正服务着阿里生态中的数十个业务板块、百余家公司、千万级客户,在帮助决策层看清甚至决定业态走向的同时,在上万个业务场景中应用并催生创新。 本书基于作者在阿里巴巴的十年大数据从业经历,精彩演绎云上数据中台之道。全书基于大数据探索的大趋势,讲述阿里巴巴云上数据中台顶层设计,再以实际案例详述阿里巴巴云上数据中台建设及其业务模式的形成过程,总结云上数据中台沉淀的独特价值,并开诚布公地分享阿里巴巴以赋能为本质的大数据战略。 作者希望通过一名老数据人发自肺腑的分享,帮助尽可能多的有志于大数据构建、应用与创新者,构建自己的云上数据中台,从而拥有既“准”且“快”的“全”“统”“通”的智能大数据体系,以驱动各类业务数据化与数据业务化创新!