随着用户对国产数据库了解的加深,信息化和工业化融合加深,用户软件知识产权保护意识和信息化成本意识的加强,国产数据库市场机遇越来越大。发展国产数据库体现了国家战略,国家自主创新、正版化和国家信息安全等政策将为国产数据库带来发展机遇。何清法、王澍丰、顾云苏、冯柯、刘峰主编的《国产神通数据库教程》帮助读者了解神通数据库,介绍数据库基础与神通数据库体系结构以及数据库管理。
本书是首本专注于利用R语言进行科研数据清洗的书籍,全书主要分为两大块,首块以简洁的内容向读者介绍R语言的入门知识,让读者了解并认识R语言,为后面的内容打下基础。全书大部分篇幅主要集中在第二块内容,即数据清洗的知识。作者从实际问题出发,详细的介绍了如何利用R语言处理科研中的数据,比如缺失值的插补,异常值的查找,长宽型数据结构的转换,时间日期数据的处理,文本数据的处理等,此外,作者也将数据清洗的内容进行了适当扩展,比如书中加入了R语言与数据库的连接方法,让大数据的处理更加得心应手。
本书介绍Web数据管理技术 ,包括:Web数据抽取(数据型页面和文档型页面的 抽取方法、基于视觉信息的抽取方法、包装器生成与 维护及实体识别),Web数据集成(查询接口集成、 模式匹配、查询转换、数据库采样、数据库大小估计 及集成系统实现),数据空间(数据空间的模型、索 引、查询及系统实现),以及Web数据管理新技术 (Web信息可信性、移动Web搜索、移动应用集成、大 规模知识库构建及社交媒体)。 本书适合作为Web数据管理的教科书,也可以作 为相关领域研究人员和开发人员的参考书。