教材系统地介绍文本数据挖掘的相关概念,利用Python作为工具进行相关试验,其内容主要包括:文本挖掘产生的背景及发展;文本挖掘的概念、文本模型表示、文本内容的预处理,包括分词、去停用词以及特征抽取;文本相似度的概念等。介绍文本分类的概念及常用方法,如KNN算法、SVM算法等,并对分类结果进行评价;在介绍文本聚类聚类的概念时是,同样介绍聚类常用算法,如K均值算法、层次聚类法、密度聚类法等,作为有文本分类、文本聚类的应用,*后给出了信息抽取、社会网络中的实体关系抽取和事件抽取。
如今企业数字化转型和“互联网+”已成为热门话题。那么,如何开展转型工作,让具体工作可以落到实处呢?由于数字化转型工作的复杂性,很多企业管理者感觉无从下手,市面上也十分缺乏相关的指引和资料。本书介绍的企业架构方法以及多个领先企业和行业数字化案例,可以使读者系统地掌握数字化转型的理论和落地方法,帮助企业完成生死攸关的转型变革。本书回答了“什么是数字经济,什么是数字化转型,什么是数字化转型的关键要素”等问题,并在转型方法方面介绍了数字化企业架构的业务架构、流程、组织、IT架构,详细阐述了金融、零售、医疗、物联网、AI、智能制造等方面*的商业模式和技术发展。本书打开了一扇新的数字化转型方法之门,是企业管理者、信息化从业者以及管理咨询服务机构、IT服务公司从业人员、大专院校师生很好的参考资料。
本书从数据流通的背景、基础、场景应用、市场生态体系、机制体制、趋势展望六个方面对数据流通的基础知识与实际应用进行介绍。 综合本书内容可见,第一,本书是理论与实践的结合。以数据和数字经济的基础理论为出发点,再论述数据发挥作用的途径以及具体的实践应用,有助于对数据流通问题的理解。第二,内容覆盖了数据流通的各个环节、多个行业,从技术分析到机制设计。第三,数据流通是快速发展的领域,提供了相对前沿的知识。 读者对象:期望了解数据流通和数字经济的学者、企业从业者、政府工作人员、学生等。
数据库基础 是高校非计算机专业的必修课程。本书从数据库理论到应用到实例开发,以一个案例贯穿全书,共分为两大部分,*部分由前3章组成,主要介绍数据库技术的应用与发展、关系模型的基本概念、关系数据库的设计理论及数据库设计方法等内容;第二部分以Access 2013作为开发背景,主要介绍Access 2013数据库操作、表的创建和使用、查询设计、VBA基础、窗体设计、报表设计、使用宏和系统开发实例等知识。本书适合作为高校非计算机专业本科、专科学生学习数据库基础课程的教材,也可作为Access的使用者、学习者与开发人员的参考书。
本书较系统全面地阐述了数据库系统的基础理论、基本技术和基本方法,既可以作为高等院校计算机、软件工程、信息安全、信息管理与信息系统、信息与计算科学等相关专业本科生数据库课程的教材,也可以作为电气工程相关专业研究生数据库课程及电力企业信息化教材
本书是一本从理论到实践的全面且细致的企业数据驱动指南,作者见证并献身百度大数据的建设,毫无保留地将成败摸索实践的真实场景进行完整还原,并对近十年大数据从业经验与心得做了归纳和总结,同时详解大数据本质、理念与现状,并围绕数据驱动四环节——采集、建模、分析、指标,深入浅出地讲述企业如何从零到一将完整的数据驱动方案落地,全面展示大数据在各领域内的应用情况与趋势展望。
本书立足于当前公安交通管理领域利用Hadoop技术在处理非互联网行业大数据时存在的低效问题,基于天云星数据库(SCSDB)对结构化大数据分布式并行处理技术进行了介绍。全书共7章,主要内容包括概论、天云星数据库基础、数据库对象管理、SCSDB安全管理、SCSDB备份与还原、数据库监控与调优、数据导入与导出。在介绍理论知识的同时,本书在文中还穿插了公安交通管理大数据处理应用案例。 本书适用于高校计算机科学与技术、交通信息工程及控制、智能交通技术等专业,也可供大数据、软件工程、人工智能等领域的专业技术人员参考。