《从零进阶!数据分析的统计基础(第2版)》 共 6 章,分别讲解了数据分析的步骤和方法、描述性统计分析、抽样估计、假设检验、方差分析、 相关与回归分析,使用简单的语言介绍了这些数据分析基本方法的核心思想和涉及的统计学、概率论等方面 的理论内容,并使用图示的方法详细介绍了使用 Excel 2013 进行简单的描述性统计分析和使用 SPSS 进行相 关的数据分析的过程与结果分析。
电商坐拥互联网行业最丰富的用户数据金矿,却很少有人从中挖掘出真金白银。《数据掘金——电子商务运营突围》一书旨在打破这一困境,一步一步引导从业者以数据为核心来运营网站或网店。《数据掘金——电子商务运营突围》用浅显的文字与独特的视角,不仅成功解读电商数据运营之惑,更呈现大量数据分析和挖掘的必要基础知识及实用相关工具。在通过阅读轻松掌握电商数据运营须关注的要点与方法之后,读者还可有针对性地从书中选择学习如何利用数据来完成——流量获取优化、广告投放、客户分析,以及客户价值提升等一系列电商运营要务。 《数据掘金——电子商务运营突围》一书主要写给电商从业人员,无论是中小电子商务的运营人员、数据分析人员,还是大公司负责电子商务的策略官、市场官和运营官,都能从《数据掘金——电子商务运营突围
本书介绍数据挖掘的基本理论与实践方法。主要内容包括:各种模型(决策树,关联规则、线性模型、聚类、贝叶斯网以及神经网络)以及在实践中的运用,所存任缺陷的分析。安全地清理数据集、建立以及评估模型的预测质量的方法,并且提供了一个公开的数据挖掘工作平台Weka。Weka系统拥有进行数据挖掘仟务的图形用户界面,有助于理解模型,是一个实用并且深受欢迎的工具。 本书逻辑严密、内容翔实、极富实践性,适合作为高等学校本科生或研究生的教材,也可供相关技术人员参考。
随着数据集规模和复杂度的持续上升,分析员必须利用更的软件工具来执行间接的、自动的智能化数据分析。《数据挖掘:概念、模型、方法和算法(第2版)》介绍了通过分析高维数据空间中的海量原始数据来提取用于决策的新信息的尖端技术和方法。 《数据挖掘:概念、模型、方法和算法(第2版)》开篇阐述数据挖掘原理,此后在示例的引导下详细讲解起源于统计学、机器学习、神经网络、模糊逻辑和演化计算等学科的具有代表性的、的挖掘方法和算法。本书还着重描述如何恰当地选择方法和数据分析软件并合理地调整参数。每章末尾附有复习题。 《数据挖掘:概念、模型、方法和算法(第2版)》主要用作计算机科学、计算机工程和计算机信息系统专业的研究生数据挖掘教材,高年级本科生或具备同等教育背景的读者也完全可以理解本书的所有主题。
《SQL即查即用》从实用角度出发,由浅入深地讲解了SQL的基本概念、常用语法和操作技术。全书共24章,包括数据的简单查询、条件查询、模糊查询、过滤数据以及数据排序、分组、统计等内容,还包括子查询、多表连接、数据的增删改查、视图、存储过程、游标、事务处理以及数据库和数据表的管理等技术。包括200多个SQL语法,200多个应用示例。有很强的实用性和可操作性,既适合作为SQL初学者的学习用书,又适合作为程序开发人员和数据库管理人员随时查阅的参考工具书。 为便于读者对SQL语法的理解,书中所有知识点和语法都结合具体示例进行讲解,并以对比图方式鲜明直观地展示数据变化,帮助读者快速掌握实际操作技巧,学以致用。书中还设置了注意、说明、常见错误、多学两招等贴心栏目,及时指出注意事项并给出相应的解决方案,帮助读者避开学习陷
社交网站数据如同深埋地下的“金矿”,如何利用这些数据来发现哪些人正通过社交媒介进行联系?他们正在谈论什么?或者他们在哪儿? 《社交网站的数据挖掘与分析(原书第2版)》第2版对上一版内容进行了全面更新和修订,它将揭示回答这些问题的方法与技巧。你将学到如何获取、分析和汇总散落于社交网站(包括Facebook、Twitter、LinkedIn、Google+、 GitHub、邮件、网站和博客等)的数据,以及如何通过可视化找到你一直在社交世界中寻找的内容和你闻所未闻的有用信息。 ■ 借助IPython Notebook、自然语言工具包、NetworkX和其他科学计算工具挖掘主流社交网站 ■ 使用文本挖掘技术(如聚类和TF-IDF)来提取人类语言数据中有价值的知识 ■ 通过发现GitHub上人、编程语言和代码工程间的亲密性,构建兴趣图谱 ■ 利用D3.js进行交互式可视化,充分发
本书是一本从理论到实践的全面且细致的企业数据驱动指南,作者见证并献身百度大数据的建设,毫无保留地将成败摸索实践的真实场景进行完整还原,并对近十年大数据从业经验与心得做了归纳和总结,同时详解大数据本质、理念与现状,并围绕数据驱动四环节——采集、建模、分析、指标,深入浅出地讲述企业如何从零到一将完整的数据驱动方案落地,全面展示大数据在各领域内的应用情况与趋势展望。
大数据的统计计算是进行数据探索和分析挖掘的基础,在实际应用中会遇到两个问题:一个是需要使用多少资源;另一个是计算时间,它关系到数据探索分析的效率和效果。人们都希望花更少的钱,并且希望计算时间更短,但对于某个确定的计算过程,它们是成反比的。《重构大数据统计》作者就是从统计计算的算法入手,重构其计算过程,从而同时降低资源使用量和计算时间。《重构大数据统计》提出了一套完整的关于大数据统计的计算理论,包括常用的各种统计量和统计方法。基于《重构大数据统计》内容开发的数据分析工具已经在集团内部的多个部门使用,并取得显著效果。另外,《重构大数据统计》还提供大量的示例程序代码帮助读者进一步了解算法细节,便于将书中的方法运用于实际计算。 《重构大数据统计》适合对大数据分析感兴趣的读者阅读,
本书分13章,分别从企业大数据战略定位、企业大数据落地实施和价值评估,以及大数据的变革与挑战这三大方面进行撰写,宏观上涵盖了企业战略决策和定位,微观上涵盖了大数据职能、思路、方法、流程、开发、应用、评估的整个环节。企业大数据的知识完整性也是本书的特色之一。
本书共分5章,涉及数据仓库的基本概念、定义及主要特点;根据数据仓库的基础技术和结构概念,采用从元数据、多维数据结构、联机分析处理、数据挖掘、数据仓库的基础部件到联机和成品分析报告一条龙的方法,描述了数据仓库设计与开发生命周期的各个阶段以及相应的技术结构框架;另外,还提供了大量的应用实例,如支票信用认可网络系统、某飞机制造公司单源生产数据、汽车销售管理网络系统等多个工程开发的成功案例;同时,本书还介绍了数据仓库开发过程和策略,主要有跳跃(蛙跳)式发展、数据仓库系统多层次的结构平台——内核与外壳、数据仓库应用开发的要点与特征、数据仓库设计、质量保障、任务、资源、团队、技能等基本内容;,通过一系列程序实例,讲解了数据仓库设计与应用开发的建立过程,以及SQL程序在Oracle 9i和SQL Server 分析服务
《数据库系统概念(原书第6版)》是经典的数据库系统教科书《Database System Concepts》的新修订版,全面介绍数据库系统的各种知识,透彻阐释数据库管理的基本概念。本书内容丰富,不仅讨论了关系数据模型和关系语言、数据库设计过程、关系数据库理论、数据库应用设计和开发、数据存储结构、数据存取技术、查询优化方法、事务处理系统和并发控制、故障恢复技术、数据仓库和数据挖掘,而且对性能调整、性能评测标准、数据库应用测试和标准化、空间和地理数据、时间数据、多媒体数据、移动和个人数据库管理以及事务处理监控器、事务工作流、电子商务、高性能事务系统、实时事务系统和持续长时间的事务等应用主题进行了广泛讨论。 《数据库系统概念(原书第6版)》既可作为高年级本科生或低年级研究生的数据库课程教材,也可供数据库领域的技
本书提供了一种简单、高效、通用的关系型数据库索引设计方法。作者通过系统的讲解及大量的案例清晰地阐释了关系型数据库的访问路径选择原理,以及表和索引的扫描方式,详尽地讲解了如何快速地估算SQL运行的CPU时间及执行时间,帮助读者从原理上理解SQL、表及索引结构、访问方式等对关系型数据库造成的影响,并能够运用量化的方法进行判断和优化,指导关系型数据库的索引设计。
本书是国家精品课程“数据结构”的研究成果之一,是面向21世纪课程教材和普通高等教育“十一五”规划教材。本书系统介绍了数据结构的概念、原理与技术,主要内容包括绪论,基本数据结构,排序、查找与内存管理,相关工具和文件等。其中,章绪论主要对算法描述语言(ADL)、算法书写规范、数据结构与算法基本概念、算法分析基础和算法正确性证明等进行了介绍;第二至五章是基本数据结构部分,主要涉及线性表、堆栈和队列,数组和字符串,树与二叉树,图结构等内容;第七至九章从算法的视角讨论了排序、查找和内存管理等方面的内容,给出了若干典型算法的描述、时间复杂性分析和相关算法的比较等;第六章和十一章分别对递归和随机数两种主要工具进行了讲解,其中随机数是数据结构的新内容;文件这种复杂的数据结构则在第十章中阐明。本书
本书是ERP理论与实践结合的一部著作。本书的特点就是源于实践,国有大型企业集团先进管理系统ERP和供应链管理系统咨询的经验体会是形成本书的基础。全书共分6章。章和第2章分别对新型工业化道路的实施、管理变革的必要性以及在管理变革中所需要的各种先进管理思想和技术进行了阐述;第3章和第4章通过理论结合实际的方法介绍了大型制造企业ERP系统构建的基本框架以及ERP项目实施的过程与步骤;第5章讨论分析了ERP系统应用的评价与推进;第6章进行了总结。 本书可作为高等学校管理科学与工程、工商管理、企业管理、信息管理以及系统工程等专业的本科生教材,也适合研究生阅读;还可供企业信息化建设的技术人员和管理人员阅读参考。