本书是为广大数据分析师量身定制的入门读物,它旨在帮助读者站在大数据时代的制高点。数据分析处于统计学、计算机信息科学、运筹学、数据库等多个领域的交叉地带,大数据时代的到来大大丰富了数据分析的内涵,数据分析师的职责与以往相比发生了巨大的改变。本书全面介绍了经典数据分析、模式识别、机器学习、深度学习、数据挖掘、商务智能等多个领域的数据分析算法,将大数据时代的数据分析热点技术一网打尽。本书为每个数据分析算法都搭配了一个经典案例,并按照由易到难的原则构建知识框架,充分照顾了不同水平读者的阅读习惯。通过阅读本书,读者将对大数据时代下的数据分析有一个全面的认识。无论是入门级的数据分析员还是有一定基础的数据分析师,都能通过本书完善、加深对数据分析的认识。
本书是中山大学重点学科建设成果,获中国矿物岩石地球化学协会大数据与数学地球科学专业委员会推荐,是我国*部地质科学大数据与机器学习教材。本书是中山大学研究生试用研究型教材,对运用大数据挖掘与机器学习算法解决地球科学问题大有裨益。适合地质科学领域研究生和高年级本科生做教材,也可供科研人员研究时参考。它系统地介绍了地球科学大数据挖掘与机器学习的基本框架与原理,重点分析高维数据的降维、分类与预测、大图形社区结构识别、无限流数据处理、机器学习及人工智能地质学的建模过程,对必要的应用场景,使用Python语言给出案例。
在新媒体时代,如果对新闻报道、网上搜索的结果或者所谓的 专家告知 不加思考地完全相信,那你就等着上当受骗吧! 本书围绕当今*受瞩目的大数据科学理论,通过日本政府公布的公开数据,集中针对访日游客的增加、舆论调查的可靠性、 安倍经济学 的成果、东日本大地震后的状况、相对贫困、失业率的下降、年轻人远离ХХ、全球变暖问题、减肥、恩格尔系数的上升等10个主题进行数据解读,帮助读者模拟体验数据读取方法,提高理解和分析数据的能力,挖掘出数据背后隐藏的真相。 作为 大数据分析 的超级入门书,即使不擅长数学、不了解统计学的人,读完本书也可以彻底掌握数据解读方法!
《MySQL从入门到精通》从初学者角度出发,通过通俗易懂的语言以及丰富多彩的实例,详细介绍了MySQL开发应该掌握的各方面技术。《MySQL从入门到精通》共分为4篇23章,包括数据库基础,初识MySQL,使用MySQL图形化管理工具,数据库操作,存储引擎及数据类型,操作数据表,MySQL基础,表数据的增、删、改操作,数据查询,常用函数,索引,视图,数据完整性约束,存储过程与存储函数,触发器,事务的应用,事件,备份与恢复,MySQL性能优化,权限管理及安全控制,PHP管理MySQL数据库中的数据,Apache+PHP+MySQL实现网上社区,Struts 2+Spring+Hibernate+ MySQL实现网络商城等内容。所有知识都结合具体实例进行介绍,涉及的程序代码也给出了详细的注释,可以使读者轻松领会MySQL的精髓,快速提高开发技能。 《MySQL从入门到精通》内容详尽,实例丰富,非常适合作为编程初学
对于各种满载私人信息的大体量数据集的生成和使用,你的组织的政策规范是什么?《大数据伦理:平衡风险与创新》考察了由大数据现象所引发的各种伦理问题,并解释了为什么各个单位需要重新思考涉及隐私和身份问题的商业决策。作者科德·戴维斯和道格·帕特森给出了各种方法和技术来帮助你的企业深入自身当前的数据实务,开展一种透明而富有成效的伦理调查。掌握数据如何被处理,对于个人和组织都属于合法具有的利益。你对数据的使用情况能够直接影响品牌质量和收益,就像在塔吉特、苹果、奈飞,以及其他数十家大公司身上印证出的那样。通过这《大数据伦理:平衡风险与创新》,你将学会如何使你的行为统一于明晰的公司价值观,如何赢得客户、合作伙伴和利益相关者的信任。
基于国家973和863相关项目成果,采用汤森路透德温特世界专利创新索引数据库作为统计数据来源,对信息存储领域的专利文献进行检索分析,从存储器件、设备、系统等层面,选取了目前信息存储领域中的多项重要技术,利用专利统计分析的方法对其发展态势进行了研究,特别是对信息存储领域相关专利进行宏观统计分析以及核心专利的具体分析,可以全方位了解信息存储技术的发展历程、专利的国家或地区分布、重要专利权人的竞争态势,为制定相关战略提供决策参考。同时结合华为、中兴、联想、浪潮、IBM、EMC、三星、美光等国内外知名企业的实际案例,从中国本土和全球的布局两个角度分别分析了专利产出、主要竞争者、热点技术和研发重点以及竞争态势,力求找到信息存储技术专利申请对技术产业化与企业发展的作用,供信息存储研发人员、专利工作者和
《数据挖掘概念与技术》(英文版)(第2版)版曾被KDnuggets的读者评选为欢迎的数据挖掘专著,是一本可读性的教材。它从数据库角度全面系统地介绍了数据挖掘的基本概念、基本方法和基本技术以及数据挖掘的技术研究进展,重点关注其可行性、有用性、有效性和可伸缩性问题。但是,自版出版之后,数据挖掘领域的研究又取得了很大的进展,开发出了新的数据挖掘方法、系统和应用。第2版在这一方面进行了加强,增加了多个章节讲述的数据挖掘方法,以便能够挖掘出复杂类型的数据,包括流数据、序列数据、图结构数据、社群网络数据和多重关系数据。 《数据挖掘概念与技术》(英文版)(第2版)主要特点 全面实用地论述了从实际业务数据中抽取出的读者需要知道的概念和技术。 更新并结合了来自读者的反馈、数据挖掘领域的技术变化以及统计和机器学习
当今,放限 ,有太多的民众经历过身份被盗,电信、网络诈骗犯罪时有耳闻,与此同时,社交媒体微信、微博、QQ空间中不时晒出大量照片和行踪,似乎所有人都末意识到隐私问题。 不法分子何以实施这些犯罪?我们如何防范于末然、保护自己和家人?《大数据时代的隐私》是两位美国 网络安全专家 ·M·佩顿、西奥多·克莱普尔为大众倾力奉献的—本大数据时代隐私安全读本。书中列举了大量的大数据应用以及安全和隐私相关案例,包括企业如何利用大数据进行营销、执法机构如何利用大数据执法等,也包括不法分子如何利用非法或合法的手段获取数据,如何利用社交网络进行犯罪。同时,每章还提出了一些有针对性的工具、技巧用来检查和防范。看完本书,相信你会对隐私和安全有新的认识。
“数据结构与算法”是一门重要的基础理论课程。它不但是计算机科学技术专业的核心课,同时已经成为理工类学生的一门必修课。本书运用面向对象的方法和C 语言讲述数据结构与算法中的基本理论,并从抽象数据类型ADT的设计、表示和实现,C 支持数据抽象、过程抽象、支持类属数据结构的手段统一描述各种数据结构与算法,使得各种常用的数据结构,如堆栈、队列、各种线性表、树、图、排序、查找、队列、队列更加条理和系统化。除此之外,本书从面向对象的角度讨论了算法设计的基本方法,做到了从面向对象和面向过程两个方面,在基本理论和基本技能上对学生进行强化训练。在本书最后一章,从应用的角度讨论了标准模板库STL,把的支持数据结构与算法的手段介绍给读者。 本书内容丰富、深入浅出,适合于计算机类、电类、信息类、数学类、自动
改变命运的不只是努力,比努力更重要的是决策。过去的决策决定了现状,正在做的决策注定将影响未来。如何汲取前人的预测和决策智慧?利用大数据技术提高决策质量和效率?本书围绕上述问题,介绍决策与生活和工作的关系、决策的历史渊源、传统文化中的决策智慧,阐述现代决策理论与基本过程、如何提高决策质量和效率,探索大数据时代的预测与决策。本书不是“决策操作手册”,而尝试为各类组织机构的管理者、涉及数据技术的科技工作者和具有传统文化基础的普通读者提供可资借鉴的智慧。