本书围绕大语言模型构建的四个阶段:预训练、指令微调、奖励建模和强化学习,详述各阶段所使用的算法、数据、难点及实践经验。在此基础上,进一步探讨了增强大语言模型能力、提升效率及如何将大语言模型落地应用的实践经验,涵盖多模态、智能体等热门方向,全面展现了大语言模型研究的近期新进展。本书适合对深入研究大语言模型内在机制和实现方法感兴趣的读者阅读,也可作为高年级本科生和研究生自然语言处理课程中相关部分的补充教材。
摩尔定律快要走到尽头,但计算革命不会终止。更好的软件编程、3D芯片和量子计算等方法应运而生,其中云计算将成为业界应对摩尔定律消亡的很好手段,物联网(IoT)的兴起将让我们逼近一个“消失点”,此前计算机的形体从大到小,此后计算机将变得“无形”,使计算无处不在,智能融入日常生活。本书由计算专业领域的专家学者知名吴翰清执笔,代表他及背后的阿里公司,对计算这个科技终极命题的感悟、展望和深刻洞察。本书为三卷书中的第一卷,着眼于对计算非常重要的数学,覆盖了量重要的数学家、数学成就及相关史实及其关联。
本书前半部分介绍强化学习的重要思想和基础知识,后半部分介绍如何将深度学习应用于强化学习,遴选讲解了深度强化学习的近期新技术。全书从最适合入门的多臂老虎机问题切入,依次介绍了定义一般强化学习问题的马尔可夫决策过程、用于寻找很好答案的贝尔曼方程,以及解决贝尔曼方程的动态规划法、蒙特卡洛方法和TD方法。随后,神经网络和Q学习、DQN、策略梯度法等几章则分别讨论了深度学习在强化学习领域的应用。本书延续"鱼书"系列的风格,搭配丰富的图、表、代码示例,加上轻松、简明的讲解,让人循序渐进地理解强化学习中各种方法之间的关系,于不知不觉中登堂入室。本书既适合深度学习的初学者,也适合对人工智能感兴趣的教师、学生和相关从业者学习参考。
本书为斯蒂芬·沃尔弗拉姆的随笔集,汇集了其过去十余年不同场合的文章、讲稿等,以计算思维范式为中心,讲述了沃尔弗拉姆在科学、技术、艺术、哲学、商业等多个领域的思想探索与实践。从为一部好莱坞电影提供科学咨询、解决人工智能道德规范问题、寻找一个不寻常的多面体的来源、与外星人交流,到建立Mathematica和 Wolfram|Alpha,再到寻找物理学的基本理论和探索π,本书捕捉到了计算世界伟大先驱之一的感染力和好奇心,向读者展示了计算思维在当代科技发展中的无限可能。 本书适合所有对科技史、科学哲学感兴趣,对于开阔视野、提升认知与思考能力有需求的读者。
本书介绍瑞萨科技公司推出的R8C/1A、1B单片机的工作原理、性能、特点及使用方法。R8C/1A、1B单片机是小型化高性能16位单片机,它具有高速处理能力,且内置了Flash存储器、多功能定时器、看门狗定时器、A/D转换器和串行I/O,是一种具有广阔应用前景的高16位单片机。本书详细阐述了R8C/1A、1B单片机的体系结构和指令系统,并说明各种内置硬件电路的组成和使用方法,给出了一些应用实例。此外,本书还介绍瑞萨单片机集成开发环境及简易开发工具,特别适合该系列单片机初学者快速入门,能够帮助读者掌握R8C/1A、1B单片机的使用方法。本书所配光盘包含瑞萨R8C/1A、1B单片机的硬件手册、软件手册、编程指南、应用说明,以及开发过程中所需的各种工具及其使用说明,为设计开发人员提供了丰富的文档资料和完备的开发环境。本书具有较强的系统性和实用性,可供从事