听觉信息处理技术的创新能够推动实现高度智能化机器感知系统的发展,本分册主要介绍了国内外听觉信息处理方面的研究现状和阶段性成果,通过对人类言语产生与听觉机理,听觉机理的计算理论与方法,语音信号处理,语音识别声学建模,特殊场景语音识别,声纹与语种识别,韵律、情绪及音乐分析,统计语音合成,口语对话系统等技术研究成果的阐述与分析,展示我国在这些研究领域的优势与特色,并提出未来的技术挑战与发展方向。
本书以PyTorch作为深度学习框架,主要包括4部分。 部分( 、2章),主要概述PyTorch基础知识与常见深度学习算法实现,例如,CNN、LSTM,即CNN-LSTM;第2部分(第3~5章) 神经网络实现,主要包括常见的深度学习网络结构,例如CNN、RNN及 的Transformer等模型;第3部分(第6~9章)生成式AI和深度强化学习,主要包括GAN、GPT和DQN等算法;第4部分( 0~14章)生产中PyTorch落地的几个关键性主题,分布式训练、自动机器学习管道构建和硬件快速部署。 本书内容翔实,以案例作为场景,通过PyTorch深度学习框架对AI算法进行了实现,适合对人工智能感兴趣的高校教师、企业工程师及对AI算法感兴趣的技术人员和研究人员阅读。
本书立足于机器智能中的视觉感知,聚焦计算成像和计算感知这两大前沿交叉研究领域,围绕传统视觉感知面临的响应维度单一、传输带宽受限、信号噪声串扰、信息通量不足等严峻挑战,以“升维-扩域-去扰-识义”递进式研究架构为线索,详细介绍信息获取、信息拓展、信息优化和信息理解的 外前沿方法与技术,为解决机器智能领域视觉系统高维“看不到”、广域“看不全”、细节“看不清”和语义“看不懂”等问题提供详实的技术参考。 本书内容丰富、结构清晰、理论与实践并重,可作为信息、光电、计算机等相关专业的研究生教材,亦可作为相关领域科研工作者及对此感兴趣的读者的参考书。