本书主要介绍基于互联网场景的交互式实时语音处理流程,内容涉及智能语音助手、智能音箱、音/视频会议等,具体包括实时语音信号处理、数字音效、网络传输编/解码和语音唤醒识别四部分。在阐述各部分内容时,本书从基本概念和原理入手,将理论和实践相结合,并细致分析了极具商业价值的实例,以帮助读者了解相关算法在工程上是如何实现的。另外,为便于有兴趣的读者快速进行算法验证并将其改进和应用到实际的项目中,作者也开源了书中算法的源码。 对于语音技术零基础的读者,建议按照本书的编排顺序阅读;本书也适合有一定语音理论基础的高等院校相关专业本科生和研究生;对从事语音相关产品的非技术人员来说,可从本书了解语音处理的主要内容和技术难点,对从事语音工程开发的技术人员来说,本书开源了一些极具商业价值的源码工程,具有较高的参考价值。