本书从实际应用出发,把生活中常见的人机交互技术进行拆分。从硬件、软件和系统三个层次,用难易不同的语言描述多模态人机交互技术。用时间、空间的眼光,为读者介绍不同场景下的多模态人机交互技术。近几年随着大数据、人工智能、深度学习的浪潮的推动,人机交互技术也由机器检测人、人操作机器的简单方式转变为人辅助机器、机器配合人的人机共融方式。本书的多模态人机交互技术涉及多模式传感器层面的视觉传感器、体感传感器、体表传感器、眼动传感器、语音传感器等多种传感器;涉及传统的基于特征提取和目前流行的基于深度学习、Transformer等的人机交互识别方式;涉及人机交互中操作员控制机器、机器感知操作员状态的人机交互方式;涉及人机交互中多模式下的任务规划和协同感知;涉及人机交互中的安全等。