科大讯飞发挥AI语音技术优势，打造座舱多模感知系统- 南方企业新闻网

科大讯飞发挥AI语音技术优势，打造座舱多模感知系统
2021年07月06日来源：南方企业新闻网

提要：汽车界普遍认为，智能座舱未来必将重新定义用户与汽车的交互方式。科大讯飞作为这一领域的佼佼者者，不仅起步早，掌握的核心技术更全面，还在智能座舱创新技术论坛上分享了“面向智能座舱的多模感知技术及交互设计思考”的主题演讲，从语音到多模态等方面展示了科大讯飞在这一领域的深刻实践。

汽车界普遍认为，智能座舱未来必将重新定义用户与汽车的交互方式。科大讯飞作为这一领域的佼佼者者，不仅起步早，掌握的核心技术更全面，还在智能座舱创新技术论坛上分享了“面向智能座舱的多模感知技术及交互设计思考”的主题演讲，从语音到多模态等方面展示了科大讯飞在这一领域的深刻实践。

对于核心技术来言，传统意义上的平台核心技术架构更多偏向机械层面，这些层面让诸多巨头汽车制造商辉煌百年，而接下来，平行于机械系统的平台架构之外，更高阶的智能座舱平台会越来越凸显自己的竞争优势。而智能座舱的构成主要包括，支持语音识别、手势识别、高清显示、主动安全报警、实时导航、在线信息娱乐、紧急救援等功能和服务。

据了解，科大讯飞此套座舱多模感知系统可分：驾驶员多模感知与乘客多模感知两个大方向。其中，驾驶员多模感知功能，包含多模语音、人脸识别、注视感知、驾驶员状态感知等功能。尤其是，在驾驶员状态感知，该系统不仅做了疲劳感知，还分别设定了分析感知、行为感知，以便在系统可对驾驶员状况进行充分的安全监测，从而进行自动提醒、调节车内状态，减少事故发生。

乘客多模感知，则从根本上避免了表情识别情绪感知的不可靠，可以更加敏锐地捕捉乘客的小情绪。在此基础上，多模感知系统将会调动媒体、灯光、空调等智能硬件，与乘客形成共情交互。总体来看，科大讯飞座舱多模感知系统，具有高准确率、高覆盖率、高效低本、高可靠性等一系列优点，能够很好地适应各种工况，树立人车交互新体验。

值得一提的是，科大讯飞此套座舱多模感知系统的多模语音、多模认证、多模情绪、多模画像等核心技术保障技术指标领先。其中，多模语音，更是应用到了科大讯飞首创的新一代唇音融合语音技术，基于讯飞大规模人脸库训练的红外异质FaceID技术，更是达到99.9%以上的准确率，复杂光线，嘈杂场景也可完成Yaw±90°，Pitch±45° 和 Roll ±45°大角度姿态下的准确检测，同时还克服驾驶员佩戴眼镜、口罩、面部各种遮挡等复杂场景的影响。在纯软件技术方案，更是保持着不增加硬件成本，充分挖掘芯片性能的初衷。

此外，科大讯飞还与奇瑞在安徽芜湖签订了全面深化战略合作伙伴关系，未来双方将在汽车智能座舱、智能音效、智能销服、国际多语种、智能驾驶、工业智能、企业数字化这7大领域全面深化合作，并携手研发自动驾驶技术。

智能座舱正成为各大科技企业构建全新用户体验，比拼驾驶体验、技术壁垒、驾驶安全的必争之地。科大讯飞持AI之技，携手行业生态，从语音到多模研发创新到技术落地，已经走出了一条稳健发展之路，正在引领汽车行业走向智能化、网联化。

责任编辑：雨燕