- 科大讯飞发挥AI语音技术优势,打造座舱多模感知系统
- 2021年07月06日来源:南方企业新闻网
提要:汽车界普遍认为,智能座舱未来必将重新定义用户与汽车的交互方式。科大讯飞作为这一领域的佼佼者者,不仅起步早,掌握的核心技术更全面,还在智能座舱创新技术论坛上分享了“面向智能座舱的多模感知技术及交互设计思考”的主题演讲,从语音到多模态等方面展示了科大讯飞在这一领域的深刻实践。
汽车界普遍认为,智能座舱未来必将重新定义用户与汽车的交互方式。科大讯飞作为这一领域的佼佼者者,不仅起步早,掌握的核心技术更全面,还在智能座舱创新技术论坛上分享了“面向智能座舱的多模感知技术及交互设计思考”的主题演讲,从语音到多模态等方面展示了科大讯飞在这一领域的深刻实践。
对于核心技术来言,传统意义上的平台核心技术架构更多偏向机械层面,这些层面让诸多巨头汽车制造商辉煌百年,而接下来,平行于机械系统的平台架构之外,更高阶的智能座舱平台会越来越凸显自己的竞争优势。而智能座舱的构成主要包括,支持语音识别、手势识别、高清显示、主动安全报警、实时导航、在线信息娱乐、紧急救援等功能和服务。
据了解,科大讯飞此套座舱多模感知系统可分:驾驶员多模感知与乘客多模感知两个大方向。其中,驾驶员多模感知功能,包含多模语音、人脸识别、注视感知、驾驶员状态感知等功能。尤其是,在驾驶员状态感知,该系统不仅做了疲劳感知,还分别设定了分析感知、行为感知,以便在系统可对驾驶员状况进行充分的安全监测,从而进行自动提醒、调节车内状态,减少事故发生。
乘客多模感知,则从根本上避免了表情识别情绪感知的不可靠,可以更加敏锐地捕捉乘客的小情绪。在此基础上,多模感知系统将会调动媒体、灯光、空调等智能硬件,与乘客形成共情交互。总体来看,科大讯飞座舱多模感知系统,具有高准确率、高覆盖率、高效低本、高可靠性等一系列优点,能够很好地适应各种工况,树立人车交互新体验。
值得一提的是,科大讯飞此套座舱多模感知系统的多模语音、多模认证、多模情绪、多模画像等核心技术保障技术指标领先。其中,多模语音,更是应用到了科大讯飞首创的新一代唇音融合语音技术,基于讯飞大规模人脸库训练的红外异质FaceID技术,更是达到99.9%以上的准确率,复杂光线,嘈杂场景也可完成Yaw±90°,Pitch±45° 和 Roll ±45°大角度姿态下的准确检测,同时还克服驾驶员佩戴眼镜、口罩、面部各种遮挡等复杂场景的影响。在纯软件技术方案,更是保持着不增加硬件成本,充分挖掘芯片性能的初衷。
此外,科大讯飞还与奇瑞在安徽芜湖签订了全面深化战略合作伙伴关系,未来双方将在汽车智能座舱、智能音效、智能销服、国际多语种、智能驾驶、工业智能、企业数字化这7大领域全面深化合作,并携手研发自动驾驶技术。
智能座舱正成为各大科技企业构建全新用户体验,比拼驾驶体验、技术壁垒、驾驶安全的必争之地。科大讯飞持AI之技,携手行业生态,从语音到多模研发创新到技术落地,已经走出了一条稳健发展之路,正在引领汽车行业走向智能化、网联化。