- 讯飞超脑2030计划核心技术不断突破,无监督学习让AI更懂知识
- 2022年11月28日来源:南方企业新闻网
提要:11月18日,在2022科大讯飞全球1024开发者上,科大讯飞AI研究院副院长高建清表示,支撑“讯飞超脑2030计划”的发展,有两个关键算法亟待突破,无监督学习和知识推理。前者要实现实用化、场景化的预训练技术,后者要构建基于知识检索、决策以及融合的推理系统。
自今年年初推出“讯飞超脑2030计划”以来,不到一年的时间,科大讯飞在相关方面的技术持续突破,成果不断显现。
11月18日,在2022科大讯飞全球1024开发者上,科大讯飞AI研究院副院长高建清表示,支撑“讯飞超脑2030计划”的发展,有两个关键算法亟待突破,无监督学习和知识推理。前者要实现实用化、场景化的预训练技术,后者要构建基于知识检索、决策以及融合的推理系统。
对此,科大讯飞设计了基于无监督学习的预训练框架,并创新使用了少量有监督数据进行优化,大幅提升训练效率。
针对多模语音识别、情感识别等多模态任务,全新的预训练框架对音频、人脸等不同模态的输入“一视同仁”,利用其中内容、表情及身份等信息的关联性进行融合,可设计出不同的训练目标。
而少量有监督数据构建码本,让训练机时下降八成,实现了实用化预训练。在无监督学习的预训练算法框架下,讯飞开放了轻量化的中文语音、中英文多模态预训练模型。
在知识推理方面,以回答“面包在低温下会马上发霉吗”为例,机器要理解“低温变质慢”等常识,在引入海量知识的基础上,要用预训练模型进行知识重要性排序,也要融合知识与问题进行推理,才能与人畅聊“面包变质的二三事”。同时,提出了知识与问题融合的Across attention model,实现问题和知识之间的充分交互,从而实现更有效的知识推理。
此外,科大讯飞还探索将神经网络与符号推理相结合,实现了推理过程的可解释性。应用于小学平面几何题上,这个推理系统让AI答题的正确率从完全不可用,提升到了90%的水平,显著优于传统推理系统。
受技术跃升推动,今年科大讯飞超脑计划推进顺利,已结硕果,形成多个示范应用。基于多模态交互、以及医疗认知技术,讯飞研发了抑郁定量筛查系统,该系统已在北京安定医院、合肥四院等医院试点应用,抑郁筛查效果由 75% 提高至 91%。
未来,基于定量筛查基础能力,讯飞将研发抑郁症筛查平台,向更多的学校推广,助力青少年的心理成长。
专业虚拟人家族茁壮成长,种类涉及客服、招聘、服务、法务、歌手、助理多个领域,已为上千家企业提供高效数字化服务。
同时为推动人机协同新时代早日到来,11月18日,科大讯飞宣布全面升级开放平台2.0,新增了机器人超脑AIBOT、能力云AIHUB、模型云AILAB等组件。
其中机器人超脑AIBOT融入多模交互、深度理解、运动控制、硬件模组等核心能力,为实体机器人提供高性能的算力支撑、高效率的地图导航以及高精度的定位功能,打造软硬一体的智能化机器人。
而这一项技术已经有了实际的应用案例。
在实体机器人方面,讯飞联合宇树科技推出了支持户外巡检、化工巡检等多元场景巡检的四足机器人;
联合珞石机器人推出了柔性机械臂实现与人更安全的配合,可用于工业巡检、商业服务等场景;
虚拟数字人方面,数字机器人助力企业构建协作新模式,虚拟人资产进一步扩充,星昼数字藏品为品牌客户打造了可交互的数字资产。