- 一句话定制声音,讯飞星火大模型更智能更人性化
- 2024年05月27日来源:南方企业新闻网
提要:近日,讯飞星火大模型V3.5春季重磅更新,作为业内首创的长文本、图文、语音一体化处理模型,能够迅速吸收海量信息,为各行业提供精准解答。新升级的星火语音大模型,拥有多情感超拟人合成技术,可以展现丰富情绪,并具备声音复刻功能,更富人性温度。同时,面向企业应用场景,科大讯飞推出星火智能体平台,帮助企业解决大模型落地的最后一公里难题。
近日,讯飞星火大模型V3.5春季重磅更新,作为业内首创的长文本、图文、语音一体化处理模型,能够迅速吸收海量信息,为各行业提供精准解答。新升级的星火语音大模型,拥有多情感超拟人合成技术,可以展现丰富情绪,并具备声音复刻功能,更富人性温度。同时,面向企业应用场景,科大讯飞推出星火智能体平台,帮助企业解决大模型落地的最后一公里难题。
据科大讯飞董事长刘庆峰透露,科大讯飞将在6月27日发布讯飞星火大模型V4.0,进一步解放生产力、释放想象力。
助力知识高效获取
为什么要做长文本、长图文、长语音的大模型?
通过讯飞星火App可以看到,用户使用的最高峰不是周末,而是工作日的上午9时30分和下午3时30分。这意味着,大部分用户用讯飞星火来解决和工作相关的刚需问题。而高效的知识获取是用户和开发者都高度关注的问题。
经过分析发现,在知识获取和学习的过程中,广大用户能拿到的资料往往不仅是现成的长文本,还有随手可见的报刊书籍内容、各种研讨会的PPT内容,老师黑板上的板书、同学的笔记,以及各种会议录音、访谈,各种网上的发布会、培训教育视频等,能不能把这些文本、图片、语音等都上传到讯飞星火中,快速地获取知识?
为此,科大讯飞推出首个支持长文本、长图文、长语音的大模型,来解决用户真实场景中多源信息的获取需求。
这次讯飞星火长文本功能全新升级后,具备长文档信息抽取、长文档知识问答、长文档归纳总结、长文档文本生成等能力,总体已经达到GPT-4 Turbo 4月最新长文本版本的97%水平,而在银行、保险、汽车、电力等多个垂直领域的知识问答任务上,讯飞星火长文本总体水平已经超过GPT-4 Turbo。
科大讯飞董事长刘庆峰透露,为了解决大模型应用效率和准确率问题,科大讯飞进行了重要的模型剪枝和蒸馏,从而推出业界性能最优的130亿参数的大模型,在效果损失仅3%以内的情况下,使得星火在文档上传解析处理、知识问答的首响时间以及文字生成方面都获得了极大的效率提升。测试显示,在保障长文本效果的情况下,无论是10K、64K、128K token,还是更长的文本,星火大模型的性能都做到业界最优。
此外,面向复杂的图文场景,科大讯飞在图文识别、公式识别大赛多年国际第一的技术积累基础上,首次推出星火图文识别大模型。
相比传统小模型逐行文字识别的限制,星火图文识别大模型具有三大优势:能够直接处理非常复杂的版面分析,目前已经覆盖31个典型场景,同时能自动识别标注出18类不同的版面要素;融合篇章上下文语义进行文字识别,识别更精准;面向教育、金融、医疗、科研等专业领域深度优化,能自动实现更多领域的专业符号识别。
以技术进步解决真实刚需
记者获悉,讯飞星火长文本、长图文、长语音能力的升级,进一步推动大模型在各个场景的落地。
在招投标场景,此前凭借讯飞星火出色的文本理解、逻辑推理和数学能力,科大讯飞和国家能源物资公司在企业采购场景合作了智能无人评审系统,在国家能源集团已评审5.7万余单,评审准确率达97%。这一次,叠加本次升级的长文本和长图文能力,可以让评标更便捷、更高效、更准确。
日常生活中,人们在买卖商品、装修房屋或者是购买汽车保险时经常会遇到各种各样的合同,看不懂存在风险怎么办?科大讯飞推出星火合同助手,它可以对我们的合同进行风险审核、合同比对,摘要总结以及合同生成,迅速识别潜在风险漏洞,成为你口袋里的“法务助手”。
在教育场景,科大讯飞进一步升级了讯飞AI学习机产品,不仅对作文的批改和理科题目的批改更加精准,也让智能化辅学更有针对性更高效;也结合本次多模态能力升级了百科问答功能,星火大模型理解并融合了大量图书知识,对于孩子的奇思妙问等复杂问题,“爱因斯坦”和他的大咖虚拟人朋友都能回答,让孩子们在趣味互动中学知识、长见识,同时提升了孩子主动提问的意愿和能力。
此外,星火科研助手目前已在中国科学院、三亚崖州湾科技城、北京邮电大学、哈尔滨工业大学等机构高校铺开应用。多模态能力升级下,讯飞星火科研助手也进一步提升了论文问答、综述生成、实验解读等的效果,使得解析的学术资料更加丰富,进一步赋能高校和科研院所的科研工作。
能“情感共鸣”,还能“一句话声音复刻”
万物互联时代,需要更真实的AI语音交互。年初讯飞星火V3.5发布会上,科大讯飞推出了超拟人对话功能,AI的声音更自然更真实,拟人度达到了83%,受到用户的广泛欢迎。
此次科大讯飞发布多情感超拟人合成,进一步提升了情绪表达的可感知度,对高兴、抱歉、安慰、撒娇、困惑等情绪表达的可感知度达到85%以上,AI语音的生动、真实性再度提升。
除了超拟人对话,科大讯飞还推出“一句话声音复刻”功能,一句话就可以定制你的AI助手声音。比如模仿小朋友的声音,每天给爷爷奶奶读书读报;在我们出差的时候,模仿我们的声音给孩子讲故事。这个功能可以让世界变得更有温度。
科大讯飞的这一系列升级,无疑将AI技术的应用推向了新的高度。从文本到语音,从日常应用到专业领域,科大讯飞的星火大模型V3.5以及即将发布的V4.0,都在不断突破技术的边界,为人们的生活、工作和学习带来前所未有的便利。而这一切的背后,是科大讯飞对于技术创新和用户需求的深度理解和不懈追求。未来,科大讯飞将继续引领AI技术的发展,推动人工智能与各行各业的深度融合,让AI真正成为人们生活工作中的得力助手。