直接开源,阿里达摩院公布下一代工业级语音识别模型
时间:2022-12-22 15:07 来源: IT之家 阅读量:7493
阿里巴巴达摩院今日发布新一代语音识别模型Paraformer,适用于语音输入法,智能客服,车载导航,会议纪要等场景。
据介绍,这是业内首个非自回归端到端语音识别模型其推理效率最高可达传统模型的10倍,识别准确率在众多权威数据集排名第一目前该模型在魔术社区面向全社会开源
资料显示,用GPU推理,不同版本的Paraformer可以提高推理效率5—10倍同时,Paraformer采用6倍下采样的低帧率建模方案,可以减少近6倍的计算量,支持大模型的高效推理
本站了解到,阿里达摩院表示,Paraformer是阿里巴巴研发的下一代杀手级语音识别基础模型,未来将广泛应用于理解,钉钉语音转文本,高德导航等会议纪要产品中。
相关阅读:
阿里达摩院推出AI模型社区魔:开源300+ AI模型,可体验国画AI
。声明:以上内容为本网站转自其它媒体,相关信息仅为传递更多企业信息之目的,不代表本网观点,亦不代表本网站赞同其观点或证实其内容的真实性。投资有风险,需谨慎。