摩尔线程开源MooER:国产GPU驱动的先进语音识别与翻译大模型

网络 2024-08-26 15:00:31新闻资讯
114

8月26日消息:摩尔线程智能科技有限公司(Moore Threads)近日宣布,其基于国产全功能GPU训练和推理的大型语音模型MooER(摩耳)已成功开源。这一举措标志着国产GPU在人工智能领域的应用实力,同时为全球音频AI技术的发展注入了新的活力。

摩尔线程.jpg

MooER模型采用了创新的三部分结构设计,包括Encoder(编码器)、Adapter(适配器)和Decoder(大型语言模型,LLM)。这种设计使得MooER能够有效地处理原始音频数据,提取关键特征,并执行包括语音识别和翻译在内的下游任务。

在与多个知名开源音频理解大模型的对比测试中,MooER展现出了卓越的性能。在中文测试集上,MooER的字错误率(CER)达到了4.21%,在英文测试集上的词错误率(WER)为17.98%,与其他顶级模型相比表现更优或相当。特别值得一提的是,在Covost2zh2en中译英测试集上,MooER的BLEU分数高达25.2,大幅领先其他开源模型,达到了工业级应用的水平。

MooER.png

摩尔线程的项目团队已经开源了推理代码和基于5000小时数据训练的模型,并计划进一步开源训练代码和基于8万小时数据训练的增强版模型。基于8万小时数据训练的MooER-80K模型在性能上更进一步,在中文测试集上的CER降至3.50%,英文测试集上的WER优化到12.66%,显示了其巨大的发展潜力。

摩尔线程开源MooER的行动不仅展示了国产GPU的强大计算能力,也为音频AI技术的创新应用和普及提供了新的可能性。随着更多训练数据和代码的开源,业界期待MooER能在语音识别、翻译等领域带来更多突破性进展。

有关MooER的更多信息和开源资源,可以通过以下链接访问:

摩尔线程 大模型
THE END
tom
不图事事圆满 但图事事甘心。

相关推荐

百度文心一言App升级为文小言:9月内文心4.0大模型免费用
9月4日消息,百度今日宣布,其旗下AI应用“文心一言”已全面升级为4.0.0版本,并更名为“文小言”。据悉,文小言功能更强大,场景更丰富,基于文心大模型提供搜索、创作、聊天...
2024-09-04 新闻资讯
108

智谱AI:GLM-4-Flash大模型API接口免费向公众开放
北京智谱华章科技有限公司近期宣布,将旗下GLM-4-Flash大型语言模型的API接口免费向公众开放,以推动大型模型技术的普及和应用。GLM-4-Flash模型在速度和性能上都展现出显著的...
2024-08-27 新闻资讯
112

什么是MLM?它与LLM大模型有什么区别?
随着人工智能技术的迅猛发展,语言模型在自然语言处理(NLP)领域扮演着至关重要的角色。其中,两种常见的语言模型MLM(Masked Language Model,掩码语言模型)和LLM(Large ...
2024-08-01 电脑知识
170

360集团创始人周鸿祎:360安全大模型正式对公众免费开放
7月31日消息:在ISC.AI2024第十二届互联网安全大会数字安全峰会上,360集团创始人周鸿祎宣布了一个行业里程碑式的决定:360安全大模型正式对公众免费开放。这一举措标志着360...
2024-07-31 新闻资讯
117

Llama:Meta AI团队开发的基于Transformer架构的大型语言模型
Llama是由Meta AI团队开发的一个基于Transformer架构的大型语言模型。其名称“Llama”来源于“Lightweight LAnguage Model Architecture”的首字母缩写,意在强调其高效性和轻...
2024-07-29 新闻资讯
137

对标Sora!快手自研视频生成大模型可灵AI全面开放内测
7月25日消息,日前,快手视频生成大模型可灵AI宣布基础模型升级,并全面开放内测,同时正式上线付费会员体系。用户每日登录都可免费获得66灵感值,可用于兑换可灵AI平台内指定...
2024-07-25 新闻资讯
140