摩尔线程开源MooER:国产GPU驱动的先进语音识别与翻译大模型

网络 2024-08-26 15:00:31新闻资讯
210

8月26日消息:摩尔线程智能科技有限公司(Moore Threads)近日宣布,其基于国产全功能GPU训练和推理的大型语音模型MooER(摩耳)已成功开源。这一举措标志着国产GPU在人工智能领域的应用实力,同时为全球音频AI技术的发展注入了新的活力。

摩尔线程.jpg

MooER模型采用了创新的三部分结构设计,包括Encoder(编码器)、Adapter(适配器)和Decoder(大型语言模型,LLM)。这种设计使得MooER能够有效地处理原始音频数据,提取关键特征,并执行包括语音识别和翻译在内的下游任务。

在与多个知名开源音频理解大模型的对比测试中,MooER展现出了卓越的性能。在中文测试集上,MooER的字错误率(CER)达到了4.21%,在英文测试集上的词错误率(WER)为17.98%,与其他顶级模型相比表现更优或相当。特别值得一提的是,在Covost2zh2en中译英测试集上,MooER的BLEU分数高达25.2,大幅领先其他开源模型,达到了工业级应用的水平。

MooER.png

摩尔线程的项目团队已经开源了推理代码和基于5000小时数据训练的模型,并计划进一步开源训练代码和基于8万小时数据训练的增强版模型。基于8万小时数据训练的MooER-80K模型在性能上更进一步,在中文测试集上的CER降至3.50%,英文测试集上的WER优化到12.66%,显示了其巨大的发展潜力。

摩尔线程开源MooER的行动不仅展示了国产GPU的强大计算能力,也为音频AI技术的创新应用和普及提供了新的可能性。随着更多训练数据和代码的开源,业界期待MooER能在语音识别、翻译等领域带来更多突破性进展。

有关MooER的更多信息和开源资源,可以通过以下链接访问:

摩尔线程 大模型
THE END
tom
不图事事圆满 但图事事甘心。

相关推荐

站长禁止AI抓取网站内容用于大模型训练大方法详解
一些AI模型通过爬虫技术非法抓取网站内容用于训练,这不仅侵犯了网站的知识产权,还可能对网站的正常运营造成严重影响。为了保护网站内容不被非法抓取和利用,站长需要采取一...
2024-12-30 站长之家
174

FunASR:阿里巴巴达摩院开源的语音识别工具包
FunASR是由阿里巴巴达摩院开源的语音识别工具包,旨在帮助研究人员和开发者更高效地进行语音识别模型的研究和生产。它集成了语音端点检测、语音识别、标点预测等领域的工业级...
2024-12-24 新闻资讯
171

Ruyi:图森未来推出的图生视频AI大模型
Ruyi是由北京图森未来科技有限公司研发的一款基于深度学习的“图生视频”大模型,旨在通过输入文本描述或图像,生成高质量的视频内容。其核心目标是降低动漫和游戏内容的开发...
2024-12-17 新闻资讯
199

国内AI大模型有哪些?国内10个主流AI大模型盘点
​近年来,人工智能技术飞速发展,AI大模型作为其中的重要一环,在各个领域发挥着越来越重要的作用。国内众多企业和研究机构纷纷投入大量资源,推动AI大模型的研发和应用。本...
2024-11-23 电脑知识
1089

文心千帆是什么?文心千帆和文心一言有什么区别?
在当今人工智能技术日新月异的时代,各种AI大模型如雨后春笋般涌现,为企业和个人用户带来了前所未有的智能化体验。百度,作为中国AI领域的领军企业,不断推陈出新,其中“文...
2024-11-23 电脑知识
241

昆仑万维发布天工大模型 Skywork 4.0O1版:国内首款中文逻辑推理模型将正式启动邀请测试
昆仑万维科技股份有限公司近日宣布,其最新研发的天工大模型4.0O1版(英文名:Skywork O1)将于2024年11月27日正式启动邀请测试。这款模型是国内首款具备中文逻辑推理能力的o1模...
2024-11-18 新闻资讯
175