斯坦福团队大模型Octopus v2火了:手机就能运行 准确性超越GPT-4

站长之家 2024-04-07 16:01:31新闻资讯
52

近日,斯坦福大学研究人员发布的 Octopus v2模型引起了开发者社区的极大关注,其20亿参数的模型一夜下载量超过2k。

Octopus v2.png

这一模型可以在智能手机、汽车、个人电脑等端侧设备上运行,并在准确性和延迟方面表现超越了 GPT-4,同时将上下文长度减少了95%。Octopus v2还比 Llama7B + RAG 方案快了整整36倍,展示了端侧 AI 智能体的崛起。

Octopus v2的设计独特之处在于其函数性 token 策略,使其能够实现与 GPT-4相当的性能水平,同时大幅提高推理速度,超越基于 RAG 的方法,对边缘计算设备特别有利。模型在生成单独的、嵌套的和并行的函数调用时表现优异。为了训练该模型,研究团队采用了高质量数据集,并使用 Google Gemma-2B 作为预训练模型框架。训练过程中采用了完整模型训练和 LoRA 模型训练两种方法,展现了 Octopus v2在推理速度和准确性方面的优异表现。

在基准测试中,Octopus v2表现出卓越的推理速度,比 Llama7B + RAG 解决方案快36倍,在准确率上也超越了其他方案。这种效率和性能的提升归功于 Octopus v2的函数性 token 设计,使其成为端侧设备上极具竞争力的 AI 智能体。设备端 AI 智能体时代即将到来,Octopus v2的发布为这一趋势注入了新的活力。

论文:https://arxiv.org/abs/2404.01744

产品入口:https://huggingface.co/NexaAIDev/Octopus-v2

ai
THE END
tom
不图事事圆满 但图事事甘心。

相关推荐

国内AI大模型有哪些?国内10个主流AI大模型盘点
​近年来,人工智能技术飞速发展,AI大模型作为其中的重要一环,在各个领域发挥着越来越重要的作用。国内众多企业和研究机构纷纷投入大量资源,推动AI大模型的研发和应用。本...
2024-11-23 电脑知识
138

文心千帆是什么?文心千帆和文心一言有什么区别?
在当今人工智能技术日新月异的时代,各种AI大模型如雨后春笋般涌现,为企业和个人用户带来了前所未有的智能化体验。百度,作为中国AI领域的领军企业,不断推陈出新,其中“文...
2024-11-23 电脑知识
107

SPIRIT LM:Meta开源的多模态大语言模型,能自由混合并理解文本和语音数据
SPIRIT LM(Spirit Language Model),由Meta AI团队开发并开源,是一款具有里程碑意义的多模态大语言模型。不同于传统语言模型主要聚焦于单一模态(如纯文本)的处理,SPIRIT LM...
2024-11-22 新闻资讯
110

Whisper-NER:aiOla推出的开源AI音频转录模型,实时遮蔽敏感信息
Whisper-NER是aiOla基于OpenAI的开源语音识别模型Whisper开发的一款高级音频转录模型。它不仅继承了Whisper在多语言、实时处理及高准确度方面的卓越性能,还创新性地加入了敏...
2024-11-21 新闻资讯
117

昆仑万维发布天工大模型 Skywork 4.0O1版:国内首款中文逻辑推理模型将正式启动邀请测试
昆仑万维科技股份有限公司近日宣布,其最新研发的天工大模型4.0O1版(英文名:Skywork O1)将于2024年11月27日正式启动邀请测试。这款模型是国内首款具备中文逻辑推理能力的o1模...
2024-11-18 新闻资讯
109

Ultravox:Fixie AI推出的开源多模态实时语音交互AI模型
在人工智能技术飞速发展的今天,实时语音交互已成为人们日常生活的重要组成部分。Ultravox,一款由FixieAI公司开发的创新性多模态大语言模型,旨在提供一个封闭源模型如 GPT-...
2024-11-15 新闻资讯
123