斯坦福团队大模型Octopus v2火了:手机就能运行 准确性超越GPT-4

站长之家 2024-04-07 16:01:31新闻资讯
40

近日,斯坦福大学研究人员发布的 Octopus v2模型引起了开发者社区的极大关注,其20亿参数的模型一夜下载量超过2k。

Octopus v2.png

这一模型可以在智能手机、汽车、个人电脑等端侧设备上运行,并在准确性和延迟方面表现超越了 GPT-4,同时将上下文长度减少了95%。Octopus v2还比 Llama7B + RAG 方案快了整整36倍,展示了端侧 AI 智能体的崛起。

Octopus v2的设计独特之处在于其函数性 token 策略,使其能够实现与 GPT-4相当的性能水平,同时大幅提高推理速度,超越基于 RAG 的方法,对边缘计算设备特别有利。模型在生成单独的、嵌套的和并行的函数调用时表现优异。为了训练该模型,研究团队采用了高质量数据集,并使用 Google Gemma-2B 作为预训练模型框架。训练过程中采用了完整模型训练和 LoRA 模型训练两种方法,展现了 Octopus v2在推理速度和准确性方面的优异表现。

在基准测试中,Octopus v2表现出卓越的推理速度,比 Llama7B + RAG 解决方案快36倍,在准确率上也超越了其他方案。这种效率和性能的提升归功于 Octopus v2的函数性 token 设计,使其成为端侧设备上极具竞争力的 AI 智能体。设备端 AI 智能体时代即将到来,Octopus v2的发布为这一趋势注入了新的活力。

论文:https://arxiv.org/abs/2404.01744

产品入口:https://huggingface.co/NexaAIDev/Octopus-v2

ai
THE END
tom
不图事事圆满 但图事事甘心。

相关推荐

百度文心一言App升级为文小言:9月内文心4.0大模型免费用
9月4日消息,百度今日宣布,其旗下AI应用“文心一言”已全面升级为4.0.0版本,并更名为“文小言”。据悉,文小言功能更强大,场景更丰富,基于文心大模型提供搜索、创作、聊天...
2024-09-04 新闻资讯
108

智谱AI:GLM-4-Flash大模型API接口免费向公众开放
北京智谱华章科技有限公司近期宣布,将旗下GLM-4-Flash大型语言模型的API接口免费向公众开放,以推动大型模型技术的普及和应用。GLM-4-Flash模型在速度和性能上都展现出显著的...
2024-08-27 新闻资讯
112

摩尔线程开源MooER:国产GPU驱动的先进语音识别与翻译大模型
摩尔线程智能科技有限公司(Moore Threads)近日宣布,其基于国产全功能GPU训练和推理的大型语音模型MooER(摩耳)已成功开源。MooER模型采用了创新的三部分结构设计,包括En...
2024-08-26 新闻资讯
114

什么是MLM?它与LLM大模型有什么区别?
随着人工智能技术的迅猛发展,语言模型在自然语言处理(NLP)领域扮演着至关重要的角色。其中,两种常见的语言模型MLM(Masked Language Model,掩码语言模型)和LLM(Large ...
2024-08-01 电脑知识
170

360集团创始人周鸿祎:360安全大模型正式对公众免费开放
7月31日消息:在ISC.AI2024第十二届互联网安全大会数字安全峰会上,360集团创始人周鸿祎宣布了一个行业里程碑式的决定:360安全大模型正式对公众免费开放。这一举措标志着360...
2024-07-31 新闻资讯
117

LiblibAI(哩布哩布AI):国内首家原创AI模型分享及图片生成网站
LiblibAI(哩布哩布AI)是一个专注于AI模型分享和图片生成的在线平台。它汇聚了众多原创AI模型和AI创作工具,用户可以通过这些模型轻松生成各种风格和主题的图片,满足个性化的...
2024-07-30 新闻资讯
219