ai模型

Whisper-NER是aiOla基于OpenAI的开源语音识别模型Whisper开发的一款高级音频转录模型。它不仅继承了Whisper在多语言、实时处理及高准确度方面的卓越性能,还创新性地加入了敏...
2024-11-21
新闻资讯
292

在人工智能技术飞速发展的今天,实时语音交互已成为人们日常生活的重要组成部分。Ultravox,一款由FixieAI公司开发的创新性多模态大语言模型,旨在提供一个封闭源模型如 GPT-...
2024-11-15
新闻资讯
285

在人工智能领域的最新发展中,Anthropic公司宣布即将推出其新一代AI模型——Claude3.5 Opus,这一消息在业界引起了广泛关注。公司首席执行官达里奥·阿莫德伊在Lex Fridman播...
2024-11-13
新闻资讯
249

Hallo是一项由复旦大学、百度公司、苏黎世联邦理工学院和南京大学联合开发的革命性AI技术。这项技术通过用户上传的照片,结合语音输入,能够生成高度逼真且动态的肖像动画,实...
2024-11-13
新闻资讯
224

Bark 是由 Suno 开发的一款基于变压器架构的先进 TTA 模型,它不仅能够生成高度逼真的多语言语音,还能生成音乐、背景噪音和简单的声音效果,甚至非语言交流如笑声、叹息和哭...
2024-11-12
新闻资讯
388

Fluid是由Google DeepMind和MIT联合开发的一款先进的文本到图像生成模型。它通过自回归生成方法,结合连续标记和随机生成顺序的技术,实现了在视觉质量和评估性能上的显著提升...
2024-11-08
新闻资讯
293

EchoMimic是阿里巴巴达摩院推出的一款AI音频驱动图片说话开源项目,专注于通过先进的深度学习技术将静态图像转化为具有动态语音和表情的数字人像。这项技术的核心在于它能够根...
2024-10-29
新闻资讯
432

FLUX.1是由Black Forest Labs推出的一款前沿AI图像生成模型,旨在提供高质量的图像生成服务。这款模型由前Stability AI核心成员Robin Rombach创立的新公司Black Forest Labs开...
2024-10-28
新闻资讯
275

LiblibAI(哩布哩布AI)是一个专注于AI模型分享和图片生成的在线平台。它汇聚了众多原创AI模型和AI创作工具,用户可以通过这些模型轻松生成各种风格和主题的图片,满足个性化的...
2024-07-30
新闻资讯
1026

GPT-4o mini是OpenAI于2024年7月18日推出的迷你AI模型,它是GPT-4o的一个分支。本文ZHANID将深入探讨GPT-4o mini的核心特点、应用场景以及与完整版GPT-4o的主要区别。我们将从...
2024-07-20
电脑知识
1120

全球领先的人工智能研究和部署公司Open AI近日宣布,已正式启动新一代旗舰人工智能模型的训练工作。这一举措旨在超越现有的GPT-4大模型,进一步拓展人工智能技术的能力边界,...
2024-05-29
新闻资讯
202

Dream Machine AI 是由 Luma Labs 开发的一款先进的人工智能视频生成模型。它能够从文本和图片迅速生成高质量、逼真的视频。这一模型通过直接在视频上进行训练,具备了生成物...
2024-08-01
AI工具
272