阿里AI模型EMO免费上线通义APP 一张照片即可开口唱歌说话

站长之家 2024-04-26 20:08:00新闻资讯
60

阿里云宣布,EMO模型成功在通义APP中上线,并且完全开放给所有用户免费使用。

如今,在通义千问APP内,用户只需简单三步操作:选择模版、上传照片、生成视频,即可轻松实现照片中人物演戏唱歌的神奇效果。

通义APP首批上线了多达80个EMO模板,涵盖了热门歌曲、网络热梗等多种内容。用户可以选择预置的音频来生成视频,但目前暂不支持用户自定义音频。

阿里AI模型EMO.png

EMO模型是通义实验室精心研发的AI模型,其背后的肖像说话技术正是当前AIGC领域的热门话题。与传统的Talking Head技术相比,EMO模型采用了创新的弱控制设计,无需对人脸、人头或身体部分进行繁琐的3D建模,即可轻松驱动肖像开口说话。这不仅大大降低了视频生成的成本,还显著提升了视频的质量。

EMO模型具备强大的学习能力,能够编码人类表达情绪的能力。它能够将音频内容与人物的表情、嘴型精准匹配,甚至能将音频的语气特征和情绪色彩细腻地反映到人物的微表情上,使得生成的视频更加生动逼真。

自2月底通义实验室公布相关论文以来,EMO模型便受到了广泛关注,成为继Sora之后最受瞩目的AI模型之一。未来,EMO技术有望在数字人、数字教育、影视制作、虚拟陪伴、电商直播等众多领域发挥巨大潜力。

通义APP一直致力于为用户提供前沿模型的免费体验。除了EMO模型外,通义APP还推出了众多现象级应用,如“全民舞王”、“兵马俑跳科目三”、“金毛跳舞”等,这些应用背后的模型也均出自通义实验室。此外,通义APP还不断推出实用功能,如超长文档解析、AI编码助手、AI会议助手等,为用户提供全方位的超级AI助手服务。

体验地址https://www.zhanid.com/daohang/tongyiqianwen.html

通义千问 AI
THE END
tom
不图事事圆满 但图事事甘心。

相关推荐

EchoMimic:阿里巴巴达摩院推出的AI音频驱动图片说话开源项目
EchoMimic是阿里巴巴达摩院推出的一款AI音频驱动图片说话开源项目,专注于通过先进的深度学习技术将静态图像转化为具有动态语音和表情的数字人像。这项技术的核心在于它能够根...
2024-10-29 新闻资讯
109

FLUX.1:Black Forest Labs推出的一款AI图像生成模型
FLUX.1是由Black Forest Labs推出的一款前沿AI图像生成模型,旨在提供高质量的图像生成服务。这款模型由前Stability AI核心成员Robin Rombach创立的新公司Black Forest Labs开...
2024-10-28 新闻资讯
111

Memory Compression 是什么进程?Memory Compression 有什么用?
在现代操作系统中,内存管理是一个至关重要的环节。随着计算机应用程序的日益复杂和多样化,对内存的高效利用和管理变得越来越关键。Memory Compression 作为一种内存管理技术...
2024-10-19 电脑知识
128

LiblibAI(哩布哩布AI):国内首家原创AI模型分享及图片生成网站
LiblibAI(哩布哩布AI)是一个专注于AI模型分享和图片生成的在线平台。它汇聚了众多原创AI模型和AI创作工具,用户可以通过这些模型轻松生成各种风格和主题的图片,满足个性化的...
2024-07-30 新闻资讯
291

GPT-4o mini是什么?GPT-4o mini和GPT-4o的区别对比
GPT-4o mini是OpenAI于2024年7月18日推出的迷你AI模型,它是GPT-4o的一个分支。本文ZHANID将深入探讨GPT-4o mini的核心特点、应用场景以及与完整版GPT-4o的主要区别。我们将从...
2024-07-20 电脑知识
172

OpenAI启动新一代AI模型训练,迈向通用人工智能新征程
全球领先的人工智能研究和部署公司Open AI近日宣布,已正式启动新一代旗舰人工智能模型的训练工作。这一举措旨在超越现有的GPT-4大模型,进一步拓展人工智能技术的能力边界,...
2024-05-29 新闻资讯
91