网站导航

新闻资讯 编程技术 电脑知识 站长之家 自媒体

阿里AI模型EMO免费上线通义APP 一张照片即可开口唱歌说话

站长之家 2024-04-26 20:08:00新闻资讯

111

阿里云宣布，EMO模型成功在通义APP中上线，并且完全开放给所有用户免费使用。

如今，在通义千问APP内，用户只需简单三步操作:选择模版、上传照片、生成视频，即可轻松实现照片中人物演戏唱歌的神奇效果。

通义APP首批上线了多达80个EMO模板，涵盖了热门歌曲、网络热梗等多种内容。用户可以选择预置的音频来生成视频，但目前暂不支持用户自定义音频。

阿里AI模型EMO.png

EMO模型是通义实验室精心研发的AI模型，其背后的肖像说话技术正是当前AIGC领域的热门话题。与传统的Talking Head技术相比，EMO模型采用了创新的弱控制设计，无需对人脸、人头或身体部分进行繁琐的3D建模，即可轻松驱动肖像开口说话。这不仅大大降低了视频生成的成本，还显著提升了视频的质量。

EMO模型具备强大的学习能力，能够编码人类表达情绪的能力。它能够将音频内容与人物的表情、嘴型精准匹配，甚至能将音频的语气特征和情绪色彩细腻地反映到人物的微表情上，使得生成的视频更加生动逼真。

自2月底通义实验室公布相关论文以来，EMO模型便受到了广泛关注，成为继Sora之后最受瞩目的AI模型之一。未来，EMO技术有望在数字人、数字教育、影视制作、虚拟陪伴、电商直播等众多领域发挥巨大潜力。

通义APP一直致力于为用户提供前沿模型的免费体验。除了EMO模型外，通义APP还推出了众多现象级应用，如“全民舞王”、“兵马俑跳科目三”、“金毛跳舞”等，这些应用背后的模型也均出自通义实验室。此外，通义APP还不断推出实用功能，如超长文档解析、AI编码助手、AI会议助手等，为用户提供全方位的超级AI助手服务。

体验地址：https://www.zhanid.com/daohang/tongyiqianwen.html

通义千问 AI

本文来源于#站长之家，由@tom 整理发布。如若内容造成侵权/违法违规/事实不符，请联系本站客服处理!

该文章观点仅代表作者本人，不代表本站立场。本站不承担相关法律责任。

如若转载，请注明出处：https://www.zhanid.com/news/1030.html

THE END

tom

不图事事圆满但图事事甘心。

相关推荐

VMix：提升文本到图像扩散模型的交叉注意力混合控制

VMix：提升文本到图像扩散模型的交叉注意力混合控制

VMix是一种新颖的即插即用适配器，通过细粒度的美学控制显著提升了文本到图像生成模型的性能。其灵活的设计和强大的功能使其在个性化图像生成、艺术创作、商业应用和教育培训...

2025-01-18 新闻资讯

111

StructLDM：高质量、多样化三维数字人生成模型

StructLDM：高质量、多样化三维数字人生成模型

StructLDM是一种从2D图像集合中生成3D人体的新型范式。它利用先进的深度学习技术和计算机视觉算法，从图像和视频中学习人体的高维表征，并通过结构化的自动解码器和隐空间扩散...

2025-01-16 新闻资讯

130

ViTPose：基于视觉变换器(ViT)的人体姿态估计模型

ViTPose：基于视觉变换器(ViT)的人体姿态估计模型

ViTPose 是一种基于视觉变换器(ViT)的人体姿态估计模型。视觉变换器最初由 Google Research 提出，用于图像分类任务，其核心思想是将图像分割成多个小块(patch)，然后通过自注...

2025-01-15 新闻资讯

122

AudioLCM：浙江大学与阿里巴巴联合推出的高质量文本到音频生成模型

AudioLCM：浙江大学与阿里巴巴联合推出的高质量文本到音频生成模型

AudioLCM 是一种基于一致性模型(Consistency Models, CMs)和潜在扩散模型(LDMs)的新型文本到音频生成模型。该模型通过集成一致性模型到生成过程中，并引入多步常微分方程(mul...

2025-01-13 新闻资讯

129

LongWriter：清华大学数据挖掘研究组(THUDM)开源的超长文本生成模型

LongWriter：清华大学数据挖掘研究组(THUDM)开源的超长文本生成模型

LongWriter是由清华大学数据挖掘研究组(THUDM)开发的开源语言模型，旨在让大型语言模型(LLMs)能够生成超长文本。通过引入一种基于代理的“计划-写作”方法，LongWriter将复杂...

2025-01-09 新闻资讯

143

LatentSync：字节跳动开源的视频人物唇部动作与音频精准同步模型

LatentSync：字节跳动开源的视频人物唇部动作与音频精准同步模型

LatentSync是一项由字节跳动联合北京交通大学提出的创新技术，它代表了一种新型的唇部同步框架。该框架基于音频条件潜在扩散模型，旨在实现视频中人物唇部动作与音频的精准同...

2025-01-06 新闻资讯

221

推荐工具

热门文章

1 ed2k下载工具有哪些：8款广受好评的ed2k下载工具推荐 2 下划线“_”怎么打？电脑中下划线符号输入方法详解 3 Word顶端有一条横线怎样删除？删除Word顶部横线的几种方法 4 Safari 无法与服务器建立安全连接的解决方法 5 微信文件传输助手文件存放位置详解(电脑+手机) 6 微信网页版登录不了怎么办？微信网页版登录不了的解决方法详解

图文资讯

图片压缩软件有哪些？5款免费好用的图片压缩软件推荐

软件下载

太极工具箱
下载
太极工具箱app是一款工具聚合软...
宇宙工具箱
下载
宇宙工具箱是一款功能十分强大且...
金花站长工具
下载
金花站长工具是一款可以进行百度...
爱站SEO工具包
下载
爱站SEO工具包是一款强大的站长工...
入梦工具箱
下载
入梦工具箱是一款仿照图吧工具箱...
极速图片压缩器
下载
极速图片压缩器是一款功能十分强...