网站导航

新闻资讯 编程技术 电脑知识 站长之家 自媒体

字节跳动放大招！OmniHuman数字人模型即将上线：一张图+一段音频即可生成视频

快科技 2025-02-08 13:44:05新闻资讯

203

近期，抖音集团旗下图片视频工具即梦AI在官方社交媒体上发布了一条新功能上线预告片。

视频显示，新功能采用了全新的多模态视频生成模型OmniHuman，让用户仅需输入一张图片和一段音频，就可以生成一条生动的AI视频，有望大幅提升AI短片的制作效率和质量。

OmniHuman技术主页信息显示，该模型为字节跳动自研的闭源模型，可支持肖像、半身以及全身等不同尺寸的图片输入，并根据输入的音频，在视频中让人物生成与之匹配的动作，包括演讲、唱歌、乐器演奏以及移动。

对于人物视频生成中常见的手势崩坏，也相比现有方法取得了显著的改善。

此外，对动漫、3D卡通等非真人图片输入的支持效果也较为出色，生成的视频能保持特定风格和原有的运动模式。

根据技术主页展示的演示效果来看，OmniHuman的生成效果已经具有较高的自然度。为防止该项技术被不当利用，字节跳动技术团队在主页中特别标注称，OmniHuman将不会对外提供下载。

即梦AI相关负责人透露，该模型目前已具备较好的表现，但在生成影视真实级别的视频上仍存在一定的提升空间。

由其支持的多模态视频生成功能会在即梦上以小范围内测的形式进行调优调整，并逐步开放。

该负责人同时表示，即梦还会对这一功能设置严格的安全审核机制，并且对输出的视频标注水印以作提醒，从而确保AI发挥正面、积极的作用，助力视频创作者更好地实现想象力的表达。

数字人字节跳动 OmniHuman

本文来源于#快科技，由@tom 整理发布。如若内容造成侵权/违法违规/事实不符，请联系本站客服处理!

该文章观点仅代表作者本人，不代表本站立场。本站不承担相关法律责任。

如若转载，请注明出处：https://www.zhanid.com/news/3094.html

THE END

tom

不图事事圆满但图事事甘心。

相关推荐

Phantom：字节跳动开源的跨模态对齐AI视频生成框架

Phantom：字节跳动开源的跨模态对齐AI视频生成框架

Phantom是字节跳动开源的一款先进的AI视频生成框架，它专注于跨模态对齐技术，能够将文本、图像等多种模态的信息有效融合，生成高质量、连贯的视频内容。作为字节跳动在人工智...

2025-02-20 新闻资讯

158

FlashVideo：字节跳动和香港大学联合推出的高分辨率视频生成框架

FlashVideo：字节跳动和香港大学联合推出的高分辨率视频生成框架

FlashVideo是一种高效的高分辨率视频生成框架，旨在解决传统单阶段扩散模型在计算成本上的不足。该框架通过两阶段方法生成高分辨率视频，首先使用大型模型在低分辨率下生成与...

2025-02-12 新闻资讯

173

VideoWorld：字节跳动开源的自回归视频生成模型

VideoWorld：字节跳动开源的自回归视频生成模型

VideoWorld是由北京交通大学、中国科学技术大学和字节跳动联合开发的一款自回归视频生成模型。该模型旨在探索深度生成模型是否能够通过未标注的视频数据学习复杂知识，包括规...

2025-02-11 新闻资讯

192

Loopy：字节跳动开发的一款音频驱动的AI视频生成模型

Loopy：字节跳动开发的一款音频驱动的AI视频生成模型

Loopy是由字节跳动和浙江大学联合开发的一款基于音频驱动的AI视频生成模型。它能够将静态照片或图像转化为动态视频，使照片中的人物能够根据输入的音频文件进行面部表情和头部...

2025-01-31 新闻资讯

223

StructLDM：高质量、多样化三维数字人生成模型

StructLDM：高质量、多样化三维数字人生成模型

StructLDM是一种从2D图像集合中生成3D人体的新型范式。它利用先进的深度学习技术和计算机视觉算法，从图像和视频中学习人体的高维表征，并通过结构化的自动解码器和隐空间扩散...

2025-01-16 新闻资讯

247

LatentSync：字节跳动开源的视频人物唇部动作与音频精准同步模型

LatentSync：字节跳动开源的视频人物唇部动作与音频精准同步模型

LatentSync是一项由字节跳动联合北京交通大学提出的创新技术，它代表了一种新型的唇部同步框架。该框架基于音频条件潜在扩散模型，旨在实现视频中人物唇部动作与音频的精准同...

2025-01-06 新闻资讯

377

推荐工具

热门文章

1 ed2k下载工具有哪些：8款广受好评的ed2k下载工具推荐 2 下划线“_”怎么打？电脑中下划线符号输入方法详解 3 Word顶端有一条横线怎样删除？删除Word顶部横线的几种方法 4 微信文件传输助手文件存放位置详解(电脑+手机) 5 打开浏览器显示空白页about:blank怎么办？ 6 Safari 无法与服务器建立安全连接的解决方法

图文资讯

图片压缩软件有哪些？5款免费好用的图片压缩软件推荐

软件下载

太极工具箱
下载
太极工具箱app是一款工具聚合软...
宇宙工具箱
下载
宇宙工具箱是一款功能十分强大且...
金花站长工具
下载
金花站长工具是一款可以进行百度...
爱站SEO工具包
下载
爱站SEO工具包是一款强大的站长工...
入梦工具箱
下载
入梦工具箱是一款仿照图吧工具箱...
极速图片压缩器
下载
极速图片压缩器是一款功能十分强...