DreaMoving:图片+文字提示就能生成高质量舞蹈视频

站长之家 2023-12-12 15:40:54新闻资讯
50

DreaMoving由阿里巴巴集团的一组研究人员倾力打造,一种基于扩散模型的可控视频生成框架。该框架的核心目标基于图文就能生成高质量、定制化的人类舞蹈视频。

DreaMoving以其出色的扩散模型为基础,能够根据人物的身份和姿势序列生成目标身份在任何地方跳舞的视频。

DreaMoving 可以生成高质量和高保真度的视频,给定指导序列和简单的内容描述,例如文本和参考图像作为输入。具体来说,DreaMoving 通过人脸参考图像、通过姿势序列进行精确运动操作以及由指定文本提示提示的综合视频外观控制来展示身份控制的熟练程度。

比如你“投喂”一张人像,以及一段prompt就能生成对应的视频,而且改变prompt,人物背景和身上的衣服也会跟着变化。

为实现这一目标,该技术引入了Video ControlNet和Content Guider两个关键组件。

Video ControlNet:这是一个图像ControlNet,通过在每个U-Net块后注入运动块,处理控制序列(姿势或深度)以产生额外的时间残差。这有效实现了对运动的控制。

Content Guider:该组件负责将输入文本提示和外观表达,如人脸(衣物是可选的),转换为内容嵌入,实现跨注意力的传递。

DreaMoving.png

值得一提的是,目前DreaMoving项目并没有开源代码。

项目网址:https://dreamoving.github.io/dreamoving/

论文网址:https://arxiv.org/abs/2312.05107

ai
THE END
tom
不图事事圆满 但图事事甘心。

相关推荐

Tailor:一款开源免费的AI智能视频剪辑工具
Tailor(中文简称:泰勒)是一款开源免费的AI智能视频剪辑工具,具有 Apache - 2.0 许可证。它主要包括视频剪辑、视频生成和视频优化三大类视频处理方向,共 10 种方法。Tailor...
2024-09-01 电脑知识
255

“即梦AI”上架苹果应用商店:支持AI视频创作 效果直逼Sora
字节跳动旗下剪映团队研发的一站式AI创作平台“即梦AI”移动版,于今日正式上架苹果App Store应用商店。即梦AI集成了尖端的AI图片与视频创作技术,将用户的每一个创意想法转化...
2024-08-06 新闻资讯
187

FunClip:阿里巴巴出品的开源AI自动化视频剪辑工具
FunClip一款完全开源、本地部署的开源AI自动化视频剪辑工具。通过调用阿里巴巴通义实验室开源的FunASR Paraformer系列模型进行视频的语音识别,随后用户可以自由选择识别结果...
2024-07-28 电脑知识
242

Sora平替?2分钟超长AI视频模型StreamingT2V免费开源 试玩地址公布
近日,Picsart AI Research等团队联合发布了一款名为StreamingT2V的AI视频模型,该模型能够生成长达1200帧、时长达2分钟的视频,这在技术上超越了之前备受关注的Sora模型。St...
2024-04-15 新闻资讯
53

PixVerse(AI视频生成神器):保持角色一致性、百变场景
最近,视频生成神器 PixVerse 推出了新功能,让用户能够实现角色一致性换背景,解决了 AI 生成效果不一致的问题。网友展示了生成效果,角色面部基本一致,背景丰富生动。PixV...
2024-04-01 新闻资讯
103

超越Sora!AI视频模型StreamingT2V可生成120秒超长视频
近日,UT奥斯丁等机构提出的StreamingT2V技术引发了广泛关注,将AI视频生成推向了新的高度。这项技术突破了以往视频长度的限制,实现了生成高度一致且长度可扩展的视频。
2024-03-26 新闻资讯
52