字节跳动开源MagicAnimate:照片秒变真人舞蹈视频

站长之家 2023-12-05 11:04:45新闻资讯
386

从今天起,在社交平台上看到的小姐姐舞蹈短视频很可能就是AI生成的。字节跳动新开源基于SD1.5的MagicAnimate,它只需要一张照片和一组动作,就能生成近似真人的舞蹈视频。

MagicAnimate.png

项目地址:https://github.com/magic-research/magic-animate

MagicAnimate是一项利用先进的扩散模型实现人体图像动画的创新性项目。其核心优势在于确保生成内容的时间一致性,通过提供预训练的稳定扩散V1.5和MSE微调的VAE基础模型,使用户能够轻松入门。

使用MagicAnimate只需要一张照片和一组动作。用户可以选择一张喜欢的小姐姐的照片,然后通过输入一组动作,让AI根据这些信息生成一个舞蹈视频。这个舞蹈视频看起来非常逼真,几乎可以让人误以为是真实人物在跳舞。

为使用MagicAnimate,用户需下载稳定扩散V1.5和MSE微调的VAE预训练基模型,并按照提供的结构组织检查点。安装简便,仅需Python(3.8以上版本)、CUDA(11.3以上版本)和FFmpeg。可通过conda或pip安装依赖项。

推理过程:

MagicAnimate提供了用户友好的推理过程。用户可通过提供的bash脚本在单个GPU上运行推理,或使用另一个脚本在多个GPU上运行,以优化性能。这种简便的推理方式确保了从初学者到经验丰富的研究人员的广泛可访问性。

字节跳动 开源
THE END
tom
不图事事圆满 但图事事甘心。

相关推荐

Phantom:字节跳动开源的跨模态对齐AI视频生成框架
Phantom是字节跳动开源的一款先进的AI视频生成框架,它专注于跨模态对齐技术,能够将文本、图像等多种模态的信息有效融合,生成高质量、连贯的视频内容。作为字节跳动在人工智...
2025-02-20 新闻资讯
148

SkyReels-V1:昆仑万维开源的AI短视频生成模型
SkyReels-V1是昆仑万维开发的一款面向AI短剧创作的视频生成模型。它利用先进的深度学习技术,通过结合口型生成、表情生成和肢体生成等多个生成模块,实现了对人物表演细节的精...
2025-02-19 新闻资讯
170

Step-Audio:阶跃星辰与吉利汽车集团联合开源的语音交互大模型
Step-Audio是阶跃星辰与吉利汽车集团联合开源的阶跃Step系列多模态大模型中的一个重要组成部分,专注于语音交互领域。作为行业内首款产品级开源语音交互大模型,Step-Audio的...
2025-02-18 新闻资讯
153

百度将推出文心大模型4.5系列,并于6月30日正式开源
今日,百度公司正式宣布,将在未来几个月内陆续推出备受关注的文心大模型4.5系列,并计划于2025年6月30日起正式开源。这一消息引发了科技界和人工智能领域的高度关注,预示着...
2025-02-14 新闻资讯
166

FlashVideo:字节跳动和香港大学联合推出的高分辨率视频生成框架
FlashVideo是一种高效的高分辨率视频生成框架,旨在解决传统单阶段扩散模型在计算成本上的不足。该框架通过两阶段方法生成高分辨率视频,首先使用大型模型在低分辨率下生成与...
2025-02-12 新闻资讯
170

FireRedASR:小红书开源的一款基于大模型的自动语音识别(ASR)系统
FireRedASR是由小红书FireRed团队开发并开源的一款基于大模型的自动语音识别(ASR)系统。这款语音识别系统不仅在中文识别领域取得了显著突破,还在多语言支持、高效推理等方面...
2025-02-12 新闻资讯
168