字节跳动开源MagicAnimate:照片秒变真人舞蹈视频

站长之家 2023-12-05 11:04:45新闻资讯
161

从今天起,在社交平台上看到的小姐姐舞蹈短视频很可能就是AI生成的。字节跳动新开源基于SD1.5的MagicAnimate,它只需要一张照片和一组动作,就能生成近似真人的舞蹈视频。

MagicAnimate.png

项目地址:https://github.com/magic-research/magic-animate

MagicAnimate是一项利用先进的扩散模型实现人体图像动画的创新性项目。其核心优势在于确保生成内容的时间一致性,通过提供预训练的稳定扩散V1.5和MSE微调的VAE基础模型,使用户能够轻松入门。

使用MagicAnimate只需要一张照片和一组动作。用户可以选择一张喜欢的小姐姐的照片,然后通过输入一组动作,让AI根据这些信息生成一个舞蹈视频。这个舞蹈视频看起来非常逼真,几乎可以让人误以为是真实人物在跳舞。

为使用MagicAnimate,用户需下载稳定扩散V1.5和MSE微调的VAE预训练基模型,并按照提供的结构组织检查点。安装简便,仅需Python(3.8以上版本)、CUDA(11.3以上版本)和FFmpeg。可通过conda或pip安装依赖项。

推理过程:

MagicAnimate提供了用户友好的推理过程。用户可通过提供的bash脚本在单个GPU上运行推理,或使用另一个脚本在多个GPU上运行,以优化性能。这种简便的推理方式确保了从初学者到经验丰富的研究人员的广泛可访问性。

字节跳动 开源
THE END
tom
不图事事圆满 但图事事甘心。

相关推荐

字节推音乐生成神器(Seedusic):支持多样化输入和精确控制
最近,字节跳动放出了一个音乐创作的新玩意,叫 Seed-Music。这个神奇的音乐生成模型,可以让你通过多种输入方式(比如文字描述、音频参考、乐谱、甚至语音提示)轻松生成和音乐...
2024-09-18 新闻资讯
123

知名Web服务器软件 Nginx 迁移至 GitHub,推动开源发展迈向新台阶
近日,知名Web服务器软件 NGINX 宣布其官方开源开发存储库已从 Mercurial 迁移至 GitHub,今后,NGINX 将在 GitHub 上以接受拉取请求(Pull Requests)的形式开始接受贡献。同时...
2024-09-11 新闻资讯
121

FastAdmin:一款开源免费的极速后台开发框架
FastAdmin 是基于 PHP 语言,结合 ThinkPHP 和 Bootstrap 两大主流技术构建而成的后台开发框架。ThinkPHP 是一款优秀的 PHP 开发框架,具有简洁、高效、易扩展等特点,为 Fas...
2024-09-06 编程技术
125

Tailor:一款开源免费的AI智能视频剪辑工具
Tailor(中文简称:泰勒)是一款开源免费的AI智能视频剪辑工具,具有 Apache - 2.0 许可证。它主要包括视频剪辑、视频生成和视频优化三大类视频处理方向,共 10 种方法。Tailor...
2024-09-01 电脑知识
150

阿里巴巴开源Qwen2-VL:革新多模态AI,超越GPT-4o的性能
阿里巴巴集团近日宣布开源其最新研发的视觉多模态模型——Qwen2-VL,Qwen2-VL模型在多项性能测试中超越了包括OpenAI的GPT-4o和Anthropic的Claude3.5-Sonnet在内的多个著名闭源...
2024-08-30 新闻资讯
112

Awesome-Digital-Human:基于Dify的开源AI数字人技术框架
Awesome-Digital-Human 是一个基于现代技术和AI服务的开源数字人技术框架,旨在帮助开发者快速搭建具备高度定制化和扩展性的数字人平台。该项目不仅适合初学者,也适合经验丰...
2024-08-27 编程技术
123