阿里巴巴推AI画图框架(SCEdit):可显著减少训练参数

站长之家 2023-12-27 11:24:30新闻资讯
31

阿里巴巴的新项目SCEdit是一个AI画图框架,可以显著减少训练参数、内存使用率和计算开销。在训练阶段,它减少了52%的内存消耗,仅利用ControlNet所需参数的7.9%,并实现内存使用量减少30%。

SCEdit.png

项目地址:https://scedit.github.io/

该项目的简介指出,图像扩散模型已被用于各种任务,如文本到图像生成和可控图像合成。最近的研究引入了微调方法,对原始模型进行细微调整,在基础生成式扩散模型的特定适应性方面取得了有希望的结果。

SCEdit2.png

SCEdit并不是修改扩散模型的主干部分,而是深入研究U-Net中跳跃连接的作用,并揭示出在编码器和解码器之间聚合远程信息的分层特征对图像生成内容和质量产生重大影响。

基于这一观察,SCEdit提出了一个高效的生成式调整框架,它使用轻量级调节模块SC-Tuner来集成和编辑Skip Connection。此外,所提出的框架允许通过注入不同条件与可控SC-Tuner简化并统一多条件输入网络设计以实现可控图像合成任务。由于其轻量级调节器使得反向传播仅传递给解码器块,SCEdit显著减少了训练参数、内存使用率和计算开销。

在文本到图像生成和可控图像合成任务上进行了大量实验,结果表明SCEdit在效率和性能方面具有优势。同时,该项目也宣布了开源,尽管还没有提供具体的代码,但已经有开发者表示愿意帮助实现。

ai画图
THE END
tom
不图事事圆满 但图事事甘心。

相关推荐

Outfit Anyone:阿里巴巴集团智能研究院推出的AI虚拟试衣开源项目
Outfit Anyone 是由阿里巴巴集团智能计算研究院推出的一款基于人工智能技术的开源AI虚拟试衣项目,通过先进的计算机视觉和深度学习技术,用户可以上传自己的照片或选择预设的...
2024-11-11 新闻资讯
151

MIMO:阿里巴巴智能研究院开源的多功能可控视频合成模型
MIMO 是阿里巴巴集团智能计算研究院开源的一种用于可控视频合成的通用模型,其核心思想是将2D视频编码为紧凑的空间代码,并考虑视频发生的固有3D特性。通过这种编码方式,MIM...
2024-11-10 新闻资讯
124

Animate-X:阿里巴巴蚂蚁集团开发的通用角色图像动画系统
Animate-X是一个由阿里巴巴蚂蚁集团开发的通用角色图像动画系统,能够通过增强运动表现进行动画制作,使得静态图像能够自动转化为动态角色动画。这一技术的出现,不仅降低了动...
2024-10-30 新闻资讯
141

EchoMimic:阿里巴巴达摩院推出的AI音频驱动图片说话开源项目
EchoMimic是阿里巴巴达摩院推出的一款AI音频驱动图片说话开源项目,专注于通过先进的深度学习技术将静态图像转化为具有动态语音和表情的数字人像。这项技术的核心在于它能够根...
2024-10-29 新闻资讯
143

阿里巴巴开源Qwen2-VL:革新多模态AI,超越GPT-4o的性能
阿里巴巴集团近日宣布开源其最新研发的视觉多模态模型——Qwen2-VL,Qwen2-VL模型在多项性能测试中超越了包括OpenAI的GPT-4o和Anthropic的Claude3.5-Sonnet在内的多个著名闭源...
2024-08-30 新闻资讯
124

FunClip:阿里巴巴出品的开源AI自动化视频剪辑工具
FunClip一款完全开源、本地部署的开源AI自动化视频剪辑工具。通过调用阿里巴巴通义实验室开源的FunASR Paraformer系列模型进行视频的语音识别,随后用户可以自由选择识别结果...
2024-07-28 电脑知识
276