阿里巴巴推AI画图框架(SCEdit):可显著减少训练参数

站长之家 2023-12-27 11:24:30新闻资讯
123

阿里巴巴的新项目SCEdit是一个AI画图框架,可以显著减少训练参数、内存使用率和计算开销。在训练阶段,它减少了52%的内存消耗,仅利用ControlNet所需参数的7.9%,并实现内存使用量减少30%。

SCEdit.png

项目地址:https://scedit.github.io/

该项目的简介指出,图像扩散模型已被用于各种任务,如文本到图像生成和可控图像合成。最近的研究引入了微调方法,对原始模型进行细微调整,在基础生成式扩散模型的特定适应性方面取得了有希望的结果。

SCEdit2.png

SCEdit并不是修改扩散模型的主干部分,而是深入研究U-Net中跳跃连接的作用,并揭示出在编码器和解码器之间聚合远程信息的分层特征对图像生成内容和质量产生重大影响。

基于这一观察,SCEdit提出了一个高效的生成式调整框架,它使用轻量级调节模块SC-Tuner来集成和编辑Skip Connection。此外,所提出的框架允许通过注入不同条件与可控SC-Tuner简化并统一多条件输入网络设计以实现可控图像合成任务。由于其轻量级调节器使得反向传播仅传递给解码器块,SCEdit显著减少了训练参数、内存使用率和计算开销。

在文本到图像生成和可控图像合成任务上进行了大量实验,结果表明SCEdit在效率和性能方面具有优势。同时,该项目也宣布了开源,尽管还没有提供具体的代码,但已经有开发者表示愿意帮助实现。

ai画图
THE END
tom
不图事事圆满 但图事事甘心。

相关推荐

阿里巴巴1688接入DeepSeek:所有商家可免费使用AI工具
2月10日,阿里巴巴旗下知名B2B电子商务平台1688在京举行了一场盛大的招商活动,并在会上宣布了一项重大决定:所有面向商家的AI产品将全部免费开放使用。这一举措标志着1688在...
2025-02-10 新闻资讯
181

AudioLCM:浙江大学与阿里巴巴联合推出的高质量文本到音频生成模型
AudioLCM 是一种基于一致性模型(Consistency Models, CMs)和潜在扩散模型(LDMs)的新型文本到音频生成模型。该模型通过集成一致性模型到生成过程中,并引入多步常微分方程(mul...
2025-01-13 新闻资讯
206

阿里巴巴矢量图标库(iconfont)的几种使用方法详解
阿里巴巴矢量图标库(Iconfont)作为一个免费的图标库平台,提供了丰富的图标资源和多种使用方法,深受广大开发者和设计师的喜爱。本文ZHANID工具网将详细介绍阿里巴巴矢量图标...
2025-01-13 编程技术
339

FunASR:阿里巴巴达摩院开源的语音识别工具包
FunASR是由阿里巴巴达摩院开源的语音识别工具包,旨在帮助研究人员和开发者更高效地进行语音识别模型的研究和生产。它集成了语音端点检测、语音识别、标点预测等领域的工业级...
2024-12-24 新闻资讯
274

Marco-o1:阿里巴巴开源的一款先进大型推理模型
Marco-o1是阿里巴巴国际数字商业集团MarcoPolo团队研发的一款先进的大型推理模型。该模型基于Qwen2-7B-Instruct架构,通过结合多种先进技术和大量训练数据,旨在解决复杂现实...
2024-11-26 新闻资讯
290

Outfit Anyone:阿里巴巴集团智能研究院推出的AI虚拟试衣开源项目
Outfit Anyone 是由阿里巴巴集团智能计算研究院推出的一款基于人工智能技术的开源AI虚拟试衣项目,通过先进的计算机视觉和深度学习技术,用户可以上传自己的照片或选择预设的...
2024-11-11 新闻资讯
677