阿里推开源版“妙鸭”FaceChain 1张图片百种定制

站长之家 2024-01-10 17:03:29新闻资讯
39

FaceChain-FACT是阿里推出的一项人工智能生成个性化肖像的技术,通过Deformable Neural Radiance Fields技术从普通视频中创造自由视点的肖像。使用FaceChainAI照片生成模型,不需要提供多张照片训练LoRA(妙鸭相机的原理),仅需一张用户照片即可生成高度定制的肖像,支持百余种定制模版,生成速度更是快过商业应用100倍,达到秒级。

FaceChain-FACT.png

项目地址:https://facechain-fact.github.io/

其技术方法包括图像预处理、基于Transformer的面部特征提取器、稳定扩散等,支持多种LoRA模型,实现多样化肖像风格。这一技术的应用前景广泛,尤其在人工智能生成内容领域具有巨大潜力。

在技术方法方面,FaceChain-FACT通过一系列图像预处理步骤获取训练数据集,利用Transformer-based的面部特征提取器提取面部特征,使用稳定扩散将面部条件传递给FACT-Adapter,结合文本嵌入生成高质量肖像图像。该技术还支持ControlNet和LoRA插件,具有强大的插拔性。

总体而言,FaceChain-FACT的提出填补了现有技术的空白,为个性化肖像生成提供了一种更加高效和简便的解决方案,同时在生成速度和定制化程度方面实现了显著的进步。这对于人工智能生成内容的发展具有积极的推动作用。

开源
THE END
tom
不图事事圆满 但图事事甘心。

相关推荐

Whisper-NER:aiOla推出的开源AI音频转录模型,实时遮蔽敏感信息
Whisper-NER是aiOla基于OpenAI的开源语音识别模型Whisper开发的一款高级音频转录模型。它不仅继承了Whisper在多语言、实时处理及高准确度方面的卓越性能,还创新性地加入了敏...
2024-11-21 新闻资讯
114

Ultravox:Fixie AI推出的开源多模态实时语音交互AI模型
在人工智能技术飞速发展的今天,实时语音交互已成为人们日常生活的重要组成部分。Ultravox,一款由FixieAI公司开发的创新性多模态大语言模型,旨在提供一个封闭源模型如 GPT-...
2024-11-15 新闻资讯
118

Outfit Anyone:阿里巴巴集团智能研究院推出的AI虚拟试衣开源项目
Outfit Anyone 是由阿里巴巴集团智能计算研究院推出的一款基于人工智能技术的开源AI虚拟试衣项目,通过先进的计算机视觉和深度学习技术,用户可以上传自己的照片或选择预设的...
2024-11-11 新闻资讯
148

MIMO:阿里巴巴智能研究院开源的多功能可控视频合成模型
MIMO 是阿里巴巴集团智能计算研究院开源的一种用于可控视频合成的通用模型,其核心思想是将2D视频编码为紧凑的空间代码,并考虑视频发生的固有3D特性。通过这种编码方式,MIM...
2024-11-10 新闻资讯
124

Buzz:开源免费的离线AI音频转录和翻译工具
Buzz是一款开源免费的离线AI音频转录和翻译工具,致力于为用户提供高效、安全且便捷的音频处理解决方案。其核心基于OpenAI的Whisper模型,支持多种语言,无需网络连接即可对个...
2024-11-04 新闻资讯
137

ElementUI:饿了么前端团队开源的一套基于 Vue.js 的桌面端组件库
ElementUI 是饿了么前端团队开发的一套基于 Vue.js 的桌面端组件库。其提供了一系列经过精心设计和测试的 UI 组件,涵盖了从基本的输入框、按钮到复杂的表格、导航菜单等各个...
2024-11-01 编程技术
155