ai资讯

关注ai行业发展，专注ai软件推荐。

95 文章 0 关注0 粉丝 0 收藏0 点赞

关注

文章

关注

粉丝

VMix：提升文本到图像扩散模型的交叉注意力混合控制

VMix是一种新颖的即插即用适配器，通过细粒度的美学控制显著提升了文本到图像生成模型的性能。其灵活的设计和强大的功能使其在个性化图像生成、艺术创作、商业应用和教育培训...

2025-01-18 新闻资讯

104

StructLDM：高质量、多样化三维数字人生成模型

StructLDM是一种从2D图像集合中生成3D人体的新型范式。它利用先进的深度学习技术和计算机视觉算法，从图像和视频中学习人体的高维表征，并通过结构化的自动解码器和隐空间扩散...

2025-01-16 新闻资讯

127

ViTPose：基于视觉变换器(ViT)的人体姿态估计模型

ViTPose 是一种基于视觉变换器(ViT)的人体姿态估计模型。视觉变换器最初由 Google Research 提出，用于图像分类任务，其核心思想是将图像分割成多个小块(patch)，然后通过自注...

2025-01-15 新闻资讯

118

NeuralSVG：从简单文本提示自动生成高质量的矢量图形

NeuralSVG是一种基于神经隐式表示的方法，旨在从文本提示自动生成矢量图形(SVG)。与传统的矢量图形生成方法不同，NeuralSVG通过将整个场景编码到一个小型的多层感知器(MLP)网...

2025-01-14 新闻资讯

128

AudioLCM：浙江大学与阿里巴巴联合推出的高质量文本到音频生成模型

AudioLCM 是一种基于一致性模型(Consistency Models, CMs)和潜在扩散模型(LDMs)的新型文本到音频生成模型。该模型通过集成一致性模型到生成过程中，并引入多步常微分方程(mul...

2025-01-13 新闻资讯

124

HelloMeme：开源AI面部表情与姿态迁移框架

HelloMeme是一款开源的面部表情与姿态迁移框架，它利用先进的AI技术，特别是基于最新的Diffusion生成技术，实现了将视频中的人物表情和姿态迁移到静态图像中，生成个性化、趣...

2025-01-10 新闻资讯

138

LongWriter：清华大学数据挖掘研究组(THUDM)开源的超长文本生成模型

LongWriter是由清华大学数据挖掘研究组(THUDM)开发的开源语言模型，旨在让大型语言模型(LLMs)能够生成超长文本。通过引入一种基于代理的“计划-写作”方法，LongWriter将复杂...

2025-01-09 新闻资讯

141

DiffSensei：个性定制化AI漫画生成框架

DiffSensei 是一个由北京大学、上海AI实验室及南洋理工大学共同推出的AI漫画生成框架。它旨在利用人工智能技术，将文本提示和角色图像转化为具有连贯性和视觉吸引力的漫画面板...

2025-01-09 新闻资讯

150

Windsurf：Codeium团队开发AI集成开发环境(IDE)

Windsurf是一款功能强大的集成开发环境(IDE)，由Codeium团队开发。它被誉为世界上第一个基于AI Flow范式的IDE，旨在通过人工智能技术提升开发者的编程效率和体验。Windsurf...

2025-01-08 新闻资讯

150

Sonus-1：Sonus AI推出的高性能大语言模型

Sonus-1是Sonus AI推出的一系列高性能大语言模型。该系列模型包括三个版本：Sonus-1 Mini、Sonus-1 Air和Sonus-1 Pro。这些模型旨在满足不同应用场景和性能需求，从快速响应的...

2025-01-07 新闻资讯

140

LatentSync：字节跳动开源的视频人物唇部动作与音频精准同步模型

LatentSync是一项由字节跳动联合北京交通大学提出的创新技术，它代表了一种新型的唇部同步框架。该框架基于音频条件潜在扩散模型，旨在实现视频中人物唇部动作与音频的精准同...

2025-01-06 新闻资讯

217

InfAlign：谷歌DeepMind推出的提升语言模型推理对齐能力的机器学习框架

随着人工智能技术的不断发展，生成式语言模型在各个领域的应用日益广泛。然而，这些模型在从训练到实际应用的过程中面临着诸多挑战。其中，如何在推理阶段使模型达到最佳表现...

2025-01-03 新闻资讯

139

TangoFlux：高效的文本到音频生成模型，3.7秒就能生成30秒音频!

TangoFlux 是一种高效的文本到音频生成模型，具有 515M 参数，能够在单个 A40 GPU 上生成长达 30 秒的 44.1kHz 立体声音频，仅需 3.7 秒。该模型通过引入一种新颖的框架——C...

2025-01-02 新闻资讯

164

BrushEdit：腾讯、清华大学等联合推出的一体化图像编辑与修复技术

BrushEdit是腾讯、北京大学、香港中文大学及清华大学联合推出的先进图像编辑框架，是BrushNet模型的高级迭代版本。它结合了多模态大型语言模型(MLLMs)和双分支图像修复模型，...

2025-01-01 新闻资讯

150

Sana：NVIDIA实验室开发的高效文本到图像生成框架

Sana是一个高效的文本到图像生成框架，由NVIDIA实验室开发。它能够生成高质量、高分辨率的图像，并且具有极快的生成速度。Sana的核心设计理念在于优化算法和硬件的协同工作，...

2024-12-31 新闻资讯

169

图文资讯

图片压缩软件有哪些？5款免费好用的图片压缩软件推荐

软件下载

太极工具箱
下载
太极工具箱app是一款工具聚合软...
宇宙工具箱
下载
宇宙工具箱是一款功能十分强大且...
金花站长工具
下载
金花站长工具是一款可以进行百度...
爱站SEO工具包
下载
爱站SEO工具包是一款强大的站长工...
入梦工具箱
下载
入梦工具箱是一款仿照图吧工具箱...
极速图片压缩器
下载
极速图片压缩器是一款功能十分强...