百度推出视频生成模型UniVG 可处理各种文本和图像的组合输入

站长之家 2024-01-19 10:31:09新闻资讯
74

百度推出的UniVG是一款视频生成模型,其特点在于针对高自由度和低自由度两种任务分别采用不同的生成方式,以更好地平衡两者之间的关系。

UniVG.png

项目地址:https://huggingface.co/papers/2401.09084

项目演示页面:https://univg-baidu.github.io/

视频生成技术基于“扩散”原理的方法近来在学术和产业界引起广泛关注,并取得显著成就。然而,目前这一领域主要集中在单一目标或单一任务的视频生成上,例如根据文本、图片或它们的组合生成视频。但这样的方法并不能完全满足真实世界多变的应用需求。用户通常需要更灵活的输入方式,如单独使用图像或文本,或将二者结合起来。

为了解决这一问题,百度提出了UniVG,一种“统一模态视频生成系统”,能够处理各种文本和图像的组合输入。该系统重新定义了视频生成模型中的多项任务,将它们划分为“高自由度生成”和“低自由度生成”两大类。在高自由度视频生成方面,采用了“多条件交叉注意力”技术,以生成与输入的图像或文本语义高度一致的视频。而在低自由度视频生成方面,引入了“偏置高斯噪声”,这种方法相较于传统的完全随机高斯噪声更能有效地保留输入条件的原始内容。

技术性能方面,UniVG在MSR-VTT视频数据库上表现出色,获得了最低的帧间视频差异性度量(Frame Video Distance, FVD)。这一成绩不仅超越了当前的开源方法,还与业界领先的闭源方法Gen2不相上下,显示出了卓越的实用价值和技术优势。

百度
THE END
tom
不图事事圆满 但图事事甘心。

相关推荐

字节跳动推出PixelDance与Seaweed视频生成模型:可在即梦AI平台免费体验
近日,字节跳动宣布推出两款全新的视频生成模型——PixelDance和Seaweed,并通过其即梦AI平台向公众免费开放使用。这一举措旨在助力设计师、影视制作人员及动画创作者等专业人...
2024-11-18 新闻资讯
116

站长如何利用百度小程序提升网站自然流量
在当今互联网环境中,网站的自然流量是站长们最为关注的核心指标之一。自然流量不仅代表网站的受欢迎程度,更直接关系到网站的盈利能力和长期发展。随着百度小程序的兴起,站...
2024-11-15 站长之家
122

百度大量删站:站长还有必要做网站和SEO优化吗?
近年来,百度作为中国最大的搜索引擎,频繁进行算法更新和站点审核,导致大量低质量网站被删除。这一现象引发了广泛讨论,许多站长和SEO从业者开始质疑:在当前的环境下,是否...
2024-11-14 站长之家
139

站长如何百度关键词规划师做精准问答引流?
百度关键词规划师作为一款强大的工具,可以帮助站长们精准定位关键词,优化问答内容,从而有效提升网站的流量和转化率。本文站长工具网将从百度关键词规划师的使用、精准问答...
2024-11-12 站长之家
119

百度SEO:为什么站长需要关注“网站抓取频率”?
对于许多站长来说,特别是中小企业网站的运营者,他们可能并不直接关心搜索引擎蜘蛛(如百度蜘蛛)的抓取频次,认为这对其网站影响不大。然而,对于大型网站和致力于SEO优化的网...
2024-11-11 站长之家
136

如何开通百度站长工具平台的站点子链功能?
站点子链功能是一种独特的展示权限,可以在搜索结果中展示网站的重要子站点和频道页,提高网站的曝光率和用户体验。然而,开通站点子链功能并非易事,需要满足一定的条件并通...
2024-11-03 站长之家
125