百度推出视频生成模型UniVG 可处理各种文本和图像的组合输入

站长之家 2024-01-19 10:31:09新闻资讯
53

百度推出的UniVG是一款视频生成模型,其特点在于针对高自由度和低自由度两种任务分别采用不同的生成方式,以更好地平衡两者之间的关系。

UniVG.png

项目地址:https://huggingface.co/papers/2401.09084

项目演示页面:https://univg-baidu.github.io/

视频生成技术基于“扩散”原理的方法近来在学术和产业界引起广泛关注,并取得显著成就。然而,目前这一领域主要集中在单一目标或单一任务的视频生成上,例如根据文本、图片或它们的组合生成视频。但这样的方法并不能完全满足真实世界多变的应用需求。用户通常需要更灵活的输入方式,如单独使用图像或文本,或将二者结合起来。

为了解决这一问题,百度提出了UniVG,一种“统一模态视频生成系统”,能够处理各种文本和图像的组合输入。该系统重新定义了视频生成模型中的多项任务,将它们划分为“高自由度生成”和“低自由度生成”两大类。在高自由度视频生成方面,采用了“多条件交叉注意力”技术,以生成与输入的图像或文本语义高度一致的视频。而在低自由度视频生成方面,引入了“偏置高斯噪声”,这种方法相较于传统的完全随机高斯噪声更能有效地保留输入条件的原始内容。

技术性能方面,UniVG在MSR-VTT视频数据库上表现出色,获得了最低的帧间视频差异性度量(Frame Video Distance, FVD)。这一成绩不仅超越了当前的开源方法,还与业界领先的闭源方法Gen2不相上下,显示出了卓越的实用价值和技术优势。

百度
THE END
tom
不图事事圆满 但图事事甘心。

相关推荐

百度文心一言App升级为文小言:9月内文心4.0大模型免费用
9月4日消息,百度今日宣布,其旗下AI应用“文心一言”已全面升级为4.0.0版本,并更名为“文小言”。据悉,文小言功能更强大,场景更丰富,基于文心大模型提供搜索、创作、聊天...
2024-09-04 新闻资讯
108

站长如何做好百度下拉框关键词优化?
在搜索引擎优化(SEO)的众多策略中,百度下拉框关键词优化是提升网站流量和用户粘性的一种有效手段。百度下拉框,即百度搜索框中的下拉提示,能够为用户提供快速、便捷的搜索...
2024-08-27 站长之家
127

百度AI助力搜索升级,18%结果由人工智能生成
百度公司在最新发布的2024年第二季度财报中披露,其搜索业务已经实现了显著的技术升级,目前有18%的搜索结果由人工智能生成。这一比例的增长标志着百度在利用人工智能技术改善...
2024-08-23 新闻资讯
112

防止内容被抓取训练AI:百度百科屏蔽谷歌/必应等搜索引擎
据报道,近日百度百科开始屏蔽谷歌和必应等大多数搜索引擎,预计是为了阻止这些搜索引擎和其他爬虫,未经授权抓取百度百科的内容用于训练AI。百度百科的robots.txt文件显示,...
2024-08-22 新闻资讯
146

百度关键词排名起伏很大的原因及解决方法
百度作为中国最大的搜索引擎,其关键词排名对于网站流量和曝光度的重要性不言而喻。然而,许多网站管理员和SEO专家常常会遇到百度关键词排名起伏不定的问题。这种情况不仅令人...
2024-08-11 站长之家
139

网站客服系统悬浮窗是否会影响百度收录和抓取?
网站客服系统悬浮窗是一种嵌入在网页中的实时通信工具,通常以一个小窗口的形式出现在页面的某个角落。它允许用户在不离开当前页面的情况下与客服人员进行交流,从而提高用户...
2024-08-08 站长之家
118