AI模型(PIGEON):通过几张照片就能找到你的位置

站长之家 2023-12-20 10:54:27新闻资讯
17

斯坦福大学的研究生们开发了一款名为 PIGEON 的应用程序,可以仅仅通过查看 Google 街景图像或其他图像来确定具体位置,其准确率令人印象深刻。

根据预印本论文的数据,PIGEON 可以以92%的准确率预测所拍摄国家,并且在40%的猜测中可以将位置定位在目标位置的25公里范围内。该论文指出,PIGEON 在 GeoGuessr 游戏中排名前0.01%的玩家之内,该游戏要求用户根据所拍摄的 Google 街景图像猜测位置,这也是这个项目的灵感来源。

那么,PIGEON 是如何工作的呢?

学生们利用了 OpenAI 开发的神经网络 CLIP,通过对视觉类别名称进行训练,使其能够将文本和图像进行连接。然后,他们根据 GeoGuessr 的数据集进行了训练,该数据集包含了10万个原始随机采样的地点和四张图像,以覆盖给定位置的整个 “全景”,总共有40万张图像。与其他 AI 模型训练的图像数量相比,PIGEON 的训练图像数量相对较少。例如,OpenAI 流行的图像生成模型 DALL-E2是基于数亿张图像进行训练的。

PIGEON.png

此外,学生们还研发了一个名为 PIGEOTTO 的单独模型,该模型通过训练来自 Flickr 和维基百科的400万张照片,以从单张图像中识别位置。根据论文的数据,PIGEOTTO 在图像地理定位基准测试中取得了令人印象深刻的成绩,在城市准确度方面超过先前的最新技术结果7.7%,在国家准确度方面超过29.8%。

论文还探讨了与该模型相关的伦理考虑,包括其益处和风险。在一方面,图像地理定位具有许多积极的用途,例如自动驾驶、视觉调查以及满足对照片拍摄地点的好奇心。然而,其负面影响包括对隐私的最直接侵犯。因此,学生们决定不公开发布模型权重,仅在学术验证时发布代码。

这项研究为我们展示了 AI 在图像地理定位方面的巨大潜力,但也引发了隐私和伦理方面的一些担忧。在将来的发展中,必须更加重视这些问题,并确保合适的保护措施得以实施。

论文网址:https://arxiv.org/abs/2307.05845

ai
THE END
tom
不图事事圆满 但图事事甘心。

相关推荐

LiblibAI(哩布哩布AI):国内首家原创AI模型分享及图片生成网站
LiblibAI(哩布哩布AI)是一个专注于AI模型分享和图片生成的在线平台。它汇聚了众多原创AI模型和AI创作工具,用户可以通过这些模型轻松生成各种风格和主题的图片,满足个性化的...
2024-07-30 新闻资讯
219

GPT-4o mini是什么?GPT-4o mini和GPT-4o的区别对比
GPT-4o mini是OpenAI于2024年7月18日推出的迷你AI模型,它是GPT-4o的一个分支。本文ZHANID将深入探讨GPT-4o mini的核心特点、应用场景以及与完整版GPT-4o的主要区别。我们将从...
2024-07-20 电脑知识
155

OpenAI启动新一代AI模型训练,迈向通用人工智能新征程
全球领先的人工智能研究和部署公司Open AI近日宣布,已正式启动新一代旗舰人工智能模型的训练工作。这一举措旨在超越现有的GPT-4大模型,进一步拓展人工智能技术的能力边界,...
2024-05-29 新闻资讯
81

OpenAI推出免费旗舰AI模型GPT-4o,全面提升交互体验
在人工智能领域不断突破的OpenAI近日宣布,其最新研发的生成式AI模型GPT-4o即将与公众见面,并在未来数周内逐步整合到OpenAI的系列产品之中。这一消息在科技界引起了广泛关注...
2024-05-14 新闻资讯
57

阿里AI模型EMO免费上线通义APP 一张照片即可开口唱歌说话
阿里云宣布,EMO模型成功在通义APP中上线,并且完全开放给所有用户免费使用。如今,在通义千问APP内,用户只需简单三步操作:选择模版、上传照片、生成视频,即可轻松实现照片...
2024-04-26 新闻资讯
54

斯坦福团队大模型Octopus v2火了:手机就能运行 准确性超越GPT-4
近日,斯坦福大学研究人员发布的 Octopus v2模型引起了开发者社区的极大关注,其20亿参数的模型一夜下载量超过2k。这一模型可以在智能手机、汽车、个人电脑等端侧设备上运行,...
2024-04-07 新闻资讯
40