数据集链接:

不废话,先给链接,不想看介绍的兄弟直接拿走,但请留个赞。


链接: https://pan.baidu.com/s/14s1PSXwNnvqS9sw-YpvgaQ 密码: leog


数据集介绍

这个数据集一般用于图像地理定位,有一些数据集就是从其中取得子集。

数据构成为:

  • 62058 张高清图像 (10343个地点)

这些图像涵盖宾州Pittsburgh的市区和邻近地区、佛罗里达州奥兰多市和纽约州曼哈顿市的部分地区。

对于每一个地点,包括了4个侧面照和一个仰角照片,形成360度视角。此外,还包括一张含有地址、街道名称等标记的图像。即,每个地点包含了6张照片。

01
02
03
04
05


以上几张是四个侧面照以及一个仰视角照片,现在再来一个含有标记的照片。


06

数据集格式

以上照片,对应XXXXXX_Y.jpg中的Y,1-5对应四个侧面和仰角图,0对应标记图。

files

经纬度标记

每一地点都给了一个经纬度标记,如下图所示:

在这里插入图片描述
这数据存在于GPS_Long_Lat_Compass.mat文件中,第一列和第二列对应的是经纬度,第三列对应的是每个地点第’4‘张图片的方向(与正北方向,逆时针的角度),其余几张图像的角度都是与这个图像的角度称正交或者平行的方向。

图像距离如何计算

在文件’Cartesian_Location_Coordinates.mat’中,是每一个地点的笛卡尔坐标(XYZ),在这个坐标系中计算两点之间的距离,就是两点之间的实际距离(单位:米)。

GIST & Color 直方图

’GIST.mat‘文件中包含了图像的GIST特征,即颜色直方图。这个可以用于计算相似度和画图。

在这里插入图片描述

按照官方文档中的说法,每个通道会有20维的特征,一个RGB图像就有60维,按理来说应该有6*60=360维特征,搞不懂为什么这里是960维,如果有大胸弟能理解,希望给我留言,探讨一下。

引言此数据集的论文

[1] Liu L, Li H, Dai Y. Stochastic attraction-repulsion embedding for large scale image localization(ICCV2019)[A]. arXiv[C]. 2018: 2570–2579.

数据来源于一篇2014年的TPAMI,在下载链接中有官方文档。


大胸弟,留个赞呗!!!

Logo

魔乐社区(Modelers.cn) 是一个中立、公益的人工智能社区,提供人工智能工具、模型、数据的托管、展示与应用协同服务,为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作,由全产业链共同建设、共同运营、共同享有,推动国产AI生态繁荣发展。

更多推荐