Jarvis' Blog 总有美丽的风景让人流连

FSS1000 数据集

2021-08-14
Jarvis
Post

Few-Shot Segmentation (FSS) 是元学习中的一类分割任务, 希望训练出的模型可以在少量有标签的样本下就能泛化到新的类别上. 对比 ImageNet 上百万图像的分类任务目的是识别不同类别的物体, FSS 是从大量类别中学习广泛的特征, 并在少量有标签样本的引导下识别新类别的物体. 所以我们应当期望训练集中包含大量的类别帮助模型学习广泛的特征. 但是 FSS 经典的几个数据集 PASCAL VOC 和 COCO 只有 20 个 80 个类别, 因此港科大和腾讯联合退出了 FSS 1000 数据集用于 FSS, 其中包含了 1000 个类别, 每个类别有 10 个有标签的样本, 共计 10000 个样本.

下表列出了几个数据集的统计信息, 其中 Mean 和 Stddev 是类别中图像数量的均值和方差.

Dataset Images Classes Classification Detection Segmentation Mean Stddev
SUN 131,067 3,819 39.22 717.68
ImageNet 3,200,000 5,247 650.02 526.03
Open Image 9,052,839 7,186 1409.62 14429.29
PASCAL VOC 2012 19,740 20 215.90 164.07
MS COCO 204,721 80 4492.13 7487.38
FSS-1000 10,000 1000 10 0

下图给出了 FSS-1000 图像的示例, 共 12 个大类, 每个大类给出 5 个小类的例子, mask 覆盖在物体上.

图 1: FSS-1000 的示例图片 1

图 2: FSS-1000 的示例图片 2


Content