Few-Shot Segmentation (FSS) 是元学习中的一类分割任务, 希望训练出的模型可以在少量有标签的样本下就能泛化到新的类别上. 对比 ImageNet 上百万图像的分类任务目的是识别不同类别的物体, FSS 是从大量类别中学习广泛的特征, 并在少量有标签样本的引导下识别新类别的物体. 所以我们应当期望训练集中包含大量的类别帮助模型学习广泛的特征. 但是 FSS 经典的几个数据集 PASCAL VOC 和 COCO 只有 20 个 80 个类别, 因此港科大和腾讯联合退出了 FSS 1000 数据集用于 FSS, 其中包含了 1000 个类别, 每个类别有 10 个有标签的样本, 共计 10000 个样本.
下表列出了几个数据集的统计信息, 其中 Mean 和 Stddev 是类别中图像数量的均值和方差.
Dataset | Images | Classes | Classification | Detection | Segmentation | Mean | Stddev |
---|---|---|---|---|---|---|---|
SUN | 131,067 | 3,819 | ✔ | ✔ | ✘ | 39.22 | 717.68 |
ImageNet | 3,200,000 | 5,247 | ✔ | ✔ | ✘ | 650.02 | 526.03 |
Open Image | 9,052,839 | 7,186 | ✔ | ✔ | ✘ | 1409.62 | 14429.29 |
PASCAL VOC 2012 | 19,740 | 20 | ✔ | ✔ | ✔ | 215.90 | 164.07 |
MS COCO | 204,721 | 80 | ✔ | ✔ | ✔ | 4492.13 | 7487.38 |
FSS-1000 | 10,000 | 1000 | ✔ | ✔ | ✔ | 10 | 0 |
下图给出了 FSS-1000 图像的示例, 共 12 个大类, 每个大类给出 5 个小类的例子, mask 覆盖在物体上.

图 1. FSS-1000 的示例图片 1

图 2. FSS-1000 的示例图片 2