登录 注册
English
数据集描述
简介

移动互联网时代的开启使得图片的获取与分享越来越容易,图片已经成为人们交互的重要媒介。如何根据图像的视觉内容为图像赋予一个语义类别(例如,教室、街道等)是图像场景分类的目标,也是图像检索、图像内容分析和目标识别等问题的基础。我们从400万张互联网图片中精选出8万张图片,分属于80个日常场景类别,例如航站楼、足球场等。每个场景类别包含600-1100张图片。详细的场景类别id和中英文名称见表格1

训练集:56,000 张
验证集:8,000 张
测试集 A:8,000 张
测试集 B:8,000 张

数据说明

训练标注数据包含照片id和所属场景类别标签号。训练数据文件与验证数据文件的结构如下所示:

    
[
    {
        "image_id":"5d11cf5482c2cccea8e955ead0bec7f577a98441.jpg",
        "label_id": 0
    },
    {
        "image_id":"7b6a2330a23849fb2bace54084ae9cc73b3049d3.jpg",
        "label_id": 11
    },
    ...
]
    

我们提供场景类别标号与场景中英文名称对照,文件结构如下:

label id Chinese label English label
0 航站楼 airport_terminal
1 停机坪 landing_field
2 机舱 airplane_cabin
数据预览
表格1:场景分类类别示例
0/航站楼:airport_terminal 1/停机坪:landing_field
2/机舱:airplane_cabin 3/游乐场:amusement_park
4/冰场:skating_rink 5/舞台:arena/performance
6/艺术室:art_room 7/流水线:assembly_line
8/棒球场:baseball_field 9/橄榄球场:football_field
10/足球场:soccer_field 11/排球场:volleyball_court
查看更多
数据下载
训练数据集 3.3G
sha1sum:
ba2ea5879d912af4da789b19a9187aa33bb8bc83
验证数据集 446M
sha1sum:
f2136cb14346dc45ca14ac93a7878fc774c19317
Test A 437M
sha1sum:
3de1e3089e72661e975b73505f92c3420ec95be8
Test B 439M
sha1sum:
9d86a5e1e03503a8067a18cc1b71049ba8daf6a2
验证脚本&基线模型
下载AI Challenger官方提供的验证脚本代码与基线模型

如果发现本网站存在侵犯自身合法权益的内容,请及时与hi@challenger.ai取得联系。