COCO 数据集介绍
拥有超过 330K 张图像,其中 220K 张是有标注的图像,包含 150 万个目标,80 个目标类别如行人、汽车、大象等,91 种材料类别如草、墙、天空等,还有 250,000 个带关键点标注的行人。:COCO 数据集是完全公开的,研究人员可以自由下载和使用,并且可以根据自己的需求对数据进行修改、扩展和再利用,为计算机视觉领域的研究和开发提供了极大的便利,促进了学术交流和技术共享。:图像主要来源
COCO 数据集即 Microsoft COCO(Common Objects in Context)数据集,是由微软开发维护的,在计算机视觉领域非常权威和官方。以下是其相关介绍:
-
规模庞大:拥有超过 330K 张图像,其中 220K 张是有标注的图像,包含 150 万个目标,80 个目标类别如行人、汽车、大象等,91 种材料类别如草、墙、天空等,还有 250,000 个带关键点标注的行人。
-
任务多样:可用于图像检测、语义分割、图像标题生成、目标检测、关键点检测等多种计算机视觉任务。
-
来源广泛:图像主要来源于日常生活场景,包括各种环境下的常见物体,如街道、室内、公园等场所的人物、车辆、动物、家具等。
-
版本更新:2014 年发布第一版,包含 164k 张图像,分为训练集(83k)、验证集(41k)和测试集(41k)。2015 年新增了 81k 张图像的测试集。2017 年对训练 / 验证集分割进行了更改,变为 118k/5k。
-
标注丰富:为每个目标物体提供精确的边界框信息,用于训练模型识别图像中不同物体的位置和类别;为每张图像提供了与之相关的自然语言描述,用于支持图文匹配、图像描述生成等跨模态任务。
-
公开开放:COCO 数据集是完全公开的,研究人员可以自由下载和使用,并且可以根据自己的需求对数据进行修改、扩展和再利用,为计算机视觉领域的研究和开发提供了极大的便利,促进了学术交流和技术共享。
COCO 数据集的官方网站是:COCO - Common Objects in Context
魔乐社区(Modelers.cn) 是一个中立、公益的人工智能社区,提供人工智能工具、模型、数据的托管、展示与应用协同服务,为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作,由全产业链共同建设、共同运营、共同享有,推动国产AI生态繁荣发展。
更多推荐


所有评论(0)