COCO 数据集介绍

拥有超过 330K 张图像，其中 220K 张是有标注的图像，包含 150 万个目标，80 个目标类别如行人、汽车、大象等，91 种材料类别如草、墙、天空等，还有 250,000 个带关键点标注的行人。：COCO 数据集是完全公开的，研究人员可以自由下载和使用，并且可以根据自己的需求对数据进行修改、扩展和再利用，为计算机视觉领域的研究和开发提供了极大的便利，促进了学术交流和技术共享。：图像主要来源

Kikolee

1127人浏览 · 2025-05-21 14:12:28

Kikolee · 2025-05-21 14:12:28 发布

COCO 数据集即 Microsoft COCO（Common Objects in Context）数据集，是由微软开发维护的，在计算机视觉领域非常权威和官方。以下是其相关介绍：

规模庞大：拥有超过 330K 张图像，其中 220K 张是有标注的图像，包含 150 万个目标，80 个目标类别如行人、汽车、大象等，91 种材料类别如草、墙、天空等，还有 250,000 个带关键点标注的行人。
任务多样：可用于图像检测、语义分割、图像标题生成、目标检测、关键点检测等多种计算机视觉任务。
来源广泛：图像主要来源于日常生活场景，包括各种环境下的常见物体，如街道、室内、公园等场所的人物、车辆、动物、家具等。
版本更新：2014 年发布第一版，包含 164k 张图像，分为训练集（83k）、验证集（41k）和测试集（41k）。2015 年新增了 81k 张图像的测试集。2017 年对训练 / 验证集分割进行了更改，变为 118k/5k。
标注丰富：为每个目标物体提供精确的边界框信息，用于训练模型识别图像中不同物体的位置和类别；为每张图像提供了与之相关的自然语言描述，用于支持图文匹配、图像描述生成等跨模态任务。
公开开放：COCO 数据集是完全公开的，研究人员可以自由下载和使用，并且可以根据自己的需求对数据进行修改、扩展和再利用，为计算机视觉领域的研究和开发提供了极大的便利，促进了学术交流和技术共享。

COCO 数据集的官方网站是：COCO - Common Objects in Context

魔乐社区

魔乐社区（Modelers.cn) 是一个中立、公益的人工智能社区，提供人工智能工具、模型、数据的托管、展示与应用协同服务，为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作，由全产业链共同建设、共同运营、共同享有，推动国产AI生态繁荣发展。

更多推荐

全家桶集齐！Qwen3.5四款小模型上线魔乐社区，附昇腾全套实践教程

魔乐社区

Pont - 搭建前后端之桥：高效、灵活的接口管理工具

Pont 是一款强大的数据服务层解决方案，它能够帮助开发者快速搭建前后端之间的桥梁，实现接口的高效管理和代码自动生成。无论是新手还是有经验的开发者，都能通过 Pont 轻松处理接口文档、生成类型安全的 API 代码，从而显著提升开发效率。[![Pont 工具标志](https://raw.gitcode.com/gh_mirrors/po/pont/raw/3f1b7d4bbba3fd2dda