searchusermenu
  • 发布文章
  • 消息中心
点赞
收藏
评论
分享
原创

图像标注工具简介

2023-05-05 01:55:07
99
0

1. 概述

       图像标注是用于CV监督机器学习的标志性技术之一。目前深度学习算法精度的提升严重依赖于数据的规模和质量,甚至决定了算法的上限。在此需求背景下,业界发布了诸多的图像标注工具,大公司的AI中台也集成了图像标注版块功能,也出现了以数据众包和数据标注众筹平台为主要业务的初创企业,图像标注软件和平台目前发展非常活跃,在未来也是必不可少的重要一环。下面笔者对一些常见的、有亮点的图像标注工具进行简要介绍,并对图像标注技术发展趋势进行展望,希望对cv算法和AI平台开发同学能有所帮助。

2. 概述

2.1 LabelImg

     

      LabelImg是很多cv初学者的入门标注工具[1],由于其用户界面的友好性,理解该工具操作使用并不难,该工具支持源码安装和绿色安装,也支持跨平台运行(Win、Linux、Mac)。 此工具的缺点是它仅提供一种形状,即边界框或矩形形状,适合做目标检测和图像分割等视觉任务的操作。labelImg 可自定义标签名称,并提供了两种类型的文件,一种是 PascalVOC格式的标签,另一种是 YOLO格式的标签,方便支持目前最常见的目标检测器训练和评估。

2.2 Labelme

     

       Labelme 在易于安装和界面方面与 labelimg 相似[2],但更适合做图像分割的任务,该工具最好的功能之一是右下角的“文件列表”。 当您要注释大量图像时,可能会错过注释某些图像的机会。 这就是“文件列表”派上用场的原因,因为它不仅列出了您的文件,而且还为您已经注释的每个文件提供了一个复选标记。在 labelme 中,您可以自由选择它具有的六种类型,从多边形、矩形、圆形、线、点和线条开始。 labelme 使您可以灵活地注释图像,同时仍然易于使用。labelme 主要的缺点是它只能以 JSON 格式保存标签文件,对于其他的标注格式,需要算法工程师自己写脚本进行转换。

2.3 BBox-Label-Tool

     

      BBox-Label-Tool支持在图像中标记边框和人物属性,亮点是支持多标签标注,标签保存格式为txt文件,类别加框坐标,适合多属性的标注任务。该模型架构清晰,接口简洁,具有良好的扩展性,有望作为cv基础模型,为多项cv任务和多模态任务进行赋能。

2.4 CVAT

     

      CVAT是兼顾图像/视频标注,和项目管理功能的标注工具,由Intel团队开发,目前在已经交给了OPENCV组织来维护[4],该项目已经修改成MIT协议。在 CVAT可以创建一个包含相同类型任务的项目。 与项目相关的所有任务都将继承标签列表,可创建不同的角色,并为该项目的不同角色人员分配标注任务,同时也可以基于预训练模型,在后端辅助完成半自动化标注工作。CVAT支持多种标注任务和标注格式,例如目标检测、跟踪,支持图像和视频标注,并支持大约 15 种不同的格式保存标签。

2.5 Roboflow

       

      Roboflow是一款专为著名的目标检测算法YOLO设计的自动化训练数据工具[5],它为YOLO提供了一种更便捷、更快速的方式来准备训练数据。它能够自动从开发者提供的原始图像数据中提取所需的信息,并将其转换为YOLO可以直接使用的格式。Roboflow还提供了一种独特的标记方式,让开发者更轻松地为图像中的物体设定标签,以便YOLOv8能够更有效地识别它们。本文将为大家介绍如何使用Roboflow来训练YOLO自定义数据集,它提供了一种简单的方式来调整训练数据,使其能够更好地适应YOLO模型训练和评估的要求,帮助我们更轻松地准备YOLO 所需的训练数据。还可以自动转换和标记图像,以及针对不同的训练数据集设置特定的训练参数,确保YOLO模型能够更有效地识别物体,从而使YOLO模型能够更有效地训练学习。

       值得惊喜的是,目前Roboflow平台上已经与Meta合作,引入了SAM AI自标注和分割技术,与以往的自动标注技术采用预训练模型,进行1次辅助标注的方式不同的是,通过SAM技术引入了提示工程交互方式,标注者可通过text文本、划分提示框区域和可关注点方式,来灵活引导SAM模型在Roboflow平台完成标注,并且可以实现对一次标注目标的按需编辑,进行数据生成,极大提升了用户体验和数据质量,代表了数据标注新的技术方向。

3. 总结展望

      无论在工业界还是学术界,图像标注工具均是cv模型快速产出和优化迭代的利器,目前cv图像标注工具繁多,总结起来其发展特点和技术趋势总结如下:

  1. 图像标注工具的基本功能和特征均来自于实际的标注需求,具有多样化的发展特点,如分为单机运行版、联网版、开源版、绿色版等,丰富的工具形态和良好的开源生态为cv算法开发者提供了极大的便利,标注工具本身无好坏之分,cv开发者可根据操作熟练度、cv任务类型、标注格式、开发合作方式、数据安全性等方面的需求,选择合适的标注工具。
  2. 数据标注工具与AI模型开发、评估及应用评估等环节的结合越来越紧密,目前诸多科技公司如阿里、百度、华为等均开放了自己的AI平台,把AI标注工具当成用户引流的重要入口,与公司云端的数据仓库、AI创作间等版块结合日益紧密,与单机版和离线版的图像标注工具相比,平台级的AI标注工具在数据规模、数据及角色管理、AI自动化辅助等方面具有巨大优势,大大加快了数据标注和AI模型产出的生产进程。
  3. 交互式和生成式AI技术为图像标注工具注入新的活力。SAM技术通过提示工程方式为图像标注工具提供了新的人机交互接口,使标注人员更高效地聚焦于标注样本的语义信息,SAM所提供的cv基础分割模型为全自动化数据标注提供了新的数据引擎,图像标注的操作范围由传统的图像扩展到多模态人机交互,而以Diffusion Model为代表的生成扩散模型,为图像标注任务提供了图像编辑和内容创作能力,相信在不久的将来,会出现全新的图像标注工具,将成为面向AI数据生产的助推器。

4. 参考链接

[1]. https://github.com/heartexlabs/labelImg

[2]. https://github.com/wkentaro/labelme

[3]. https://github.com/puzzledqs/BBox-Label-Tool

[4]. https://github.com/opencv/cvat.git

[5]. https://blog.roboflow.com/label-data-segment-anything-model-sam

0条评论
0 / 1000