今日问题:数据标注员的日常工作除了图像标注,主要还有哪些任务类型?
本题选项:
A.文本标注
B.网页标注
正确答案:文本标注
出题单位:答答星球
支付宝蚂蚁新村小课堂 - 2023年09月07日 - 答案
答案解析:标注员任务包括文本标注:筛选、加标、修翻译,简单任务只需识字。图像标注:打点、拉框,工具如3D-BOX、超像素分割简化操作。语音标注:转写语音,需打字。视频标注:截图或打视频标签。
数据标注员基本工作是对图片、视频、语音、文本、人物、头像、场景、环境等数据内容进行简单地标注并结合需求对相应数据进行快速的整理、分类。
1、语音标注:
语音标注也称为语音转写,顾名思义就是根据要求将所听到的话转写出来。项目分为长语音、短语音、中英混转语音、小语种、方言等等。通常需要根据要求将文字填写出来,这其中需要先根据要求进行截取,截取的时长叫做有效时长。
2、2d拉框:
通常2d拉框做的最多的都是2d障碍物的项目,需要框选的有车辆、行人、锥桶等障碍物。这里面主要注意的是可见性的问题,要分清遮挡和截断的区别,同样的遮挡1/3:,2/3还是完全遮挡这要看具体的项目要求里面的解释。
3、3d点云:
点云成像数据通常是有激光镭射雷达、红外线成像方式在空间中打点成像,这里面包含三维立体数据、肉眼颜色的感官变化等复杂的数据处理。可以理解为通过点的造型透视出所要标注的三维立体物。
数据标注注意事项:
1、图像标注:
在被遮挡的情况下,遮挡部分需要脑补,但是不要脑补到图像外。不遗漏框/打点数,不误标框/打点数,不多标框/打点数。若出现图像较模糊无法标注的则不标。
2、文本标注:
同类标注属性,标注方式要保持一致。在文字标注过程中,由于部分文字间隔近,若同页中有相同的元素,可以考虑隔行标注,避免标注都挤到一起。标注标签的定义要细化到集体场景。
3、语音标注:
确定是否包含有效语音;确定语音的噪声情况;确定说话人数量;确定说话人性别、确定是否有口音、有效语音内容转写。整句话无法分辨出内容的,标为无效;背景噪音过大的,标为无效。
4、3D点云标注:
目标本身须全部被3D框包围,不漏点且不包含噪点。若目标物体边界清晰,则3D框边界距离目标主体真实边界最多不能大于10cm。
版权声明:本文为 “鸭先知” 原创文章,转载请附上原文出处链接及本声明;
工作时间:08:00-18:00
客服电话
400-000-0000
电子邮件
000000@qq.com
扫码二维码
获取最新动态