今日问题:在新村上岗的人工智能数据标注员们,他们最基本的工作是什么?
本题选项:
A.算法
B.关键点标注
正确答案:关键点标注
出题单位:答答星球
支付宝蚂蚁新村小课堂 - 2023年07月07日 - 答案
答案解析:数据标注最基本的就是关键点的标注,也就是画框,框得不准确机器就可能“学坏”。比如人的姿态识别,就包括18个关键点,经过训练的标注员才能掌握这些关键点的标注,标注完成的数据也才能符合机器学习的标准。
数据标注的类型
数据标注的类型取决于数据标注的形式,通常包括文本标注、音频语音标注、图像标注和视频标注。 我们都说术业有专攻,对于不同类型的数据标注项目自然有不同类型的数据标注员。
语音标注的重要性
自互联网冲击着传统媒介以来,我们的生活方式早已离不开网络。看着菜市场的小贩们都灵活熟练地使用支付宝,每个人只要有手机就可以轻轻松松完成任何生活琐事。互联网和计算机作为新的媒介传递着人与人之间的各种形式的信息,图像、文字、声音等等。
虽然机器在将这些信息推送给感兴趣的用户方面很出色,但在理解语言本身方面却不太擅长。 理论语言学和计算机语言学专注于揭示语言的深层本质,并捕捉语言结构的计算特性。
人类语言技术(HLTs)试图采用这些见解和算法,并将其转化为能够影响我们使用语言与计算机交互方式的高性能程序。随着每天有越来越多的人使用互联网,研究人员可获得的语言数据量大大增加,使得语言建模问题可以被视为ML任务,而不是局限于人类自己能够处理的相对较少的数据量。
然而,仅仅向计算机提供大量数据并期望它学会说话是不够的–必须以这样一种方式准备数据,使机器模型能够更容易地找到模式和推论。这通常是通过向数据集添加相关元数据来实现。任何用于标记数据集元素的元数据标签都被称为对输入数据的标注。
为了让算法高效学习,注入高质量、大量的标记数据和明确要生产的机器模型需要完成的任务密不可分。因此,语音标注是开发人工智能语言技术的关键环节。
版权声明:本文为 “鸭先知” 原创文章,转载请附上原文出处链接及本声明;
工作时间:08:00-18:00
客服电话
400-000-0000
电子邮件
000000@qq.com
扫码二维码
获取最新动态