一旦应用标签,您的汽车将能够在几秒钟内理解
作者:365bet官网 发布时间:2025-11-04 12:50
“数据标注”业务的项目经理黄雨辰正在做这个项目。 编者注 当流水线工人变成人工智能训练师,车间噪音变成数据流,湖北省凭借产业链的蓬勃发展,出色地回答了“人去哪儿”的问题?换句话说,工作岗位是基于行业每次迭代的新轨迹和新场景。敬请关注本报“行业就业增长”专栏。 文/图 湖北日报全媒体记者 刘天松 街景让人们一目了然地看到“车、人、红绿灯、建筑物和道路”。 AI看到的是一堆0到255像素的矩阵。 对人工智能来说,标记数据意味着“翻译世界”。数据标注者顺应时代需求而应运而生。蓝亿(武汉)智能数据服务有限公司位于武汉科技大学科技园,拥有一支数据标注人员500余人,分布于省内外多个城市,平均年龄不到30岁。 恩施市27岁的女孩范玉成就是其中之一。她于2020年加入蓝一智能,如今已经从一名普通的“数据记录员”转型为“项目经理”。令人惊讶的是,他大学的专业是汉语言文学。在数据、代码和算法无处不在的人工智能领域,文科学生确实被推到了中心位置。 即使对于初学者来说,上手也不难。 他留着齐肩的短发,戴着黑框眼镜,穿着休闲T恤,手里拿着平板电脑和一些书……当我第一次在兰依智能门外看到范玉城时,我以为她是一个去图书馆的自学大学生。 当您打开办公室计算机时,您会看到引人注目的图像,这些图像形成了一系列“网络”风格的城市街景:连接点图s、彩色注释框和互锁标记线。 “这就是数据标注,可以是文本、图像、视频、音频等。通过对不同类型的数据进行标注、描述、添加注释,轻松学习和理解大规模AI模型。”范玉成解释道。 AI产业的三要素是数据、算力、算法。其中,数据是AI的“营养源”,计算力是其“筋力”,算法是其“思维”。数据注释是为人工智能创建“切片”来处理原始数据并将其转换为可识别的内容,并通过机器学习算法进行酸化。 例如,查看城市街道需要人类使用专门的软件来标记汽车、行人、道路、红绿灯、建筑物、绿地、车道等各种元素,以训练大型AI模型的“眼力”和“脑力”。 数据标注容易上手吗? “如果你有很强的学习能力、耐心、注意力“注重细节,又会电脑,入门没那么难。”黄雨辰透露,2020年大学毕业时,湖北的数据标注行业才刚刚兴起,专业人才严重短缺,他决定尝试一下,并将简历投给了蓝一信息。 所有初学者任务都是初学者级别。例如,标记用行车记录仪拍摄的照片。对于黄雨辰来说,这类似于使用女孩子喜欢且擅长的专业软件“P图”。每张照片中的行人、车辆、道路等元素总数约为60个“注释框”。黄雨辰每天可以处理50到60张这样的照片。 ,成为新员工中的佼佼者。 人工智能需要越来越多的数据作为“食物” 尝试修饰一些照片可能会很有趣。如果你每天要编辑几十张甚至上百张照片,你难免会感到无聊。如果你想成为一名优秀的数据注释者,你必须努力工作阿德。 “与在照相馆制作的复杂照片相比,带有注释数据的图像的准确性要高得多。”黄宇辰说,入职第一年,他主要处理二维图像数据或车载摄像头拍摄的照片。每张照片打分后,公司都有专门的质检员来验证标注的质量,误差不能超过1个像素。 例如,在 24 英寸显示器上,如果将分辨率设置为 1920(宽)x 1080(高),则每个像素的宽度小于 0.3 毫米。黄雨辰标记了人和车,相当于将一张像素照片精确地“裁剪”成“万花筒”形状。图像数据标注错误每增加 1%,就会显着降低训练大规模 AI 模型的有效性。 黄雨辰表示,数据标注者的日常工作是“以数字为基础”进行评估的。效率高的人可以从工作中获得更多的成果,而注释慢的人则可以从工作中获得更多收益。离子速度快、质量差只能花费更多的时间和精力来弥补其缺点。另外,汽车企业的很多订单都与新车的研发和生产进度相关,数据标注员每天必须按照节点毫不拖延地完成工作,因此数据标注员熬夜加班是常有的事。 由于出色的表现,黄雨辰从一名数据标注员、团队负责人、项目主管,成长为一名项目经理,为蓝亿智能协调培训、客户对接、生产进度以及多个项目的交付。其项目涵盖汽车、工业制造、智能安防、新零售、医疗健康、金融等行业。 “大规模的人工智能模型大约每三到四个月就会迭代一次。市场对数据标注的需求越来越大,标注的内容也越来越复杂。”范玉成说。 塔以自动驾驶为例。黄雨辰在其职业生涯的最初几年,主要对车载摄像头拍摄的二维图像数据以及图像中车辆、行人、交通标志等的帧进行标注。 在2D图像数据中,由于无法识别距离和空间,激光雷达和毫米波雷达生成的3D点云数据标注正在迅速发展。 然而,驾驶自动驾驶汽车时,周围环境是动态的,3D点云数据仅提供静态的空间场景。因此,2024年,包含时间序列信息的四维标注将开始出现,能够更全面地描述物体的运动轨迹、形态变化以及物体与环境的相互作用。 如今,从汽车企业的订单来看,4D点云数据标注已经很普遍。蔚来、理想、吉利、东风、长安等企业都做出了蓝一智力。 “这说明我国自动驾驶技术正在快速发展,对人工智能获取‘饲料’数据的要求越来越高。”范玉成表示。 AI有助于消除“心理内耗” 黄宇辰将人工智能产业分为“人工智能+智能”。日益智能的AI模型背后,是无数数据标注者日日夜夜的默默奉献。 蓝一智能创始人兼CEO张雪娇是一位“90后”。黄雨辰和其他数据标注者一路走来都经历了挑战。 ,我可以从他的眼睛里看到这一点。 张雪娇透露,近年来,我国每年新增数百家数据标注公司。 “企业要想在智力密集型行业生存,就必须拥有自己的‘技术护城河’。”张雪娇表示,借助武汉理工大学在汽车行业的优势,蓝亿智能自主研发了私奔推出了一款“线”数据标注和管理平台,可以解决大部分汽车企业的数据标注需求问题,实现全面的数据“采集、清洗、脱敏、标注、质量”处理。检验培训。” “线”平台最直接的作用就是提高了数据标注的效率和质量,减轻了数据标注者的负担。仅此而已。 以4维点云图像数据为例,每个点云图像包含100到500帧,每帧必须标记至少数百个点、线和框。如果人们只是用手做标记,他们将在几个小时内无法离开座位。 “线”平台可自动完成70%以上的预贴标任务,支持多人或团队协同贴标,并提供智能质检能力。数据标注者需要做的就是帮助AI找到并填写数据e间隙,整体标注效率提升30%以上。 没有高质量的数据集,就无法训练高质量、大规模的人工智能模型。处理者越细致、越专业,数据集的质量就越高。与医学图像数据一样,治疗医生所做的手动注释的质量可能高于医学生。 如今,金融、医疗、嵌入式智能等行业已成为企业新的增长点。张雪娇认为,行业数据标注AI已进入快速发展期,对人才的需求量很大。湖北省作为科教大省具有得天独厚的优势。蓝亿智能成立五年来,与所属院校合作开展技能培训,积累了数万名人才的培训数据,真正“带动”了行业就业。
电话
020-66888888