谁能训练人工智能?

经济日报新闻客户端2020-08-10 17:13:15

最近,人社部公布了一批新职业,其中有个新职业叫做“人工智能训练师”。听起来满是高科技的人工智能还要靠人来训练?谁能训练这些看不见、摸不着的人工智能?“人工智能训练师”究竟做些啥?关键是,挣得多不多?

带着这些问题,近日记者走访了百度(山西)人工智能基础数据产业基地。这里是目前国内从业人员和产值规模第一的单体数据标注基地,入驻企业35家,AI数据标注师从业人员超过2300人。

“我是数据标注员,中专学历,一天工作8小时,大概能挣300多元。”面对记者的问题,山西麟诺网络科技有限公司的李宇龙很自豪地给出了答案。这个收入对一个在太原生活的年轻人来说算高水平了——数据显示,2019年,太原市的城镇居民人均可支配收入36362元。不过,李宇龙说自己不算最高的,“我同事有一天能挣1000多元的。”

李宇龙学历不高,原先的工作跟人工智能没什么关系。2018年,山西麟诺网络科技有限公司成立,李宇龙经朋友介绍来到了这家公司。

“当时我也不知道数据标注员是做啥的,更没听说过人工智能。我们老板就交给我一套规则,让我按照规则在电脑上认车道线。”那会李宇龙刚20出头,正是肯学的时候,他在短时间内熟悉了规则,还总结出了标注车道的新规律。

作为这项新职业里的老员工,李宇龙目前已经转型培训师,除了日常工作,也承担起对公司新员工的培训教学,“还有的同事会转型做项目,或者内容审核员,上升空间还是有的。”

(中专学历的李宇龙是山西麟诺网络科技有限公司的数据标注员,一天工作8小时,大概能挣300多元。除了日常工作,他也承担公司的培训业务。)

“数据标注技术门槛低,招工人群范围广泛,对于促进就业作用显著。”山西麟诺网络科技有限公司负责人李应维告诉记者,目前公司招聘的员工以大专生为主,也有部分中专生。标注的规则由百度和相关领域的专家共同制定,并形成可操作的软件平台提供给企业,企业对员工进行简单培训就能上手。以人脸为例,目前能实现对约150个特征点的标注。大致的标注规则是数据标注师看到双眼皮就标记双眼皮,看到狮子鼻就标记狮子鼻,让机器自己去理解和学习。标注的特征点越多,AI就越能精确地识别人脸。

看似简单的工作,背后有庞大的数据基础做支持。算法、算力和数据是人工智能发展的三大要素,数据就是人工智能发展的燃料。每天人类社会产生的海量数据必须经过清洗和标注,换成人工智能熟悉的语言才有价值。因此,人工智能训练师的主要任务就是数据采集和标注。特别是数据标注。如果说人工智能是个孩子,那数据标注师就是带领这个孩子认识世界的启蒙老师,是他们一点点教会AI认识世间万物、分辨喜怒哀乐、听懂嬉笑怒骂。有了足够多、足够好的数据,AI才能学会像人一样去感知、思考和决策,更好地为人类服务。

人工智能产业发展之初,数据采集和标注需要人力完成的部分比较多,但现在技术相对成熟,数据平台已经有了持续学习能力,大部分采集和标注工作人工智能自己就可以完成,实现预标注和自动标注,所以现在的数据标注工作以机器辅助和人工标注结合为主。除了眼底检查片、肺部X光片等技术含量较高的有专业要求,大多数员工都能按照规则,在平台上完成语音、人脸、道路的标注操作,只要能熟练操作电脑就能胜任。

34岁的郭梅就是新职业的受益者。她原本在山西一家煤矿做监控员,因为孩子到太原上学,她跟过来照顾孩子,到学校附近的数据标注基地求职。经过公司的岗前培训和团队的帮助,她从一开始每天只能标注两三百张,提升到每天能完成1300多张。

(34岁的郭梅原本在山西一家煤矿做监控员,经过公司的岗前培训和团队的帮助,她也成为一名数据标注员,孩子也在基地的帮助下,进入了附近一所优质学校读书。)

数据标注员的工作跟着人工智能的发展需求不断调整。前几年人工智能刚发展的时候,语音识别、人脸、图像等识别需求大;近几年无人驾驶、进入发展快车道,郭梅和李宇龙的主要工作就改成了无人车、地图、3D点云等数据标注,天天看的是车道线、行人、障碍物。

“也还有一些垂类的语音识别项目,比如普通话的语音识别基本解决了,现在有的公司开始开发方言的语音识别,我们也接了一些方言的语音数据标注项目,但那些就要招聘当地人来完成了。”李应维说。

有了足够的技术基础,数据标注员还能教会人工智能新任务。疫情期间,戴着口罩的人脸识别需求激增。“根据客户需求,山西数据标注基地采集了大量戴口罩的人脸照片,由数据标注师对人脸的眉毛、眼镜、颧骨等人脸关键点进行精准标注,训练人工智能完成了戴口罩的人脸图像识别。 ”百度(山西)人工智能基础数据产业基地负责人尉赤说,“人们能在不摘口罩的情况下实现精确的体温测量,或是通过人脸闸机,背后就是这些数据标注员在训练人工智能。”

艾瑞咨询发布的《中国人工智能基础数据服务行业白皮书》预测,随着全球人工智能产业、物联网、5G的爆发式增长,到2025年,全球每年产生的数据量将从2016年的16.1ZB猛增至2025年的163ZB,其中80-90%是非结构化数据,需要经过清洗和标注才能被唤醒价值。在我国,每年需要进行标注的语音数据超过200万小时,图片则有数亿张。因此,人工智能数据标注师的岗位需求将持续增长。尉赤透露,今年基地新招了500多人,未来5年计划培养5万名AI数据训练师,并引入更多AI合作伙伴。李应维也预计,到明年自己的企业用工将翻一倍,从160多人扩展到300人左右。后疫情时代,数据标注将成为创造大量就业需求的新兴职业领域。

(百度(山西)人工智能基础数据产业基地的AI数据标注师们正在工作。这里是目前国内从业人员和产值规模第一的单体数据标注基地,未来5年还计划培养5万名AI数据训练师。)

PHP网站源码大连百度竞价包年推广海西SEO按天计费报价辽源网站改版哪家好果洛网站推广多少钱百色网站建设报价遵义阿里店铺运营多少钱上饶设计公司网站哪家好海北百度竞价价格南平优化报价汉中高端网站设计价格襄樊SEO按天扣费多少钱呼和浩特网站搜索优化公司荆门外贸网站设计公司坂田高端网站设计白山网站关键词优化多少钱松岗优化报价南山seo排名哪家好武汉外贸网站设计哪家好长春关键词按天收费哪家好娄底模板推广济南网站seo优化报价张北外贸网站设计价格东莞网站优化多少钱岳阳网站制作公司坪山品牌网站设计哪家好沧州网络营销公司沧州至尊标王丹竹头网站优化软件公司晋中建网站价格宜昌模板推广歼20紧急升空逼退外机英媒称团队夜以继日筹划王妃复出草木蔓发 春山在望成都发生巨响 当地回应60岁老人炒菠菜未焯水致肾病恶化男子涉嫌走私被判11年却一天牢没坐劳斯莱斯右转逼停直行车网传落水者说“没让你救”系谣言广东通报13岁男孩性侵女童不予立案贵州小伙回应在美国卖三蹦子火了淀粉肠小王子日销售额涨超10倍有个姐真把千机伞做出来了近3万元金手镯仅含足金十克呼北高速交通事故已致14人死亡杨洋拄拐现身医院国产伟哥去年销售近13亿男子给前妻转账 现任妻子起诉要回新基金只募集到26元还是员工自购男孩疑遭霸凌 家长讨说法被踢出群充个话费竟沦为间接洗钱工具新的一天从800个哈欠开始单亲妈妈陷入热恋 14岁儿子报警#春分立蛋大挑战#中国投资客涌入日本东京买房两大学生合买彩票中奖一人不认账新加坡主帅:唯一目标击败中国队月嫂回应掌掴婴儿是在赶虫子19岁小伙救下5人后溺亡 多方发声清明节放假3天调休1天张家界的山上“长”满了韩国人?开封王婆为何火了主播靠辱骂母亲走红被批捕封号代拍被何赛飞拿着魔杖追着打阿根廷将发行1万与2万面值的纸币库克现身上海为江西彩礼“减负”的“试婚人”因自嘲式简历走红的教授更新简介殡仪馆花卉高于市场价3倍还重复用网友称在豆瓣酱里吃出老鼠头315晚会后胖东来又人满为患了网友建议重庆地铁不准乘客携带菜筐特朗普谈“凯特王妃P图照”罗斯否认插足凯特王妃婚姻青海通报栏杆断裂小学生跌落住进ICU恒大被罚41.75亿到底怎么缴湖南一县政协主席疑涉刑案被控制茶百道就改标签日期致歉王树国3次鞠躬告别西交大师生张立群任西安交通大学校长杨倩无缘巴黎奥运

PHP网站源码 XML地图 TXT地图 虚拟主机 SEO 网站制作 网站优化