揭秘人工智能训练师:用数据“喂养”机器人5年,AI长大了,我却遇到天花板
原标题:揭秘人工智能训练师:用数据“喂养”机器人5年,AI长大了,我却遇到天花板
来源:时代周报
5年前,巫伟成怎么也没有想到自己的工作会和人工智能扯上关系。
巫伟成本科就读计算机专业,毕业后在一家外包呼叫服务商做客服组长,后来偶然间接触到一款智能客服产品。在此之前,公司只有人工客服业务。
从未接触过人工智能的巫伟成惊讶于客服机器人的效率,“当时我看了一组数据,说客服机器人能取代多少人工客服,就觉得它一定是未来。”
抱着这样的想法,巫伟成到了一家电商公司做高级知识库管理员,工作内容相当于AI训练师。
巫伟成提到的智能客服产品是阿里2017年发布的“店小蜜”,一款专门针对商家研发的人工智能客服机器人,能7*24小时在线,全年无休,缓解了618、双11咨询高峰期人工客服不够用的问题。
伴随店小蜜出现的还有第一批AI训练师群体。2020年3月,AI训练师被人力资源和社会保障部正式纳入新职业。这个职业中的大多数人来自客服组长、客户运营等岗位,此前从未接触过人工智能,现在却是支撑人工智能应用必不可少的一批群体,是人工智能背后的人工。
虽然AI训练师直接面对的是新兴的人工智能技术,但从很多方面看,这都是一份较为机械和枯燥的工作。训练师们从上班开始面对的只有一个东西——数据,他们要用大量的数据喂养白纸一样的机器人,直到他们能听懂并回答客户的问题。
巫伟成目前在一家智能客服供应商乐言科技做AI训练师,负责训练智能客服机器人,他们的工作包括收集不同行业的客户需求、提供数据标注原则、设计机器人对话逻辑等。
“这项工作很考验耐心,我们需要把非常大量的数据进行整合,慢慢地把数据量减下来,还要把数据量转化成有效的东西,这是一个很枯燥的过程。”
比如做3C产品的客服机器人,巫伟成需要先找行业内较大的店铺前线客服和销售人员沟通,收集店铺和客户日常的沟通数据和客户较为关心的问题,将问题标准化,并提取出行业特征。
在实际问答过程中,顾客的提问方式千奇百怪。在某智能语音交互公司担任AI训练师的陈哲如对时代财经介绍,比如“忘记密码”这一件事,客户可能会问“我密码丢了”“不知道我密码是什么”等等,这就需要训练师们将典型问题标准化,然后编写一些相似问题进行模型训练。
收集完数据后,训练师需要将数据灌入系统中,分解、聚类,再进行数据标注。数据标注是教人工智能认识某个句子的过程,标注内容包括意图、做分词等。
比如,“我买的手机壳尺寸不对”这句话,数据标注师们会将之标注到“退换货”这个意图中,如果某个句子没有明确的意图,便会根据相关的业务知识和使用场景进行标注。
很多公司会聘请专门的数据标注人员或者外包团队负责数据标注,但在数据量不大或者涉及到较专业的行业知识(如医学)的情况下,AI训练师也会做数据标注的工作。
数据标注完成后是对话流设计,当顾客问出一个问题时,机器人需要准确识别其场景或意图,然后从知识库中搜索合适的回答或推送相关商品服务。如果说数据标注是让机器人学习知识,那么对话流设计就是让机器人学会运用知识。
要让机器人准确识别出某个意图,背后需要有强大的模型和足够的数据量,巫伟成介绍,一个意图里面需要50-100个句子。
对话流设计成功后是日常修复bug的工作。智能机器人只是AI训练师们用一堆数据堆起来的智能,没有任何自己思考的能力,当客户问到数据库里未收录的问题、问话时采用过多的修辞、方言口音过重时,机器人都没办法回答,这就需要AI训练师手动找到问题调整。
“很多人对AI不太了解,他们觉得AI是可以达到一个成人智力水平的,但实际上它还处在比较初级的阶段。顾客会觉得一个这么简单的问题,机器人为什么回答不上来,实际上如果模型不行或者初始语料不够,以及考虑到算法在实际应用过程中的限制,机器人就是不会回答。”会计出身、大学刚毕业就做了AI训练师的陈哲如说。
在整个工作过程中,训练师们不需要掌握专业的算法知识,只需了解模型的基础工作原理,如果模型有问题可以与专业的算法团队对接。
陈哲如所在公司有内部的算法知识分享会,他表示自己有一个“老大”,依靠自学转型成为算法工程师,但“那是比较牛的人,大多数人只掌握一些基础知识。有一些小公司不是通过模型,而是直接通过关键词设置对话流,这就完全不需要算法。”
在提供客服机器人产品的平台方做AI训练师,一个难点在于需要持续接触不同行业的知识,因为AI落地应用一定会结合到某个垂直领域。比如陈哲如最近在做国家电网的项目,对电网知识完全不懂的他需要持续学习相关知识,否则便无法弄懂用户的真实意图。
当客服机器人由平台方制作好,交到客户手中,需要商家端的AI训练师针对具体业务再做优化。
“刚引进来的智能客服只能回答行业通用问题,完全无法用到实际业务中,宛如一个人工智障。比如发什么快递、店铺售后流程、开发票退差价等零碎问题,都需要我们继续优化。”赵云峰说,“有时候甚至会出现一些离谱的错误,比如客户问‘什么时候发货’,它会识别成‘什么东西好吃’”。
赵云峰本科毕业于交通工程专业,此前在阿迪达斯电商服务部做数据分析,因一个偶然机会接触到智能客服,2020年前后转行到生鲜零售电商杭州大希地公司做AI训练师。
AI训练师赵云峰刚来时,公司还没有AI训练部门,只是因为赵云峰的数据分析工作看起来和AI训练师有联系,便被拉过去负责这项业务,没有任何经验的他从0到1摸索着搭建起了该部门。
刚开始,赵云峰整天泡在客服人员旁边,看他们怎么回复客户问题,在哪些节点推荐商品,哪些节点发送关怀语,然后将这些数据模型化,配置话术放到机器人知识库中。
2017年时,AI训练师还是一个刚刚兴起的职业,没有同行可以参考,赵云峰一开始走了不少弯路。比如,电商店铺经常凌晨举办活动,需要机器人回答一些有时效性的问题,但他们不知道怎么预设回答,只能半夜两三点爬起来更新话术。
经过4年多发展,公司的AI训练部门已经走入正轨。与平台端的AI训练师一样,商家端的AI训练师也是每天和数据打交道,主要工作就是对话流抽检,找出错误的对话,解决问题或将问题反馈给供应商。
遇到最多的问题,还是机器无法理解人的语言导致的对话流紊乱,背后原因是客户提问方式有太大的不确定性。
赵云峰介绍,人在线上说话经常会分段说。比如客户在问发货问题时可能会先说“今天上海来台风了”,机器人的底层逻辑决定,必须要对客户发出去的每一句话回应,当客户的话没有实际的指向时,机器人可能会默认到错误的话术场景。
当客户说话有太多语气词或者形容词时,如“我想要一件适合现在穿且防水的衣服”,机器人都会推荐错误,这时候一些没有耐心的客户可能就直接不买了。
碰见无法被识别的对话时,训练师需要在系统里添加新的问答和相似问题,最多一天需要处理10个对话流紊乱的问题,大约花费2小时的时间。赵云峰表示,处理对话问题时,最大的难点实际上在于公司内部沟通不顺畅,训练师往往没办法及时更新商品信息。
与平台端AI训练师不同的是,商家端AI训练师更需要关注智能客服是否给品牌带来了业绩提升,并在此基础上,优化智能客服和提升品牌的服务能力。
比如品牌端的智能客服要对客户追单,训练师需要跟踪追单效果,若效果不好则要更新智能客服的追单话术,或者辅之以图片、视频。这些都要求训练师本身有营销相关的知识。
此外,商家端训练师在训练机器人时还要考虑品牌调性和人文关怀。比如杭州大希地公司的主要客户是白领和精致妈妈,客服机器人就需要用“家庭风”的语言回复,比如“这款食品特别适合宝宝食用”。
团队能够正常运营后,赵云峰没有再继续做AI训练师,而是开始在探索电商行业的数智化运营方式,例如数智化营销、智能客服、虚拟主播等。
巫伟成也转任了产品定义主管。在平台端,从AI训练师到产品经理是最为普遍的职业晋升道路。
AI训练师并不需要特定的专业知识,所以作为一份新职业,并没有专业的人才输送路径,人才来源也较为多元。
会计专业出身的陈哲如表示,自己刚来公司时,身边同事“学什么的都有”。不过,这几年岗位也在慢慢“内卷”,最近一段时间他发现新来的同事都有一定专业背景,包括一些善于处理文字语句的汉语言文学专业,以及计算机背景的毕业生和有相关行业知识的人才。
赵云峰则坦言,从团队搭建到现在的5年间,公司AI训练师人员和工作内容都没有太大变化。其团队人员大多来自于客服岗位,“客服培训一个月就完全有能力上岗,能做一些比较标准化的日常运行工作。所以这个行业并不缺人,但缺高质量人才。”
他表示,客服做AI训练师基本都有思维定式,很难跳出原本工作框架。所谓高质量人才是指,不止能做日常的运营,还能追踪前沿技术,把技术和业务相结合,且能想到哪些新产品能对提升公司业绩有帮助。
赵云峰所在的公司已经从不关心这个职业到逐渐重视AI训练师群体,但AI训练师在公司并不是价值较高的人才。“目前AI训练师还只是围绕智能客服这个产品去做运维,没有涉及到更深层的一些东西。”
另外,虽然AI训练师有统一的职业名称,但工作内容却不同。陈哲如去年因自身特殊原因换了三四份工作,他发现,不同公司实际工作内容会有很大区别。
“一些AI技术不太成熟的公司,训练师更多会做一些数据标注或者话术设计的工作。在AI技术较为成熟的公司里,训练师则会参与产品设计和算法调优的工作,这时候虽然同样被叫做AI训练师,工作内容已经相当于AI产品助理。”
作为一份新职业,AI训练师或许还要一段时间朝更正规的方向发展,“训练师只是在抓一个产品,始终会有局限性,会有一个天花板在那。”赵云峰感叹。
责任编辑:邓健
网红“人造肉” 你想尝尝吗?
网红“人造肉”,香吗?来源:经济参考报盒马鲜生本周末上新“植物汉堡肉饼”,你想尝尝吗?全球传统肉联厂巨头“不务正业”布局“人造肉”,你还淡定吗?有报告说,20年后,人类一半以上的肉类食品将是“人造肉”,你还要为了减肥而不吃“肉肉”吗?有匿名的经济学家认为,“人造肉”纯属资本炒作,如果任其发展必将损害农牧民利益。欲知详情,请接着往下看,您大概需要5分钟完成阅读。0000互联网打工人不幸福:996、大小周和越来越严重的内卷
来源:燃次元闫俊文为什么社会在发展,内卷却越来越严重了?3月7日播出的《吐槽大会》上,程璐吐槽呼兰将互联网公司的996风气带到了一个喜剧公司,才来了两个月,就把公司的保安都熬秃了头,后悔没去当程序员。0001江苏苏宁击败广州恒大首夺中超冠军 苏宁嘉奖令紧随而至
11月12日在苏州赛区举行的2020赛季中国足球协会超级联赛冠军争夺战次回合比赛中,江苏苏宁队凭借埃德尔和特谢拉在上下半时的两个进球,以2:1击败10人作战的广州恒大队。韦世豪为广州恒大扳回一分。此前两队首回合战成0:0平,江苏苏宁最终以2:1的总比分赢得队史首个中超联赛冠军。苏宁方面今天对江苏苏宁易购进行嘉奖,嘉奖令如下:{image=1}责任编辑:杨亚龙0001谈“薯”色变:肥宅们还能快乐起来吗?
多款薯片检出潜在致癌物,还能愉快地咔滋咔滋吗?最近,肥宅们可能不太快乐了。同为“肥宅快乐”食品,薯片之于零食就如同可乐之于饮料,结合了土豆与油炸这两大舌尖上的幸福元素,在休闲食品中占据着领先的地位。但这咔滋咔滋的幸福,最近却站上了风口浪尖——“多款知名薯片检出致癌物超标”被顶上热搜。我们的快乐,还能继续吗?{image=1}被检测的15款薯片。图片来源:深圳市消费者委员会微信公众号0000教育局回应家长举报班主任索贿被泼热水:联合调查组正在调查中
近日,河北沧州一名家长称,孩子班主任向其索贿,自己一个月内送4次礼总计价值4000多元,此后她举报班主任索贿,遭到部分家长声讨被泼热水,矛盾激化后警方介入,自己被行拘20天。26日,当地教育局办公室一名工作人员表示,目前已在调查此事。至于涉事教师是否存在索贿行为,暂未有调查结果。0000