外包人员表示,即使意识到自己无法准确评估聊天机器人的反应,他们也会尽力完成任务。
DoNews4 月 6 日消息,谷歌近日推出了聊天机器人 Bard,并呼吁公司员工进行内部测试,同时也委托了许多外包进行评估。然而,一些外包人员抱怨称,他们根本没有足够的时间来验证 Bard 的答案是否正确,最终只能凭借猜测。
据网易科技报道,目前,跨国 AI 训练数据服务公司 Appen 正在帮助改进谷歌的聊天机器人。虽然这些人没有被明确告知他们被分配的任务与 Bard 有关,但是关于新任务的内部讨论可以追溯到 2 月 7 日,也就是在谷歌首次发布 Bard 当天。Appen 内部文件显示外包人员需要审查 AI 聊天机器人所提供的回应质量。
这些外包人员通常会帮助评估谷歌搜索算法和搜索结果中广告的相关性,还会标记有害网站,使得这些网站不会出现在搜索结果中。
四名接受采访的外包人员表示,自 1 月份以来,他们的大部分工作已经转向审查 AI 聊天机器人的提示。在评估过程中,外包人员对聊天机器人的表现感到失望,并称他们没有足够时间准确评估聊天机器人对提示的响应是否正确,有时只能凭借猜测。不过他们仍然可以拿到报酬。
外包人员表示,他们被设定固定的时间来完成每项任务。审查提示的任务时间从 60 秒到几分钟不等,差异很大。这些人承认,如果他们不熟悉聊天机器人谈论的话题,比如区块链等技术,就很难给 AI 的回应评分。
但由于每项任务都有固定报酬,一些外包人员表示,即使意识到自己无法准确评估聊天机器人的反应,他们也会尽力完成任务。