最近一则招聘搅动了成都高校的社交媒体圈。招聘的是“声音模特”,要会说成都话,声音还要年轻乐观有活力。工资是:700元每小时。有网友跃跃欲试:一天5600元,我能录到公司破产。
记者了解到,招聘“声音模特”是为了录制用于智能音箱的语音合成素材。除以上要求,应聘者还要能创造性发挥,会外语口语,并且只选一个人。目前收到的四五百份应聘语音里,阿里巴巴一位公关经理听了几十份,觉得在创造性发挥方面都有欠缺。
“一天一般录4小时。录8小时,恐怕接下来要休息一周。”上述公关经理说道。
700元一小时 一则招聘引热议
“成都话说得好,也能挣钱,而且还不低:700元一小时。”最近,不少成都高校的学生关注到这样一则招聘。招聘由标贝(北京)科技有限公司发布,招聘的是“天猫精灵声音模特”,薪资待遇700元每小时。
招聘中要求,成都方言发音标准流畅,熟练掌握使用各种方言词汇,还要求“具备基本英语能力,能模仿外语口语发音”。应聘者需要发送两段录音,其中一段是以“你好,我是天猫精灵”开始的固定文本,另一段要求用成都方言进行2分钟以内的自我介绍。
这则招聘像是在四川一些高校的学生群里扔下一块巨石。招聘信息刚到群里,有人就跃跃欲试:“嗨呀,这太适合我了。我要去录音了。”有同学自信满满:“700元一小时,一天5600元?我感觉我能录到公司破产。”有人觉得遗憾:“我的四川话本来很正,但宿舍来了一个东北老铁,口音被他带歪了,我感觉损失了好几个亿。”也有来自外省的同学不解:“凭什么四川话这么值钱?我们广东人表示不服。”另一个同学也在群里问:“粤语就不行?”
收到四五百份应聘素材 目前还没选出合适的
阿里巴巴公关经理朱女士确认了这份招聘的真实性,“是为了录制用于天猫精灵智能音箱的语音合成素材,采集四川话的成都口音。”她看了下邮箱后说,上周四前后招聘发布,现在邮箱里已收到四五百份应聘的素材。不过她表示,自己跟着听了几十份,“还没有符合条件的。”在她耳朵里,这些声音的音质自不必说,只是在稳定性方面或在创造性上都有所欠缺。
“收到的邮件里,有一些是专业的配音公司发来的。”朱女士介绍,除了发音标准、音质稳定,考虑到天猫精灵智能音箱的用户人群,声音还得年轻、活泼,“所以我们更加倾向于学生。”她也解释了“创造性发挥”:实际使用中智能音箱和使用者交流时,是有性格的,有时候会是幽默的,有时候可以怼,有时又要可爱,因而应聘者在录音时并不总是阅读固定文本,“例如,我们会给出一个问题,要求给出十个不同的回答。”她介绍,2分钟的自我介绍就有意考察应聘者的发挥。
至于外语要求,她举例:使用者要听英语歌曲时,说出后智能音箱会复述,“需要保持汉语和英语音质的一致性,所以要求应聘者会说英文。”
在她看来,时薪700元的工资,在语音合成行业里已不算低,“一般是400-600元。”给出高薪是考虑到方言的语音合成相对于普通话要难。不过一天挣5600元的想法不太现实,“一般一天会录4个小时,如果录8个小时,可能接下来要休息一周。”朱女士补充,这次招聘是根据实际录音时间计薪的。
四川话和普通话差异小 目前只在做四川话版本
“如果确实有与要求相符的声音,最终会选定一人。“朱女士介绍,之后便由供应商安排选中的人录音,做语音合成,并提供给阿里巴巴方面。标贝(北京)科技有限公司便是这个项目的供应商。她解释,使用时智能音箱会说很多不同的话,录音时不可能全部顾及,“会把有可能出现的字、词和连贯的句子录下来,供应商再做语音合成——这样,就会自动生成各种各样的话。”
据介绍,目前天猫精灵的方言版本只有四川话。“四川话覆盖的人群广泛,能够和我们一起做这件事的人就多。”另一方面,朱女士表示,四川话和普通话的差异相对小一些。“智能音箱还涉及到语音识别,需要理解方言在普通话里的意思,四川话几乎不存在这个障碍。”
“肯定不会只有四川方言。”她也透露,不过目前还没想好其他地区的方言版怎么做。