他们的声音正在被“偷”走
“我们这种网上声音工作者,还有视频博主,都是高危人群。”在刷到林景的微博后,小默忍不住感慨。从媒体转行,她已在杭州干了近10年有声书主播,见到过一些针对“声音偷窃”设下的“陷阱”。
“有的活行价就在300元左右,即使声音再好,也不可能翻倍。但有些公司突然给出800元,当中很可能就有猫腻。”她说的猫腻,指的是合同里的“隐藏条款”,比如在权责部分,藏在大堆关于版权的说明里,有一行小字,提到授权声音制作使用等说法,但不会直接出现AI等字眼。
这种情况变多,也和AI生成一个人的声音技术门槛越来越低有关。
3年前,剪映开始推出多种音色的文本朗读,今年初又上线克隆音色功能;番茄小说、喜马拉雅的AI有声小说,也做得有声有色。
真人有声书、AI有声书
“这些元素其实是glam rock(笑),然后加这种bling的感觉(笑),我觉得像这个衣服有一些jacket,比如说那个oversized的jacket,我觉得我是可以offduty的model。”
就在近日,一款名为ChatTTS的文本转语音工具火爆出圈。只要你输入文字,无论中文、英语还是双语混搭,它都能以不同音色读出来,还会自动加上口语化的连词,会笑、会停顿,甚至能模仿口头禅。
“定制高质量的AI声音模型,需要一两个小时的语音素材,训练一两天。”长音频AIGC平台“呱呱有声”业务负责人张政鹏表示。它背后的灵伴智能,从2016年开始专注于智能语音相关的AI技术研发和落地。而完成普通品质的AI声音模型,仅需几分钟素材,“合成效果能做到一定程度与原始说话人相似,但很难用于高标准的有声作品制作场景。”