为什么数字人克隆必须要克隆声音

帮助中心  发表于  2026-06-02    

各位用户,

如题,大家如果是想做真人形象克隆,必须要进行声音克隆。

为什么?

数字人克隆一共分为2部分,

1、是形象克隆,形象克隆的本质,就是人脸特征迁移。

将人脸特征迁移并绘制出的图片,就能让图片看起来很真人非常像。

2、是声音克隆,

从理论来讲,数字人形象可以使用任意音色。

但我们经过大量的测试发现,音色对数字人说话是的脸部动作影响极大。

不同音色,说同样的内容,两个动作看起来都不像是同一个人。

当数字人克隆完成后,用户在查看时,

如果不是自己的声音,你看克隆好的形象就会显得很别扭,因为人的眼睛非常灵敏!

能捕捉非常细微的变化,

当数字人说话时,脸部肌肉变化与本人有差异,就会让您感到很假。

如果把声音换成本人的音色,数字人的克隆相似度至少可以上升20%;

所以我们推荐大家使用音色克隆。