帮助中心 发表于 2026-06-02
各位用户,
如题,大家如果是想做真人形象克隆,必须要进行声音克隆。
为什么?
数字人克隆一共分为2部分,
1、是形象克隆,形象克隆的本质,就是人脸特征迁移。
将人脸特征迁移并绘制出的图片,就能让图片看起来很真人非常像。
2、是声音克隆,
从理论来讲,数字人形象可以使用任意音色。
但我们经过大量的测试发现,音色对数字人说话是的脸部动作影响极大。
不同音色,说同样的内容,两个动作看起来都不像是同一个人。
当数字人克隆完成后,用户在查看时,
如果不是自己的声音,你看克隆好的形象就会显得很别扭,因为人的眼睛非常灵敏!
能捕捉非常细微的变化,
当数字人说话时,脸部肌肉变化与本人有差异,就会让您感到很假。
如果把声音换成本人的音色,数字人的克隆相似度至少可以上升20%;
所以我们推荐大家使用音色克隆。