提酒映画2代声音(音色)克隆技术的区别

[来源:管理员A]  发表于  2024-09-05    

目前提酒映画开发的声音克隆,音色克隆功能,已经发布两代产品。

两代产品各有不同特点,

目前全部开发给用户,用户可根据自己的需要使用。


1、一代克隆

需要40-120秒音频,克隆时长5分钟。

优点:仿真度更高

缺点:偶尔会有漏音重音等情况

适合用在娱乐类应用场景。


2、二代克隆

需要5-20秒音频,克隆时长30秒。

优点:音频样品需要更少,发音读词更准确。

缺点:音频仿真度低于一代克隆

适合用在对音色相似度要求不高的场景。


两代克隆均使用轻量级克隆技术,

无法100%与真人声音一致