目前提酒映画开发的声音克隆,音色克隆功能,已经发布两代产品。
两代产品各有不同特点,
目前全部开发给用户,用户可根据自己的需要使用。
1、一代克隆
需要40-120秒音频,克隆时长5分钟。
优点:仿真度更高
缺点:偶尔会有漏音重音等情况
适合用在娱乐类应用场景。
2、二代克隆
需要5-20秒音频,克隆时长30秒。
优点:音频样品需要更少,发音读词更准确。
缺点:音频仿真度低于一代克隆
适合用在对音色相似度要求不高的场景。
两代克隆均使用轻量级克隆技术,
无法100%与真人声音一致
帮助中心 发表于
目前 提酒映画 开发的声音克隆,音色克隆功能,已经发布两代产品。 两代产品各有不同特点, 目前全部开发给用户,用户可根据自己的需要使用。 1、一代克隆 需要40-120秒音频,克隆时长5分钟。 优点:仿真度更高 缺点:偶尔会有漏音重音等情况 适合用在娱乐类应用场景。 2、二代克隆
目前提酒映画开发的声音克隆,音色克隆功能,已经发布两代产品。
两代产品各有不同特点,
目前全部开发给用户,用户可根据自己的需要使用。
1、一代克隆
需要40-120秒音频,克隆时长5分钟。
优点:仿真度更高
缺点:偶尔会有漏音重音等情况
适合用在娱乐类应用场景。
2、二代克隆
需要5-20秒音频,克隆时长30秒。
优点:音频样品需要更少,发音读词更准确。
缺点:音频仿真度低于一代克隆
适合用在对音色相似度要求不高的场景。
两代克隆均使用轻量级克隆技术,
无法100%与真人声音一致