帮助中心 发表于 2024-09-05
目前提酒映画开发的声音克隆,音色克隆功能,已经发布两代产品。
两代产品各有不同特点,
目前全部开发给用户,用户可根据自己的需要使用。
1、一代克隆
需要40-120秒音频,克隆时长5分钟。
优点:仿真度更高
缺点:偶尔会有漏音重音等情况
适合用在娱乐类应用场景。
2、二代克隆
需要5-20秒音频,克隆时长30秒。
优点:音频样品需要更少,发音读词更准确。
缺点:音频仿真度低于一代克隆
适合用在对音色相似度要求不高的场景。
两代克隆均使用轻量级克隆技术,
无法100%与真人声音一致
简单好用的 AI数字人视频工具