Painel Web

Clonagem de voz com Coqui XTTS

Envie um ou mais WAVs de referencia, escolha o idioma e gere audio com GPU.

Modelo ativo: tts_models/multilingual/multi-dataset/xtts_v2
GPU: ativa
Idioma padrao: pt

Para soar mais natural, use um WAV limpo, sem musica, com 6 a 12 segundos de fala clara.

Preset atual focado em fala mais natural: menos aleatoriedade e velocidade levemente mais lenta.

Aguardando envio.