Painel Web

Clonagem de voz com Coqui XTTS

Envie um ou mais WAVs de referencia, escolha o idioma e gere audio com GPU.

Modelo ativo: tts_models/multilingual/multi-dataset/xtts_v2

GPU: ativa

Idioma padrao: pt

Texto Idioma

WAV de referencia da voz

Para soar mais natural, use um WAV limpo, sem musica, com 6 a 12 segundos de fala clara.

Temperature

Top P

Top K

Repetition Penalty

Velocidade

Preset atual focado em fala mais natural: menos aleatoriedade e velocidade levemente mais lenta.

Aguardando envio.

Abrir arquivo WAV