ToolBox

Real-Time Voice Cloning

Real-Time Voice Cloning

Clona uma voz a partir de poucos segundos de áudio e sintetiza fala em tempo real com ela. É uma implementação open-source do paper SV2TTS (Speaker Verification to Text-To-Speech), combinando três modelos — encoder, synthesizer e vocoder — num pipeline completo. Serve para pesquisadores, devs e entusiastas de áudio que querem explorar síntese de voz sem depender de APIs pagas. O diferencial é a capacidade de generalizar para vozes nunca vistas no treino, usando apenas um clipe curto como referência. Projeto open-source, gratuito, roda localmente.

Open Source

Ferramentas Relacionadas