Visão geral do pipeline
- Coloque um vídeo — MP4, MKV, AVI, MOV, WebM, WMV, FLV, ou M4V.
- O reconhecimento de fala funciona no dispositivo com segmentação em nível de frase ajustada para legendas de transmissão.
- O AI no dispositivo traduz cada linha com consciência da voz do personagem e continuidade.
- Uma segunda passagem AI relê todo o arquivo de legendas para coerência — a "passagem de revisão".
- Destaque de diferença em nível de palavra visualiza o que o AI corrigiu.
- Relatório de qualidade: cobertura %, velocidade média de leitura, detecção de lacunas, contadores de linhas rápidas / lentas.
Cinco presets de qualidade
De Rápido (máximo rendimento) a Qualidade Máxima (mais lenta, mas mais precisa), com Equilibrado como o padrão recomendado e um preset dedicado de Fala Suave que captura vozes sussurradas ou silenciosas. Um modo personalizado expõe todos os parâmetros para usuários avançados.
Multi-idioma a partir de uma transcrição
Transcreva uma vez, traduza para muitos. O botão "+ Adicionar Idioma" retraduz a transcrição em cache para um novo idioma-alvo em segundos, gerando arquivos SRT por idioma sem reexecutar a passagem de reconhecimento de fala.
Queima dura acelerada por hardware
Queime legendas traduzidas no vídeo usando o codificador de vídeo da sua GPU — NVIDIA, AMD ou Intel. Detectado automaticamente. Ou soft-mux para zero perda de qualidade quando seu player suporta. Fonte, tamanho, cor e contorno são todos configuráveis.
Fila de múltiplos vídeos
Coloque uma pasta, processa cada vídeo sequencialmente. Skip-on-exists evita reexecutar vídeos já finalizados. Cache por projeto armazena a transcrição mais os idiomas concluídos — retome após reiniciar sem reexecutar a passagem de reconhecimento de fala.