Descripción general del pipeline
- Suelta un video — MP4, MKV, AVI, MOV, WebM, WMV, FLV o M4V.
- El reconocimiento de voz se ejecuta en el dispositivo con segmentación a nivel de frase ajustada para subtítulos de transmisión.
- La IA en el dispositivo traduce cada línea teniendo en cuenta la voz del personaje y la continuidad.
- Una segunda pasada de IA vuelve a leer todo el archivo de subtítulos para coherencia — la "pasada de revisión".
- El resaltado de diferencias a nivel de palabra visualiza lo que la IA corrigió.
- Informe de calidad: cobertura %, velocidad de lectura promedio, detección de huecos, contadores de líneas rápidas / lentas.
Cinco presets de calidad
Desde Rápido (máximo rendimiento) hasta Máxima Calidad (más lento pero más preciso), con Equilibrado como el predeterminado recomendado y un preset dedicado de Voz Suave que captura voces susurradas o silenciosas. Un modo personalizado expone todos los parámetros para usuarios avanzados.
Multi-idioma desde una transcripción
Transcribe una vez, traduce a muchos. El botón "+ Agregar Idioma" retraduce la transcripción en caché a un nuevo idioma objetivo en segundos, generando archivos SRT por idioma sin volver a ejecutar la pasada de reconocimiento de voz.
Grabación acelerada por hardware
Graba subtítulos traducidos en el video utilizando el codificador de video de tu GPU — NVIDIA, AMD o Intel. Detectado automáticamente. O soft-mux para cero pérdida de calidad cuando tu reproductor lo soporta. Fuente, tamaño, color y contorno son totalmente configurables.
Cola de múltiples videos
Suelta una carpeta, procesa cada video secuencialmente. Skip-on-exists evita volver a ejecutar videos ya terminados. La caché por proyecto almacena la transcripción más los idiomas completados — reanuda después de reiniciar sin volver a ejecutar la pasada de reconocimiento de voz.