Añade tu archivo
Arrastra el archivo al cuadro o selecciónalo desde tu dispositivo.
Genera subtítulos limpios a partir de marcas de tiempo a nivel de palabra con controles profesionales de segmentacion, luego exporta SRT o VTT pulidos al instante.
o haz clic para seleccionar desde tu dispositivo
[ {"text":"Hola","start":0.12,"end":0.44}, {"text":"a todos,","start":0.44,"end":0.93}, {"text":"bienvenidos.","start":0.93,"end":1.40} ] // Tambien compatible: // {"words":[{"word":"Hola","start":120,"end":440}]} // {"results":{"channels":[{"alternatives":[{"words":[...]}]}]}}
Pega el JSON de marca de tiempo para validarlo antes de la generacion. El validador marca los campos que faltan inicio/fin por indice de palabra.
Admite matrices de palabras comunes de AssemblyAI, salida estilo Whisper y objetos de palabras anidados.
Ajusta la longitud de la linea, la duracion de la pista, la velocidad de lectura, las divisiones de puntuacion y el espacio entre pistas para que coincidan con el estilo de entrega.
La generacion se ejecuta en el navegador. Tu archivo de marca de tiempo subido no se envia a APIs de conversion externas.
Usa la herramienta en tres pasos sencillos. Mantén la página abierta hasta que el archivo esté listo.
Arrastra el archivo al cuadro o selecciónalo desde tu dispositivo.
Genera SRT, VTT o JSON a partir de marcas de tiempo por palabra.
Revisa la vista previa si está disponible y descarga el archivo final.
Prioriza los limites de oraciones y las divisiones opcionales de comas para que las pistas se lean de forma natural en la pantalla.
Aplica duracion minima y maxima de la pista con espacios entre pistas configurables para evitar colisiones y parpadeos.
Genera SRT o VTT limpios de la misma fuente de marca de tiempo sin reformatear manualmente.
Carga un JSON en el que cada palabra incluya el tiempo de inicio y fin. La herramienta detecta automáticamente segundos o milisegundos.
[{"text":"Hola","start":0.12,"end":0.44}] o [{"word":"Hola","start":120,"end":360}].
Encuentra anidados palabras arrays dentro canales, alternativas, segmentos u objetos de resultado.
Entiende segundos numericos, milisegundos numericos y cadenas como 00:00:12.340 o 120ms.
Una marca de tiempo a nivel de palabra vincula cada token con el tiempo de inicio y fin. Esto es comun en Whisper y pipelines STT modernos.
Cada indicacion de subtitulo se construye a partir de tiempos de token precisos, no de tiempos de frase adivinados.
Soporta estilo Whisper palabras arrays y salidas ASR anidadas de proveedores comunes de voz a texto.
Utiliza el validador integrado para detectar valores de tiempo faltantes antes de generar archivos SRT/VTT.
Esquema minimo recomendado para una generacion de subtítulos robusta:
[{"text":"Hola","start":0.12,"end":0.44}] donde inicio y fin son segundos o milisegundos.
palabra, tiempo_inicio, tiempo_fin, duracion, y anidados palabras arrays.
Genera archivos de subtítulos listos para editores, clips sociales y vídeo de formato largo en SRT o VTT.
Cada palabra debe tener texto ademas de campos de tiempo. Las claves comunes son texto o palabra, con inicio y fin.
Sí. La herramienta admite arrays de palabras directos y salidas anidadas que incluyen tiempos por palabra de Whisper y proveedores STT comunes.
Sí. Establece 'Líneas por indicación' en 1 y el generador mantendrá cada indicación en una sola línea.
Sí. El inicio y el fin de la indicación se derivan de los tiempos de las palabras y luego se refinan con tus ajustes de duración mínima/máxima y espacio.
Puedes exportar los subtítulos generados en formato SRT o VTT.