What input format is supported?

Upload JSON that contains words with start and end timestamps, such as text/start/end, word/start/end, or nested words arrays from ASR systems.

Posso scegliere la logica di segmentazione dei sottotitoli?

Sì. Puoi configurare caratteri massimi per riga, righe per cue, target CPS, limiti di durata cue, spazio tra cue e comportamento con la punteggiatura.

Which export formats are available?

You can export generated subtitles as SRT or VTT.

Da timestamp parola a sottotitoli

Genera sottotitoli puliti da timestamp parola per parola con controlli professionali di segmentazione, poi esporta subito in SRT o VTT.

Trascina qui il tuo JSON con timestamp parola

oppure fai clic per scegliere dal tuo dispositivo

Scegli file

JSON

Impostazioni sottotitoli

Formato output

SRT SubRip

VTT WebVTT

Regole di formattazione

Caratteri max / riga

Professional range: 32-42

Righe per cue

▾

1 for social, 2 for long-form

Reading speed

cps

Caratteri al secondo

Durata min cue

Short cues are extended

Durata max cue

Long cues split faster

Gap between cues

Mantiene transizioni pulite

Options

Prefer sentence boundaries

Interrompi dopo . ? ! quando la durata lo permette

Allow comma-level splits

Usa virgole e punti e virgola quando un cue diventa troppo lungo

View accepted JSON sample

[
  {"text":"Hello","start":0.12,"end":0.44},
  {"text":"everyone,","start":0.44,"end":0.93},
  {"text":"welcome.","start":0.93,"end":1.40}
]

// Supportato anche:
// {"words":[{"word":"Hello","start":120,"end":440}]}
// {"results":{"channels":[{"alternatives":[{"words":[...]}]}]}}

Validazione JSON ed esempio

Incolla il JSON dei timestamp per validarlo prima della generazione. Il validatore segnala i campi start/end mancanti per indice parola.

Generazione...

Generazione completata

Pronto per JSON ASR

Supporta array di parole comuni da AssemblyAI, output in stile Whisper e oggetti parole annidati.

Professional Logic Controls

Regola lunghezza riga, durata cue, velocità di lettura, divisioni su punteggiatura e spazio tra cue in base allo stile.

Private by Design

La generazione avviene nel browser. Il file timestamp caricato non viene inviato ad API di conversione esterne.

Come funziona

Usa lo strumento in tre passaggi semplici. Tieni la pagina aperta finché il file è pronto.

Aggiungi il file

Trascina il file nel riquadro o sceglilo dal tuo dispositivo.

Scegli l’output sottotitoli

Genera SRT, VTT o JSON dai timestamp parola per parola.

Scarica il risultato

Controlla l’anteprima se è disponibile, poi scarica il file finale.

Pensato per creare sottotitoli professionali

Divisioni basate sulla punteggiatura

Dà priorità ai confini delle frasi e alle pause opzionali su virgola per cue naturali sullo schermo.

Vincoli temporali

Applica durata minima e massima dei cue con gap configurabili per evitare sovrapposizioni e flash.

Due output disponibili

Genera SRT o VTT puliti dalla stessa fonte di timestamp senza riformattare manualmente.

Input timestamp accettati

Carica JSON in cui ogni parola include il tempo di inizio e fine. Lo strumento rileva automaticamente secondi o millisecondi.

ARRAY

Elenco diretto di parole

[{"text":"Hello","start":0.12,"end":0.44}] or [{"word":"Hi","start":120,"end":360}].

NESTED

Output ASR annidato

Finds nested words arrays inside channels, alternatives, segments, or result objects.

UNITS

Secondi o millisecondi

Riconosce secondi numerici, millisecondi numerici e stringhe come 00:00:12.340 or 120ms.

Cos'e un timestamp parola per parola?

Un timestamp parola per parola collega ogni token a inizio e fine. È comune in Whisper e nei moderni flussi STT.

SYNC

Temporizzazione parola per parola

Ogni cue viene creato da timing accurati dei token, non da tempi stimati della frase.

WHISPER

Pronto per Whisper e STT

Supports Whisper-style words array e output ASR annidati dai comuni provider speech-to-text.

Validazione prima dell'esportazione

Usa il validatore integrato per trovare timing mancanti prima di generare file SRT/VTT.

Esempio di schema JSON

Schema minimo consigliato per una generazione robusta dei sottotitoli:

SCHEMA

Campi obbligatori

[{"text":"Hello","start":0.12,"end":0.44}] where start and end are either seconds or milliseconds.

ALT KEYS

Accettato anche

word, start_time, end_time, duration, and nested words arrays.

EXPORT

Output

Genera file di sottotitoli pronti per editor, clip social e video lunghi in SRT o VTT.

Domande frequenti

Come dovrebbe essere il mio JSON?

Ogni parola dovrebbe avere testo e campi timing. Le chiavi comuni sono text or word, with start and end.

Funziona con Whisper e timestamp parola per parola STT?

Sì. Lo strumento supporta array di parole diretti e output annidati con timing parola per parola da Whisper e provider STT comuni.

Posso generare solo sottotitoli a una riga?

Sì. Imposta “Righe per cue” su 1 e il generatore manterrà ogni cue su una sola riga.

Conserva i timing delle parole dal mio file?

Sì. Inizio e fine dei cue derivano dai timing delle parole e vengono poi rifiniti con durata minima/massima e impostazioni di gap.

Quali formati di sottotitoli posso esportare?

Puoi esportare i sottotitoli generati in SRT o VTT.