Da timestamp parola a sottotitoli

Genera sottotitoli puliti da timestamp parola per parola con controlli professionali di segmentazione, poi esporta subito in SRT o VTT.

Trascina qui il tuo JSON con timestamp parola

oppure fai clic per scegliere dal tuo dispositivo

JSON
Impostazioni sottotitoli
Caratteri max / riga
ch
Professional range: 32-42
Righe per cue
1 for social, 2 for long-form
Reading speed
cps
Caratteri al secondo
Durata min cue
ms
Short cues are extended
Durata max cue
ms
Long cues split faster
Gap between cues
ms
Mantiene transizioni pulite
Prefer sentence boundaries
Interrompi dopo . ? ! quando la durata lo permette
Allow comma-level splits
Usa virgole e punti e virgola quando un cue diventa troppo lungo
View accepted JSON sample
[
  {"text":"Hello","start":0.12,"end":0.44},
  {"text":"everyone,","start":0.44,"end":0.93},
  {"text":"welcome.","start":0.93,"end":1.40}
]

// Supportato anche:
// {"words":[{"word":"Hello","start":120,"end":440}]}
// {"results":{"channels":[{"alternatives":[{"words":[...]}]}]}}

Validazione JSON ed esempio

Incolla il JSON dei timestamp per validarlo prima della generazione. Il validatore segnala i campi start/end mancanti per indice parola.

Generazione...

Generazione completata

Pronto per JSON ASR

Supporta array di parole comuni da AssemblyAI, output in stile Whisper e oggetti parole annidati.

Professional Logic Controls

Regola lunghezza riga, durata cue, velocità di lettura, divisioni su punteggiatura e spazio tra cue in base allo stile.

Private by Design

La generazione avviene nel browser. Il file timestamp caricato non viene inviato ad API di conversione esterne.

Come funziona

Usa lo strumento in tre passaggi semplici. Tieni la pagina aperta finché il file è pronto.

1

Aggiungi il file

Trascina il file nel riquadro o sceglilo dal tuo dispositivo.

2

Scegli l’output sottotitoli

Genera SRT, VTT o JSON dai timestamp parola per parola.

3

Scarica il risultato

Controlla l’anteprima se è disponibile, poi scarica il file finale.

Pensato per creare sottotitoli professionali

Divisioni basate sulla punteggiatura

Dà priorità ai confini delle frasi e alle pause opzionali su virgola per cue naturali sullo schermo.

Vincoli temporali

Applica durata minima e massima dei cue con gap configurabili per evitare sovrapposizioni e flash.

Due output disponibili

Genera SRT o VTT puliti dalla stessa fonte di timestamp senza riformattare manualmente.

Input timestamp accettati

Carica JSON in cui ogni parola include il tempo di inizio e fine. Lo strumento rileva automaticamente secondi o millisecondi.

ARRAY

Elenco diretto di parole

[{"text":"Hello","start":0.12,"end":0.44}] or [{"word":"Hi","start":120,"end":360}].

NESTED

Output ASR annidato

Finds nested words arrays inside channels, alternatives, segments, or result objects.

UNITS

Secondi o millisecondi

Riconosce secondi numerici, millisecondi numerici e stringhe come 00:00:12.340 or 120ms.

Cos'e un timestamp parola per parola?

Un timestamp parola per parola collega ogni token a inizio e fine. È comune in Whisper e nei moderni flussi STT.

SYNC

Temporizzazione parola per parola

Ogni cue viene creato da timing accurati dei token, non da tempi stimati della frase.

WHISPER

Pronto per Whisper e STT

Supports Whisper-style words array e output ASR annidati dai comuni provider speech-to-text.

QC

Validazione prima dell'esportazione

Usa il validatore integrato per trovare timing mancanti prima di generare file SRT/VTT.

Esempio di schema JSON

Schema minimo consigliato per una generazione robusta dei sottotitoli:

SCHEMA

Campi obbligatori

[{"text":"Hello","start":0.12,"end":0.44}] where start and end are either seconds or milliseconds.

ALT KEYS

Accettato anche

word, start_time, end_time, duration, and nested words arrays.

EXPORT

Output

Genera file di sottotitoli pronti per editor, clip social e video lunghi in SRT o VTT.

Domande frequenti

Come dovrebbe essere il mio JSON?

Ogni parola dovrebbe avere testo e campi timing. Le chiavi comuni sono text or word, with start and end.

Funziona con Whisper e timestamp parola per parola STT?

Sì. Lo strumento supporta array di parole diretti e output annidati con timing parola per parola da Whisper e provider STT comuni.

Posso generare solo sottotitoli a una riga?

Sì. Imposta “Righe per cue” su 1 e il generatore manterrà ogni cue su una sola riga.

Conserva i timing delle parole dal mio file?

Sì. Inizio e fine dei cue derivano dai timing delle parole e vengono poi rifiniti con durata minima/massima e impostazioni di gap.

Quali formati di sottotitoli posso esportare?

Puoi esportare i sottotitoli generati in SRT o VTT.