Datei hinzufügen
Ziehe die Datei in das Feld oder wähle sie auf deinem Gerät aus.
Erzeuge saubere Untertitel aus Wort-Timestamps mit professionellen Segmentierungsregeln und exportiere sofort SRT oder VTT.
oder klicken, um eine Datei von deinem Gerät auszuwaehlen
[
{"text":"Hello","start":0.12,"end":0.44},
{"text":"everyone,","start":0.44,"end":0.93},
{"text":"welcome.","start":0.93,"end":1.40}
]
// Auch unterstützt:
// {"words":[{"word":"Hello","start":120,"end":440}]}
// {"results":{"channels":[{"alternatives":[{"words":[...]}]}]}}
Füge Timestamp-JSON ein, um es vor der Erzeugung zu validieren. Der Validator markiert fehlende start/end-Felder nach Wortindex.
Unterstützt gängige Wort-Arrays von AssemblyAI, Whisper-ähnliche Ausgaben und verschachtelte Wortobjekte.
Passe Zeilenlänge, Cue-Dauer, Lesegeschwindigkeit, Satzzeichen-Splits und Cue-Abstand an den Stil an.
Die Generierung läuft im Browser. Deine hochgeladene Timestamp-Datei wird nicht an externe Konvertierungs-APIs gesendet.
Nutze das Tool in drei einfachen Schritten. Lass die Seite offen, bis die Datei fertig ist.
Ziehe die Datei in das Feld oder wähle sie auf deinem Gerät aus.
Erstelle SRT, VTT oder JSON aus Wort-Zeitstempeln.
Prüfe die Vorschau, wenn sie verfügbar ist, und lade dann die fertige Datei herunter.
Priorisiert Satzgrenzen und optionale Kommaumbrüche, damit Cues natürlich auf dem Bildschirm lesbar sind.
Wendet minimale und maximale Cue-Dauer mit konfigurierbaren Abständen an, um Überschneidungen und Flackern zu vermeiden.
Erzeuge sauberes SRT oder VTT aus derselben Timestamp-Quelle, ohne manuell umzuformatieren.
JSON hochladen, in dem jedes Wort einen Start- und Endzeitpunkt enthaelt. Das Werkzeug erkennt automatisch Sekunden oder Millisekunden.
[{"text":"Hello","start":0.12,"end":0.44}] or [{"word":"Hi","start":120,"end":360}].
Finds nested words arrays inside channels, alternatives, segments, or result objects.
Erkennt numerische Sekunden, numerische Millisekunden und Strings wie 00:00:12.340 or 120ms.
Ein Wort-Timestamp verknüpft jedes Token mit Start- und Endzeit. Das ist üblich in Whisper und modernen STT-Pipelines.
Jeder Untertitel-Cue wird aus exaktem Token-Timing erstellt, nicht aus geschätztem Phrasen-Timing.
Supports Whisper-style words Arrays und verschachtelte ASR-Ausgaben gängiger Speech-to-Text-Anbieter.
Nutze den integrierten Validator, um fehlende Timing-Werte vor der SRT/VTT-Generierung zu finden.
Empfohlenes Mindestschema für robuste Untertitelgenerierung:
[{"text":"Hello","start":0.12,"end":0.44}] where start and end are either seconds or milliseconds.
word, start_time, end_time, duration, and nested words arrays.
Generiere Untertiteldateien für Editoren, Social Clips und Langform-Videos in SRT oder VTT.
Jedes Wort sollte Text plus Timing-Felder enthalten. Häufige Schlüssel sind text or word, with start and end.
Ja. Das Werkzeug unterstützt direkte Wort-Arrays und verschachtelte Ausgaben mit Wort-Timing von Whisper und gängigen STT-Anbietern.
Ja. Setze „Zeilen pro Cue“ auf 1, dann hält der Generator jeden Cue einzeilig.
Ja. Cue-Start und -Ende werden aus Wort-Timings abgeleitet und danach mit deinen Mindest-/Maximaldauer- und Abstandseinstellungen verfeinert.
Du kannst die generierten Untertitel als SRT oder VTT exportieren.