What input format is supported?

Lade JSON hoch, das Wörter mit Start- und End-Timestamps enthält, etwa text/start/end, word/start/end oder verschachtelte Wort-Arrays aus ASR-Systemen.

Kann ich die Segmentierungslogik für Untertitel wählen?

Ja. Du kannst maximale Zeichen pro Zeile, Zeilen pro Cue, CPS-Ziel, Cue-Dauerlimits, Cue-Abstand und Umbruchverhalten bei Satzzeichen konfigurieren.

Which export formats are available?

You can export generated subtitles as SRT or VTT.

Wort-Timestamps in Untertitel umwandeln

Erzeuge saubere Untertitel aus Wort-Timestamps mit professionellen Segmentierungsregeln und exportiere sofort SRT oder VTT.

Wort-Timestamp-JSON hier ablegen

oder klicken, um eine Datei von deinem Gerät auszuwaehlen

Datei auswählen

JSON

Untertitel-Einstellungen

Ausgabeformat

SRT SubRip

VTT WebVTT

Formatierungsregeln

Max. Zeichen / Zeile

Professional range: 32-42

Zeilen pro Cue

▾

1 for social, 2 for long-form

Reading speed

cps

Zeichen pro Sekunde

Min. Cue-Dauer

Short cues are extended

Max. Cue-Dauer

Long cues split faster

Gap between cues

Hält Übergänge sauber

Options

Prefer sentence boundaries

Nach . ? ! umbrechen, wenn die Dauer es erlaubt

Allow comma-level splits

Komma- und Semikolon-Umbrüche nutzen, wenn ein Cue zu lang wird

View accepted JSON sample

[
  {"text":"Hello","start":0.12,"end":0.44},
  {"text":"everyone,","start":0.44,"end":0.93},
  {"text":"welcome.","start":0.93,"end":1.40}
]

// Auch unterstützt:
// {"words":[{"word":"Hello","start":120,"end":440}]}
// {"results":{"channels":[{"alternatives":[{"words":[...]}]}]}}

JSON-Validierung und Beispiel

Füge Timestamp-JSON ein, um es vor der Erzeugung zu validieren. Der Validator markiert fehlende start/end-Felder nach Wortindex.

Wird generiert...

Generierung abgeschlossen

Bereit für ASR-JSON

Unterstützt gängige Wort-Arrays von AssemblyAI, Whisper-ähnliche Ausgaben und verschachtelte Wortobjekte.

Professional Logic Controls

Passe Zeilenlänge, Cue-Dauer, Lesegeschwindigkeit, Satzzeichen-Splits und Cue-Abstand an den Stil an.

Private by Design

Die Generierung läuft im Browser. Deine hochgeladene Timestamp-Datei wird nicht an externe Konvertierungs-APIs gesendet.

So funktioniert es

Nutze das Tool in drei einfachen Schritten. Lass die Seite offen, bis die Datei fertig ist.

Datei hinzufügen

Ziehe die Datei in das Feld oder wähle sie auf deinem Gerät aus.

Untertitelausgabe wählen

Erstelle SRT, VTT oder JSON aus Wort-Zeitstempeln.

Ergebnis herunterladen

Prüfe die Vorschau, wenn sie verfügbar ist, und lade dann die fertige Datei herunter.

Für professionelles Untertitel-Drafting gemacht

Punctuation-Aware Splits

Priorisiert Satzgrenzen und optionale Kommaumbrüche, damit Cues natürlich auf dem Bildschirm lesbar sind.

Timing Constraints

Wendet minimale und maximale Cue-Dauer mit konfigurierbaren Abständen an, um Überschneidungen und Flackern zu vermeiden.

Zwei Ausgabeziele

Erzeuge sauberes SRT oder VTT aus derselben Timestamp-Quelle, ohne manuell umzuformatieren.

Accepted Timestamp Inputs

JSON hochladen, in dem jedes Wort einen Start- und Endzeitpunkt enthaelt. Das Werkzeug erkennt automatisch Sekunden oder Millisekunden.

ARRAY

Direct Word List

[{"text":"Hello","start":0.12,"end":0.44}] or [{"word":"Hi","start":120,"end":360}].

NESTED

Verschachtelte ASR-Ausgabe

Finds nested words arrays inside channels, alternatives, segments, or result objects.

UNITS

Seconds or Milliseconds

Erkennt numerische Sekunden, numerische Millisekunden und Strings wie 00:00:12.340 or 120ms.

Was ist ein Wort-Timestamp?

Ein Wort-Timestamp verknüpft jedes Token mit Start- und Endzeit. Das ist üblich in Whisper und modernen STT-Pipelines.

SYNC

Per-Word Timing

Jeder Untertitel-Cue wird aus exaktem Token-Timing erstellt, nicht aus geschätztem Phrasen-Timing.

WHISPER

Bereit für Whisper und STT

Supports Whisper-style words Arrays und verschachtelte ASR-Ausgaben gängiger Speech-to-Text-Anbieter.

Validierung vor dem Export

Nutze den integrierten Validator, um fehlende Timing-Werte vor der SRT/VTT-Generierung zu finden.

JSON Schema Example

Empfohlenes Mindestschema für robuste Untertitelgenerierung:

SCHEMA

Required Fields

[{"text":"Hello","start":0.12,"end":0.44}] where start and end are either seconds or milliseconds.

ALT KEYS

Also Accepted

word, start_time, end_time, duration, and nested words arrays.

EXPORT

Output

Generiere Untertiteldateien für Editoren, Social Clips und Langform-Videos in SRT oder VTT.

Häufige Fragen

Wie sollte mein JSON aussehen?

Jedes Wort sollte Text plus Timing-Felder enthalten. Häufige Schlüssel sind text or word, with start and end.

Funktioniert das mit Whisper- und STT-Wort-Timestamps?

Ja. Das Werkzeug unterstützt direkte Wort-Arrays und verschachtelte Ausgaben mit Wort-Timing von Whisper und gängigen STT-Anbietern.

Kann ich nur einzeilige Untertitel erzeugen?

Ja. Setze „Zeilen pro Cue“ auf 1, dann hält der Generator jeden Cue einzeilig.

Bleiben die Wort-Timings aus meiner Datei erhalten?

Ja. Cue-Start und -Ende werden aus Wort-Timings abgeleitet und danach mit deinen Mindest-/Maximaldauer- und Abstandseinstellungen verfeinert.

Welche Untertitelformate kann ich exportieren?

Du kannst die generierten Untertitel als SRT oder VTT exportieren.