Wort-Timestamps in Untertitel umwandeln

Erzeuge saubere Untertitel aus Wort-Timestamps mit professionellen Segmentierungsregeln und exportiere sofort SRT oder VTT.

Wort-Timestamp-JSON hier ablegen

oder klicken, um eine Datei von deinem Gerät auszuwaehlen

JSON
Untertitel-Einstellungen
Max. Zeichen / Zeile
ch
Professional range: 32-42
Zeilen pro Cue
1 for social, 2 for long-form
Reading speed
cps
Zeichen pro Sekunde
Min. Cue-Dauer
ms
Short cues are extended
Max. Cue-Dauer
ms
Long cues split faster
Gap between cues
ms
Hält Übergänge sauber
Prefer sentence boundaries
Nach . ? ! umbrechen, wenn die Dauer es erlaubt
Allow comma-level splits
Komma- und Semikolon-Umbrüche nutzen, wenn ein Cue zu lang wird
View accepted JSON sample
[
  {"text":"Hello","start":0.12,"end":0.44},
  {"text":"everyone,","start":0.44,"end":0.93},
  {"text":"welcome.","start":0.93,"end":1.40}
]

// Auch unterstützt:
// {"words":[{"word":"Hello","start":120,"end":440}]}
// {"results":{"channels":[{"alternatives":[{"words":[...]}]}]}}

JSON-Validierung und Beispiel

Füge Timestamp-JSON ein, um es vor der Erzeugung zu validieren. Der Validator markiert fehlende start/end-Felder nach Wortindex.

Wird generiert...

Generierung abgeschlossen

Bereit für ASR-JSON

Unterstützt gängige Wort-Arrays von AssemblyAI, Whisper-ähnliche Ausgaben und verschachtelte Wortobjekte.

Professional Logic Controls

Passe Zeilenlänge, Cue-Dauer, Lesegeschwindigkeit, Satzzeichen-Splits und Cue-Abstand an den Stil an.

Private by Design

Die Generierung läuft im Browser. Deine hochgeladene Timestamp-Datei wird nicht an externe Konvertierungs-APIs gesendet.

So funktioniert es

Nutze das Tool in drei einfachen Schritten. Lass die Seite offen, bis die Datei fertig ist.

1

Datei hinzufügen

Ziehe die Datei in das Feld oder wähle sie auf deinem Gerät aus.

2

Untertitelausgabe wählen

Erstelle SRT, VTT oder JSON aus Wort-Zeitstempeln.

3

Ergebnis herunterladen

Prüfe die Vorschau, wenn sie verfügbar ist, und lade dann die fertige Datei herunter.

Für professionelles Untertitel-Drafting gemacht

Punctuation-Aware Splits

Priorisiert Satzgrenzen und optionale Kommaumbrüche, damit Cues natürlich auf dem Bildschirm lesbar sind.

Timing Constraints

Wendet minimale und maximale Cue-Dauer mit konfigurierbaren Abständen an, um Überschneidungen und Flackern zu vermeiden.

Zwei Ausgabeziele

Erzeuge sauberes SRT oder VTT aus derselben Timestamp-Quelle, ohne manuell umzuformatieren.

Accepted Timestamp Inputs

JSON hochladen, in dem jedes Wort einen Start- und Endzeitpunkt enthaelt. Das Werkzeug erkennt automatisch Sekunden oder Millisekunden.

ARRAY

Direct Word List

[{"text":"Hello","start":0.12,"end":0.44}] or [{"word":"Hi","start":120,"end":360}].

NESTED

Verschachtelte ASR-Ausgabe

Finds nested words arrays inside channels, alternatives, segments, or result objects.

UNITS

Seconds or Milliseconds

Erkennt numerische Sekunden, numerische Millisekunden und Strings wie 00:00:12.340 or 120ms.

Was ist ein Wort-Timestamp?

Ein Wort-Timestamp verknüpft jedes Token mit Start- und Endzeit. Das ist üblich in Whisper und modernen STT-Pipelines.

SYNC

Per-Word Timing

Jeder Untertitel-Cue wird aus exaktem Token-Timing erstellt, nicht aus geschätztem Phrasen-Timing.

WHISPER

Bereit für Whisper und STT

Supports Whisper-style words Arrays und verschachtelte ASR-Ausgaben gängiger Speech-to-Text-Anbieter.

QC

Validierung vor dem Export

Nutze den integrierten Validator, um fehlende Timing-Werte vor der SRT/VTT-Generierung zu finden.

JSON Schema Example

Empfohlenes Mindestschema für robuste Untertitelgenerierung:

SCHEMA

Required Fields

[{"text":"Hello","start":0.12,"end":0.44}] where start and end are either seconds or milliseconds.

ALT KEYS

Also Accepted

word, start_time, end_time, duration, and nested words arrays.

EXPORT

Output

Generiere Untertiteldateien für Editoren, Social Clips und Langform-Videos in SRT oder VTT.

Häufige Fragen

Wie sollte mein JSON aussehen?

Jedes Wort sollte Text plus Timing-Felder enthalten. Häufige Schlüssel sind text or word, with start and end.

Funktioniert das mit Whisper- und STT-Wort-Timestamps?

Ja. Das Werkzeug unterstützt direkte Wort-Arrays und verschachtelte Ausgaben mit Wort-Timing von Whisper und gängigen STT-Anbietern.

Kann ich nur einzeilige Untertitel erzeugen?

Ja. Setze „Zeilen pro Cue“ auf 1, dann hält der Generator jeden Cue einzeilig.

Bleiben die Wort-Timings aus meiner Datei erhalten?

Ja. Cue-Start und -Ende werden aus Wort-Timings abgeleitet und danach mit deinen Mindest-/Maximaldauer- und Abstandseinstellungen verfeinert.

Welche Untertitelformate kann ich exportieren?

Du kannst die generierten Untertitel als SRT oder VTT exportieren.