Ajoutez votre fichier
Déposez le fichier dans la zone ou choisissez-le depuis votre appareil.
Générez des sous-titres propres à partir de timestamps mot par mot avec des contrôles de segmentation professionnels, puis exportez immédiatement en SRT ou VTT.
ou cliquez pour choisir depuis votre appareil
[
{"text":"Hello","start":0.12,"end":0.44},
{"text":"everyone,","start":0.44,"end":0.93},
{"text":"welcome.","start":0.93,"end":1.40}
]
// Également pris en charge:
// {"words":[{"word":"Hello","start":120,"end":440}]}
// {"results":{"channels":[{"alternatives":[{"words":[...]}]}]}}
Collez le JSON de timestamps pour le valider avant la génération. Le validateur signale les champs start/end manquants par index de mot.
Prend en charge les tableaux de mots courants d’AssemblyAI, les sorties de style Whisper et les objets de mots imbriqués.
Réglez la longueur des lignes, la durée des cues, la vitesse de lecture, les divisions sur ponctuation et l’écart entre cues selon le style souhaité.
La génération se fait dans le navigateur. Le fichier de timestamps importé n’est pas envoyé à des API de conversion externes.
Utilisez l’outil en trois étapes simples. Gardez la page ouverte jusqu’à ce que le fichier soit prêt.
Déposez le fichier dans la zone ou choisissez-le depuis votre appareil.
Générez du SRT, du VTT ou du JSON à partir de timestamps mot par mot.
Vérifiez l’aperçu s’il est disponible, puis téléchargez le fichier final.
Priorise les fins de phrase et les pauses optionnelles sur virgule pour que les cues se lisent naturellement à l’écran.
Applique une durée minimale et maximale des cues avec des écarts configurables pour éviter les chevauchements et les flashs.
Générez un SRT ou VTT propre depuis la même source de timestamps, sans reformater manuellement.
Importez un JSON dans lequel chaque mot inclut un temps de début et de fin. L’outil détecte automatiquement les secondes ou millisecondes.
[{"text":"Hello","start":0.12,"end":0.44}] ou [{"word":"Hi","start":120,"end":360}].
Trouve les tableaux words imbriqués dans les channels, alternatives, segments ou objets de résultat.
Comprend les secondes numériques, millisecondes numériques et chaînes comme 00:00:12.340 or 120ms.
Un timestamp mot par mot relie chaque token à un temps de début et de fin. C’est courant dans Whisper et les pipelines STT modernes.
Chaque cue est construit à partir du timing précis des tokens, pas d’un timing de phrase estimé.
Prend en charge les tableaux words de style Whisper et les sorties ASR imbriquées des fournisseurs speech-to-text courants.
Utilisez le validateur intégré pour détecter les timings manquants avant de générer les fichiers SRT/VTT.
Schéma minimum recommandé pour une génération robuste des sous-titres :
[{"text":"Hello","start":0.12,"end":0.44}] où start et end sont en secondes ou millisecondes.
word, start_time, end_time, duration et les tableaux words imbriqués.
Générez des fichiers de sous-titres prêts pour éditeurs, clips sociaux et vidéos longues en SRT ou VTT.
Chaque mot doit avoir un texte et des champs de timing. Les clés courantes sont text ou word, avec start et end.
Oui. L’outil prend en charge les tableaux de mots directs et les sorties imbriquées avec timing mot par mot depuis Whisper et les fournisseurs STT courants.
Oui. Définissez « Lignes par cue » sur 1 et le générateur gardera chaque cue sur une seule ligne.
Oui. Le début et la fin des cues sont dérivés des timings des mots, puis affinés avec vos réglages de durée minimale/maximale et d’écart.
Vous pouvez exporter les sous-titres générés en SRT ou VTT.