dvd-rip utilise transcode comme "back-end". Tu peux donc tout faire directement à partir de transcode. Il faut juste utiliser un terminal (ex: Xterm, Eterm, konsole....)
pour connaitre les sous-titres présent sur ton dvd (je suppose que ton périphérique dvd-rom est accessible depuis "/dev/dvd" a vérifier sur ta machine... peut-etre "/dev/cdrom").
tcprobe -i /dev/dvd 2>&1 | grep "subtitle\|title"
Il te renvoi par exemple:
(dvd_reader.c) DVD title 1/16: 16 chapter(s), 1 angle(s), title set 1
(dvd_reader.c) title playback time: 01:48:55.12 6536 sec
(dvd_reader.c) subtitle 00= fr
(dvd_reader.c) subtitle 01= nl
le SID subtitle identifier est 0 pour le francais, 1 pour le néerlandais
le 1/16 veut dire 1 track et 16 chapitre
tu extrait le sous-titre 0 (fr)... -a 0x20 veut dire (0x20 + SID)... 0x20 est la base de référence des sous-titres... tu ecris donc un fichier subs-fr
qui contient les sous-titres en format binaire (raw). c'est un peu long puisqu'il parcours l'ensemble du DVD pour en extraire les sous-titres.
Le DVD n'a pas les sous titres sous forme de texte mais plutôt comme des images. Il faut donc les convertir en images pgm puis faire une reconnaissance de caractère pour le traduire au format texte... voici les laborieuses étapes (cette méthode a l'avantage de creer un fichier de sous titre et non pas de l'inclure dans la video... ca permet de pouvoir l'enlever et de choisir différentes langues...).
Crée ensuite un repertoire "french" mkdir french subtitle2pgm -o ./french/french -c 255,255,0,255 < subs-fr
ceci va creer tout un ensemble de fichier images qu'il faut transformer en .txt
grace a gocr (logiciel de reconnaissance de caractères a installer: urpmi gocr).
il crée aussi un fichier french.srtx
un petit script fait tout ca: cd french pgm2txt french
Il risque de poser plein de question sur les caractères qu'il n'arrive pas a traiter automatiquement. Il faut lui répondre à la main ex (ç, plusieurs lettre accoller...).
tu peux éventuellement corriger les erreurs de OCR par l'utilisation de ispell
ispell -d francais french*txt (le dictionnaire francais doit etre installé)
Enfin pour finir... il faut creer le fichier srt de sous titre à partir de tout ca:
cd .. srttool -s -w < french/french.srtx > french.srt
et voili voilou... pas facile, un peu long... mais efficace.
enfin pour voir si le résultat te plait :
# Utilisation de transcode
Posté par Damien COTTIER . En réponse au message Extraction sous-titres avec dvdrip sous mdk 10.1. Évalué à 1.
dvd-rip utilise transcode comme "back-end". Tu peux donc tout faire directement à partir de transcode. Il faut juste utiliser un terminal (ex: Xterm, Eterm, konsole....)
pour connaitre les sous-titres présent sur ton dvd (je suppose que ton périphérique dvd-rom est accessible depuis "/dev/dvd" a vérifier sur ta machine... peut-etre "/dev/cdrom").
tcprobe -i /dev/dvd 2>&1 | grep "subtitle\|title"
Il te renvoi par exemple:
(dvd_reader.c) DVD title 1/16: 16 chapter(s), 1 angle(s), title set 1
(dvd_reader.c) title playback time: 01:48:55.12 6536 sec
(dvd_reader.c) subtitle 00= fr
(dvd_reader.c) subtitle 01= nl
le SID subtitle identifier est 0 pour le francais, 1 pour le néerlandais
le 1/16 veut dire 1 track et 16 chapitre
tccat -i /dev/dvd -T 1 -L | tcextract -x ps1 -t vob -a 0x20 > subs-fr
tu extrait le sous-titre 0 (fr)... -a 0x20 veut dire (0x20 + SID)... 0x20 est la base de référence des sous-titres... tu ecris donc un fichier subs-fr
qui contient les sous-titres en format binaire (raw). c'est un peu long puisqu'il parcours l'ensemble du DVD pour en extraire les sous-titres.
Le DVD n'a pas les sous titres sous forme de texte mais plutôt comme des images. Il faut donc les convertir en images pgm puis faire une reconnaissance de caractère pour le traduire au format texte... voici les laborieuses étapes (cette méthode a l'avantage de creer un fichier de sous titre et non pas de l'inclure dans la video... ca permet de pouvoir l'enlever et de choisir différentes langues...).
Crée ensuite un repertoire "french"
mkdir french
subtitle2pgm -o ./french/french -c 255,255,0,255 < subs-fr
ceci va creer tout un ensemble de fichier images qu'il faut transformer en .txt
grace a gocr (logiciel de reconnaissance de caractères a installer: urpmi gocr).
il crée aussi un fichier french.srtx
un petit script fait tout ca:
cd french
pgm2txt french
Il risque de poser plein de question sur les caractères qu'il n'arrive pas a traiter automatiquement. Il faut lui répondre à la main ex (ç, plusieurs lettre accoller...).
tu peux éventuellement corriger les erreurs de OCR par l'utilisation de ispell
ispell -d francais french*txt (le dictionnaire francais doit etre installé)
Enfin pour finir... il faut creer le fichier srt de sous titre à partir de tout ca:
cd ..
srttool -s -w < french/french.srtx > french.srt
et voili voilou... pas facile, un peu long... mais efficace.
enfin pour voir si le résultat te plait :
mplayer -sub french.srt dvd://1
Enjoy...