Whisper-ui – Transcrire vos audios / vidéos bien au chaud dans une interface graphique

korsb4182 avril 30, 2023

Vous vous souvenez de Whisper, ce projet d’OpenAI qui permet de convertir au format texte, n’importe quel audio, ce qui permet par exemple de faire des transcriptions d’interview ou des sous-titres pour une vidéo ?

J’avais même fait un tuto sur le sujet.

Et bien bonne nouvelle, le codeur Abhay Kashyap a mis au point une interface graphique pour Whisper simplement nommée Whisper-ui. Cela fonctionne avec Streamlit et ça permet de se constituer une liste de média à traduire ou retranscrire très facilement.

Capture d'écran de l'interface graphique de Whisper-ui montrant la transcription en cours d'un fichier audio

Vous pourrez ensuite naviguer dans vos fichiers et les filtrer comme bon vous semble avec le moteur sur la gauche et évidemment récupérer la retranscription.

Pour installer Whisper-ui, le plus simple c’est de passer par Docker puisqu’il y a un Docker-Compose fourni.

git clone https://github.com/hayabhay/whisper-ui.git
cd whisper-ui
docker-compose up -d

Puis vous rendre sur l’URL suivante : http://localhost:8501/

Sinon, vous pouvez aussi l’installer directement :

sudo apt install ffmpeg
pip install -r requirements.txt

Et lancer le script Python avec Streamlit :

streamlit run app/01_🏠_Home.py

Bref, c’est pratique, ça fait gagner du temps et ça permet d’éviter de se farcir tout en ligne de commande. Et si vous cherchez d’autres projets qui utilisent Whisper, y’a toute une liste merveilleuse ici ! Merci à Nobody pour l’info !

+ d’infos ici.

Korben