IA - Whisper

De Vanlindt Marc
Version datée du 2 juillet 2025 à 19:29 par VanlindtMarc (discussion | contributions) (Page créée avec « Il s'agit d'une IA qui retranscrit, soit dans la langue d'origine de l'audio, soit en anglais, un audio ou une vidéo. J'ai réalisé plusieurs tests et ils sont plus que concluants, même si sur certains audios (réunions enregistrées avec un ipad au milieu d'une table, sur une terasse de café où il y a beaucoup de bruit) étaient parfois de mauvaise qualité. Le fait qu'il s'agisse d'une IA et non d'une simple retranscription mot à mot fera que si quelqu'... »)
(diff) ← Version précédente | Voir la version actuelle (diff) | Version suivante → (diff)
Aller à la navigation Aller à la recherche

Il s'agit d'une IA qui retranscrit, soit dans la langue d'origine de l'audio, soit en anglais, un audio ou une vidéo.

J'ai réalisé plusieurs tests et ils sont plus que concluants, même si sur certains audios (réunions enregistrées avec un ipad au milieu d'une table, sur une terasse de café où il y a beaucoup de bruit) étaient parfois de mauvaise qualité.

Le fait qu'il s'agisse d'une IA et non d'une simple retranscription mot à mot fera que si quelqu'un dit :

"Alors... Euh... Bonjour! Bonjour à tous! donc... Aujourd'hui, ce que nous allons voir, c'est... euh... ce que nous allons voir c'est la manière dont... euh... la manière dont les gens se rencontrent et... comment dire ?.. rentrent en interaction" deviendra :

"Bonjour à tous, aujourd'hui ce que nous allons c'est la manière dont les se rencontrent et rentrent en interaction."

Pour notre exemple, nous allons partir de la vidéo de Jean-Luc Mélenchon : "3 heures pour penser le XXIème siècle"[1].