« IA - Whisper » : différence entre les versions

De Vanlindt Marc
Aller à la navigation Aller à la recherche
Page créée avec « Il s'agit d'une IA qui retranscrit, soit dans la langue d'origine de l'audio, soit en anglais, un audio ou une vidéo. J'ai réalisé plusieurs tests et ils sont plus que concluants, même si sur certains audios (réunions enregistrées avec un ipad au milieu d'une table, sur une terasse de café où il y a beaucoup de bruit) étaient parfois de mauvaise qualité. Le fait qu'il s'agisse d'une IA et non d'une simple retranscription mot à mot fera que si quelqu'... »
 
Aucun résumé des modifications
Ligne 7 : Ligne 7 :
"Alors... Euh... Bonjour! Bonjour à tous! donc... Aujourd'hui, ce que nous allons voir, c'est... euh... ce que nous allons voir c'est la manière dont... euh... la manière dont les gens se rencontrent et... comment dire ?.. rentrent en interaction" deviendra :  
"Alors... Euh... Bonjour! Bonjour à tous! donc... Aujourd'hui, ce que nous allons voir, c'est... euh... ce que nous allons voir c'est la manière dont... euh... la manière dont les gens se rencontrent et... comment dire ?.. rentrent en interaction" deviendra :  


"Bonjour à tous, aujourd'hui ce que nous allons c'est la manière dont les se rencontrent et rentrent en interaction."
"Bonjour à tous, aujourd'hui ce que nous allons voir c'est la manière dont les gens se rencontrent et rentrent en interaction."


Pour notre exemple, nous allons partir de la vidéo de Jean-Luc Mélenchon : "3 heures pour penser le XXIème siècle"<ref>[https://www.youtube.com/watch?v=JJUpHvEunoA YouTube - Trois heures pour penser le XXIème siècle] </ref>.
Pour notre exemple, nous allons partir de la vidéo de Jean-Luc Mélenchon : "3 heures pour penser le XXIème siècle"<ref>[https://www.youtube.com/watch?v=JJUpHvEunoA YouTube - Trois heures pour penser le XXIème siècle] </ref>.

Version du 2 juillet 2025 à 20:06

Il s'agit d'une IA qui retranscrit, soit dans la langue d'origine de l'audio, soit en anglais, un audio ou une vidéo.

J'ai réalisé plusieurs tests et ils sont plus que concluants, même si sur certains audios (réunions enregistrées avec un ipad au milieu d'une table, sur une terasse de café où il y a beaucoup de bruit) étaient parfois de mauvaise qualité.

Le fait qu'il s'agisse d'une IA et non d'une simple retranscription mot à mot fera que si quelqu'un dit :

"Alors... Euh... Bonjour! Bonjour à tous! donc... Aujourd'hui, ce que nous allons voir, c'est... euh... ce que nous allons voir c'est la manière dont... euh... la manière dont les gens se rencontrent et... comment dire ?.. rentrent en interaction" deviendra :

"Bonjour à tous, aujourd'hui ce que nous allons voir c'est la manière dont les gens se rencontrent et rentrent en interaction."

Pour notre exemple, nous allons partir de la vidéo de Jean-Luc Mélenchon : "3 heures pour penser le XXIème siècle"[1].