IA - Whisper
Il s'agit d'une IA qui retranscrit, soit dans la langue d'origine de l'audio, soit en anglais, un audio ou une vidéo.
J'ai réalisé plusieurs tests et ils sont plus que concluants, même si sur certains audios (réunions enregistrées avec un ipad au milieu d'une table, sur une terasse de café où il y a beaucoup de bruit) étaient parfois de mauvaise qualité.
Le fait qu'il s'agisse d'une IA et non d'une simple retranscription mot à mot fera que si quelqu'un dit :
"Alors... Euh... Bonjour! Bonjour à tous! donc... Aujourd'hui, ce que nous allons voir, c'est... euh... ce que nous allons voir c'est la manière dont... euh... la manière dont les gens se rencontrent et... comment dire ?.. rentrent en interaction" deviendra :
"Bonjour à tous, aujourd'hui ce que nous allons voir c'est la manière dont les gens se rencontrent et rentrent en interaction."
Pour notre exemple, nous allons partir de la vidéo de Jean-Luc Mélenchon : "3 heures pour penser le XXIème siècle"[1].