« Gestion audiothèque » : différence entre les versions
| (28 versions intermédiaires par le même utilisateur non affichées) | |||
| Ligne 2 : | Ligne 2 : | ||
Il existe deux formats dans lesquels nous retrouvons, en général, la musique | Il existe deux formats dans lesquels nous retrouvons, en général, la musique | ||
# '''MP3 ''': le format le plus courant, destructif | # '''MP3 ''': le format le plus courant, destructif mais compatible avec tout. | ||
# '''FLAC ''': le format des audiophiles, sans destruction, diminuant la taille sans diminuer la qualité. | # '''FLAC ''': le format des audiophiles, sans destruction, diminuant la taille sans diminuer la qualité. | ||
Cela n'est pas sans raison. | |||
On peut parfois retrouver d'autres formats, comme le '''Vorbis (OGG)''', le '''OPUS''' ou le '''AAC (MP4/M4A) | ==== Formats destructifs ==== | ||
On peut parfois retrouver d'autres formats, comme le '''Vorbis (OGG)''', le '''OPUS''' ou le '''AAC (MP4/M4A).''' | |||
Ces formats, bien que destructifs comme le '''MP3''' sont parfois de bien meilleure qualité, l''''OPUS''' allant jusqu'à proposer des fichiers trois fois plus petits que le '''MP3''' mais avec une qualité proche du '''FLAC'''. Le problème est que ces formats ne se sont pas imposés et que le '''MP3''' est le seul à pouvoir être lu sur tous les appareils prévus pour lire de la musique, même les plus anciens car, étant rétrocompatible, même un ancien lecteur restituera la bonne qualité d'un '''MP3''' récent. | Ces formats, bien que destructifs comme le '''MP3''' sont parfois de bien meilleure qualité, l''''OPUS''' allant jusqu'à proposer des fichiers trois fois plus petits que le '''MP3''' mais avec une qualité proche du '''FLAC'''. Le problème est que ces formats ne se sont pas imposés et que le '''MP3''' est le seul à pouvoir être lu sur tous les appareils prévus pour lire de la musique, même les plus anciens car, étant rétrocompatible, même un ancien lecteur '''MP3''' d'une voiture d'il y a 20 ans restituera la bonne qualité d'un '''MP3''' récent. | ||
Ce problème vient en partie d'une chose : le fait que le format soit propriétaire ou non. | Ce problème vient en partie d'une chose : le fait que le format soit propriétaire ou non. | ||
| Ligne 17 : | Ligne 19 : | ||
Contrairement à '''LAME''', le codec '''Fraunhofer''' n'a pas cherché à faire évoluer la qualité mais est passé au 5.1 et au Surround pour une utilisation vidéo, faisant que leur codec propriétaire était encore très utilisé. | Contrairement à '''LAME''', le codec '''Fraunhofer''' n'a pas cherché à faire évoluer la qualité mais est passé au 5.1 et au Surround pour une utilisation vidéo, faisant que leur codec propriétaire était encore très utilisé. | ||
Un autre groupe a créé le codec '''Vorbis''', totalement libre et open-source cherchant à offrir une alternative au '''MP3''' en proposant, entres autres le 5.1. '''OGG''' n'est pas un format c'est un conteneur pouvant contenir plusieurs codecs. Donc si vous voyez un '''OGG''', c'est peut-être un '''MP3''' | Un autre groupe, '''xiph''', a créé le codec '''Vorbis''', totalement libre et open-source cherchant à offrir une alternative au '''MP3''' en proposant, entres autres le 5.1. '''OGG''' n'est pas un format c'est un conteneur pouvant contenir plusieurs codecs. Donc si vous voyez un '''OGG''', c'est peut-être un '''MP3''' (mais c'est très rare)... Ce codec est encore très utilisé entre autres pour les pistes audios de films ou séries. | ||
Nous pouvons donc avoir le même '''MP3''', faisant exactement la même taille, au même bitrate, mais avec trois qualités différentes. | Nous pouvons donc avoir le même '''MP3''', faisant exactement la même taille, au même bitrate, mais avec trois qualités différentes. | ||
| Ligne 31 : | Ligne 33 : | ||
Toujours est-il que si l'on a la possibilité d'encoder en '''MP3''' avec '''LAME''', cela vaut mieux que du '''AAC''' et, pour la vidéo, si l'on a la possibilité de passer par '''Vorbis''', qui a aussi continué à évoluer, cela vaut mieux également. | Toujours est-il que si l'on a la possibilité d'encoder en '''MP3''' avec '''LAME''', cela vaut mieux que du '''AAC''' et, pour la vidéo, si l'on a la possibilité de passer par '''Vorbis''', qui a aussi continué à évoluer, cela vaut mieux également. | ||
L''''OPUS''' est un cas à part car il n'a pas du tout été créé pour la musique ou la vidéo. Bien que sous licence libre, il est créé par un groupe de grosses entreprises voulant créer le meilleur codec pour la communication audio. | L'un des avantages pésenté par '''Fraunhofer''' du '''ACC''' par rapport au '''MP3''' est l'absence de gap, le petit blanc entre deux pistes. Mais pour cela, les '''AAC''' doivent être intégrés dans un '''MP4''', cela ne fonctionne pas avec des fichiers séparés... '''LAME''' a de son côté réglé ce problème et le '''MP3''' est gapless, il n'y aucun gap lors de la lecture dans les lecteurs courants ('''WinAMP''', '''Foobar''', '''VLC'''...). Le '''Vorbis''' est également gapless par défaut. | ||
L''''OPUS''' est un cas à part car il n'a pas du tout été créé pour la musique ou la vidéo. Bien que sous licence libre, il est créé par un groupe de grosses entreprises voulant créer le meilleur codec pour la communication audio. Ils ont alors demandé à '''xiph'''... | |||
C'est donc le codec utilisé par '''Facebook''' '''Messenger''', '''Google''' '''Meet''', '''What's App, Discord, Zoom'''... | C'est donc le codec utilisé par '''Facebook''' '''Messenger''', '''Google''' '''Meet''', '''What's App, Discord, Zoom'''... | ||
Mais en voulant absolument améliorer la qualité à très bas débit, ils ont créé le meilleur codec audio pour la musique à haut débit, tout en diminuant drastiquement la taille des fichiers. Et en plus de ça, ce codec est déjà présent partout vu qu'utilisé par les logiciels cités plus haut. N'importe quel navigateur internet actuel peut lire un fichier '''OPUS'''. | Mais en voulant absolument améliorer la qualité à très bas débit, ils ont créé le meilleur codec audio pour la musique à haut débit, tout en diminuant drastiquement la taille des fichiers. Et en plus de ça, ce codec est déjà présent partout vu qu'utilisé par les logiciels cités plus haut. N'importe quel navigateur internet actuel peut lire un fichier '''OPUS'''. De plus, ne cherchant pas à limiter l'utilisation, ce format est capable de gérer toute configuration jusqu'à 255 enceintes | ||
Depuis peu, '''YouTube Music''' passe par '''OPUS''' pour l'encodage de la musique. | Depuis peu, '''YouTube Music''' passe par '''OPUS''' pour l'encodage de la musique. | ||
==== Formats non-destructifs ==== | |||
Le '''FLAC''' est un format ouvert créé par '''xiph''', vu plus haut pour le '''Vorbis''' et le '''OPUS'''. | |||
Il a également existé le format '''APE''', dont le format de tag, compatible avec les '''MP3''' est toujours utilisé, créé spécialement pour le logiciel '''Monkey's Audio''', mais ce logiciel ne s'étant pas imposé, le format audio '''APE''' a totalement disparu. | |||
'''FLAC''' est connu pour offrir une compression supérieure à celle du '''ZIP''', pris en général comme référence pour la compression sans perte, tout en permettant une décompression plus rapide que le temps de la piste compressée, quel que soit le niveau de compession. | |||
Avant cela, les audiophiles utilisaient soit des formats non destructifs comme le '''WAV''' ou le '''PCM''', mais qui ne permettaient pas les tags, faisant que les lecteurs audios n'affichaient pas les informations, soit alors ils réalisaient un '''ISO,''' une copie conforme d'un CD, en un seul fichier, mais pris par les lecteurs comme un réel CD avec plusieurs pistes. | |||
Ce format est toujours utilisé et maintenant que la plupart des gens ont un accès internet haut-débit, un site comme '''Qobuz''' propose une alternative à '''YouTube Music''' et '''Spotify''' en proposant une écoute en qualité '''FLAC''' ainsi que l'achat des albums en réelle qualité CD. | |||
'''Apple''' a créé alors le format propriétaire '''ALAC''', offrant la même chose sans aucun avantage mais utilisé pour les offres haute qualité de '''Apple'''... | |||
Bien que le '''FLAC''' soit sans perte, lors de l'encodage, il vous sera demandé 16 ou 24bits. Il peut sembler logique que 24 offre une meilleure qualité que 16 mais ce n'est pas le cas. | |||
La majorité des '''FLAC''' viennent de sources en 16bits car sont les seules existantes pour le grand public. Le 24bit n'est utilisé que dans les studios, même si les cartes son actuelles sont toutes 24bits et que si vous avez le matériel nécessaire ou réalisez certaines opérations, vous entendrez la différence, surtout à haut volume. | |||
Il est possible de rencontrer du 24bit, par exemple lorsque '''Peter Gabriel''', pour le 25ème anniversaire de son album "So", donnait un lien dans chaque CD afin de pouvoir télécharger la version studio '''FLAC''' 24bits. | |||
Ou alors lorsque vous utilisez des formats particuliers. | |||
---- | |||
=== Formats particuliers === | === Formats particuliers === | ||
Il existe deux formats très particuliers : | |||
# Le '''MIDI''' : qui avant d'être un format audio est un protocole de communication entre instruments éléctroniques permettant de dire quelle note doit être utilisée, avec quelle vélocité et avec quel instrument. | |||
# Le '''Module''' : un format insérant des petits échantillons audio mais fortement modifiables afin de créer une musique. Principalement utilisé pour la techno et la dance dans les années 90. | |||
==== MIDI ==== | |||
Le format '''MIDI''' n'est pas utilisable dans une audiothèque car ce format ne contient que des notes, des informations sur les notes (vélocité, longueur...) et un code indiquant à quel instrument ces notes sont attribuées. | |||
Sur ordinateur, les cartes sonores font qu'une synthèse FM est attribuée à chaque instrument et il est donc possible de lire un '''MIDI''' avec des instruments simulés mais la qualité ne sera pas au rendez-vous. | |||
Cette simplicité permet néanmoins à ce format d'être utilisé, entre autres, sur les "pianos automatiques", de vrais pianos qui, quand ils ne sont pas utilisés, permettent d'utiliser un '''MIDI''' pour jouer les notes automatiquement. | |||
Mais elle permet aussi, dans un logiciel ou sur un synthétiseur, d'attribuer des '''SoundFont''' à un '''MIDI''' qui se chargera alors d'attribuer des échantillons sonores à chaque instrument. | |||
La '''SoundFont''' (format de fichier '''SF2''') est un ensemble de fichiers, en général de très haute qualité dans un format audio brut sans compression ('''WAV''' ou '''PCM'''), attribués aux différentes notes. | |||
Une même note peut avoir plusieurs échantillons en fonction de la vélocité, ce qui est particulièrement utilisé pour les instruments claviers comme le piano, le clavecin, l'orgue... | |||
Si vous devez transformer un '''MIDI''' en format audio, il faut donc voir quels instruments sont présents dans la composition. | |||
Par exemple, pour une oeuvre au piano, il vaudra mieux choisir une '''SoundFont''' de 100Mo avec uniquement le piano présent, qu'une '''SoundFont''' plus connue, avec tous les instruments, de 600Mo. | |||
Les '''SF2''' sont très nombreux, il y a des passionnés qui passent leur temps à créer des '''SoundFont''' juste pour un piano qui, selon eux, rend bien. | |||
Lors de la conversion en audio, il est également possible de créer une variable aléatoire modifiant la vélocité et le moment où la note est frappée afin de rendre le résultat plus "humain". | |||
La '''SoundFont''' est à choisir en fonction du cas. Par exemple, si vous voulez avoir une copie haute qualité de la bande son de '''Doom''', tel que dans vos souvenirs de joueurs sur une carte son '''Sound Blaster''', il y a une '''SoundFont''' "Creative.sf2". | |||
Transformer un '''MIDI''' en format audio n'est pas l'opération la plus simple qui soit. | |||
Le plus simple est de passer par '''LMMS''' (Linux Multi Media Studio), disponible sur toutes les plates-formes, charger une '''SoundFont''', facilement trouvables sur '''Google''', et créer son audio. | |||
'''LMMS''' propose un export en '''WAV''', qu'il faudra alors retransformer en '''FLAC''', par exemple avec '''Audacity''' ou '''Handbrake'''. | |||
'''Attention''' : Les logiciels musicaux gérant le '''MIDI''' n'utilisent pas les échantillons de la '''SoundFont''' lorsque vous jouez votre morceau en cours d'édition. Ils utilisent des versions simplifiées et le résultat entendu ne sera donc pas le résultat final, qui doit être entièrement calculé. C'est le même principe que pour les images de synthèses proposant une prévisualisation simplifiée mais imposent un rendu très long pour obtenir le résultat final, de bonne qualité. | |||
==== | ==== Modules ==== | ||
Les | Les modules sont un type de fichier, né dans les années 90, cherchant à mélanger le '''MIDI''' avec ce qu'allaient proposer les '''SoundFont'''. | ||
C'est un format créé par les Demo-Makers, des développeurs cherchant toujours à faire au mieux avec le moins de place et de ressources possible. | |||
Il y a eu à l'époque un nombe incroyables de musiciens ayant utilisés les modules mais dont beaucoup ont arrêtés et ces modules sont les seuls formats qu'il reste. | |||
Plusieurs formats se sont imposés et sont maintenant gérés par tous les logiciels : '''MOD''', '''XM''', '''S3M''', '''IT'''... | |||
Le logiciel de référence pour gérer ces formats et les transformer en audio est '''OpenMPT'''. | |||
Celui-ci permet un export en '''WAV''' et en '''FLAC'''. | |||
==== 16, 24 ou 32bits ? ==== | |||
'''LMMS''' et '''OpentMPT''' vous proposeront chacun de pouvoir monter jusqu'à 32bits. | |||
Ne faites cela que si vous avez votre propre studio ou avez l'intention de jouer cette piste à Forest National. | |||
Pour les deux, passez par du 24bits. Même si un module est composé de samples 8bits mal enregistrés il y a parfois 30 ans, ce que cela assure c'est la dynamique voulue par le morceau | |||
---- | |||
=== La dynamique ? === | |||
Il s'agit de l'écart en décibels entre les sons les plus bas et ceux les plus forts. Plus cet écart est grand, plus la dynamique est grande. | |||
Ce que cherchent à faire les formats destructifs est diminuer cette dynamique là où cela est possible car c'est cette dynamique qui prend de la place. | |||
Beaucoup de musiques modernes ont une dynamique faible, faisant que la compression donne un résultat assez proche de l'original. | |||
Le | Le problème se pose avec les morceaux où la dynamique est plus élevée, en particulier, le rock, les lives et le classique. | ||
La réponse a été vite trouvée : l'utilisation du "Variable Bitrate" ('''VBR''') au lieu du "Constant Bitrate" ('''CBR'''). | |||
Le '''CBR''' est très simple à calculer : | |||
* <math>D = \text{Durée en secondes}</math> | * <math>D = \text{Durée en secondes}</math> | ||
* <math>B = \text{Bitrate}</math> | * <math>B = \text{Bitrate}</math> | ||
| Ligne 114 : | Ligne 141 : | ||
* <math>M = 1024 \text{ : pour passer de Ko en Mo}</math> | * <math>M = 1024 \text{ : pour passer de Ko en Mo}</math> | ||
* <math>T = \text{Taille finale en Mo}</math> | * <math>T = \text{Taille finale en Mo}</math> | ||
Donc : <math>\frac{D \times B}{K \times M} = T</math> | |||
Donc : <math>\frac{T \times M \times K}{B} = D</math> | |||
Par exemple, si vous avez un morceau de 4 minutes 27, avec bitrate de 320, sa taille sera de : <math> \frac{D = 267 \times B = 320}{K = 8 \times M = 1024} = T \approx 10,429 Mo</math> | |||
Ce que feront la très gande majorité des lecteurs audios est très simple : | |||
* <math>a = \text{Taille du fichier en bits}</math> | |||
* <math>b = \text{Bitrate donné par l'analyse du fichier}</math> | |||
* <math>D = \text{Durée en secondes}</math> | |||
donnant alors : <math>\frac{a = 85440}{b = 320} = D = 267</math>, donc une piste de 267 secondes, soit 4 minutes 27. | |||
Mais le problème avec le '''VBR''' est qu'il donne une moyenne du bitrate faisant que ces lecteurs allaient alors faire le calcul suivant : <math>\frac{a = 85440}{b = 278} = D = 378</math> soit 6 minutes et 18 secondes. | |||
Bien que ce problème ait été réglé directement dans '''LAME''', et que tous les lecteurs maintenant affichent convenablement la durée d'un '''VBR''', le '''CBR''' est resté la référence pour le '''MP3''' car '''Fraunhofer''' n'a pas mis à jour son codec pour ce problème, faisant qu'il est toujours présent. | |||
Actuellement, un '''MP3''' en '''VBR''' dans sa plus haute qualité est très largement supérieur à un '''MP3''' '''CBR''' 320. | |||
Le '''FLAC''' est d'office en '''VBR''', mais les formats destructifs permettent tous le choix entre '''CBR''' et '''VBR''', bien que pour ceux-ci le '''VBR''' soit toujours la norme par défaut puisque tous les lecteurs gèrent le calcul de la durée. | |||
==== Vérifier la dynamique ==== | |||
Au vu de la qualité des codecs quant à la restitution de l'audio, il est rare de tomber sur un audio de mauvaise qualité, le vrai problème est la dynamique. | |||
Il n'est pas rare de tomber sur des '''FLAC''' mal enregistrés, ce qui peut se voir grâce à une analyse spectrographique. Cela faisant qu'à choisir entre un '''FLAC''' mal enregistré et un '''MP3''' 320, il vaut mieux choisir le '''MP3'''. | |||
Il | Je vais partir d'un '''FLAC''' que j'ai en 24 bits puisque j'ai l'original de l'album '''So''' de '''Peter Gabriel'''. Il pèse 136,806 Mo pour une durée de 6 minutes 34. | ||
Voici | Voici le spctrogramme du '''FLAC''' en 24bits : | ||
[[Fichier:Imageflac24bits.png|centré|960x960px]] | |||
Je vais le convertir en 16 bits puisque tous les formats de ce comparatif sont 16 bits. | |||
Le spectrogramme est le suivant, pour un fichier de 42,989 Mo : | |||
[[Fichier:Spectroflac.png|bordure|centré|960x960px]] | |||
Voici le spectrogamme du '''MP3''' 320, pour un résultat de 15,378 Mo : | |||
[[Fichier:SpectroMP320.png|centré|960x960px]] | |||
Voici le spectrogamme du '''MP3''' 160, pour un résultat de 7,689 Mo : | |||
[[Fichier:Image.png|centré|960x960px]] | |||
Voici le spectrogramme du '''MP3''' 128, pour un résultat de 6,152 Mo : | |||
[[Fichier:Imagemp3128.png|centré|960x960px]]Voici le spectrogramme d'un '''OPUS''' en qualité AUTO, pour un résultat de 5,861 Mo : | |||
[[Fichier:Imageopusauto.png|centré|960x960px]] | |||
Voici le spectrograpmme d'un '''OPUS''' en qualité Max, pour un résultat de 24,769 Mo : | |||
[[Fichier:Imageopusmax.png|centré|960x960px]]Voici le spectrogramme d'un '''OPUS''' en '''CBR''' 256, la meilleure qualité possible en CBR, pour un résultat de 12,453 Mo : | |||
[[Fichier:Imageopuscbr256.png|centré|960x960px]] | |||
== Les tags == | |||
Une des choses qui a rendu le '''MP3''' populaire est l'utilisation de tags. | |||
Les tags sont des informations textuelles ou numériques, incluses à chaque fichier '''MP3'''. Celles-ci permettent au logiciel que vous utilisez de vous présenter vos fichiers en ne devant pas uniquement se baser sur le nom de fichier. | |||
* '''ALBUM''' : Nom de l'album | |||
* '''TITLE''' : Titre de la piste | |||
* '''ARTIST''' : Artiste de la piste | |||
* '''COMMENT''' : Commentaires sur la piste | |||
* '''YEAR''' : Année de parution | |||
* '''GENRE''' : Genre musical. | |||
Ceux-ci ne sont pas une création officielle mais une sorte de "hack" créé par '''Eric Kemp''' qui voulait voir ces données affichées et qui a remarqué qu'il était possible de modifier les '''MP3''' pour les y intégrer. | |||
---- | ---- | ||
==== | === Les formats de tags === | ||
==== ID3 ==== | |||
'''Kemp''' a établi ces tags de base sous le format '''ID3.''' | |||
Dans sa première version, le nombre de caractères était limité pour chaque zone et il n'était pas possible d'utiliser des caractères spéciaux ou accentués. | |||
Il y a eu une version '''ID3v1.1''', mais celle-ci n'a apporté que la possibilité d'indiquer un numéro de piste car la majorité des lecteurs lisaient les fichiers dans l'ordre alphabétique. | |||
La vraie évolution a été la création du '''ID3v2''', toujours utilisé aujourd'hui dans sa version '''ID3v2.3''', qui permet des tags à longueur variable, étend le nombre de tags par défaut de manière inimaginable, absurdre et pensée avec les pieds et permet d'insérer tout type de données, y compris des images ou des paroles synchronisées. | |||
Mais attention, les choses sont beaucoup plus compliquées que ça... | |||
===== Le problème ID3 ===== | |||
En fait, les tags '''ALBUM''', '''ARTIST''', '''YEAR''', etc... ne sont pas des tags, ce sont des noms attribués aux réels tags qui sont des codes de quatre caractères. | |||
Tous les logiciels se sont plus ou moins accordés pour donner le même nom aux différents tags, donc : | |||
* '''TALB''' = '''%ALBUM%''' | |||
* '''TIT2''' = '''%TITLE%''' | |||
* '''TPE1''' = '''%ARTIST%''' | |||
* '''TYER''' = '''%YEAR%''' - Un des problèmes de ce tag est que n'étant plus limité à 4 chiffres, beaucoup l'utilisent pour indiquer la... | |||
* '''TDAT''' = '''%DATE%''' - date de sortie... | |||
* '''TCON''' = '''%GENRE%''' | |||
* '''COMM''' = '''%COMMENT%''' | |||
* '''TBPM''' = '''%BPM%''' | |||
* '''USLT''' = '''%LYRICS%''' ou '''%UNSYNCEDLYRICS%''' | |||
Lorsqu'un nouveau tag, par exemple '''%GENRE2%''', est créé dans '''MP3tag''', ce qui est réellement créé dans le '''MP3''' est : | |||
* '''TXXX''':'''Tag'''='''Valeur''' | |||
Donc, en réalité, nous nous retrouvons avers plusieurs entrées '''TXXX''', ayant chacune une description qui devient le tag et une valeur qui devient la valeur de ce tag. | |||
Mais un problème est que '''Kemp''' a créé énormément de tags, donnant parfois peu de libertés pour sortir du modèle imposé. | |||
Par exemple, si le titre de la piste est '''TIT2''' et non '''TIT1''', c'est car '''Kemp''' avait prévu les choses comme ça (exemple) pour une piste : | |||
* '''TALB''' : Le meilleur de Beethoven | |||
* '''TIT1''' : Symphonie n°9 | |||
* '''TIT2''' : Presto | |||
* '''TIT3''' : Mouvement 2 | |||
J'imagine que son format de date préféré est mois/jour/année... | |||
==== APE ==== | |||
Ce système de tag vient d'un format de fichier, propre à un lecteur audio, '''Monkey's Ape''', qui permettait d'obtenir une copie de ses CDs, au format '''APE''', qui était non destructif, comme le '''FLAC'''. | |||
Celui-ci se base sur le principe créé par '''xiph''' pour le '''OGG''' et le '''FLAC''', puis l''''OPUS''' : le '''Vorbis Comment'''. | |||
C'est simple : il n'y a plus de code et le nom de la variable est la variable. | |||
Il est considéré comme plus intéressant et évolué que le '''ID3''', mais vu que la plupart des audiophiles sont également passés à d'autres formats, comme le '''FLAC''', il n'est pas le plus utilisé et le plus suivi par les différents logiciels et, surtout, n'est pas du tout compatible avec les anciens lecteurs et même Windows. | |||
Néanmoins, le simple fait que ce soit un "meilleur système" fait qu'il est parfois conseillé alors que ne constitue pas du tout un standard. | |||
==== Quel format de tag choisir ? ==== | |||
Pour les '''MP3''', le mieux est le '''ID3v2.3''' (et non 2.4 car le 2.3 était encore compatible avec les vieux lecteurs, mais le 2.4 pose problème, raison pour laquelle MP3Tag garde la 2.3 par défaut) | |||
---- | ---- | ||
| Ligne 193 : | Ligne 270 : | ||
# '''Spek''' : Analyse un fichier afin d'en fournir le spectre, permettant de s'assurer de la qualité réelle de la piste. | # '''Spek''' : Analyse un fichier afin d'en fournir le spectre, permettant de s'assurer de la qualité réelle de la piste. | ||
---- | ---- | ||
== Problème de téléchargement == | |||
Plusieurs sites, comme '''YouTube Music''' et '''Spotify''' proposent des albums complets. | |||
Un très gros problème cependant est qu'ils génèrent leurs albums en fonction des pistes censées s'y trouver mais ne vérifient pas toujours que ce soit la bonne version de la piste pour cet album en particulier. | |||
Beaucoup d'albums auront alors parfois une version "Radio" à la place d'un morceau version longue car ils n'auront pas cette version. | |||
== Workflow == | == Workflow == | ||
Dernière version du 12 mars 2026 à 21:44
Introduction
Il existe deux formats dans lesquels nous retrouvons, en général, la musique
- MP3 : le format le plus courant, destructif mais compatible avec tout.
- FLAC : le format des audiophiles, sans destruction, diminuant la taille sans diminuer la qualité.
Cela n'est pas sans raison.
Formats destructifs
On peut parfois retrouver d'autres formats, comme le Vorbis (OGG), le OPUS ou le AAC (MP4/M4A).
Ces formats, bien que destructifs comme le MP3 sont parfois de bien meilleure qualité, l'OPUS allant jusqu'à proposer des fichiers trois fois plus petits que le MP3 mais avec une qualité proche du FLAC. Le problème est que ces formats ne se sont pas imposés et que le MP3 est le seul à pouvoir être lu sur tous les appareils prévus pour lire de la musique, même les plus anciens car, étant rétrocompatible, même un ancien lecteur MP3 d'une voiture d'il y a 20 ans restituera la bonne qualité d'un MP3 récent.
Ce problème vient en partie d'une chose : le fait que le format soit propriétaire ou non.
Lorsque Fraunhofer a créé le MP3, il s'agissait d'un format propriétaire et il fallait payer une licence pour obtenir les outils pour lire et encoder en MP3. Un groupe de développeur a alors créé son propre codec, LAME, toujours maintenu et offrant une bien meilleure qualité. Mais une très grosse entreprise ne peut pas utiliser un codec libre et open source car celui est fourni sans garantie. Donc on paye Fraunhofer.
C'est ce qu'a fait Microsoft pour son Windows Media Player. Il était possible d'encoder en WMA et en MP3. Une piste encodée en WMA donnait mieux qu'en MP3, mais c'est car Microsoft avait demandé une version modifiée à Fraunhofer afin de rendre ses outils un peu plus rapide au détriment de la qualité.
Contrairement à LAME, le codec Fraunhofer n'a pas cherché à faire évoluer la qualité mais est passé au 5.1 et au Surround pour une utilisation vidéo, faisant que leur codec propriétaire était encore très utilisé.
Un autre groupe, xiph, a créé le codec Vorbis, totalement libre et open-source cherchant à offrir une alternative au MP3 en proposant, entres autres le 5.1. OGG n'est pas un format c'est un conteneur pouvant contenir plusieurs codecs. Donc si vous voyez un OGG, c'est peut-être un MP3 (mais c'est très rare)... Ce codec est encore très utilisé entre autres pour les pistes audios de films ou séries.
Nous pouvons donc avoir le même MP3, faisant exactement la même taille, au même bitrate, mais avec trois qualités différentes.
En gros, il est considéré que si l'on encode avec Windows Media Player avec un bitrate de 128, cela équivaut à un encodage Fraunhofer avec un bitrate de 96. Là où un encodage LAME 128 équivaut à un Fraunhofer 160.
Le AAC est également une création de Fraunhofer et est donc un format propriétaire vu comme l'évolution du MP3, utilisé par YouTube Music et Spotify ainsi que par Apple.
Bien que Fraunhofer annonce une amélioration de qualité par rapport au MP3, elle n'est vraie qu'avec le codec Fraunhofer du MP3. Pas avec LAME qui, à bitrate égal, offre une meilleure qualité.
Néanmoins, c'est devenu un standard utilisé également par Netflix, Disney et la majorité des plates formes de streaming videos. Celles-ci proposent toujours des systèmes beaucoup plus évolués, tel que le Dolby 5.1, le Dolby TrueHD ou encore le Dolby Atmos, mais pour ça, il faut un matériel que la très très grande majorité des gens n'a pas et si on ne l'a pas, ce sera du AAC stéréo.
Toujours est-il que si l'on a la possibilité d'encoder en MP3 avec LAME, cela vaut mieux que du AAC et, pour la vidéo, si l'on a la possibilité de passer par Vorbis, qui a aussi continué à évoluer, cela vaut mieux également.
L'un des avantages pésenté par Fraunhofer du ACC par rapport au MP3 est l'absence de gap, le petit blanc entre deux pistes. Mais pour cela, les AAC doivent être intégrés dans un MP4, cela ne fonctionne pas avec des fichiers séparés... LAME a de son côté réglé ce problème et le MP3 est gapless, il n'y aucun gap lors de la lecture dans les lecteurs courants (WinAMP, Foobar, VLC...). Le Vorbis est également gapless par défaut.
L'OPUS est un cas à part car il n'a pas du tout été créé pour la musique ou la vidéo. Bien que sous licence libre, il est créé par un groupe de grosses entreprises voulant créer le meilleur codec pour la communication audio. Ils ont alors demandé à xiph...
C'est donc le codec utilisé par Facebook Messenger, Google Meet, What's App, Discord, Zoom...
Mais en voulant absolument améliorer la qualité à très bas débit, ils ont créé le meilleur codec audio pour la musique à haut débit, tout en diminuant drastiquement la taille des fichiers. Et en plus de ça, ce codec est déjà présent partout vu qu'utilisé par les logiciels cités plus haut. N'importe quel navigateur internet actuel peut lire un fichier OPUS. De plus, ne cherchant pas à limiter l'utilisation, ce format est capable de gérer toute configuration jusqu'à 255 enceintes
Depuis peu, YouTube Music passe par OPUS pour l'encodage de la musique.
Formats non-destructifs
Le FLAC est un format ouvert créé par xiph, vu plus haut pour le Vorbis et le OPUS.
Il a également existé le format APE, dont le format de tag, compatible avec les MP3 est toujours utilisé, créé spécialement pour le logiciel Monkey's Audio, mais ce logiciel ne s'étant pas imposé, le format audio APE a totalement disparu.
FLAC est connu pour offrir une compression supérieure à celle du ZIP, pris en général comme référence pour la compression sans perte, tout en permettant une décompression plus rapide que le temps de la piste compressée, quel que soit le niveau de compession.
Avant cela, les audiophiles utilisaient soit des formats non destructifs comme le WAV ou le PCM, mais qui ne permettaient pas les tags, faisant que les lecteurs audios n'affichaient pas les informations, soit alors ils réalisaient un ISO, une copie conforme d'un CD, en un seul fichier, mais pris par les lecteurs comme un réel CD avec plusieurs pistes.
Ce format est toujours utilisé et maintenant que la plupart des gens ont un accès internet haut-débit, un site comme Qobuz propose une alternative à YouTube Music et Spotify en proposant une écoute en qualité FLAC ainsi que l'achat des albums en réelle qualité CD.
Apple a créé alors le format propriétaire ALAC, offrant la même chose sans aucun avantage mais utilisé pour les offres haute qualité de Apple...
Bien que le FLAC soit sans perte, lors de l'encodage, il vous sera demandé 16 ou 24bits. Il peut sembler logique que 24 offre une meilleure qualité que 16 mais ce n'est pas le cas.
La majorité des FLAC viennent de sources en 16bits car sont les seules existantes pour le grand public. Le 24bit n'est utilisé que dans les studios, même si les cartes son actuelles sont toutes 24bits et que si vous avez le matériel nécessaire ou réalisez certaines opérations, vous entendrez la différence, surtout à haut volume.
Il est possible de rencontrer du 24bit, par exemple lorsque Peter Gabriel, pour le 25ème anniversaire de son album "So", donnait un lien dans chaque CD afin de pouvoir télécharger la version studio FLAC 24bits.
Ou alors lorsque vous utilisez des formats particuliers.
Formats particuliers
Il existe deux formats très particuliers :
- Le MIDI : qui avant d'être un format audio est un protocole de communication entre instruments éléctroniques permettant de dire quelle note doit être utilisée, avec quelle vélocité et avec quel instrument.
- Le Module : un format insérant des petits échantillons audio mais fortement modifiables afin de créer une musique. Principalement utilisé pour la techno et la dance dans les années 90.
MIDI
Le format MIDI n'est pas utilisable dans une audiothèque car ce format ne contient que des notes, des informations sur les notes (vélocité, longueur...) et un code indiquant à quel instrument ces notes sont attribuées.
Sur ordinateur, les cartes sonores font qu'une synthèse FM est attribuée à chaque instrument et il est donc possible de lire un MIDI avec des instruments simulés mais la qualité ne sera pas au rendez-vous.
Cette simplicité permet néanmoins à ce format d'être utilisé, entre autres, sur les "pianos automatiques", de vrais pianos qui, quand ils ne sont pas utilisés, permettent d'utiliser un MIDI pour jouer les notes automatiquement.
Mais elle permet aussi, dans un logiciel ou sur un synthétiseur, d'attribuer des SoundFont à un MIDI qui se chargera alors d'attribuer des échantillons sonores à chaque instrument.
La SoundFont (format de fichier SF2) est un ensemble de fichiers, en général de très haute qualité dans un format audio brut sans compression (WAV ou PCM), attribués aux différentes notes.
Une même note peut avoir plusieurs échantillons en fonction de la vélocité, ce qui est particulièrement utilisé pour les instruments claviers comme le piano, le clavecin, l'orgue...
Si vous devez transformer un MIDI en format audio, il faut donc voir quels instruments sont présents dans la composition.
Par exemple, pour une oeuvre au piano, il vaudra mieux choisir une SoundFont de 100Mo avec uniquement le piano présent, qu'une SoundFont plus connue, avec tous les instruments, de 600Mo.
Les SF2 sont très nombreux, il y a des passionnés qui passent leur temps à créer des SoundFont juste pour un piano qui, selon eux, rend bien.
Lors de la conversion en audio, il est également possible de créer une variable aléatoire modifiant la vélocité et le moment où la note est frappée afin de rendre le résultat plus "humain".
La SoundFont est à choisir en fonction du cas. Par exemple, si vous voulez avoir une copie haute qualité de la bande son de Doom, tel que dans vos souvenirs de joueurs sur une carte son Sound Blaster, il y a une SoundFont "Creative.sf2".
Transformer un MIDI en format audio n'est pas l'opération la plus simple qui soit.
Le plus simple est de passer par LMMS (Linux Multi Media Studio), disponible sur toutes les plates-formes, charger une SoundFont, facilement trouvables sur Google, et créer son audio.
LMMS propose un export en WAV, qu'il faudra alors retransformer en FLAC, par exemple avec Audacity ou Handbrake.
Attention : Les logiciels musicaux gérant le MIDI n'utilisent pas les échantillons de la SoundFont lorsque vous jouez votre morceau en cours d'édition. Ils utilisent des versions simplifiées et le résultat entendu ne sera donc pas le résultat final, qui doit être entièrement calculé. C'est le même principe que pour les images de synthèses proposant une prévisualisation simplifiée mais imposent un rendu très long pour obtenir le résultat final, de bonne qualité.
Modules
Les modules sont un type de fichier, né dans les années 90, cherchant à mélanger le MIDI avec ce qu'allaient proposer les SoundFont.
C'est un format créé par les Demo-Makers, des développeurs cherchant toujours à faire au mieux avec le moins de place et de ressources possible.
Il y a eu à l'époque un nombe incroyables de musiciens ayant utilisés les modules mais dont beaucoup ont arrêtés et ces modules sont les seuls formats qu'il reste.
Plusieurs formats se sont imposés et sont maintenant gérés par tous les logiciels : MOD, XM, S3M, IT...
Le logiciel de référence pour gérer ces formats et les transformer en audio est OpenMPT.
Celui-ci permet un export en WAV et en FLAC.
16, 24 ou 32bits ?
LMMS et OpentMPT vous proposeront chacun de pouvoir monter jusqu'à 32bits.
Ne faites cela que si vous avez votre propre studio ou avez l'intention de jouer cette piste à Forest National.
Pour les deux, passez par du 24bits. Même si un module est composé de samples 8bits mal enregistrés il y a parfois 30 ans, ce que cela assure c'est la dynamique voulue par le morceau
La dynamique ?
Il s'agit de l'écart en décibels entre les sons les plus bas et ceux les plus forts. Plus cet écart est grand, plus la dynamique est grande.
Ce que cherchent à faire les formats destructifs est diminuer cette dynamique là où cela est possible car c'est cette dynamique qui prend de la place.
Beaucoup de musiques modernes ont une dynamique faible, faisant que la compression donne un résultat assez proche de l'original.
Le problème se pose avec les morceaux où la dynamique est plus élevée, en particulier, le rock, les lives et le classique.
La réponse a été vite trouvée : l'utilisation du "Variable Bitrate" (VBR) au lieu du "Constant Bitrate" (CBR).
Le CBR est très simple à calculer :
Donc :
Donc :
Par exemple, si vous avez un morceau de 4 minutes 27, avec bitrate de 320, sa taille sera de :
Ce que feront la très gande majorité des lecteurs audios est très simple :
donnant alors : , donc une piste de 267 secondes, soit 4 minutes 27.
Mais le problème avec le VBR est qu'il donne une moyenne du bitrate faisant que ces lecteurs allaient alors faire le calcul suivant : soit 6 minutes et 18 secondes.
Bien que ce problème ait été réglé directement dans LAME, et que tous les lecteurs maintenant affichent convenablement la durée d'un VBR, le CBR est resté la référence pour le MP3 car Fraunhofer n'a pas mis à jour son codec pour ce problème, faisant qu'il est toujours présent.
Actuellement, un MP3 en VBR dans sa plus haute qualité est très largement supérieur à un MP3 CBR 320.
Le FLAC est d'office en VBR, mais les formats destructifs permettent tous le choix entre CBR et VBR, bien que pour ceux-ci le VBR soit toujours la norme par défaut puisque tous les lecteurs gèrent le calcul de la durée.
Vérifier la dynamique
Au vu de la qualité des codecs quant à la restitution de l'audio, il est rare de tomber sur un audio de mauvaise qualité, le vrai problème est la dynamique.
Il n'est pas rare de tomber sur des FLAC mal enregistrés, ce qui peut se voir grâce à une analyse spectrographique. Cela faisant qu'à choisir entre un FLAC mal enregistré et un MP3 320, il vaut mieux choisir le MP3.
Je vais partir d'un FLAC que j'ai en 24 bits puisque j'ai l'original de l'album So de Peter Gabriel. Il pèse 136,806 Mo pour une durée de 6 minutes 34.
Voici le spctrogramme du FLAC en 24bits :

Je vais le convertir en 16 bits puisque tous les formats de ce comparatif sont 16 bits.
Le spectrogramme est le suivant, pour un fichier de 42,989 Mo :

Voici le spectrogamme du MP3 320, pour un résultat de 15,378 Mo :

Voici le spectrogamme du MP3 160, pour un résultat de 7,689 Mo :

Voici le spectrogramme du MP3 128, pour un résultat de 6,152 Mo :

Voici le spectrogramme d'un OPUS en qualité AUTO, pour un résultat de 5,861 Mo :

Voici le spectrograpmme d'un OPUS en qualité Max, pour un résultat de 24,769 Mo :

Voici le spectrogramme d'un OPUS en CBR 256, la meilleure qualité possible en CBR, pour un résultat de 12,453 Mo :

Les tags
Une des choses qui a rendu le MP3 populaire est l'utilisation de tags.
Les tags sont des informations textuelles ou numériques, incluses à chaque fichier MP3. Celles-ci permettent au logiciel que vous utilisez de vous présenter vos fichiers en ne devant pas uniquement se baser sur le nom de fichier.
- ALBUM : Nom de l'album
- TITLE : Titre de la piste
- ARTIST : Artiste de la piste
- COMMENT : Commentaires sur la piste
- YEAR : Année de parution
- GENRE : Genre musical.
Ceux-ci ne sont pas une création officielle mais une sorte de "hack" créé par Eric Kemp qui voulait voir ces données affichées et qui a remarqué qu'il était possible de modifier les MP3 pour les y intégrer.
Les formats de tags
ID3
Kemp a établi ces tags de base sous le format ID3.
Dans sa première version, le nombre de caractères était limité pour chaque zone et il n'était pas possible d'utiliser des caractères spéciaux ou accentués.
Il y a eu une version ID3v1.1, mais celle-ci n'a apporté que la possibilité d'indiquer un numéro de piste car la majorité des lecteurs lisaient les fichiers dans l'ordre alphabétique.
La vraie évolution a été la création du ID3v2, toujours utilisé aujourd'hui dans sa version ID3v2.3, qui permet des tags à longueur variable, étend le nombre de tags par défaut de manière inimaginable, absurdre et pensée avec les pieds et permet d'insérer tout type de données, y compris des images ou des paroles synchronisées.
Mais attention, les choses sont beaucoup plus compliquées que ça...
Le problème ID3
En fait, les tags ALBUM, ARTIST, YEAR, etc... ne sont pas des tags, ce sont des noms attribués aux réels tags qui sont des codes de quatre caractères.
Tous les logiciels se sont plus ou moins accordés pour donner le même nom aux différents tags, donc :
- TALB = %ALBUM%
- TIT2 = %TITLE%
- TPE1 = %ARTIST%
- TYER = %YEAR% - Un des problèmes de ce tag est que n'étant plus limité à 4 chiffres, beaucoup l'utilisent pour indiquer la...
- TDAT = %DATE% - date de sortie...
- TCON = %GENRE%
- COMM = %COMMENT%
- TBPM = %BPM%
- USLT = %LYRICS% ou %UNSYNCEDLYRICS%
Lorsqu'un nouveau tag, par exemple %GENRE2%, est créé dans MP3tag, ce qui est réellement créé dans le MP3 est :
- TXXX:Tag=Valeur
Donc, en réalité, nous nous retrouvons avers plusieurs entrées TXXX, ayant chacune une description qui devient le tag et une valeur qui devient la valeur de ce tag.
Mais un problème est que Kemp a créé énormément de tags, donnant parfois peu de libertés pour sortir du modèle imposé.
Par exemple, si le titre de la piste est TIT2 et non TIT1, c'est car Kemp avait prévu les choses comme ça (exemple) pour une piste :
- TALB : Le meilleur de Beethoven
- TIT1 : Symphonie n°9
- TIT2 : Presto
- TIT3 : Mouvement 2
J'imagine que son format de date préféré est mois/jour/année...
APE
Ce système de tag vient d'un format de fichier, propre à un lecteur audio, Monkey's Ape, qui permettait d'obtenir une copie de ses CDs, au format APE, qui était non destructif, comme le FLAC.
Celui-ci se base sur le principe créé par xiph pour le OGG et le FLAC, puis l'OPUS : le Vorbis Comment.
C'est simple : il n'y a plus de code et le nom de la variable est la variable.
Il est considéré comme plus intéressant et évolué que le ID3, mais vu que la plupart des audiophiles sont également passés à d'autres formats, comme le FLAC, il n'est pas le plus utilisé et le plus suivi par les différents logiciels et, surtout, n'est pas du tout compatible avec les anciens lecteurs et même Windows.
Néanmoins, le simple fait que ce soit un "meilleur système" fait qu'il est parfois conseillé alors que ne constitue pas du tout un standard.
Quel format de tag choisir ?
Pour les MP3, le mieux est le ID3v2.3 (et non 2.4 car le 2.3 était encore compatible avec les vieux lecteurs, mais le 2.4 pose problème, raison pour laquelle MP3Tag garde la 2.3 par défaut)
Logiciels utilisés
Afin de normaliser les choses, je passe par plusieurs logiciels :
- MusicBrainz Picard : Ce logiciel permet de relier son album ou ses pistes à quelque chose de déjà existant afin d'obtenir plus d'informations que ce que l'on. Il permet également, si l'on créé un compte MusicBrainz, de proposer de nouvelles choses si elles n'existent pas encore.
- MP3Tag : Permet de modifier tous les tags d'un audio (pas seulement MP3), via des scripts très poussés. Utile pour envoyer une nouvelle proposition à MusicBrainz.
- FooBar2000 :Ce logiciel utilise une nouvelle méthode de calcul du ReplayGain, beaucoup (beaucoup (beaucoup)) plus rapide et précise, que cela soit par piste ou par album
- Spek : Analyse un fichier afin d'en fournir le spectre, permettant de s'assurer de la qualité réelle de la piste.
Problème de téléchargement
Plusieurs sites, comme YouTube Music et Spotify proposent des albums complets.
Un très gros problème cependant est qu'ils génèrent leurs albums en fonction des pistes censées s'y trouver mais ne vérifient pas toujours que ce soit la bonne version de la piste pour cet album en particulier.
Beaucoup d'albums auront alors parfois une version "Radio" à la place d'un morceau version longue car ils n'auront pas cette version.
Workflow
Vérifier les audios
Même si vous encodez vous-même vos CDs, vous n'êtes pas à l'abri d'une version pirate basée sur des MP3s de mauvaise qualité.
Afin de le savoir rapidement sans devoir écouter la piste, il existe le logiciel Spek.
En très très gros,