Gestion audiothèque
Introduction
Il existe deux formats dans lesquels nous retrouvons, en général, la musique
- MP3 : le format le plus courant, destructif car pour diminuer la taille une partie des informations audios sont supprimées, diminuant la qualité
- FLAC : le format des audiophiles, sans destruction, diminuant la taille sans diminuer la qualité.
On peut parfois retrouver d'autres formats, comme le Vorbis (OGG), le OPUS ou le AAC (MP4/M4A) ou encore le ALAC.
Ces formats, bien que destructifs comme le MP3 sont parfois de bien meilleure qualité, l'OPUS allant jusqu'à proposer des fichiers trois fois plus petits que le MP3 mais avec une qualité proche du FLAC. Le problème est que ces formats ne se sont pas imposés et que le MP3 est le seul à pouvoir être lu sur tous les appareils prévus pour lire de la musique, même les plus anciens car, étant rétrocompatible, même un ancien lecteur restituera la bonne qualité d'un MP3 récent.
Ce problème vient en partie d'une chose : le fait que le format soit propriétaire ou non.
Lorsque Fraunhofer a créé le MP3, il s'agissait d'un format propriétaire et il fallait payer une licence pour obtenir les outils pour lire et encoder en MP3. Un groupe de développeur a alors créé son propre codec, LAME, toujours maintenu et offrant une bien meilleure qualité. Mais une très grosse entreprise ne peut pas utiliser un codec libre et open source car celui est fourni sans garantie. Donc on paye Fraunhofer.
C'est ce qu'a fait Microsoft pour son Windows Media Player. Il était possible d'encoder en WMA et en MP3. Une piste encodée en WMA donnait mieux qu'en MP3, mais c'est car Microsoft avait demandé une version modifiée à Fraunhofer afin de rendre ses outils un peu plus rapide au détriment de la qualité.
Contrairement à LAME, le codec Fraunhofer n'a pas cherché à faire évoluer la qualité mais est passé au 5.1 et au Surround pour une utilisation vidéo, faisant que leur codec propriétaire était encore très utilisé.
Un autre groupe a créé le codec Vorbis, totalement libre et open-source cherchant à offrir une alternative au MP3 en proposant, entres autres le 5.1. OGG n'est pas un format c'est un conteneur pouvant contenir plusieurs codecs. Donc si vous voyez un OGG, c'est peut-être un MP3... Mais seul un OGG peut contenir du Vorbis... Ce codec est encore très utilisé entre autres pour les pistes audios de films ou séries.
Nous pouvons donc avoir le même MP3, faisant exactement la même taille, au même bitrate, mais avec trois qualités différentes.
En gros, il est considéré que si l'on encode avec Windows Media Player avec un bitrate de 128, cela équivaut à un encodage Fraunhofer avec un bitrate de 96. Là où un encodage LAME 128 équivaut à un Fraunhofer 160.
Le AAC est également une création de Fraunhofer et est donc un format propriétaire vu comme l'évolution du MP3, utilisé par YouTube Music et Spotify ainsi que par Apple.
Bien que Fraunhofer annonce une amélioration de qualité par rapport au MP3, elle n'est vraie qu'avec le codec Fraunhofer du MP3. Pas avec LAME qui, à bitrate égal, offre une meilleure qualité.
Néanmoins, c'est devenu un standard utilisé également par Netflix, Disney et la majorité des plates formes de streaming videos. Celles-ci proposent toujours des systèmes beaucoup plus évolués, tel que le Dolby 5.1, le Dolby TrueHD ou encore le Dolby Atmos, mais pour ça, il faut un matériel que la très très grande majorité des gens n'a pas et si on ne l'a pas, ce sera du AAC stéréo.
Toujours est-il que si l'on a la possibilité d'encoder en MP3 avec LAME, cela vaut mieux que du AAC et, pour la vidéo, si l'on a la possibilité de passer par Vorbis, qui a aussi continué à évoluer, cela vaut mieux également.
L'OPUS est un cas à part car il n'a pas du tout été créé pour la musique ou la vidéo. Bien que sous licence libre, il est créé par un groupe de grosses entreprises voulant créer le meilleur codec pour la communication audio.
C'est donc le codec utilisé par Facebook Messenger, Google Meet, What's App, Discord, Zoom...
Mais en voulant absolument améliorer la qualité à très bas débit, ils ont créé le meilleur codec audio pour la musique à haut débit, tout en diminuant drastiquement la taille des fichiers. Et en plus de ça, ce codec est déjà présent partout vu qu'utilisé par les logiciels cités plus haut. N'importe quel navigateur internet actuel peut lire un fichier OPUS.
Depuis peu, YouTube Music passe par OPUS pour l'encodage de la musique.
Formats particuliers
Les tags
Les tags sont des informations textuelles ou image incluses à chaque fichier MP3. Celles-ci permettent au logiciel que vous utilisez de vous présenter vos fichiers en ne devant pas uniquement se baser sur le nom de fichier.
Par exemple, si vous avez de "01.mp3" à "14.mp3", vous aurez de base les tags :
- ALBUM : Nom de l'album
- TITLE : Titre de la piste
- TRACK : n° de la piste
- ARTIST : Artiste de la piste
- ALBUMARTIST : Artiste principal de l'album
- DISCNUMBER : n° du disque si plusieurs
amenant tout logiciel audio à vous les présenter convenablement.
Plutôt que normaliser les tags du MP3, les développeurs ont laissé les utilisateurs faire et il est donc possible à tous de créer un nouveau tag dans son MP3.
Cela a permis la création de tout un tas de logiciels créant de nouveaux tags pour un usage bien précis mais qui seront alors repris par tous les autres logiciels :
- ReplayGain : Ce logiciel analyse la musique par piste et par album afin de créer un tag indiquant le nombre de décibels à appliquer pour que toute l'audiothèque ait un volume normalisé, que cela soit par piste si en mode shuffle ou en mode album si l'on écoute plusieurs albums d'affilée (utile pour le classique). Ce logiciel a créé le tag mais maintenant de nouveaux logiciels, avec de nouveaux algorithmes, plus précis et plus rapides les utilisent toujours bien que n'étant plus du tout reliés aux créateurs du tag.
- Analyseurs BPM : Plusieurs logiciels analysent les BPM et l'indiquent dans un tag BPM.
- Lyrics : Il existe plusieurs tag permettant à différents logiciels d'avoir aussi bien les paroles que les paroles synchronisées sur la musique.
Mais maintenant arrive un nouveau problème...
Les formats de tags
Les créateurs du format MP3 ont établi ces tags de base sous le format ID3v1
Si vous utilisez MP3Tag, vous serez confrontés à :
- ID3v1 : tags de base
- ID3v2.x : tags étendus et personnalisés
- APE/APEv2 : nouveau système de tags, plus propre, pris en compte par tous les logiciels modernes (dont les dernières versions de Winamp)
Le TRÈS gros problème est que les logiciels gérant les tags, comme MP3Tag, vous afficheront les tags que vous voulez voir et non ceux qui seront gérés par votre lecteur.
Par exemple, si vous gérez vos tags dans MP3Tag sans tenir compte des APE existants, vous ne les verrez pas mais un logiciel comme Winamp verra les AMP comme prioritaires sur les ID3 que vous utilisez.
MP3
Le format MP3 est un format résultant d'une compression de données, réalisée grâce à un co(mpression)dec et lu grâce à un codec(ompression).
Le codec est donc un logiciel qui transforme des données audio brutes en votre piste MP3.
Afin de définir la qualité voulue, il faut indiquer au codec un certain nombre de bits, le "bitrate", sur lesquels encoder les données.
En général, cela sera 128, 160, 192, 256 ou 320 kilobits.
Les codecs proposent deux manières d'encoder le bitrate :
- CBR : Constant bitrate : signifie que le bitrate ne s'adapte pas à l'audio en utilisera le nombre de bit choisi pour une séquence simple ou complexe. Un morceau d'une certaine durée aura donc toujours une taille fixe pouvant se calculer sur la durée et le nombre de bits.
- VBR : Variable bitrate : le bitrate s'adapte à l'audio afin d'utiliser le bitrate optimal selon que la séquence soit simple ou complexe, donnant au final un fichier beaucoup plus léger.
Le VBR est bien meilleur et un VBR dans sa meilleure qualité donnera une meilleure qualité qu'un CBR dans sa meilleure qualité, voire proche d'un FLAC.
Le problème est qu'il a fallu longtemps pour que la compression évolue et qu'il soit possible de calculer la durée d'une piste sans devoir la lire en entier, faisant que, par habitude, les gens sont restés au CBR puis sont passés au FLAC vu l'augmentation de la taille des disques durs.
Le VBR était principalement utilisé comme codec pour les vidéos mais ne s'est pas imposé puisqu'il a fallu longtemps avant que le MP3 ne gère le multi-canal autre que stéréo, faisant que d'autres codecs (OGG, OPUS, AAC...) se sont imposés.
Avec le CBR, la formule est simple :
| B | D = 267 | D = 3600 |
|---|---|---|
| 128 | ||
| 160 | ||
| 192 | ||
| 256 | ||
| 320 |
Mais ce n'est pas la taille ou le bitrate qui fait la qualité.
Ce qui fait la qualité du MP3 est la qualité de l'encodeur utilisé et le moment où il a été créé.
Lorsque le MP3 s'est démocratisé, les ordinateurs étaient lents et convertir un CD était une opération qui prenait beaucoup de temps.
Le codec principal était celui de Fraunhofer, le créateur du format, utilisé dans Windows Media Player dans une version modifiée afin de rendre la conversion plus rapide mais de moins bonne qualité, mais surtout sans diminuer le bitrate.
Ce codec étant propriétaire et les seuls encodeurs proposant une meilleure qualié à taille équivalent étant payant, un groupe de développeurs a créé le codec open-source LAME, devenu rapidement beaucoup plus performant que le codec originel. Le seul défaut étant un encodage beaucoup plus lent.
Il est en général considéré que pour avoir une écoute acceptable, il faut prendre, à minima un bitrate de 128 car c'était que Fraunhofer conseillait avec son codec.
Voici l'équivalence si l'on utilise les deux autres solutions en encodant avec un bitrate de 128 :
- Windows Media Player : qualité équivalente à Fraunhofer avec un bitrate de 96.
- LAME: qualité équivalente à Fraunhofer avec un bitrate de 160.
Ce que cela veut dire, c'est que lorsque l'on recherche un album, surtout des années 80/90/2000, et qu'on le trouve dans plusieurs exemplaires, réalisés par différentes personnes, il peut être intéressant d'analyser chaque version car avec le même album, prenant exactement la même taille, vous pouvez être confronté à des qualités totalement différentes uniquement de par l'encodeur utilisé.
Un autre problème est que pour ces disques là, la plupart des audiophiles préférant payer un logiciel que faire appel à des solutions open-source, ce sont principalement des encodages réalisés avec Fraunhofer que l'on retrouve.
Mais en plus de ça, il faut voir aussi quelle version a été utilisé...
Le LAME de 2005 n'est plus du tout celui de 2026. C'est la raison pour laquelle réapparaissent parfois d'anciens albums, mais encodés avec des encodeurs de meilleure qualité.
La taille ne change pas, mais la qualité est meilleure.
FLAC
Contrairement au MP3, le format FLAC est un format libre et open source. Il n'y a donc pas pas besoin de plusieurs codecs : il n'y en a qu'un qui évolue.
Il gère parfaitement les tags sans se soucier de plusieurs versions.
L'encodage se fait très simplement en indiquant la quantité de compression, un peu comme on le fait pour une compression en Zip.
Comme pour le MP3, le FLAC évolue et il est normal de trouver de nouvelles versions dès qu'une nouvelle version de l'encodeur sort.
La qualité ne change pas, mais la taille diminue.
Ce que cela veut dire, c'est que si vous voyez deux fois le même morceau, ayant la même durée, mais avec une taille différente, voire complètement différente, ce ne sera pas celle prenant le plus de place qui aura la meilleure qualité.
Logiciels utilisés
Afin de normaliser les choses, je passe par plusieurs logiciels :
- MusicBrainz Picard : Ce logiciel permet de relier son album ou ses pistes à quelque chose de déjà existant afin d'obtenir plus d'informations que ce que l'on. Il permet également, si l'on créé un compte MusicBrainz, de proposer de nouvelles choses si elles n'existent pas encore.
- MP3Tag : Permet de modifier tous les tags d'un audio (pas seulement MP3), via des scripts très poussés. Utile pour envoyer une nouvelle proposition à MusicBrainz.
- FooBar2000 :Ce logiciel utilise une nouvelle méthode de calcul du ReplayGain, beaucoup (beaucoup (beaucoup)) plus rapide et précise, que cela soit par piste ou par album
- Spek : Analyse un fichier afin d'en fournir le spectre, permettant de s'assurer de la qualité réelle de la piste.
Workflow
Vérifier les audios
Même si vous encodez vous-même vos CDs, vous n'êtes pas à l'abri d'une version pirate basée sur des MP3s de mauvaise qualité.
Afin de le savoir rapidement sans devoir écouter la piste, il existe le logiciel Spek.
En très très gros,