« Gestion audiothèque » : différence entre les versions

De Vanlindt Marc
Aller à la navigation Aller à la recherche
Ligne 51 : Ligne 51 :


==== Raisons de l'utilisation du AAC et maintenant de l'OPUS ====
==== Raisons de l'utilisation du AAC et maintenant de l'OPUS ====
Ces deux formats ont un énorme avantage sur le '''MP3''' : la qualité est meilleure à faible bitrate et ces formats étant gapless (contrairement au '''MP3''' de '''Fraunhofer'''), les serveurs peuvent créer plusieurs versions de l'audio, à différents bitrate, et dès que le serveur remarque une baisse de vitesse chez le client, il lui envoie une version en moins bonne qualité sans qu'il n'y ait de coupure.
La raison est le streaming.


Ces formats ne sont donc pas réellement "plus adaptés" au streaming que le '''MP3''' ou le '''FLAC''', c'est juste que, s'il faut streamer, ce sont ces formats qui fourniront la meilleure qualité à faible débit et donc ceux utilisés par les serveurs de streaming.
Lorsque je stream ma musique depuis mon seveur ('''Jellyfin'''), je peux le faire de deux manières :
 
# Je lis directement le média : mais cela peut prendre beaucoup de bande passante si on lit des '''FLAC''' et est donc intéressant lorsque connecté à un wifi.
# Je convertis le média sur le serveur pendant la lecture : cela permet d'obtenir une version plus légère, par exemple en cas de trajets.
 
La conversion se fait en '''AAC''' (et bientôt en '''OPUS''') car ces formats ont un gros avantage sur le '''MP3''', que ce soit celui de '''Fraunhofer''' ou de '''LAME''' : ils sont de bien meilleure qualité à faible et très faible bitrate.
 
Ce que fait un serveur musical lorsque l'on demande la conversion, c'est diviser la musique que vous écoutez et allez écouter en blocs de x secondes, chacun convertis en plusieurs bitrate et effacés après lecture.
 
Le serveur analyse la vitesse de votre connexion et enverra la qualité la plus à même de ne pas faire sauter le morceau si vous avez une perte de connexion ou une connexion très lente.
 
Ainsi, si sur la route la connexion est catastrophique, la musique sera de moins bonne qualité mais ne s'arrêtera pas.
----
----


Ligne 195 : Ligne 206 :
Il n'est pas rare de tomber sur des '''FLAC''' mal enregistrés, ce qui peut se voir grâce à une analyse spectrographique. Cela faisant qu'à choisir entre un '''FLAC''' mal enregistré et un '''MP3''' 320, il vaut mieux choisir le '''MP3'''.
Il n'est pas rare de tomber sur des '''FLAC''' mal enregistrés, ce qui peut se voir grâce à une analyse spectrographique. Cela faisant qu'à choisir entre un '''FLAC''' mal enregistré et un '''MP3''' 320, il vaut mieux choisir le '''MP3'''.


Je vais partir d'un '''FLAC''' que j'ai en '''24bits''' puisque j'ai l'original de l'album '''So''' de '''Peter Gabriel'''. Il pèse 136,806 Mo pour une durée de 6 minutes 34.
Je vais partir d'un '''FLAC''' que j'ai en '''24bits''' puisque j'ai l'original de l'album '''So''' de '''Peter Gabriel'''. '''Don't give up''' pèse 136,806 Mo pour une durée de 6 minutes 34.


Voici le spectrogramme du '''FLAC''' en '''24bits ''':  
Voici le spectrogramme du '''FLAC''' en '''24bits ''':  
Ligne 217 : Ligne 228 :
== La dynamique ==
== La dynamique ==
Il s'agit de l'écart en décibels entre les sons les plus bas et ceux les plus forts. Plus cet écart est grand, plus la dynamique est grande.
Il s'agit de l'écart en décibels entre les sons les plus bas et ceux les plus forts. Plus cet écart est grand, plus la dynamique est grande.
On peut réduire la dynamique sans diminuer la qualité (dans une certaine mesure) de l'audio.
Mais ce qu'apporte la dynamique est une "qualité d'écoute", indépendante de la qualité même de l'audio.


=== La "Guerre du Volume" (The Loudness War) ===
=== La "Guerre du Volume" (The Loudness War) ===
Ligne 222 : Ligne 237 :


Pour résumer, des années 1980 à 2000, l'industrie de disques, les stations de radios et de télévision... ont eu tendance à réduire la dynamique d'une musique afin d'augmenter son volume et le "normaliser", jusqu'à ce qu'on mette le hola en imposant un volume maximal et, donc, une limite à la compression de la dynamique.
Pour résumer, des années 1980 à 2000, l'industrie de disques, les stations de radios et de télévision... ont eu tendance à réduire la dynamique d'une musique afin d'augmenter son volume et le "normaliser", jusqu'à ce qu'on mette le hola en imposant un volume maximal et, donc, une limite à la compression de la dynamique.
Cela évitait à l'auditeur de passer son temps à changer de volume entre les morceaux ou quand le présentateur parlait.


Les principales raisons sont :  
Les principales raisons sont :  
Ligne 233 : Ligne 246 :
# L'informatique propose des méthodes pour le faire
# L'informatique propose des méthodes pour le faire


Contrairement à ce que l'on pourrait croire, les nouvelles ré-éditions d'anciens albums ne sont pas de meilleure qualité, c'est la dynamique qui a été diminuée afin de fournir une meilleure sensation de volume.
Contrairement à ce que l'on pourrait croire, les nouvelles ré-éditions d'anciens albums ne sont pas forcément de meilleure qualité, c'est la dynamique qui a été diminuée afin de fournir une meilleure sensation de volume.


Voici l'évolution, au cours des quatre éditions CD effectuées, du morceau '''Something''' des '''Beatles''' :
Voici l'analyse de l'évolution du morceau '''Something''' des '''Beatles''', réalisée par des audiophiles, au cours des quatre éditions CD effectuées pendant cette période :
{|
{|
![[Fichier:1983.png|gauche]]
![[Fichier:1983.png|gauche]]
Ligne 242 : Ligne 255 :
![[Fichier:2000.png|gauche|330x330px]]
![[Fichier:2000.png|gauche|330x330px]]
|}
|}
Ce dont il faut se rendre compte, c'est que la version de 1983 est la meilleure car même si à plus bas volume, c'est celle qui a la plus grande dynamique car pensée par le studio l'ayant produit. Les versions suivantes sont créées car imposées par le modèle économique.
C'est une de raisons pour laquelle '''ReplayGain''' s'est imposé : il créé un ensemble de tags permettant aux lecteurs d'automatiquement adapter le volume sans toucher à la dynamique, permettant une normalisation de tous les volumes.
De plus, lors de l'analyse, il est mesure de signaler s'il y a distortion due à la compression de la dynamique.
Ce problème de dynamique est également une des raisons pour lesquelles il faut, idéalement, éviter les compilations : c'est tout un tas de morceaux n'ayant rien à voir les uns avec les autres mais auxquels on aura appliqué le même traitement afin qu'ils aient un volume équivalent, au détriment de leur dynamique.
Ce problème de dynamique est également une des raisons pour lesquelles il faut, idéalement, éviter les compilations : c'est tout un tas de morceaux n'ayant rien à voir les uns avec les autres mais auxquels on aura appliqué le même traitement afin qu'ils aient un volume équivalent, au détriment de leur dynamique.


Le pire seront les compilations de musique classique mélangeant plusieurs compositeurs, chaque oeuvre ayant en principe besoin d'une grande dynamique à elle seule.
Le pire seront les compilations de musique classique mélangeant plusieurs compositeurs, chaque oeuvre ayant en principe besoin d'une grande dynamique à elle seule.


Par exemple, sur "'''Je n'aime pas le classique'''", si on prend le '''Carmina''' '''Burana''' ou un extrait du '''Requiem''' de '''Mozart''', ils ont tous les deux une dynamique de 7, ce qui est très bas. Si je les prends séparémment, chaque morceau sur l'album du compositeur, ils ont tous les deux une dynamique de 12, ce qui est beaucoup mieux.  
Par exemple, sur "'''Je n'aime pas le classique'''", si on prend le '''Carmina''' '''Burana''' ou un extrait du '''Requiem''' de '''Mozart''', ils ont tous les deux une dynamique de 7, ce qui est très bas. Si je les prends séparémment, chaque morceau sur l'album du compositeur, ils ont tous les deux une dynamique de 12, ce qui est beaucoup mieux.


C'est la dynamique qui rend des labels comme '''Deutsche Grammophon''' célèbres car ils cherchent à proposer la meilleure qualité possible, sans jouer sur la dynamique, quitte à diviser une oeuvre pouvant tenir sur un seul CD en plusieurs si les différentes parties de l'oeuvre méritent un mastering différent.
C'est la dynamique qui rend des labels comme '''Deutsche Grammophon''' célèbres car ils cherchent à proposer la meilleure qualité possible, sans jouer sur la dynamique, quitte à diviser une oeuvre pouvant tenir sur un seul CD en plusieurs si les différentes parties de l'oeuvre méritent un mastering différent.
Ligne 265 : Ligne 272 :
Il existe plusieurs méthodes :  
Il existe plusieurs méthodes :  


# '''MP3Gain ''': Le problème de ce logiciel est qu'il ne fonctionne qu'avec les MP3, mais il indique s'il y a une distortion due à la réducation de la dynamique.  
# '''MP3Gain ''': Le problème de ce logiciel est qu'il ne fonctionne qu'avec les '''MP3''', mais il indique s'il y a une distortion due à la réducation de la dynamique.  
# '''Foobar + DR-Meter''' : Donne directement l'écart de manière chiffrée  
# '''Foobar + DR-Meter''' : Donne directement l'écart de manière chiffrée  
# '''Audacity''' : Si la piste prend trop de place ou que plusieurs pics atteignent le sommet, c'est qu'il y a compression dynamique.  
# '''Audacity''' : Si la piste prend trop de place ou que plusieurs pics atteignent le sommet, c'est qu'il y a compression dynamique.  
Par exemple, je vais prendre deux fois le même album : Abbey Road, une fois dans sa sortie 2012 et une fois dans sa sortie 2019. Chaque version est le '''FLAC''' directement tiré de l'album original.[[Fichier:Abbery Road 2012.png|centré|cadre|Version 2012]]
Comme l'exemple du dessus part de Something des Beatles, je vais prendre trois versions de l'album Abbey Road :
[[Fichier:Abbey Road 2019.png|centré|cadre|Version 2019]]
 
# Version CD de 1983
# Version CD de 1987
# Version CD de 2019 qui, suite à la "fin de la guerre du volume" a le meme mastering qu'en 2000.
 
Voici la plage dynamique de l'album :  
{| class="wikitable"
|+
!Nom de la piste
!1983
!1987
!2019
|-
|Come Together
|12
|9
|8
|-
|Something
|12
|9
|8
|-
|Maxwell's Silver Hammer
|13
|11
|10
|-
|Oh! Darling
|13
|10
|8
|-
|Octopus's Garden
|13
|11
|8
|-
|I Want You (She's So Heavy)
|12
|9
|7
|-
|Here Comes The Sun
|11
|9
|9
|-
|Because
|11
|10
|10
|-
|You Never Give Me Your Money
|11
|9
|11
|-
|Sun King
|11
|10
|10
|-
|Mean Mr. Mustard
|12
|10
|9
|-
|Polythene Pam
|11
|9
|8
|-
|She Came In Through The Bathroom Window
|11
|9
|8
|-
|Golden Slumbers
|12
|10
|9
|-
|Carry That Weight
|11
|9
|9
|-
|The End
|11
|9
|9
|-
|Her Majesty
|11
|11
|9
|}
Et comme pour le test réalisé plus haut, si on ouvre les trois versions du morceau Something dans Audacity :
[[Fichier:Audacity Something.png|centré|1000x1000px]]
Je suis également tombé sur un rip du vinyl sorti en 2012. La dynamique était exactement la même que la version CD de 1983.
 
==== Musique moderne ====
Certains albums modernes sont connus pour avoir un mastering catastrophique et une dynamique surcompressée.
 
C'est par exemple le cas de '''AC/DC''' avec son album '''Black Ice''' : la majorité a une dynamique de 5 et quelques morceaux ont 6. Et il n'y a pas d'autre version...
 
On voit le problème simplement en ouvrant les pistes dans Audacity. Voici les trois premières :
[[Fichier:Audacity Black Ice.png|centré|1000x1000px]]
 
 
'''Back in Black''' est également un bon exemple d'évolution exagérée de la dynamique :
{| class="wikitable"
|+
!Nom de la piste
!1980
!1994
!2003
|-
|Hells Bells
|13
|9
|8
|-
|Shoot To Thrill
|13
|9
|7
|-
|What Do You Do For Money Honey
|13
|9
|8
|-
|Givin The Dog A Bone
|14
|9
|8
|-
|Let Me Put My Love Into You
|13
|9
|7
|-
|Back In Black
|13
|9
|8
|-
|You Shook Me All Night Long
|13
|9
|8
|-
|Have A Drink On Me
|13
|9
|8
|-
|Shake A Leg
|13
|8
|7
|-
|Rock And Roll Ain't Noise Pollution
|14
|10
|8
|}
Evolution de Hells Bells :
[[Fichier:Audacity ACDC.png|centré|1000x1000px]]
 
=== Analyse visuelle ===
La simple analyse visuelle permet de "voir" l'effet qui a été appliqué sur le volume.
 
Si nous remonttons et analysons les différentes versions de Something des Beatles, nous pouvons voir :
 
=== Résoudre le problème des dynamiques différentes ===
Ces dynamiques différentes amènent à des variations de volume entre les morceaux.
 
Un logiciel a été créé, '''ReplayGain''', analysant l'audio et créant alors différents tags permettant aux logiciels la normalisation du volume. Maintenant tous les logiciels utilisent ces tags :
 
# '''Track Gain''' : Modificateur à appliquer pour avoir une piste normalisée
# '''Album Gain''' : Facultatif. Si présent et en mode lecture d'album (non shuffle), c'est ce modificateur qui sera appliqué (utile pour classique)
# '''Track Peak''' : Doit, en principe se situer entre 0 et 1. Si supérieur, c'est que le mastering a forcé et qu'il y a légère distortion pour cette piste.
# '''Album Peak''' : Idem mais pour tout l'album.
 
Les deux premiers tags sont utilisés par les logiciels, les deux seconds sont à titre informatif mais permettent de directement indiquer dans le logiciel la présence d'une distortion.
 
De nouveaux algorithmes se sont créés afin de calculer plus fidèlement ces valeurs.
 
Si nous reprenons '''AC/DC''' avec '''Back in Black''' :
{| class="wikitable"
|+
!Version
!Album Gain
!Album Peak
|-
|'''1980'''
| -1.81 dB
|0.941061
|-
|'''1994'''
| -8.34 dB
|1.073083
|-
|'''2003'''
| -9.71 dB
|1.093027
|}




Ligne 307 : Ligne 523 :
* '''TIT2''' = '''%TITLE%'''
* '''TIT2''' = '''%TITLE%'''
* '''TPE1''' = '''%ARTIST%'''
* '''TPE1''' = '''%ARTIST%'''
* '''TYER''' = '''%YEAR%''' - Un des problèmes de ce tag est que n'étant plus limité à 4 chiffres, beaucoup l'utilisent pour indiquer la...
* '''TYER''' = '''%YEAR%'''
* '''TDAT''' = '''%DATE%''' - date de sortie...
* '''TDAT''' = '''%DATE%''' - date de sortie...
* '''TCON''' = '''%GENRE%'''
* '''TCON''' = '''%GENRE%'''
Ligne 342 : Ligne 558 :


==== Quel format de tag choisir ? ====
==== Quel format de tag choisir ? ====
Pour les '''MP3''', le mieux est le '''ID3v2.3''' (et non 2.4 car le 2.3 était encore compatible avec les vieux lecteurs, mais le 2.4 pose problème, raison pour laquelle MP3Tag garde la 2.3 par défaut)  
Pour les '''MP3''', le mieux est le '''ID3v2.3''' (et non 2.4 car le 2.3 était encore compatible avec les vieux lecteurs, mais le 2.4 pose problème, raison pour laquelle '''MP3Tag''' garde la 2.3 par défaut)  
 
Attention, un '''MP3''' peut avoir plusieurs types de tags en même temps et cela peut être très problématique car il est compliqué pour un logiciel de mélanger les deux. 


== Logiciels utilisés ==
== Logiciels utilisés ==
Ligne 375 : Ligne 593 :


En très très gros,
En très très gros,
=== Calculer le BPM ===
Il existe plusieurs méthodes pour le calculer.
==== Automatique ====
Pour les tests, j'utile le morceau '''Heartbeat 67 bpm''' de '''Michael Rother''' puisqu'il a un BPM connu de très exactement 67bpm.
Si vous êtes DJ, en principe, votre logiciel devrait le faire de manière assez juste lorsque vous les intégrez à votre médiathèque.
Sinon, possibilités simples :
# '''MixMeister BPM Analyzer''' : Donne une très très bonne analyse, très proche de la réalité, de manière très rapide. Le problème est que c'est un logiciel ancien, tombé maintenant dans le domaine public et qu'il ne gère que le format '''MP3'''.  Il m'a donné un 133,87 BPM soit exactement le double, ce qui est courant dans ce genre de cas et raison pour laquelle la plupart des logiciels proposent de doubler ou diviser par 2 le BPM obtenu.
# '''Foobar + BPM Analyzer''' : Donne souvent de très mauvais résultats et doit être configuré. Mais il permet une analyse de tous les formats. Il m'a donné un 89 BPM...Je ne comprends pas comment cette extension peut être fournie avec une configuration par défaut pareille...
En configurant Foobar de la manière suivante, j'obtiens un bon '''67,16 BPM''' mais le calcul est nettement plus lent et après tests sur d'autres '''MP3''', cette configuration donne de meilleurs résultats
[[Fichier:Foobar BPM Analyzer.png|centré]]
Et possibilité plus complexe :
* Mixxx : Il s'agit d'un excellent logiciel open-source pour DJ, compatible avec une grande majorité

Version du 17 mars 2026 à 17:02

Il existe deux formats dans lesquels nous retrouvons, en général, la musique :

  1. MP3 : le format le plus courant, destructif mais compatible avec tout.
  2. FLAC : le format des audiophiles, sans destruction, diminuant la taille sans diminuer la qualité.

Cela n'est pas sans raison. Nous allons voir différentes choses importantes pour savoir comment gérer au mieux son audiothèque.

Types de format

Formats destructifs

Ce que fait un format destructif est supprimer tous les sons considérés comme innaudibles, le bitrate indiquant où s'effectue la "coupure"

On peut parfois retrouver d'autres formats, comme le Vorbis (OGG), le OPUS ou le AAC (MP4/M4A).

Ces formats, bien que destructifs comme le MP3 sont parfois de bien meilleure qualité, l'OPUS allant jusqu'à proposer des fichiers trois fois plus petits que le MP3 mais avec une qualité proche du FLAC.

Le problème est que ces formats ne se sont pas imposés et que le MP3 est le seul à pouvoir être lu sur tous les appareils prévus pour lire de la musique, même les plus anciens car, étant rétrocompatible, même un ancien lecteur MP3 d'une voiture d'il y a 20 ans restituera la bonne qualité d'un MP3 récent.

Ce problème vient en partie d'une chose : le fait que le format soit propriétaire ou non.

Lorsque Fraunhofer a créé le MP3, il s'agissait d'un format propriétaire et il fallait payer une licence pour obtenir les outils pour lire et encoder en MP3.

Un groupe de développeur a alors créé son propre codec, LAME, toujours maintenu et offrant une bien meilleure qualité. Mais une très grosse entreprise ne peut pas utiliser un codec libre et open source car celui est fourni sans garantie. Donc on paye Fraunhofer.

C'est ce qu'a fait Microsoft pour son Windows Media Player. Il était possible d'encoder en WMA et en MP3. Une piste encodée en WMA donnait mieux qu'en MP3, mais c'est car Microsoft avait demandé une version modifiée à Fraunhofer afin de rendre ses outils un peu plus rapide au détriment de la qualité. Ils cherchaient ainsi à imposer leur format WMA via des partenariats qui n'ont pas duré longtemps.

Contrairement à LAME, le codec Fraunhofer n'a pas cherché à faire évoluer la qualité mais est passé au 5.1 et au Surround pour une utilisation vidéo, faisant que leur codec propriétaire était encore très utilisé.

Un autre groupe, xiph, a créé le codec Vorbis, totalement libre et open-source cherchant à offrir une alternative au MP3 en proposant, entres autres le 5.1. OGG n'est pas un format c'est un conteneur pouvant contenir plusieurs codecs. Donc si vous voyez un OGG, c'est peut-être un MP3 (mais c'est très rare)... Ce codec est encore très utilisé entre autres pour les pistes audios de films ou séries.

Nous pouvons donc avoir le même MP3, faisant exactement la même taille, au même bitrate, mais avec trois qualités différentes.

En gros, il est considéré que si l'on encode avec Windows Media Player avec un bitrate de 128, cela équivaut à un encodage Fraunhofer avec un bitrate de 96. Là où un encodage LAME 128 équivaut à un Fraunhofer 160.

Le AAC est également une création de Fraunhofer et est donc un format propriétaire vu comme l'évolution du MP3, utilisé par YouTube Music et Spotify ainsi que par Apple.

Bien que Fraunhofer annonce une amélioration de qualité par rapport au MP3, elle n'est vraie qu'avec le codec Fraunhofer du MP3. Pas avec LAME qui, à bitrate égal, offre une meilleure qualité.

Néanmoins, c'est devenu un standard utilisé également par Netflix, Disney et la majorité des plates formes de streaming videos. Celles-ci proposent toujours des systèmes beaucoup plus évolués, tel que le Dolby 5.1, le Dolby TrueHD ou encore le Dolby Atmos, mais pour ça, il faut un matériel que la très très grande majorité des gens n'a pas et si on ne l'a pas, ce sera du AAC stéréo.

Toujours est-il que si l'on a la possibilité d'encoder en MP3 avec LAME, cela vaut mieux que du AAC et, pour la vidéo, si l'on a la possibilité de passer par Vorbis, qui a aussi continué à évoluer, cela vaut mieux également.

L'un des avantages pésenté par Fraunhofer du ACC par rapport au MP3 est l'absence de gap, le petit blanc entre deux pistes. LAME a de son côté réglé ce problème et le MP3 est gapless, il n'y aucun gap lors de la lecture dans les lecteurs courants (WinAMP, Foobar, VLC...). Le Vorbis est également gapless par défaut.

L'OPUS est un cas à part car il n'a pas du tout été créé pour la musique ou la vidéo. Bien que sous licence libre, il est créé par un groupe de grosses entreprises voulant créer le meilleur codec pour la communication audio. Ils ont alors demandé à xiph...

C'est donc le codec utilisé par Facebook Messenger, Google Meet, What's App, Discord, Zoom...

Mais en voulant absolument améliorer la qualité à très bas débit, ils ont créé le meilleur codec audio pour la musique à haut débit, tout en diminuant drastiquement la taille des fichiers. Et en plus de ça, ce codec est déjà présent partout vu qu'utilisé par les logiciels cités plus haut. N'importe quel navigateur internet actuel peut lire un fichier OPUS. De plus, ne cherchant pas à limiter l'utilisation, ce format est capable de gérer toute configuration jusqu'à 255 enceintes

Depuis peu, YouTube Music passe par OPUS pour l'encodage de la musique.

Raisons de l'utilisation du AAC et maintenant de l'OPUS

La raison est le streaming.

Lorsque je stream ma musique depuis mon seveur (Jellyfin), je peux le faire de deux manières :

  1. Je lis directement le média : mais cela peut prendre beaucoup de bande passante si on lit des FLAC et est donc intéressant lorsque connecté à un wifi.
  2. Je convertis le média sur le serveur pendant la lecture : cela permet d'obtenir une version plus légère, par exemple en cas de trajets.

La conversion se fait en AAC (et bientôt en OPUS) car ces formats ont un gros avantage sur le MP3, que ce soit celui de Fraunhofer ou de LAME : ils sont de bien meilleure qualité à faible et très faible bitrate.

Ce que fait un serveur musical lorsque l'on demande la conversion, c'est diviser la musique que vous écoutez et allez écouter en blocs de x secondes, chacun convertis en plusieurs bitrate et effacés après lecture.

Le serveur analyse la vitesse de votre connexion et enverra la qualité la plus à même de ne pas faire sauter le morceau si vous avez une perte de connexion ou une connexion très lente.

Ainsi, si sur la route la connexion est catastrophique, la musique sera de moins bonne qualité mais ne s'arrêtera pas.


Formats non-destructifs

Le FLAC est un format ouvert créé par xiph, vu plus haut pour le Vorbis et le OPUS.

Il a également existé le format APE, dont le format de tag, compatible avec les MP3 est toujours utilisé, créé spécialement pour le logiciel Monkey's Audio, mais ce logiciel ne s'étant pas imposé, le format audio APE a totalement disparu.

FLAC est connu pour offrir une compression supérieure à celle du ZIP, pris en général comme référence pour la compression sans perte, tout en permettant une décompression plus rapide que le temps de la piste compressée, quel que soit le niveau de compession.

Avant cela, les audiophiles utilisaient soit des formats non destructifs comme le WAV ou le PCM, mais qui ne permettaient pas les tags, faisant que les lecteurs audios n'affichaient pas les informations, soit alors ils réalisaient un ISO, une copie conforme d'un CD, en un seul fichier, mais pris par les lecteurs comme un réel CD avec plusieurs pistes.

Ce format est toujours utilisé et maintenant que la plupart des gens ont un accès internet haut-débit, un site comme Qobuz propose une alternative à YouTube Music et Spotify en proposant une écoute en qualité FLAC ainsi que l'achat des albums en réelle qualité CD.

Apple a créé le format propriétaire ALAC, offrant la même chose sans aucun avantage mais utilisé pour les offres haute qualité de Apple...

Bien que le FLAC soit sans perte, lors de l'encodage, il vous sera demandé 16 ou 24bits.

16 ou 24bits ?

Il peut sembler logique que 24 offre une meilleure qualité que 16 mais ce n'est pas le cas.

La majorité des FLAC viennent de sources en 16bits car sont les seules existantes pour le grand public. Si vous encodez un CD en 16bit, à la lecture vous aurez très exactement la même qualité que si vous l'aviez encodé en 24bit.

Le 24bit n'est utilisé que dans les studios et il faut donc que le studio soit directement la source.

Il est possible de rencontrer du 24bit, par exemple lorsque Peter Gabriel, pour le 25ème anniversaire de son album "So", donnait un lien dans chaque CD afin de pouvoir télécharger la version studio FLAC 24bits.

Par contre, si vous avez l'intention de modifier le son, par exemple en étant DJ et en voulant l'utiliser en live dans un set, il faut passer en 24 bits.

Lors d'une manipulation, le nombre de bits correspond aux étapes d'interpolations utilisées lors de cette manipulation.

Passer de 16 à 24bit, ce n'est pas une un nombre d'interpolations multiplié légèrement de 50%, on passe de 216=65536 à 224=16777216, donc 256 fois plus de possibilités d'interpolations.

Le FLAC propose également, via certaines méthodes, l'utilisation du 32bit mais elle n'est pas proposée dans la plupart des logiciels car réellement inutile car on obtient des fichiers très volumineux et que la majorité du matériel travaille en 24bit. Passer de 16 à 32 bits, c'est passer de 216=65536 bits à 232=4294967296 faisant passer de 256 à 65536 possibilités d'interpolations. Donc, techniquement, c'est faisable, mais c'est inutile...


Formats particuliers

Il existe deux formats très particuliers :

  1. Le MIDI : qui avant d'être un format audio est un protocole de communication entre instruments éléctroniques permettant de dire quelle note doit être utilisée, avec quelle vélocité et avec quel instrument.
  2. Le Module : un format insérant des petits échantillons audio mais fortement modifiables afin de créer une musique. Principalement utilisé pour la techno et la dance dans les années 90.

MIDI

Le format MIDI n'est pas utilisable dans une audiothèque car ce format ne contient que des notes, des informations sur les notes (vélocité, longueur...) et un code indiquant à quel instrument ces notes sont attribuées.

Sur ordinateur, les cartes sonores font qu'une synthèse FM est attribuée à chaque instrument et il est donc possible de lire un MIDI avec des instruments simulés mais la qualité ne sera pas au rendez-vous.

Cette simplicité permet néanmoins à ce format d'être utilisé, entre autres, sur les "pianos automatiques", de vrais pianos qui, quand ils ne sont pas utilisés, permettent d'utiliser un MIDI pour jouer les notes automatiquement.

Mais elle permet aussi, dans un logiciel ou sur un synthétiseur, d'attribuer des SoundFont à un MIDI qui se chargera alors d'attribuer des échantillons sonores à chaque instrument.

La SoundFont (format de fichier SF2) est un ensemble de fichiers, en général de très haute qualité dans un format audio brut sans compression (WAV ou PCM), attribués aux différentes notes.

Une même note peut avoir plusieurs échantillons en fonction de la vélocité, ce qui est particulièrement utilisé pour les instruments claviers comme le piano, le clavecin, l'orgue...

Si vous devez transformer un MIDI en format audio, il faut donc voir quels instruments sont présents dans la composition.

Par exemple, pour une oeuvre au piano, il vaudra mieux choisir une SoundFont de 100Mo avec uniquement le piano présent, qu'une SoundFont plus connue, avec tous les instruments, de 600Mo.

Les SF2 sont très nombreux, il y a des passionnés qui passent leur temps à créer des SoundFont juste pour un piano qui, selon eux, rend bien.

Lors de la conversion en audio, il est également possible de créer une variable aléatoire modifiant la vélocité et le moment où la note est frappée afin de rendre le résultat plus "humain".

La SoundFont est à choisir en fonction du cas. Par exemple, si vous voulez avoir une copie haute qualité de la bande son de Doom, tel que dans vos souvenirs de joueurs sur une carte son Sound Blaster, il y a une SoundFont "Creative.sf2".

Transformer un MIDI en format audio n'est pas l'opération la plus simple qui soit.

Le plus simple est de passer par LMMS (Linux Multi Media Studio), disponible sur toutes les plates-formes, charger une SoundFont, facilement trouvables sur Google, et créer son audio.

LMMS propose un export en WAV, qu'il faudra alors retransformer en FLAC, par exemple avec Audacity ou Handbrake.

Attention : Les logiciels musicaux gérant le MIDI n'utilisent pas les échantillons de la SoundFont lorsque vous jouez votre morceau en cours d'édition. Ils utilisent des versions simplifiées et le résultat entendu ne sera donc pas le résultat final, qui doit être entièrement calculé. C'est le même principe que pour les images de synthèses proposant une prévisualisation simplifiée mais imposent un rendu très long pour obtenir le résultat final, de bonne qualité.

Modules

Les modules sont un type de fichier, né dans les années 90, cherchant à mélanger le MIDI avec ce qu'allaient proposer les SoundFont.

C'est un format créé par les Demo-Makers, des développeurs cherchant toujours à faire au mieux avec le moins de place et de ressources possible.

Il y a eu à l'époque un nombe incroyables de musiciens ayant utilisés les modules mais beaucoup ont arrêtés et ces modules sont les seuls formats qu'il reste.

Plusieurs formats se sont imposés et sont maintenant gérés par tous les logiciels : MOD, XM, S3M, IT...

Le logiciel de référence pour gérer ces formats et les transformer en audio est OpenMPT.

Celui-ci permet un export en WAV et en FLAC.

16, 24 ou 32bits ?

LMMS et OpentMPT vous proposeront chacun de pouvoir monter jusqu'à 32bits.

Comme vu plus haut, si ce n'est que pour de l'écoute : 16 bits. Sinon 24.


CBR et VBR

Avant tout, il faut savoir qu'un fichier MP3 est divisé en frames contenant chacune 1152 échantillons sonores. Cela correspond à une durée de ± 24ms si fréquence de 48Khz et ± 26ms si fréquence de 44.1Khz.

Il existe deux moyens de coder la musique dans un MP3 :

  1. Le CBR : pour "Constant BitRate" qui modifie l'ensemble de la piste
  2. Le VBR : pour "Variable BitRate" qui modifie chaque frame

Le CBR est très simple à calculer :

  • D=Durée en secondes
  • B=Bitrate en kbps
  • K=8 : pour passer de Kb en Ko
  • M=1024 : pour passer de Ko en Mo
  • T=Taille finale en Mo

Donc : T=D×BK×M

Donc : D=T×M×KB

Par exemple, si vous avez un morceau de 4 minutes 27, avec bitrate de 320 et une fréquence de 44.1Khz, sa taille sera de : D=267×B=320K=8×M=1024=T10,429Mo

Ce que feront les lecteurs audios est très simple :

  • a=Taille du fichier en Kb
  • b=Bitrate en Kbps indiqué au début du fichier
  • D=Durée en secondes

donnant alors : a=85440b=320=D=267, donc une piste de 267 secondes, soit 4 minutes 27.

Mais le problème avec le VBR est que chaque frame ayant son propre bitrate, en prenant le premier bitrate, ce ne sera que celui de la première frame. Si la première frame a un bitrate de, par exemple, 278, la durée suivante sera calculée : a=85440b=278=D=378 soit 6 minutes et 18 secondes.

Le VBR n'ayant pas été créé par Fraunhofer, bien que pouvant être implanté dans son format, tous les lecteurs utilisaient ce calcul de durée et affichaient une mauvaise durée.

Le VBR a été introduit par LAME, les grandes marques ne "pouvaient" pas donc pas le gérer puisque passaient par un accord financier avec Fraunhofer pour offrir la lecture du MP3. Cela jusqu'à ce que Fraunhofer introduise son propre sysème de VBR, différent de celui de LAME, mais personne n'allait changer son matériel : tout le monde a continué à encoder en CBR, ce qui continue encore maintenant alors qu'il n'y a plus aucune raison sauf si vous avez un autoradio d'il y a 20 ans.

Les nouvelles versions ont modifié la méthode de calcul afin de ne plus passer par le bitrate :

  • f=Nombre de frames
  • e=1152, soit le nombre d'échantillons par frame
  • q=Fréquence en Hz
  • D=Durée en secondes

Pour notre piste, nous avons donc : f=10222×e=1152q=44100=D=267,023267 soit 4 minutes 27 secondes...

Actuellement, un MP3 en VBR dans sa plus haute qualité est très largement supérieur à un MP3 CBR 320.

Le FLAC est d'office en VBR, mais les formats destructifs permettent tous le choix entre CBR et VBR, bien que pour ceux-ci le VBR soit toujours la norme par défaut puisque tous les lecteurs gèrent le calcul de la durée de ces formats.

Vérifier la qualité

Il n'est pas rare de tomber sur des FLAC mal enregistrés, ce qui peut se voir grâce à une analyse spectrographique. Cela faisant qu'à choisir entre un FLAC mal enregistré et un MP3 320, il vaut mieux choisir le MP3.

Je vais partir d'un FLAC que j'ai en 24bits puisque j'ai l'original de l'album So de Peter Gabriel. Don't give up pèse 136,806 Mo pour une durée de 6 minutes 34.

Voici le spectrogramme du FLAC en 24bits :

Je vais le convertir en 16 bits puisque tous les formats de ce comparatif sont 16 bits.

Le spectrogramme est le suivant, pour un fichier de 42,989 Mo :

Voici le spectrogamme du MP3 320, pour un résultat de 15,378 Mo :

Voici le spectrogamme du MP3 160, pour un résultat de 7,689 Mo :

Voici le spectrogramme du MP3 128, pour un résultat de 6,152 Mo :

Voici le spectrogramme d'un OPUS en qualité AUTO, pour un résultat de 5,861 Mo :

Voici le spectrograpmme d'un OPUS en qualité Max, pour un résultat de 24,769 Mo :

Voici le spectrogramme d'un OPUS en CBR 256, la meilleure qualité possible en CBR, pour un résultat de 12,453 Mo :

La dynamique

Il s'agit de l'écart en décibels entre les sons les plus bas et ceux les plus forts. Plus cet écart est grand, plus la dynamique est grande.

On peut réduire la dynamique sans diminuer la qualité (dans une certaine mesure) de l'audio.

Mais ce qu'apporte la dynamique est une "qualité d'écoute", indépendante de la qualité même de l'audio.

La "Guerre du Volume" (The Loudness War)

Je vous invite à lire l'article Wikipédia dédié à cette "guerre".

Pour résumer, des années 1980 à 2000, l'industrie de disques, les stations de radios et de télévision... ont eu tendance à réduire la dynamique d'une musique afin d'augmenter son volume et le "normaliser", jusqu'à ce qu'on mette le hola en imposant un volume maximal et, donc, une limite à la compression de la dynamique.

Les principales raisons sont :

  1. On ne peut dépasser les capacités du média
  2. Aucun artiste ne veut "sonner moins fort" que les autres
  3. De plus en plus de gens écoutent la musique pour couvrir le son ambiant ou sans réellement l'écouter
  4. Les appareils portables utilisés dans des environnements bruyants ne permettent pas d'apprécier une large dynamique
  5. L'informatique propose des méthodes pour le faire

Contrairement à ce que l'on pourrait croire, les nouvelles ré-éditions d'anciens albums ne sont pas forcément de meilleure qualité, c'est la dynamique qui a été diminuée afin de fournir une meilleure sensation de volume.

Voici l'analyse de l'évolution du morceau Something des Beatles, réalisée par des audiophiles, au cours des quatre éditions CD effectuées pendant cette période :

Ce problème de dynamique est également une des raisons pour lesquelles il faut, idéalement, éviter les compilations : c'est tout un tas de morceaux n'ayant rien à voir les uns avec les autres mais auxquels on aura appliqué le même traitement afin qu'ils aient un volume équivalent, au détriment de leur dynamique.

Le pire seront les compilations de musique classique mélangeant plusieurs compositeurs, chaque oeuvre ayant en principe besoin d'une grande dynamique à elle seule.

Par exemple, sur "Je n'aime pas le classique", si on prend le Carmina Burana ou un extrait du Requiem de Mozart, ils ont tous les deux une dynamique de 7, ce qui est très bas. Si je les prends séparémment, chaque morceau sur l'album du compositeur, ils ont tous les deux une dynamique de 12, ce qui est beaucoup mieux.

C'est la dynamique qui rend des labels comme Deutsche Grammophon célèbres car ils cherchent à proposer la meilleure qualité possible, sans jouer sur la dynamique, quitte à diviser une oeuvre pouvant tenir sur un seul CD en plusieurs si les différentes parties de l'oeuvre méritent un mastering différent.

Ce à quoi toute cette histoire de dynamique amène aussi est le fait qu'il y a un intérêt aux singles puisque, pour un morceau, même le plus "bête" des morceaux que l'on pourrait trouver sur n'importe quelle compil, le single aura toujours une meilleure dynamique que la version compil.

Les compils ne sont toujours que de bonnes playlists. Il vaut donc mieux, si vous voyez une bonne compil, en faire une bonne playlist à partir de bons enregistrements.

La dynamique est une des raisons qui fait que certains préféreront un vinyl, même usé, à un format numérique : la dynamique est beaucoup plus grande et reste, même à l'usure.

Vérifier la dynamique

Il existe plusieurs méthodes :

  1. MP3Gain : Le problème de ce logiciel est qu'il ne fonctionne qu'avec les MP3, mais il indique s'il y a une distortion due à la réducation de la dynamique.
  2. Foobar + DR-Meter : Donne directement l'écart de manière chiffrée
  3. Audacity : Si la piste prend trop de place ou que plusieurs pics atteignent le sommet, c'est qu'il y a compression dynamique.

Comme l'exemple du dessus part de Something des Beatles, je vais prendre trois versions de l'album Abbey Road :

  1. Version CD de 1983
  2. Version CD de 1987
  3. Version CD de 2019 qui, suite à la "fin de la guerre du volume" a le meme mastering qu'en 2000.

Voici la plage dynamique de l'album :

Nom de la piste 1983 1987 2019
Come Together 12 9 8
Something 12 9 8
Maxwell's Silver Hammer 13 11 10
Oh! Darling 13 10 8
Octopus's Garden 13 11 8
I Want You (She's So Heavy) 12 9 7
Here Comes The Sun 11 9 9
Because 11 10 10
You Never Give Me Your Money 11 9 11
Sun King 11 10 10
Mean Mr. Mustard 12 10 9
Polythene Pam 11 9 8
She Came In Through The Bathroom Window 11 9 8
Golden Slumbers 12 10 9
Carry That Weight 11 9 9
The End 11 9 9
Her Majesty 11 11 9

Et comme pour le test réalisé plus haut, si on ouvre les trois versions du morceau Something dans Audacity :

Je suis également tombé sur un rip du vinyl sorti en 2012. La dynamique était exactement la même que la version CD de 1983.

Musique moderne

Certains albums modernes sont connus pour avoir un mastering catastrophique et une dynamique surcompressée.

C'est par exemple le cas de AC/DC avec son album Black Ice : la majorité a une dynamique de 5 et quelques morceaux ont 6. Et il n'y a pas d'autre version...

On voit le problème simplement en ouvrant les pistes dans Audacity. Voici les trois premières :


Back in Black est également un bon exemple d'évolution exagérée de la dynamique :

Nom de la piste 1980 1994 2003
Hells Bells 13 9 8
Shoot To Thrill 13 9 7
What Do You Do For Money Honey 13 9 8
Givin The Dog A Bone 14 9 8
Let Me Put My Love Into You 13 9 7
Back In Black 13 9 8
You Shook Me All Night Long 13 9 8
Have A Drink On Me 13 9 8
Shake A Leg 13 8 7
Rock And Roll Ain't Noise Pollution 14 10 8

Evolution de Hells Bells :

Analyse visuelle

La simple analyse visuelle permet de "voir" l'effet qui a été appliqué sur le volume.

Si nous remonttons et analysons les différentes versions de Something des Beatles, nous pouvons voir :

Résoudre le problème des dynamiques différentes

Ces dynamiques différentes amènent à des variations de volume entre les morceaux.

Un logiciel a été créé, ReplayGain, analysant l'audio et créant alors différents tags permettant aux logiciels la normalisation du volume. Maintenant tous les logiciels utilisent ces tags :

  1. Track Gain : Modificateur à appliquer pour avoir une piste normalisée
  2. Album Gain : Facultatif. Si présent et en mode lecture d'album (non shuffle), c'est ce modificateur qui sera appliqué (utile pour classique)
  3. Track Peak : Doit, en principe se situer entre 0 et 1. Si supérieur, c'est que le mastering a forcé et qu'il y a légère distortion pour cette piste.
  4. Album Peak : Idem mais pour tout l'album.

Les deux premiers tags sont utilisés par les logiciels, les deux seconds sont à titre informatif mais permettent de directement indiquer dans le logiciel la présence d'une distortion.

De nouveaux algorithmes se sont créés afin de calculer plus fidèlement ces valeurs.

Si nous reprenons AC/DC avec Back in Black :

Version Album Gain Album Peak
1980 -1.81 dB 0.941061
1994 -8.34 dB 1.073083
2003 -9.71 dB 1.093027


Les tags

Une des choses qui a rendu le MP3 populaire est l'utilisation de tags.

Les tags sont des informations textuelles ou numériques, incluses à chaque fichier MP3. Celles-ci permettent au logiciel que vous utilisez de vous présenter vos fichiers en ne devant pas uniquement se baser sur le nom de fichier.

  • ALBUM : Nom de l'album
  • TITLE : Titre de la piste
  • ARTIST : Artiste de la piste
  • COMMENT : Commentaires sur la piste
  • YEAR : Année de parution
  • GENRE : Genre musical.

Ceux-ci ne sont pas une création officielle mais une sorte de "hack" créé par Eric Kemp qui voulait voir ces données affichées et qui a remarqué qu'il était possible de modifier les MP3 pour les y intégrer.


Les formats de tags

ID3

Kemp a établi ces tags de base sous le format ID3.

Dans sa première version, le nombre de caractères était limité pour chaque zone et il n'était pas possible d'utiliser des caractères spéciaux ou accentués.

Il y a eu une version ID3v1.1, mais celle-ci n'a apporté que la possibilité d'indiquer un numéro de piste car la majorité des lecteurs lisaient les fichiers dans l'ordre alphabétique.

La vraie évolution a été la création du ID3v2, toujours utilisé aujourd'hui dans sa version ID3v2.3, qui permet des tags à longueur variable, étend le nombre de tags par défaut de manière inimaginable, absurdre et pensée avec les pieds et permet d'insérer tout type de données, y compris des images ou des paroles synchronisées.

Mais attention, les choses sont beaucoup plus compliquées que ça...

Le problème ID3

En fait, les tags ALBUM, ARTIST, YEAR, etc... ne sont pas des tags, ce sont des noms attribués aux réels tags qui sont des codes de quatre caractères.

Tous les logiciels se sont plus ou moins accordés pour donner le même nom aux différents tags, donc :

  • TALB = %ALBUM%
  • TIT2 = %TITLE%
  • TPE1 = %ARTIST%
  • TYER = %YEAR%
  • TDAT = %DATE% - date de sortie...
  • TCON = %GENRE%
  • COMM = %COMMENT%
  • TBPM = %BPM%
  • USLT = %LYRICS% ou %UNSYNCEDLYRICS%

Lorsqu'un nouveau tag, par exemple %GENRE2%, est créé dans MP3tag, ce qui est réellement créé dans le MP3 est :

  • TXXX:Tag=Valeur

Donc, en réalité, nous nous retrouvons avers plusieurs entrées TXXX, ayant chacune une description qui devient le tag et une valeur qui devient la valeur de ce tag.

Mais un problème est que Kemp a créé énormément de tags, donnant parfois peu de libertés pour sortir du modèle imposé.

Par exemple, si le titre de la piste est TIT2 et non TIT1, c'est car Kemp avait prévu les choses comme ça (exemple) pour une piste :

  • TALB : Le meilleur de Beethoven
  • TIT1 : Symphonie n°9
  • TIT2 : Presto
  • TIT3 : Mouvement 2

J'imagine que son format de date préféré est année/jour/mois...

APE

Ce système de tag vient d'un format de fichier, propre à un lecteur audio, Monkey's Ape, qui permettait d'obtenir une copie de ses CDs, au format APE, qui était non destructif, comme le FLAC.

Celui-ci se base sur le principe créé par xiph pour le OGG et le FLAC, puis l'OPUS : le Vorbis Comment.

C'est simple : il n'y a plus de code et le nom de la variable est la variable.

Il est considéré comme plus intéressant et évolué que le ID3, mais vu que la plupart des audiophiles sont également passés à d'autres formats, comme le FLAC, il n'est pas le plus utilisé et le plus suivi par les différents logiciels et, surtout, n'est pas du tout compatible avec les anciens lecteurs et même Windows.

Néanmoins, le simple fait que ce soit un "meilleur système" fait qu'il est parfois conseillé alors que ne constitue pas du tout un standard.

Quel format de tag choisir ?

Pour les MP3, le mieux est le ID3v2.3 (et non 2.4 car le 2.3 était encore compatible avec les vieux lecteurs, mais le 2.4 pose problème, raison pour laquelle MP3Tag garde la 2.3 par défaut)

Attention, un MP3 peut avoir plusieurs types de tags en même temps et cela peut être très problématique car il est compliqué pour un logiciel de mélanger les deux.

Logiciels utilisés

Afin de normaliser les choses, je passe par plusieurs logiciels :

  1. MusicBrainz Picard : Ce logiciel permet de relier son album ou ses pistes à quelque chose de déjà existant afin d'obtenir plus d'informations que ce que l'on. Il permet également, si l'on créé un compte MusicBrainz, de proposer de nouvelles choses si elles n'existent pas encore.
  2. MP3Tag : Permet de modifier tous les tags d'un audio (pas seulement MP3), via des scripts très poussés. Utile pour envoyer une nouvelle proposition à MusicBrainz.
  3. FooBar2000 :Ce logiciel utilise une nouvelle méthode de calcul du ReplayGain, beaucoup (beaucoup (beaucoup)) plus rapide et précise, que cela soit par piste ou par album
  4. Spek : Analyse un fichier afin d'en fournir le spectre, permettant de s'assurer de la qualité réelle de la piste.

Problème de téléchargement

Sites de streaming audio

Plusieurs sites, comme YouTube Music et Spotify proposent des albums complets.

Plusieurs logiciels permettent de les télécharger, mais ces albums peuvent poser plusieurs problèmes, voici une liste de problème que j'ai rencontré alors que je n'en ai pas téléchargé beaucoup... :

  • Les pistes ne sont pas les bonnes : Il arrive qu'un album ait une version longue sur l'album mais que ce soit la version radio courte que l'on retrouve.
  • Albums incomplets : Ces platesformes doivent obtenir les droits pour diffuser, et il arrive qu'ils ne les aient pas. Mais parfois juste sur une piste et non un album entier. Donc l'album apparaîtra comme complet, avec une nouvelle numérotation, mais avec une piste manquante.
  • Qualité : bien que l'on puisse charger en MP3 320 et que maintenant YouTube Music passe par OPUS, l'utilisation du AAC 256 fait que quoi qu'il arrive, il y a une double compression. De plus, certains albums sont de simples vidéos YouTube mais dont on ne voit pas la vidéo et dont la qualité audio est encore moins bonne.
  • Album complet composé de plusieurs sources : Le problème que cela amène est qu'une fois chargées, ces pistes n'ont pas le même gain, des dynamiques différentes et qu'il peut y avoir des écarts de volumes entre certaines pistes.
  • Album mal composé : L'album est complet, il y a toutes les pistes, sauf une qui n'est pas la bonne. Immaginons un chanteur qui aura chanté "Je l'aime à mourir" sur un album et "Je l'aime à la folie" sur un autre, les deux seront intervertis.

Origine

Même si on transforme en FLAC,

Workflow

Vérifier les audios

Même si vous encodez vous-même vos CDs, vous n'êtes pas à l'abri d'une version pirate basée sur des MP3s de mauvaise qualité.

Afin de le savoir rapidement sans devoir écouter la piste, il existe le logiciel Spek.

En très très gros,

Calculer le BPM

Il existe plusieurs méthodes pour le calculer.

Automatique

Pour les tests, j'utile le morceau Heartbeat 67 bpm de Michael Rother puisqu'il a un BPM connu de très exactement 67bpm.

Si vous êtes DJ, en principe, votre logiciel devrait le faire de manière assez juste lorsque vous les intégrez à votre médiathèque.

Sinon, possibilités simples :

  1. MixMeister BPM Analyzer : Donne une très très bonne analyse, très proche de la réalité, de manière très rapide. Le problème est que c'est un logiciel ancien, tombé maintenant dans le domaine public et qu'il ne gère que le format MP3. Il m'a donné un 133,87 BPM soit exactement le double, ce qui est courant dans ce genre de cas et raison pour laquelle la plupart des logiciels proposent de doubler ou diviser par 2 le BPM obtenu.
  2. Foobar + BPM Analyzer : Donne souvent de très mauvais résultats et doit être configuré. Mais il permet une analyse de tous les formats. Il m'a donné un 89 BPM...Je ne comprends pas comment cette extension peut être fournie avec une configuration par défaut pareille...

En configurant Foobar de la manière suivante, j'obtiens un bon 67,16 BPM mais le calcul est nettement plus lent et après tests sur d'autres MP3, cette configuration donne de meilleurs résultats

Et possibilité plus complexe :

  • Mixxx : Il s'agit d'un excellent logiciel open-source pour DJ, compatible avec une grande majorité