MP3 : techniques de compression
Le MP3 (Mpeg 2 layer 3) est un format audio qui utilise une compression destructive, c'est à dire qu'il utilise les propriétés de l'oreille humaine pour supprimer certaines parties du son quasi inaudibles. Ainsi, il peut réduire la quantité de données d'un son d'un facteur allant jusqu'à 10 fois avec une perte de qualité très faible.
Le succès de ce format vient du fait que grâce à lui, il est possible de transmettre des morceaux entiers via internet en un temps raisonnable. (Imaginez un morceau en Wav de 50 Mo : vous mettriez environ 2 heures à le télécharger !)
La compression destructive utilisée pour la création de MP3 utilise
les défauts de l'oreille humaine pour supprimer des informations et ainsi
réduire la quantité d'informations du fichier. On peut citer les
techniques suivantes :
La technique de masquage
Le seuil à partir duquel l'oreille humaine perçoit un son dépend énormément
de la fréquence. En effet, nous percevons beaucoup plus facilement un son faible
à 4 kHz qu'à 50 Hz ou 15 kHz. De plus, à partir de 25 kHz, quel que soit le
niveau sonore, l'oreille humaine ne perçoit plus aucun son. Le MP3 tout comme
les Mini-Disc et le Dolby, utilise donc la technique de masquage : si deux sons
de fréquences proches sont joués avec une intensité très
différente, on pourra supprimer le son le plus faible qui sera de toute
façon masqué et ignoré par l'oreille humaine.
A propos du masquage de fréquences, vous pouvez lire le dossier sur la synthèse sonore, rubrique "Dolby" pour mieux comprendre
le système identique à celui que constitue le codage du MP3.
Le Joint Stereo
Un autre aspect de l'oreille humaine est son incapacité à localiser
spacialement les basses fréquences, contrairement aux fréquences
hautes. Ainsi, pourquoi coder en stéréo les basses ? C'est ce
principe qui est utlisé avec le Joint Stereo : le spectre est coupé
en hautes et basses fréquences, les hautes fréquences sont codées
en stéréo, et les basses en mono... Et on n'entend pas la différence
la plupart du temps (sauf bien sûr si la basse est stéréophonique,
par exemple un Juno 106 avec Chorus).
L'algorithme de Huffman
Il consiste à rechercher, une fois le son encodé, des occurences
identiques (minuscules samples comme une période de sinusoïde par
exemple). C'est rarement le cas dans un morceau complexe, mais cela peut l'être
dans une partie éthérée d'un morceau. A ce moment là,
chaque occurence est codée et au lieu d'enregistrer n fois la même
occurence on indiquera simplement un code de quelques bits y faisant référence.