Tests réalisés en compressant à 64Kbps en moyenne une musique sonore.
Rappel : formats audio candidats MPEG-4 :
- WMA microsoft windows media audio
- MP3pro thomson mp3 professional
- VQF ntt vector quantization filter
- AAC fraunhofer advanced audio coding
- OGG xiph.org ogg vorbis
Tests : compression effectuées :
- MP3 "classique" via codec Faunhofer pro,
mode CBR 64Kbps haute qualité
- MP3pro via codec Thomson, mode CBR 64Kbps
- MP3pro via codec Thomson, mode VBR qualité 30
- AAC via codec PsyTEL, mode CBR 64Kbps haute qualité
- AAC via codec PsyTEL, mode VBR qualité 10
- OGG via codec de Xiph.org, mode VBR qualité 0.0 (équivalent
64Kbps)
- WMA via codec wma9 de Microsoft (version redist!),
mode CBR 64Kbps
- WMA via codec wma9 de Microsoft (version redist!),
mode VBR qualité 10
- VQF : ignoré : ce format n'autorise pas de compression à 64Kbps
issue de wave qualité cd...
L'ensemble de ces compressions audios ont abouti à des fichiers dont
la taille est comprise entre 2,36Mo et 2,81Mo. Sachant que la musique originale
fait 57,8Mo, le taux de compression moyen est de 1:23 !
Attention !
- Le codec MP3 utilisé est l'officiel Fraunhofer professionnel, or actuellement
le codec le plus utilisé est LAME
3.xx, qui est beaucoup plus paramétrable! Les résultats de compression
audio à bitrate équivalent sont totalmenent différent selon
que l'on choisisse Fraunhofer ou LAME!
- Le codec WMA utilisé est la version redistribué, c'est-à-dire
fourni avec tout logiciels de lecture et compression audio. Microsoft propose
un logiciel de compression WM (audio et video) qui dispose d'un codec compresseur
WMA bien plus performant que la version redistribuable. Je rajouterai d'ici
peu un test avec ce codec plus performant.
Note :
- "Hautes fréquences" correspond à la bande situé
entre 5000Hz et 14000Hz
- "Basses fréquences" correspond à la bande situé
entre 20Hz et 5000Hz
(note : les images ci-dessous ont été compressé en Jpeg haute qualité. La taille moyenne est de 140Ko par image, aussi elles ne s'afficheront pas instantanément. Le Jpeg étant un format de compression avec pertes de données, les images sont également disponible en version PNG 24bits ici)
Spectre de la musique originale :
Nous pouvons distinguer les deux voies, de bas en haut la fréquence (de 0 à 22050 hz) pour chacune des voies, et de gauche à droite la durée / position de lecture du son (5 minutes 44 secondes)
MP3 iso/iec
Spectre résultant de la compression via codec Faunhofer pro, mode CBR
64Kbps haute qualité :
Coupure de la fréquence à 16000Hz, le reste du spectre correspond peu à l'originale, surtout les basses fréquences.
MP3pro
Spectre résultant de la compression via codec Thomson, mode CBR 64Kbps :
Coupure des fréquences au-delà de 16000Hz. Les fréquences aigue puissantes sont bien respecté, les signaux faibles ne correspondent pas à l'original. Les basses fréquences ne sont pas respecté, sauf en l'absence d'aigues (après 5:20).
Spectre résultant de la compression via codec Thomson, mode VBR qualité 30 :
Coupure des fréquences au-delà de 16000Hz. Une net atténuation du signal est visible entre 8000Hz et 10000Hz. Sinon, les hautes fréquences sont très proche de l'original, même dans les zones faible. Les basses fréquences ne correspondent pas à l'original.
Magré l'atténuation visible entre 8KHz et 10KHz du mode VBR, le mode VBR du MP3pro copie au mieux le spectre original.
AAC
Spectre résultant de la compression via codec PsyTEL, mode CBR 64Kbps haute qualité :
Coupure des fréquences au-delà de 16000Hz. Les signaux trop faible sont ignoré. Le spectre correspond globalement à l'original, avec toutefois des petites différences dans les fréquences basses et aigues.
Spectre résultant de la compression via codec PsyTEL, mode VBR qualité 10 :
Coupure des fréquences au-delà de 13000Hz. Le reste du spectre correspond globalement à l'original. Il est legèrement plus semblable qu'en mode CBR.
Dommage que le mode VBR impose le filtre de fréquence à 13KHz, car ce mode semble mieux respecté les fréquences aigues que le mode CBR.
OGG
Spectre résultant de la compression via codec de Xiph.org, mode VBR qualité 0.0 (équivalent 64Kbps) :
Coupure des fréquences à 15000Hz. Le reste du spectre correspond de beaucoup à l'original. On note juste quelques faibles différences dans les fréquences basses, et les fréquences hautes sont un peu plus marquées.
WMA
Spectre résultant de la compression via codec wma9 de Microsoft, mode CBR 64Kbps :
Coupure des fréquences au-delà de 13000Hz. Le reste du spectre correspond de beaucoup au signal original, avec des différences occasionnel dans les fréquences basses. Néanmoins il y a des différences remarquables dans les fréquences hautes lorsque le signal est faible.
Spectre résultant de la compression via codec wma9 de Microsoft, mode VBR qualité 10 :
Coupure des fréquences au-delà de 13000Hz. Le spectre correspond de beaucoup à l'original. Quelques différences occasionnel dans les basses et dans les aigues.
Les modes VBR et CBR sont à peu près équivalent, avec une préférence pour le VBR qui respecte mieux les signaux faibles.
En conclusion, en classant dans l'ordre du codec conservant au mieux l'image du spectre, on obtient :
1) OGG , montant le plus haut en fréquences (16KHz), excellent respect
des hautes fréquences et recopie correctement les basses.
2) AAC CBR, les fréquences basses sont bien copié, de grosses
différences occasionnelles dans les fréquences hautes. Garde jusqu'a
16KHz le spectre original. Coupe les signaux faibles.
2) MP3pro VBR, coupe à 16KHz, garde très bien les hautes fréquences
sauf dans une zone préçise. De grosses différences dans
les basses fréquences.
3) WMA VBR, malgré la coupure à 13KHz, le reste est bien respecté.
4) AAC VBR, coupure à 13KHz, le reste est correctement respecté.
5) WMA CBR, coupe à 13KHz, quelques différences dans les signaux
aigues faible.
6) MP3 CBR, coupe à 16KHz, grosses différences dans les fréquences
basses, des différences sensible par moment dans les fréquences
aigues
7) MP3pro CBR, coupe à 16KHz. Grosses différences dans les fréquences
basses, vraiment beaucoup de différences notable dans les aigues, surtout
lorsque le signal est complexe.
Attention, il s'agit là d'un classement par rapport au spectre. Celui-ci classe dans des bonnes positions les compression coupant le signal à 13KHz, alors qu'une telle coupure est réellement audible par beaucoup d'oreilles. Avant de fixer votre choix, lisez le test de restitution sonore!
Les tests de réstitution consiste à écouté la musique-témoin via oreille humaine en comparant la version compressé à la version originale. Pour cela, le logiciel MCP lit jusqu'a 3 fois la même musique, et le testeur choisi d'écouté l'une des 3 "sortie audio".
L'écoute s'est faite au moyen du casque stéréo de marque AKG modèle K-271 studio, celui-ci couvrant un large spectre de fréquences audible.
WAV
La musique au format original.
MP3
Ecoute déplaisante. Les fréquences en dessous de 1KHz sont bien respecté, mais au-delà, le son est déformé, avec un effet de résonance très désagréable dans les aigues.
AAC
CBR : Ecoute passable. Les sons d'ambience, faible dans le son original, sont inaudible. Au-dela de 12KHz, les aigues résonnent des harmoniques, très désagréable à l'écoute. Des déformations et ecrêtages apparaissent par moment entre 4KHz et 12KHz. Sinon l'image stéréo est correcte. Le reste du spectre et fidèle à l'original.
VBR : Ecoute correcte. On entend la coupure à 13KHz, ce qui fait disparaitre un instrument : cymbale. Le reste du spectre est bien respecté, et il n'y a pas de phénomène de résonance à l'instar du mode CBR.
OGG
Ecoute plaisante. L'ensemble du spectre est bien respecté. On entend la coupure du son a 16KHz, ce qui dénature le son original. Le signal compris entre 3Khz et 8KHz est plus fort que dans l'original. Plus ennuyeux, l'image stéréo des fréquences hautes est reserré.
WMA
CBR : Ecoute correcte. On entend nettement la coupure à 13KHz, ce qui réduit fortement l'image stéréo lorsque les nappes d'ambience sont jouées dans la musique. Les pics des basses fréquences atténuent momentanéement les signaux hautes fréquences. La coupure de fréquence entraine la disparition totale d'un instrument. A la fréquence de coupure, il y a des résonances d'harmoniques haute fréquences, peu perceptible mais bien présentes.
VBR : Ecoute correcte. On entend la coupure à 13KHz, celle-ci semble atténuer le signal vers 12KHz, ce qui réduit encore les hautes fréquences par rapport au mode CBR. En revanche, les pics de puissances des basses fréquences n'altèrent plus les hautes fréquences. L'instrument cymbale est inaudible.
MP3pro
CBR : Ecoute plaisante. On entend la coupure à 16KHz. L'image stéréo
des aigues est réduite, entrainant la perte d'effets sonore faible. Les
signaux vers 7KHz semble atténué. Des phénomènes
de résonance très faibles sont perceptible lorsque le signal est
faible. Pas d'instruments perdu.
VBR : Ecoute plaisante. On entend la coupure à 16KHz. L'image stéréo est mieux conservé que dans le mode CBR, mais les signaux aigues sont plus atténué, surtout vers 7KHz, ce qui change de l'original. Dés phénomènes de résonance vraiment très faible sont perceptible. Pas d'instruments perdu.
En conclusion, classant les codecs donc la restitution est fidèle et peu déformé :
1) OGG, malgré l'excès des fréquences hautes (ce phénomène
pourra être équilibré avec un equalizer), restitution plaisante
2) MP3pro CBR, détrôné de peu par l'ogg à cause du
phénomène de résonance. La restitution semble fidèle,
merci au phénomène psychoacoustique!
3) MP3pro VBR, malgré l'atténuation vers 7KHz (compensable également
par un equalizer), image stéréo vraiment bonne
4) WMA VBR, bonne restitution mais coupé à 13KHz.
5) WMA CBR, bonne restitution à l'instar du mode wma vbr, mais les pics
de puissance modifie le son
6) AAC VBR, phénomène de déformation remarquable
7) AAC CBR, phénomène de résonance remarquable, en total
contradiction avec l'original dans les hautes fréquences.
8) MP3, phénomène de déformation audible en permanence,
désagréable.
On notera que le AAC est basé sur la technique du MP3, ce qui provoque les mêmes problèmes de déformations lorsque le bitrate est faible.
La différence entre le MP3pro CBR et l'OGG étant vraiment mineur, si l'on fait abstraction du phénomène de résonance peu perceptible du mp3pro, celui-ci serai premier de ce classement.
L'AAC CBR est en contradiction avec l'original à cause des résonances. Lorsque celle-ci se fond plus discrète, la qualité sonore résultante plaçerai ce format en 3ème position.
Copyright
(o) Proger 2003 [email]
Toute reproduction sans notification préalable est proscrite