COMPARATIF COMPRESSION AUDIO MPEG-4

ANALYSE SPECTRAL ET RESTITUTION à 64KbPS

Par Proger - aout 2003

sommaire


Tests réalisés en compressant à 64Kbps en moyenne une musique sonore.

Rappel : formats audio candidats MPEG-4 :
- WMA microsoft windows media audio
- MP3pro thomson mp3 professional
- VQF ntt vector quantization filter
- AAC fraunhofer advanced audio coding
- OGG xiph.org ogg vorbis

 

Tests : compression effectuées :
- MP3 "classique" via codec Faunhofer pro, mode CBR 64Kbps haute qualité
- MP3pro via codec Thomson, mode CBR 64Kbps
- MP3pro via codec Thomson, mode VBR qualité 30
- AAC via codec PsyTEL, mode CBR 64Kbps haute qualité
- AAC via codec PsyTEL, mode VBR qualité 10
- OGG via codec de Xiph.org, mode VBR qualité 0.0 (équivalent 64Kbps)
- WMA via codec wma9 de Microsoft (version redist!), mode CBR 64Kbps
- WMA via codec wma9 de Microsoft (version redist!), mode VBR qualité 10
- VQF : ignoré : ce format n'autorise pas de compression à 64Kbps issue de wave qualité cd...

L'ensemble de ces compressions audios ont abouti à des fichiers dont la taille est comprise entre 2,36Mo et 2,81Mo. Sachant que la musique originale fait 57,8Mo, le taux de compression moyen est de 1:23 !

Attention !
- Le codec MP3 utilisé est l'officiel Fraunhofer professionnel, or actuellement le codec le plus utilisé est LAME 3.xx, qui est beaucoup plus paramétrable! Les résultats de compression audio à bitrate équivalent sont totalmenent différent selon que l'on choisisse Fraunhofer ou LAME!
- Le codec WMA utilisé est la version redistribué, c'est-à-dire fourni avec tout logiciels de lecture et compression audio. Microsoft propose un logiciel de compression WM (audio et video) qui dispose d'un codec compresseur WMA bien plus performant que la version redistribuable. Je rajouterai d'ici peu un test avec ce codec plus performant.

Note :
- "Hautes fréquences" correspond à la bande situé entre 5000Hz et 14000Hz
- "Basses fréquences" correspond à la bande situé entre 20Hz et 5000Hz

 


COMPARATIF DES SPECTRES

 

(note : les images ci-dessous ont été compressé en Jpeg haute qualité. La taille moyenne est de 140Ko par image, aussi elles ne s'afficheront pas instantanément. Le Jpeg étant un format de compression avec pertes de données, les images sont également disponible en version PNG 24bits ici)

Spectre de la musique originale :

Nous pouvons distinguer les deux voies, de bas en haut la fréquence (de 0 à 22050 hz) pour chacune des voies, et de gauche à droite la durée / position de lecture du son (5 minutes 44 secondes)

 

MP3 iso/iec

Spectre résultant de la compression via codec Faunhofer pro, mode CBR 64Kbps haute qualité :

Coupure de la fréquence à 16000Hz, le reste du spectre correspond peu à l'originale, surtout les basses fréquences.

 

MP3pro

Spectre résultant de la compression via codec Thomson, mode CBR 64Kbps :

Coupure des fréquences au-delà de 16000Hz. Les fréquences aigue puissantes sont bien respecté, les signaux faibles ne correspondent pas à l'original. Les basses fréquences ne sont pas respecté, sauf en l'absence d'aigues (après 5:20).

 

Spectre résultant de la compression via codec Thomson, mode VBR qualité 30 :

Coupure des fréquences au-delà de 16000Hz. Une net atténuation du signal est visible entre 8000Hz et 10000Hz. Sinon, les hautes fréquences sont très proche de l'original, même dans les zones faible. Les basses fréquences ne correspondent pas à l'original.

Magré l'atténuation visible entre 8KHz et 10KHz du mode VBR, le mode VBR du MP3pro copie au mieux le spectre original.

 

AAC

Spectre résultant de la compression via codec PsyTEL, mode CBR 64Kbps haute qualité :

Coupure des fréquences au-delà de 16000Hz. Les signaux trop faible sont ignoré. Le spectre correspond globalement à l'original, avec toutefois des petites différences dans les fréquences basses et aigues.

 

Spectre résultant de la compression via codec PsyTEL, mode VBR qualité 10 :

Coupure des fréquences au-delà de 13000Hz. Le reste du spectre correspond globalement à l'original. Il est legèrement plus semblable qu'en mode CBR.

Dommage que le mode VBR impose le filtre de fréquence à 13KHz, car ce mode semble mieux respecté les fréquences aigues que le mode CBR.

 

OGG

Spectre résultant de la compression via codec de Xiph.org, mode VBR qualité 0.0 (équivalent 64Kbps) :

Coupure des fréquences à 15000Hz. Le reste du spectre correspond de beaucoup à l'original. On note juste quelques faibles différences dans les fréquences basses, et les fréquences hautes sont un peu plus marquées.

 

WMA

Spectre résultant de la compression via codec wma9 de Microsoft, mode CBR 64Kbps :

Coupure des fréquences au-delà de 13000Hz. Le reste du spectre correspond de beaucoup au signal original, avec des différences occasionnel dans les fréquences basses. Néanmoins il y a des différences remarquables dans les fréquences hautes lorsque le signal est faible.

 

Spectre résultant de la compression via codec wma9 de Microsoft, mode VBR qualité 10 :

Coupure des fréquences au-delà de 13000Hz. Le spectre correspond de beaucoup à l'original. Quelques différences occasionnel dans les basses et dans les aigues.

Les modes VBR et CBR sont à peu près équivalent, avec une préférence pour le VBR qui respecte mieux les signaux faibles.

 

 

En conclusion, en classant dans l'ordre du codec conservant au mieux l'image du spectre, on obtient :

1) OGG , montant le plus haut en fréquences (16KHz), excellent respect des hautes fréquences et recopie correctement les basses.
2) AAC CBR, les fréquences basses sont bien copié, de grosses différences occasionnelles dans les fréquences hautes. Garde jusqu'a 16KHz le spectre original. Coupe les signaux faibles.
2) MP3pro VBR, coupe à 16KHz, garde très bien les hautes fréquences sauf dans une zone préçise. De grosses différences dans les basses fréquences.
3) WMA VBR, malgré la coupure à 13KHz, le reste est bien respecté.
4) AAC VBR, coupure à 13KHz, le reste est correctement respecté.
5) WMA CBR, coupe à 13KHz, quelques différences dans les signaux aigues faible.
6) MP3 CBR, coupe à 16KHz, grosses différences dans les fréquences basses, des différences sensible par moment dans les fréquences aigues
7) MP3pro CBR, coupe à 16KHz. Grosses différences dans les fréquences basses, vraiment beaucoup de différences notable dans les aigues, surtout lorsque le signal est complexe.

Attention, il s'agit là d'un classement par rapport au spectre. Celui-ci classe dans des bonnes positions les compression coupant le signal à 13KHz, alors qu'une telle coupure est réellement audible par beaucoup d'oreilles. Avant de fixer votre choix, lisez le test de restitution sonore!

 


TESTS DE RESTITUTION

 

Les tests de réstitution consiste à écouté la musique-témoin via oreille humaine en comparant la version compressé à la version originale. Pour cela, le logiciel MCP lit jusqu'a 3 fois la même musique, et le testeur choisi d'écouté l'une des 3 "sortie audio".

L'écoute s'est faite au moyen du casque stéréo de marque AKG modèle K-271 studio, celui-ci couvrant un large spectre de fréquences audible.

 

WAV

La musique au format original.

 

MP3

Ecoute déplaisante. Les fréquences en dessous de 1KHz sont bien respecté, mais au-delà, le son est déformé, avec un effet de résonance très désagréable dans les aigues.

 

AAC

CBR : Ecoute passable. Les sons d'ambience, faible dans le son original, sont inaudible. Au-dela de 12KHz, les aigues résonnent des harmoniques, très désagréable à l'écoute. Des déformations et ecrêtages apparaissent par moment entre 4KHz et 12KHz. Sinon l'image stéréo est correcte. Le reste du spectre et fidèle à l'original.

VBR : Ecoute correcte. On entend la coupure à 13KHz, ce qui fait disparaitre un instrument : cymbale. Le reste du spectre est bien respecté, et il n'y a pas de phénomène de résonance à l'instar du mode CBR.

 

OGG

Ecoute plaisante. L'ensemble du spectre est bien respecté. On entend la coupure du son a 16KHz, ce qui dénature le son original. Le signal compris entre 3Khz et 8KHz est plus fort que dans l'original. Plus ennuyeux, l'image stéréo des fréquences hautes est reserré.

 

WMA

CBR : Ecoute correcte. On entend nettement la coupure à 13KHz, ce qui réduit fortement l'image stéréo lorsque les nappes d'ambience sont jouées dans la musique. Les pics des basses fréquences atténuent momentanéement les signaux hautes fréquences. La coupure de fréquence entraine la disparition totale d'un instrument. A la fréquence de coupure, il y a des résonances d'harmoniques haute fréquences, peu perceptible mais bien présentes.

VBR : Ecoute correcte. On entend la coupure à 13KHz, celle-ci semble atténuer le signal vers 12KHz, ce qui réduit encore les hautes fréquences par rapport au mode CBR. En revanche, les pics de puissances des basses fréquences n'altèrent plus les hautes fréquences. L'instrument cymbale est inaudible.

 

MP3pro

CBR : Ecoute plaisante. On entend la coupure à 16KHz. L'image stéréo des aigues est réduite, entrainant la perte d'effets sonore faible. Les signaux vers 7KHz semble atténué. Des phénomènes de résonance très faibles sont perceptible lorsque le signal est faible. Pas d'instruments perdu.

VBR : Ecoute plaisante. On entend la coupure à 16KHz. L'image stéréo est mieux conservé que dans le mode CBR, mais les signaux aigues sont plus atténué, surtout vers 7KHz, ce qui change de l'original. Dés phénomènes de résonance vraiment très faible sont perceptible. Pas d'instruments perdu.

 

En conclusion, classant les codecs donc la restitution est fidèle et peu déformé :

1) OGG, malgré l'excès des fréquences hautes (ce phénomène pourra être équilibré avec un equalizer), restitution plaisante
2) MP3pro CBR, détrôné de peu par l'ogg à cause du phénomène de résonance. La restitution semble fidèle, merci au phénomène psychoacoustique!
3) MP3pro VBR, malgré l'atténuation vers 7KHz (compensable également par un equalizer), image stéréo vraiment bonne
4) WMA VBR, bonne restitution mais coupé à 13KHz.
5) WMA CBR, bonne restitution à l'instar du mode wma vbr, mais les pics de puissance modifie le son
6) AAC VBR, phénomène de déformation remarquable
7) AAC CBR, phénomène de résonance remarquable, en total contradiction avec l'original dans les hautes fréquences.
8) MP3, phénomène de déformation audible en permanence, désagréable.

On notera que le AAC est basé sur la technique du MP3, ce qui provoque les mêmes problèmes de déformations lorsque le bitrate est faible.

La différence entre le MP3pro CBR et l'OGG étant vraiment mineur, si l'on fait abstraction du phénomène de résonance peu perceptible du mp3pro, celui-ci serai premier de ce classement.

L'AAC CBR est en contradiction avec l'original à cause des résonances. Lorsque celle-ci se fond plus discrète, la qualité sonore résultante plaçerai ce format en 3ème position.

 


Attention ! les résultats obtenu ainsi que le classement peuvent varié en fonction du son qui est compressé. La grande lacune de ce test est le fait qu'il n'y ai pas de voix humaine dans la musique cobaye.

retour index

 

Copyright (o) Proger 2003 [email]
Toute reproduction sans notification préalable est proscrite