Tests réalisés en compressant à 96Kbps en moyenne une musique sonore (sauf indication contraire).
Rappel : formats audios candidats MPEG-4 :
- WMA microsoft windows media audio
- MP3pro thomson mp3 professional
- VQF ntt vector quantization filter
- AAC fraunhofer advanced audio coding
- OGG xiph.org ogg vorbis
Tests : compressions effectuées :
- MP3 "classique" via codec Faunhofer pro,
mode CBR 128Kbps haute qualité (référence)
- MP3 "classique" via codec Faunhofer pro,
mode CBR 320Kbps haute qualité
- AAC via codec PsyTEL, mode CBR 96Kbps haute qualité
- OGG via codec de Xiph.org, mode VBR qualité 2.0 (équivalent
96Kbps)
- WMA via codec wma9 de Microsoft, mode CBR 80Kbps (dit équivalent à
qualité cd)
- VQF via codec NTT, mode CBR 80Kbps haute qualité
- MP3pro via codec Thomson, mode CBR 96Kbps haute qualité
Le fichier original fait 57,8Mo
- à 96Kbps, la taille moyenne du fichier compressé est de 3,96Mo,
soit un ratio de compression 1:14
- à 80Kbps, la taille moyenne du fichier compressé est de 3,30Mo,
soit un ratio de compression 1:17
Note :
- "Hautes fréquences" correspond à la bande située
entre 5000Hz et 14000Hz
- "Basses fréquences" correspond à la bande située
entre 20Hz et 5000Hz
Le codec Fraunhofer pro n'est pas le codec le plus utilisé lorsqu'on compresse un son en MP3. Le plus répandu est LAME 3.91 et 3.93, qui offrent des fonctions compensant astucieusement les artefacts du MP3.
(note : les images ci-dessous ont été compressé en Jpeg haute qualité. La taille moyenne est de 140Ko par image, aussi elles ne s'afficheront pas instantanément. Le Jpeg étant un format de compression avec pertes de données, les images sont également disponible en version PNG 24bits ici)
Spectre de la musique originale :
Nous pouvons distinguer les deux voies, de bas en haut la fréquence (de 0 à 22050 hz) pour chacune des voies, et de gauche à droite la durée / position de lecture du son (5 minutes 44 secondes)
MP3 iso/iec
Spectre résultant de la compression via le codec original Fraunhofer
à 128Kbps, connu comme "étant proche de la qualité
cd" :
De toute évidence, le son est filtré à 16000 hz, et seul
les pics de puissance sonore au-delà de cette fréquence sont enregistré.
Note : le codec Lame mp3 a une meilleure réponse spectrale, mais n'as
pas été utilisé pour ce test. Des tests sont déjà
disponible sur le net où l'on compare les différents compresseurs
mp3 (xing, lame, blade, fraunhofer fast, fraunhofer pro,...). Lame est le compresseur
mp3 le plus utilisé car il encode les très hautes fréquences,
mais exige pour cela un bitrate minimum de 192Kbps, alors que Fraunhofer pro
se permet de descendre à 112Kbps et joue sur la psychoacoustique pour
compensé les très hautes fréquences perdues.
Une deuxième compression a été réaliser, avec le bitrate maximum autorisé pour le MP3 : 320Kbps
Même comportement que le 128Kbps, coupure à 16000Hz, mais conserve
beaucoup plus de pic audio au-delà.
NOTE IMPORTANTE : il s'agit du codec MP3 Fraunhofer Pro, qui, selon les théories
psychoacoustiques utilisées, supprime les fréquences inaudible
pour une oreille conventionnelle, c'est-à-dire 16Khz - 18Khz. En revanche,
le codec MP3 le plus répandu (LAME) respecte le spectre audio dans les
très hautes fréquences (19Khz et plus...) ce qui change le spectrogramme
et plaçerai le mp3 en première position de ce test...
AAC
Spectre résultant de la compression via le codec PsyTEL, forçé à 96Kbps.
L'AAC étant basé sur l'idée du mp3, on retrouve le principe de couper le signal aux alentour de 16000Hz, mais l'AAC garde beaucoup plus d'information au-delà. Les basses fréquences sont conservées à l'exacte par rapport à l'original, avec un premier seuil de différence à 1000Hz, où en-deçà le signal est identique à 99% de l'original, et un deuxième à 6000Hz, où au-delà les informations audios diffèrent à plus de 90%, tout en restant discrètes.
OGG
Spectre résultant de la compression via OGG vorbis codec, à 96Kbps.
On note que les hautes fréquences sont filtrées au-dela de 16000 hz, néanmoins beacoup d'informations sont gardées jusqu'à 22050 hz, plus que dans le format AAC. Les basses fréquences sont conservées à l'identique par rapport au son original, mais moins que dans le cas de l'AAC : le deuxième seuil serai à 4000Hz
WMA
Spectre résultant de la compression via le codec wma9, en mode 80Kbps. Microsoft indiquai que 64Kbps était le bitrate "proche de la qualité cd", et différents essais non publiés ici ont montré que le spectre varie très peu au-delà de ce bitrate.
L'image montre que ce format coupe net le signal aux alentours de 14000Hz et n'enregistre de ce fait aucune informations audios au-delà. A l'écoute, ce "manque de hautes fréquences" est notable, ce qui rend le fichier sonore vraiment trop distant de l'original. Les basses fréquences sont conservées, à l'instar du AAC, mais contient toujours de légères nuances, bien en-deçà de 1000Hz
VQF
Spectre résultant de la compression via le dernier codec de NTT, 80Kbps en mode haute qualité.
A l'instar du MP3pro, seul le vqf enregistre les informations audios sur l'ensemble du spectre de fréquence. Mais ceci n'est qu'une apparence, car en comparant les deux spectres (original et vqf) on s'aperçois qu'il y a énormément de différences : les hautes fréquences sont atténuées progressivement jusqu'à la limite 22050 hz, en total contradiction avec la musique originale. Les basses fréquences diffèrent du signal original.
MP3pro
Spectre résultant de la compression via le codec de Thomson, mode 96Kbps.
Tout comme le VQF, le MP3pro garde l'ensemble des informations audios jusqu'à la limite des 22050Hz. Néanmoins en aucun cas l'image du spectre du son original ne correspond à celui du MP3pro, tel que le VQF. La différence avec ce dernier réside dans le fait que le MP3pro conserve beaucoup plus la continuité des puissances audios en montant en fréquences (pas de baisse progressive).
En conclusion, en classant dans l'ordre du codec conservant au mieux l'image du spectre, on obtient :
1) OGG , montant le plus haut en fréquences
2) AAC , gardant plus d'informations basses fréquences à l'identique
de l'original
3) WMA, gardant égalemement un maximum de fréquences à
l'identique de l'original, mais coupant net à 14000Hz
4) MP3pro, conservant intégralement les hautes fréquences, mais
dans l'ensemble est peu semblable à l'original
5) VQF, conservant aussi les hautes fréquences, mais de façon
irrespectueuse par rapport à l'original
6) MP3, conservant quelques traçes au-delà de 16000Hz, sinon tout
le reste du signal ne correspond pas à l'original, avec des pics de puissances
dans des fréquences totalement délaissés dans l'original.
Attention, il s'agit là d'un classement par rapport au spectre. Voir la suite des tests avant de déçider quel est le "meilleur format mp4".
Les tests de restitution consistent à écouter la musique-témoin via oreille humaine en comparant la version compressé à la version originale. Pour cela, le logiciel MCP lit jusqu'a 3 fois la même musique, et le testeur choisi d'écouter l'une des 3 "sortie audio".
L'écoute s'est faite au moyen du casque stéréo de marque AKG modèle K-271 studio, celui-ci couvrant un large spectre de fréquences audible.
WAV
La musique au format original.
MP3
L'écoute est très satisfaisante à 128Kbps. Néanmoins le son semble légèrement étouffé, ceci dû à un affaiblissement des hautes fréquences. Notable lorsque des cymbales jouent durant l'écoute.
AAC
L'écoute est très satisfaisante à 96Kbps. Les hautes fréquences sont un peu plus forte que dans la musique originale. Cette différence reste discrète, mais a tendance à modifier l'image stéréo du son dans ces même fréquences.
OGG
L'écoute est très satisfaisante à 96Kbps. On remarque immédiatement que les hautes fréquences sont plus forte que dans la musique originale, ce qui est irréspectueux envers le son original.
WMA
L'écoute est peu satisfaisante à 80Kbps. Les hautes fréquences sont absente, coupant net le jeu des cymbales, le son est nettement moins claire. Certains pic de fréquences sont néanmoins audible, mais sont souvent déformés et ne correspondent plus au son original.
VQF
L'écoute est satisfaisante à 80Kbps. Les hautes fréquences sont atténuées, faiblement perceptible. En revanche il y a des pics de hautes fréquences lorsque celles-ci dépassent un seuil donné, ce qui donne globalement une impression de bruits parasite, comparativement au son original. Lorsqu'il n'y a que des fréquences aigues, ce phénomène est moins perceptible.
MP3pro
L'écoute est très satisfaisante à 96Kbps. Les hautes fréquences
sont très légèrement atténuées, et l'image
stéréo est réduite dans ces même fréquences.
Plus gênant, on entend de brefs parasites irréguliers lorsque les
hautes fréquences sont faible.
En utilisant un lecteur MP3 ne supportant pas le format MP3pro, l'écoute
est peu satisfaisante, avec un cruel manque dans les hautes fréquence
et quelques déformations du son.
En conclusion, en classant dans l'ordre du codec dont la réstitution est statisfaisante :
1) AAC, les différences sont très peu perceptible.
2) OGG, seul l'excès d'aigues est différent de l'original.
3) MP3 (à 128Kbps), les différences sont très peu perceptible,
mais le bitrate est considérablement plus élevé que l'AAC
(plaçé ici à titre indicatif).
4) MP3pro, quelques parasites discrèts trouble l'oreille attentive, image
stéréo aigue un peu réduite.
5) VQF, les hautes fréquences sont atténuées et déformées.
6) MP3 (à 96Kbps), les hautes fréquences sont très atténuées,
la musique est amputé de façon claire.
7) WMA, malgré les basses fréquences respecté, l'absence
totale de fréquences hautes assourdi le son, et beaucoup de pic de fréquences
déformés sont des désagrément supplémentaire
à l'écoute. Ces problèmes sont audible non seulement en
laboratoire, mais aussi en écoute "standard" sur des hauts-parleurs
grand public. On espère que microsoft améliorera la courbe de
réponse de son codec lors des futures version (test actuel avec la version
9).
On notera l'excellent résultat du MP3, dont la qualité est vraiment proche de l'original, et ce à 128Kbps. L'absence des très hautes fréquences comme vu sur le test du spectre est quasiment inaudible.
Addendum : vitesse d'encodage relative avec chaque codec, du plus rapide
au plus lent :
Voici une petite liste mémorisant la vitesse à laquelle se faisait
l'encodage de l'extrait musicale utilisé dans ces tests. Par "vitesse
originale", on sous-entend la durée totale pour l'écoute
de la musique, c'est-à-dire 5 minutes 44 secondes. 2 fois la vitesse
originale signifie que la compression a durée environ 2 minutes 50 secondes.
Processeur central cadencé à 1,4GHz
1) MP3, plus de 12 fois la vitesse originale de la musique
2) WMA, environ 10 fois la vitesse originale
3) OGG, 6 fois en moyenne
4) MP3pro, 4 fois la vitesse originale
5) VQF, 3 fois la vitesse originale
6) AAC, 2 fois la vitesse originale
Dans tout les cas (et si l'option était disponible), l'encodage se faisait avec les options de qualité au maximum et avec Join Stereo.
NOTE : ces tests ont été réalisé pour le
bitrate 96Kbps. Le format AAC aurai le meilleur rapport qualité/respect
du son pour ce bitrate. Cela ne conclue pas le débat sur "le meilleur
codec MPEG-4". Voir test à 64Kbps.
Copyright
(o) Proger 2003 [email]
Toute reproduction sans notification préalable est proscrite