Cours Codage du Son - MIC - PCM - ADPCM - les Codecs
1 Introduction
Le son de façon native se représente par un signal analogique. Il s'agit en fait d'une onde acoustique issue de la vibration d'une membrane, un haut-parleur.
Au niveau humain, on retrouve le même fonctionnement puisque les cordes vocales vibrent, produisent une onde qui est ensuite amplifiée dans la bouche.
Le codage consiste donc à faire "rentrer " cette information dans l'ordinateur afin de pouvoir la traiter et la transporter.
2 Le codage du son
2.1 L'échantillonnage
L'ordinateur ainsi que tout système informatique fonctionne avec des informations numériques. Il faut donc pour pouvoir traiter du son passer par une première phase de numérisation.
La numérisation fait appel à deux techniques qui sont l’échantillonnage et la mesure d'amplitude.
L'échantillonnage consiste à découper le temps en éléments élémentaires. De cet échantillonnage dépend la qualité du signal à l'arrivée.
La mesure d'amplitude consiste à coder le niveau du signal.
2.2 La valeur d'échantillonnage
Pendant la phase d'échantillonnage, une perte d'information liée à la fréquence d'échantillonnage est observée. L'objectif de l'échantillonnage est de
- Numériser l'information sonore
- Restituer le plus fidèlement possible l'information numériser
- Optimiser la taille du fichier final
Cette phase est indépendante de la phase de compression qui peut ensuite être appliquée.
Cette fréquence d'échantillonnage dépend donc énormément du type de support. Pour assurer une bonne restitution du signal, elle doit être au moins égale au double de la plus haute fréquence.
2.3 Les types de son
2.3.1 Le codage M IC ou PCM
Le codage M IC (Modulation par Impulsion codée) est celui utilisé au départ pour la téléphonie.
- Le signal sonore se situe dans la bande de 300 à 3400 Hz.
Le signal est soumis à une mesure toutes les 125 ms, donc 8000 fois par seconde, ce qui est deux fois plus rapide que la plus haute fréquence (4000 Hz).
- Le résultat de cette mesure est codé sur huit bits. On peut donc coder 28 = 256 niveaux d'amplitude). Comme la sensibilité de l'oreille varie non selon l'amplitude d'un signal, mais selon le logarithme de cette amplitude, les niveaux d'amplitude sont découpés en plages logarithmiques.
- Le signal qui en résulte a un débit de 8 * 8000 = 64 kbit/s.
Ce codage est également appelé PCM (Pulse Code Modulation). Il s'agit du format natif de numérisation utilisé dans les fichiers Wav (Windows) et AIFF (Apple). Ces formats sont non compressés.
2.3.2 Le codage ADPCM
Adaptive Differential Pulse Code Modulation
Le codage différentiel ou codage delta évalue la différence entre le niveau du signal à l'instant de l'échantillonnage et le niveau qu'il avait lors de l'échantillonnage précédent.
Cette méthode de codage du son exige moins d'espace de stockage que le format PCM .
- Ce codage est basé sur le fait que la voix présente rarement de fortes transitions de niveau entre deux échantillonnages successifs.
- La différence à coder est généralement moins grande que le signal lui-même.
- Le nombre de bits de codage peut être diminué.
- Ce qui réduit l'occupation en mémoire ou la bande passante (en bit/s) occupée lors d'une transmission.
- Comme une dérive importante peut avoir lieu après de nombreux calculs de différence, la valeur exacte d'un échantillon est transmise à des moments régulièrement espacés.
2.4 Les codecs
Les Codecs, abréviation de codeur/décodeur sont des logiciels permettant de réaliser ce codage du son. Ces logiciels s'appuient sur les éléments matériels disponibles dans les cartes son, vois des processeurs de traitement de signal (DSP).
Il en existe toute une variété permettant de résoudre les compromis entre qualité et volume de stockage ou bande passante.
On distingue entre autre, trois qualités principales de son (comme vu précédemment) :
- qualité téléphone
- qualité radio
- qualité CD
Les codecs disponibles permettent toute une gamme de qualités intermédiaires en donnant le choix de combiner les modes de compression, les fréquences d'échantillonnage, ainsi que la résolution. Certains sont également spécialisés dans le Streaming (flux en continu)
Les Codecs portent des noms comme
· audio Indeo,
· G.723.1,
· Lernout & Hauspie,
· trueSpeech,
· ADPCM ,
· …
Liste de Codecs fournie par GSpot
2.5 La compression du son
En plus du codage, certains Codecs ont une fonction complémentaire qui consiste à compresser les données afin de diminuer la taille des fichiers. Ces codecs (dont le plus célèbre est le M P3 ) sont basés sur l'analyse de la courbe de réponse de l'oreille (entre 20 Hz et 20 Khz) et donc "dégradent" l'information sans conséquences pour le résultat final. Il s’agit donc d'une compression avec perte. Cette compression permet une diminution de la taille du fichier dans un rapport de 4 à 12.
Grâce à cette compression, il est possible de stocker l'équivalent de plus de 10 CD audio sur un CD de donnée codé en MP3.
2.6 Les formats de fichiers sons :
2.6.1 Les formats audio :
2.6.2 Les formats mixtes
D'une autre façon, le son se trouve souvent associé à des vidéos. Dans ce cas, le son est codé (compressé ou non) à l'intérieur des fichiers vidéos sur ce que l'on appelle des pistes audio (par analogie au cinéma).
Les fichiers Audio / Vidéo portent comme extensions : AVI, M OV, M PG ou M PEG, rm …
3 Les logiciels de traitement du son
- Lecture Audio :
o Windows Media Player
o Winamp
o MusicMatch Jukebox
o …
- Logiciel de retouche et d'enregistrement Audio
o Magnetophone de Windows
o Goldwave
o Audacity
o Protools
o …
- Les logiciels de composition musicale
o Cubase
o Melody
o …
- Les rippers et convertisseurs Audio
o audiograber
o Xing M P3 Encoder/
o CDex
o …
- Les gestionnaires de codecs
o G-spot
o Sherlock
o …
Article plus récent Article plus ancien