Cet article, assez théorique, et qui pourra sembler rébarbatif à certains, vous expliquera le principe de la numérisation d’un signal audio. Nous verrons aussi l'intérêt du codage sur 24 bits à 96 kHz, qui n'est pas un simple argument commercial, mais correspond à une réelle amélioration technique, même s'il paraît nécessaire que le message musical possède une dynamique importante pour que la perception de cette amélioration se manifeste de manière beaucoup plus évidente qu'avec des messages musicaux plus "sages".

Avant-propos

Ce sujet étant très technique, il ne nous a pas toujours été facile d'être à la fois suffisamment précis tout en ne devenant pas trop compliqué et en employant un langage qui reste accessible à tous.

Nous commencerons par un bref rappel sur l’enregistrement analogique, dont les balbutiements remontent au milieu du XIXème siècle, trouvant leur apothéose en 1887 avec l’invention du « gramophone » par Emile Berliner. Ce mode d’enregistrement a perduré durant quasiment tout le XXème siècle et fut détrôné au début des années 80 par les techniques d’enregistrement numérique.

1 - Rappel sur l’enregistrement analogique

Les sons que perçoit l’oreille humaine varient de façon continue, on dit que ce sont des phénomènes analogiques.

Jusqu’à l’apparition des techniques numériques appliquées à l’audio, l’enregistrement des sons se faisait aussi de manière analogique.

Cela signifie que sur un disque vinyle, sur une bande magnétique ou sur une mini cassette, les signaux enregistrés variaient aussi de façon continue, conformément aux sons que l’on entendait et que captait le (ou les) microphone(s).

C’était en quelque sorte une image magnétique du son sur une bande de magnétophone ou des stries plus ou moins larges dans le sillon d’un disque vinyle.

2 - L’enregistrement numérique

2.1 Principe

L’enregistrement numérique est basé sur la technique appelée échantillonnage d’un signal.

L’échantillonnage d’un signal consiste à en mesurer la grandeur à intervalles de temps réguliers.

Les intervalles de temps réguliers sont fixés par la fréquence d’échantillonnage (en kHz) et la mesure de leur grandeur convertie en bits est appelée quantification.

Visuel Wikipedia libre de droits

En audio, l’échantillonnage le plus connu est le 16 bits à 44,1 kHz du CD.

Pour être plus précis, 44,1 kHz signifie que l’on prélève 44.100 valeurs, ou échantillons, du signal audio chaque seconde, tandis que les 96 kHz des fichiers proposés par Qobuz en qualité Studio Masters correspondent au prélèvement de 96.000 échantillons par seconde, soit plus du double.

On voit donc que plus la fréquence d'échantillonnage est élevée, plus l'analyse du signal est fine puisque les échantillons sont plus nombreux, et plus la reproduction sera fidèle.

D'autre part, cette augmentation de la fréquence permet également, d'après le Théorème de Nyquist-Shannon, d'échantillonner des sons plus aigus.

16 bits signifie que la mesure de chaque échantillon du signal sera arrondie à la valeur la plus proche parmi 65.356 valeurs possibles.

65.536 correspond à 216, soit 2 multiplié 16 fois par lui-même, et pour 24 bits, cela correspond à 224, soit 1.677.216 valeurs possibles, 256 fois plus qu'avec 16 bits, ce n’est pas rien !

Cela se traduit en pratique par une plage dynamique (écart entre le silence et le son le plus fort enregistrable) qui est d’autant plus grande que le nombre de bits est élevé.

« Dans le domaine du son et de l'audio, la dynamique sonore désigne le rapport entre le son le plus fort possible et le son le plus faible possible ou le niveau de bruit de fond, par exemple pour un microphone ou un haut-parleur. En audio numérique, la dynamique dépend de la résolution en bits. La dynamique sonore s'exprime en décibel (dB). » (extrait de Wikipedia)

En passant d'un bit au suivant, l'écart de dynamique est de 6 dB, soit 16 x 6 dB = 96 dB de dynamique possible pour un échantillonnage sur 16 bits, et 24 x 6 dB = 144 dB pour un échantillonnage sur 24 bits (c’est une plage dynamique énorme !).

Note : on voit donc bien quel écart de qualité sonore peut exister entre un fichier proposé par Qobuz en Vraie Qualité CD et un fichier proposé en qualité Studio Masters en 24 bits à 96 kHz, puisque l'on gagne à la fois sur la fidélité (plus du double d'échantillons), sur la plage dynamique (de 96 dB à 144 dB on gagne 48 dB, ce qui correspond à un facteur d'environ 250) et sur la bande passante (enregistrement de sons plus aigus).

L'écart de dynamique de 6 dB d'un bit au suivant s’explique par le fait qu’à chaque bit correspond une valeur, appelée poids, variant comme les puissances de 2.

En effet, un système informatique calcule en binaire ou système de numération de base 2, les deux nombres de cette base étant «0» et «1» («0» : absence de la tension électrique, «1» : présence de la tension).

En passant d’un rang au suivant, la valeur du bit double donc (on dit que le gain est de 6 dB) et cela s'exprime ainsi pour 16 bits, 20 = 1, 21 = 2, 22 = 4, 23 = 8, …, 214 = 16.384, 215 = 32.768.

Précision sur le calcul d'un gain en dB, que l'on note «G» : G = 20 x log10 (valeur A / valeur B), soit, pour un rapport de 2 : G = 20 x log10 (2) = 6 dB.

Afin de justifier l'intérêt de la quantification sur un nombre de bits élevé, voici un visuel très parlant sur les niveaux sonores exprimés en dB ( 0 dB étant le seuil de l'audibilité) et leurs valeurs en pression sur un baromètre (puisque le son est une suite de pressions et de dépressions), ainsi que les niveaux maximum que l'on peut coder sur 16 bits et sur 24 bits en gardant comme référence 0 dB le seuil de l'audibilité.

On emploie parfois, pour exprimer un niveau sonore, le terme dBSPL (SPL signifiant Sound Pressure Level : niveau de pression sonore), les dB du visuel ci-dessus sont des dBSPL.

A noter que les pressions sonores extrêmes des phénomènes acoustiques (coup de tonnerre, décollage d'avion ou de fusée), même si elles peuvent être enregistrées grâce à un échantillonnage sur un nombre de bits élevé, sont quasiment impossibles à reproduire à niveau réel par un système HiFi domestique (de toute manière ce serait insupportable, voire très dangereux pour l'ouie, sans parler des problèmes avec les voisins !).

A suivre...

Vers partie 2