Comprendre les taux d'échantillonnage et les différents formats PCM, DSD, DoP & MQA

Posté le 15/05/2024 Tutoriels & Guides, Guides 5986
Bannière article sur les taux d'échantillonnages

Taux d'échantillonnage

PCM - DSD natif - DSD DoP - MQA

Cet article est dédié à la compréhension des taux d'échantillonnage et des différents formats principalement présents sur le marché de la Hi-Fi, à savoir le PCM, le DSD DoP et natif ainsi que le MQA. Si vous ne faites pas la différence entre le PCM 24bit 192kHz et le 32bit 384kHz ou bien le DSD128 et le DSD512 ou le MQA, vous êtes au bon endroit. Le taux d'échantillonnage supporté par un appareil détermine la qualité des données audio que ce dernier est en capacité de traiter. Cela peut donc s'avérer essentiel, notamment lors du choix d'un appareil tel qu'un DAC !

La différence entre signal analogique et données audio numériques

Quand on parle de taux d'échantillonnage, cela s'applique au numérique, mais il ne faut pas oublier comment est créé un fichier audio. En effet, bien souvent, selon le type de musique, l'enregistrement audio peut être réalisé directement grâce à des sons synthétiques ou déjà numérisés, mais également via une session d'enregistrement d'un groupe ou d'un artiste. C'est pourquoi il est important de faire la différence entre signal analogique et données audio numériques. La captation audio est représenté par des variations de tension dans le temps au sein d'un câble électrique. Par exemple, si vous enregistrez une voix, votre micro convertit en fait des ondes de pression en variation de tension dans le temps pour que ces dernières puissent ensuite transiter via un câble de modulation analogique. Cet écart de tension est par exemple représenté sous la forme d'intensité de variation magnétique pour les cassettes et par la variation de la taille du sillon sur des vinyles. Mais aujourd'hui, tout enregistrement est numérisé et donc converti en une suite de 0 et de 1 pour pouvoir être traité ou tout simplement stocké sur un ordinateur. Dans le cadre d'un enregistrement numérique, la forme de l'onde initiale est divisée en différentes sections individuelles, appelées échantillons. Ce travail est généralement réalisé par une puce DAC/ADC (Digital to Analog Converter / Analog to Digital converter).

Processus des convertisseurs ADC/DAC

Le principe d'un taux d'échantillonnage

Pour comprendre le principe d'un taux d'échantillonnage, il y a deux paramètres essentiels à prendre en compte. Tout d'abord, la fréquence d'échantillonnage exprimée en kilohertz, mais également la profondeur de bit.

La fréquence d'échantillonnage correspond au nombre d'échantillons prélevés par seconde. Plus elle est élevée, plus la qualité du fichier est bonne. Cela permet de se rapprocher au maximum de la forme de l'onde analogique d'origine.

Fréquence d'échantillonnage

La profondeur de bit permet de déterminer l'écart entre l'échantillon le plus faible et l'échantillon le plus fort. En audio, on parle souvent de 16bit, 24bit ou 32bit, voire même 64bit, même si cela est rare. Pour faire plus clair, plus la profondeur de bit est élevée, plus la plage dynamique exprimée en dB de votre fichier musical sera élevée. La norme CD est par exemple de 16bit et permet une amplitude composée de 65 536 niveaux de quantification possibles.

Profondeur de bit

La norme CD 44.1kHz et les différents codecs audio

Il faut savoir que pour reproduire une fréquence donnée, le taux d’échantillonnage doit être au moins deux fois supérieur à cette fréquence selon le théorème d’échantillonnage de Nyquist-Shannon. Si l'on se base sur le fait que l'oreille humaine est en mesure de percevoir des sonorités situées entre 20Hz et 20kHz il est donc tout à fait logique que le 44.1kHz soit devenu une norme en termes de taux d'échantillonnage. Si la fréquence d'échantillonnage est inférieure à 44.1kHz, les convertisseurs et les puces de traitement risquent de mal interpréter les hautes fréquences. Cette norme a été établie par Sony et Philips au début des années 80 avant la commercialisation du format CD en 1982 aux USA puis en 1983 en France. Au début de leur commercialisation, les CD portaient un code SPARS, soit des inscriptions renseignant les trois phases phares des procédés d'enregistrement avec "A" pour analogique et "D" pour digital :

  • AAD : Enregistrement initial analogique, mixage/montage analogique et mastering numérique.
  • ADD : Enregistrement initial analogique, mixage/montage numérique et mastering numérique.
  • DDD : Enregistrement initial numérique, mixage/montage numérique et mastering numérique.
  • Etc.
Processus de diffusion de la musique

Le principe de compression à l'ère du tout numérique

Avec l'avènement d'Internet, l'industrie musicale s'est retrouvée bouleversée, forcée de suivre les habitudes de consommation et d'usage. Seulement, au début d'Internet, même si transférer un e-mail était possible, il n'était pas encore question de transférer des fichiers volumineux. Même le 16bit était considéré comme trop volumineux, alors le 24bit des enregistrements originaux... C'est pourquoi le principe de compression est apparu, créant notamment le fameux format MP3. Il existe deux méthodes de compression bien distinctes : la compression avec perte et la compression sans perte.

Compression avec perte (MP3, AAC, WMA, OGG) : dans le cadre d'une compression avec perte, certaines parties de l'enregistrement audio original sont complètement supprimées. Par exemple, si un son très faible est partiellement couvert par un son très fort, il est probable qu'il soit supprimé de l'enregistrement sans que cela fasse une grande différence pour vos oreilles. Cependant, cela rend globalement le rendu final bien moins texturé, auquel il manque certains détails.

Compression sans perte ou "lossless" (FLAC, ALAC) : c'est la meilleure façon de réaliser une compression de fichier audio sans en dégrader la qualité. C'est le même principe qu'un fichier ZIP : lorsque vous ouvrez votre fichier audio, vous "décompressez" le fichier pour profiter pleinement de l'entièreté des données.

Principe de compression

Mais alors, comment s'y retrouver entre le PCM, le DSD, le DSD DoP et le MQA

Dans le monde de la HiFi, on retrouve aujourd'hui des indications telles que PCM 32bit 768Khz, DSD512 ou encore MQA. En effet, cela permet de déterminer quel type d'échantillonnage votre appareil est en mesure de supporter. Les technologies ayant évolué, de plus en plus de plateformes proposent la possibilité de profiter d'enregistrements et de fichiers haute définition pour vos sessions d'écoute musicale.

L'encodage PCM : la modulation par impulsion de codage (Pulse-Code Modulation - PCM) est un des processus de numérisation d'un signal électrique sous forme de flux. Il se décompose en trois opérations : l'échantillonnage, la quantification et le codage. Chaque échantillon est traité de manière indépendante, permettant d'éviter le chiffrement ou la compression des données. Par exemple, si votre DAC supporte du PCM 32bit 384kHz alors il est en mesure de réaliser une conversion sur une plage dynamique de 192dB repoussant le niveau de plancher du bruit avec un échantillonnage toutes les 1/384000s pour une courbe se rapprochant au plus proche d'un format analogique. Plus la fréquence d'échantillonnage est élevée, moins il est nécessaire d'effectuer un traitement d'interpolation entre les différents échantillons.
Historiquement, c'est un certain Alec Reeves qui a contribué au développement de la modulation d'impulsion codée. Il a notamment déposé un brevet à la fin des années 30 et fut le premier à échantillonner un signal téléphonique. Mais ce n'est qu'avec l'apparition des transistors qui ont remplacé les tubes que le procédé s'est démocratisé jusqu'à apparaître dans les premiers processeurs audio durant les années 70. Vous l'aurez compris, c'est l'encodage utilisé sur les CD-AUDIO (PCM 16Bit 44.1kHz). Mais certains ont observé à l'époque que certaines harmoniques et hautes fréquences étaient détruites en raison du filtre de coupure passe-bas appliqué lors de la lecture d'un CD. Pour pallier ce phénomène, les lecteurs CD procédaient à une interpolation permettant le suréchantillonnage. C'est en partie cette problématique qui a poussé Sony et Philips à développer le DSD via le format SA-CD.

Le PCM (pulse code modulation)

L'encodage DSD : concurrent direct du PCM, le DSD ou "Direct Stream Digital" est arrivé à la fin des années 90, développé notamment pour la technologie SA-CD (Super-Audio CD) par Sony et Philips.  Le flux numérique subissait une compression sans perte DST (Direct Stream Transfer) car cela permettait d'accroître la capacité de stockage des disques SA-CD. Concrètement, le DSD consiste en une méthode de stockage d'un signal de modulation delta-sigma. Cela consiste en un encodage du signal à très haute fréquence d'échantillonnage sur une profondeur de 1 bit. Ce bit unique autorise tout de même une dynamique de 120dB sur une bande passante jusqu'à 1000kHz. Le DSD64 (2.8MHz), par exemple, correspond à un taux d'échantillonnage 64x supérieur à celui du CD. C'est le même principe pour le DSD128 (5.6MHz), DSD256 (11.2MHz), DSD512 (22.6MHz), DSD1024 (45.2MHz), etc. Cette technique n'utilisant pas de filtre brutale pour les hautes fréquences, elle permet une haute fidélité de restitution du signal original en concervant les harmoniques supérieures. Et elle permet de simplifier le travail de conversion des ADC ou des DAC. Cette méthode a notamment permis la commercialisation du multicanal à l'époque, puisque le format surround 5.1 n'était disponible qu'en format DVD-Audio et SA-CD pour le grand public, là où le CD classique n'était limité qu'à deux canaux par manque de place. De nombreux albums sont même sortis avec un vrai mixage 4.0 canaux pour obtenir des effets de spatialisation (des albums de Bjork, Aerosmith, Depeche Mode, Elthon John, et encore bien d'autres pour n'en citer que quelques uns). Vous trouverez quelques sites qui référencent de nombreuses productions multicanales tels que surrounddiscography.com ou encore sa-cd.net

Le DSD (Direct Stream Digital)

L'encodage DSD DoP (DSD over PCM) : le DSD DoP utilise en fait un conteneur (une trame) PCM pour le stockage d'un flux DSD. Cela permet techniquement d'inscrire un flux binaire dans une interface ne traitant que du PCM. Le DSD natif étant souvent exclusivement supporté via connexion USB. Le DSD DoP permet, quant à lui, aux appareils de supporter des flux DSD bien que leur interface ne soit conçue uniquement pour un flux PCM. C'est notamment le cas avec les connexions optiques Toslink, SPDIF coaxial. Le protocole de traitement du DSD DoP est réalisé en Bit-Perfect et permet de retrouver le flux DSD original sans perte. Le DSD DoP n'est donc en aucun cas un "sous-DSD". Aujourd'hui, la plupart des appareils disposent d'une connexion USB compatible avec le DSD natif.

Le DSD DoP (DSD Over PCM)

Le MQA : le MQA (Master Quality Authenticated) est quant à lui un codec audio apparu en 2014 basé sur l'encodage PCM et utilisant le format FLAC. Ce codec a spécialement été conçu pour le streaming  et le téléchargement de fichiers, puisque son principal avantage est qu'il permet un niveau de compression extrême (jusqu'à 50% d'un fichier HD traditionnel). Le flux original voit son échantillonnage réduit à 48kHz pour une quantification de 17Bit. Cela est possible grâce à une technique consistant à garder un noyau de 13bit compréssé sans perte et 4bit de métadonnées compréssé avec perte servant à reconstituer un flux 24Bit 96kHz. Le réel avantage est donc plutôt du côté des plateformes de Streaming. Les avis divergent concernant l'utilisation de cette technologie et sur le réel gain en tant qu'auditeur (on se souvient notamment de l'avis de l'artiste Neil Young à ce sujet). Techniquement, le MQA est représenté par différentes couches qui seraient encapsulés par compression pour ensuite être "redépliées" entièrement et permettre théoriquement la restitution d'un format haute résolution. Cependant, cela ne serait possible qu'avec les technologies propriétaires et compatibles de la marque. Dans le cas où votre appareil ne serait pas compatible, seule la première couche équivalente à une compression avec perte serait prise en charge par votre appareil grâce à son format universel FLAC. Si vous désirez en apprendre plus sur le MQA, nous vous invitons à visiter l'article d'Audiophile Style sur le sujet qui répondra éventuellement à vos questions techniques plus poussées.

Le MQA

Conclusion

Pour conclure sur ce sujet qui divise la communauté audiophile, nous vous invitons à réaliser vous même des tests avec différents fichiers et votre installation Hi-Fi. Nous vous proposons également cette citation de Brian Eno qui donne à réfléchir :

"Tout ce que vous trouvez bizarre, laid, inconfortable et désagréable à propos d'un nouveau support deviendra certainement sa signature. La distorsion du CD, le tremblement de la vidéo numérique, le son merdique du 8-bit - tout cela sera chéri et imité dès qu'il sera possible de l'éviter. C'est le son de l'échec : une grande partie de l'art moderne est le son de choses qui échappent à tout contrôle, d'un médium poussé à ses limites et qui se désagrège. Le son déformé de la guitare est le son de quelque chose de trop fort pour le médium censé le porter. Le chanteur de Blues à la voix fêlée est le son d'un cri émotionnel trop puissant pour la gorge qui le libère. L'excitation du film granuleux, du noir et blanc décoloré, est l'excitation d'être témoin d'événements trop importants pour le support chargé de les enregistrer."

Laisser un commentaire Leave a Reply

Vous devez être connecté pour publier un commentaire.

Rechercher dans le blog

Catégories blog

Derniers commentaires

Précédent
Suivant

Aucun produit

To be determined Frais de port
0,00 € Dont TVA
0,00 € Total

Les prix sont TTC

Aller au panier