
Guide
Ce que le taux d’échantillonnage dit sur la musique numérique et la qualité du son
par David Lee
Les meilleurs appareils coûtent extrêmement cher, surtout dans le domaine de l’audio. Ce n’est pas un problème en soi, tant qu’on entend la différence. Mais avec les progrès technologiques, c’est de moins en moins le cas, et notre cerveau finit par nous jouer des tours.
Il existe des casques d’écoute à cinq francs suisses. Si on est prêt à débourser un peu plus, on obtient déjà une qualité nettement supérieure. Et lorsqu’on augmente encore notre budget, disons à 150 francs suisses, le son commence à être vraiment bien. À 500 francs aussi, et à 2000 francs suisses, etc, etc.
Bienvenue dans le haut de gamme : là où les prix s’envolent. Mais quelle est la performance de ces articles hors de prix ?
En général (et pas seulement pour les produits audio), la performance n’augmente pas en fonction du prix. Dans la catégorie supérieure, le prix augmente au contraire de manière disproportionnée par rapport au résultat. Sur un graphique, la courbe ressemble à peu près à ça :
Cela signifie tout simplement que les produits haut de gamme ont généralement un moins bon rapport qualité-prix que les produits de milieu de gamme, ce dont se fiche leur public cible. Ceux qui veulent du haut de gamme et qui en ont les moyens le savent et l’acceptent. Après tout, on est prêt à tout quand on aime ; et la musique est la plus grande et la plus longue histoire d’amour de bien des gens.
Jusqu’ici, tout va bien. Si le casque à 2000 francs suisses sonne un tout petit mieux que celui à 500 francs et que son acheteur trouve qu’il en vaut la peine, où est le problème ?
Il est ailleurs. À un moment donné, améliorer les performances ne sert plus à rien, puisqu’on n’entend plus la différence. Eh non, l’être humain ne perçoit pas tous les sons. Pour rester sur le sujet des écouteurs, le casque que je teste en ce moment, le Sennheiser HD 660 S2, peut reproduire des fréquences allant jusqu’à 41,5 kHz. Dans une certaine mesure, il est donc meilleur que mon Beyerdynamic DT 990 Pro, qui ne reproduit « que » des sons allant jusqu’à 35 kHz. Seulement, personne n’entend 35 kHz... Même les oreilles de chauve-souris n’entendraient pas la différence, puisque ces fréquences ultrasoniques ne sont pas enregistrées dans les formats de musique les plus courants et ne sont donc pas jouées.
Dans de nombreux secteurs, la technique est arrivée à un point où les nouvelles améliorations n’apportent plus rien. La résolution de nombreux smartphones est supérieure à ce que je peux voir sans loupe ni lunettes. Qui est capable de percevoir un taux de rafraîchissement de plus 400 Hz ? Ou plus d’un milliard de nuances de couleurs sur les écrans HDR ? Les exemples ne manquent pas, mais revenons au domaine de l’audio. Pour les casques d’écoute, l’indication de la fréquence n’est pas très pertinente, ce n’est pas un argument de vente. Elle ne fait qu’être mentionnée dans les caractéristiques des produits. Les taux d’échantillonnage, en revanche, sont un vrai sujet de controverse.
En effet, les CD et de nombreux formats audio non compressés ont un taux d’échantillonnage de 44,1 kHz. Or cette valeur n’est pas choisie au hasard puisque, d’après le théorème de Nyquist-Shannon, le taux d’échantillonnage doit être deux fois plus élevé que la plus haute fréquence reproduite. La qualité CD permet donc de reproduire correctement les fréquences jusqu’à un peu plus de 22 kHz, ce qui suffit amplement pour l’oreille humaine. Les personnes de 60 ans n’entendent pratiquement plus au-delà de 10 kHz, les bébés jusqu’à 20 kHz.
Cela dit, les taux d’échantillonnage plus élevés ne sont pas complètement inutiles car, grâce à eux, on obtient des fréquences plus élevées, mais aussi des filtres de reconstruction plus précis. Le filtre de reconstruction détermine la manière dont les ondes sonores analogiques sont générées à partir des données numériques. Contrairement aux ultrasons, les meilleurs filtres sont audibles (du moins en théorie) mais, là aussi, les progrès techniques ont résolu le problème depuis longtemps. Aujourd’hui, même les convertisseurs numériques-analogiques (DAC) les moins chers maîtrisent des taux d’échantillonnage de 96 kHz. En voici un exemple. Et les DAC intégrés aux ordinateurs sont eux aussi à ce niveau.
Si vous pensez encore que ce n’est pas suffisant, vous pouvez obtenir le quadruple (384 kHz), à un prix ridicule.
Lors de l’évaluation d’un DAC, le taux d’échantillonnage n’est qu’un facteur parmi d’autres. Cela dit, on pourrait dire la même chose de la profondeur de bits et d’autres caractéristiques. Aujourd’hui, aucun DAC ne fournit une piètre qualité sonore. Pour cette catégorie d’appareils, j’adapterais mon diagramme prix/performance comme ceci :
Vous pouvez certes continuer à dépenser 5000 francs suisses ou 65 000 USD (prix catalogue du Boulder 2120) (en anglais) pour un DAC. Vous obtenez une multitude de connexions, de réglages et de fonctions supplémentaires. La majeure partie de l’énorme différence de prix se justifie quand même par la promesse d’un son encore meilleur. Mais est-ce que ces améliorations sont audibles ?
Des tests scientifiques (en anglais) ont été réalisés en aveugle pour vérifier tout ça. Et devinez quoi ? Le résultat est presque toujours le même. La plupart des gens ne sont pas capables de reconnaître de manière fiable différents taux d’échantillonnage supérieurs à 44,1 kHz. De toute façon, personne n’entend les ultrasons, et seules les personnes formées entendent les différences des filtres de reconstruction modernes, et ce dans des situations bien précises.
L’affaire est close, non ? Eh bien pas du tout !
Dans une étude (en anglais) publiée en 2000, des chercheurs affirment avoir découvert que les gens n’entendent pas consciemment les ultrasons, mais qu’ils y réagissent inconsciemment, sur le plan psychique et physique. Or, c’est difficile à prouver. Les résultats ne sont pas fiables et n’ont pas été confirmés depuis. Et pourtant, les audiophiles aiment bien les citer. On a même créé un buzzword pour décrire ce phénomène : l’effet hypersonique.
Et les filtres ? On peut mettre en doute (en allemand) beaucoup d’éléments des tests en aveugle réalisés à des taux d’échantillonnage élevés. Les morceaux de musique seraient mal choisis, le volume ne serait ajusté qu’à l’oreille et non avec des appareils de mesure, ou l’équipement ne serait pas assez bon pour mettre en valeur les différences.
C’est parce que de telles objections sont constantes que de nouveaux tests en aveugle (en anglais) continuent à être réalisés. Un jour, quelqu’un finira enfin par découvrir qu’on entend tout de même une différence. Dans l’étude (en anglais) qui le montre, il a fallu lire des signaux de test particuliers, notamment du bruit blanc. Il n’existe aucune preuve concluante pour les morceaux musicaux.
Comme toujours, on peut choisir les études scientifiques qui correspondent à notre point de vue personnel, et c’est sans doute l’une des raisons pour lesquelles ces discussions ne finissent jamais.
Prouver que quelque chose n’apporte rien est impossible. Même si l’argumentation est très solide, quelqu’un peut toujours prétendre qu’il (ou, beaucoup plus rarement, elle) entend tout de même une différence.
Et la personne sera sincère, car celles qui affirment entendre une différence ont tendance à dire la vérité.
Derrière des indications techniques simples comme « 96 kHz » se cachent des caractéristiques techniques difficiles à comprendre pour les profanes, et le manque de connaissances approfondies mène souvent à de fausses hypothèses. Il semble donc logique et raisonnable de se fier à sa propre audition. En fin de compte, l’important, c’est de savoir si les sons que je perçois sont de meilleure qualité ou pas, non ?
Eh bien non, ce n’est pas si simple que ça, car nous n’entendons pas seulement avec nos oreilles, mais aussi avec notre cerveau. Celui-ci complète les informations manquantes ou en invente. Lorsque vous entendez un mot différent de celui que votre interlocuteur a prononcé, c’est que votre cerveau a mal complété quelque chose.
En fait, le cerveau essaie constamment de trouver un sens à ce que lui fournissent les organes des sens. Lorsque je teste deux casques ou deux DAC différents, mon cerveau essaie immédiatement de comprendre la différence. S’il a décidé de reconnaître la différence entre un DAC à 100 francs suisses et un DAC à 1000 francs suisses, il le fera, que mes oreilles l’entendent réellement ou non. L’expert en audio Amir Majidimehr décrit ses expériences de manière très similaire dans cette vidéo, de la minute 31 à la minute 34.
Voilà pourquoi les chercheurs travaillent avec des tests en aveugle, c’est pour éliminer l’effet placebo. Parfois, ils mènent même des études en double aveugle. Dans ce cas, la personne qui guide les sujets ne sait pas non plus qui est testé. On procède de cette manière, car ces connaissances pourraient influencer inconsciemment leur comportement, et donc les sujets.
Chez moi, je ne peux pas effectuer un test en aveugle, puisque je sais quel casque je porte. Pour comparer deux DAC en aveugle, je devrais avoir deux appareils sources et deux casques identiques, et diffuser la même musique simultanément sur les deux systèmes. Et même là, je sais quels appareils je compare, et quelles sont leurs promesses.
Tout cela vaut aussi pour les nombreuses personnes qui écrivent des critiques dithyrambiques sur des produits audio à l’utilité franchement discutable. Prenons le commutateur de réseau audiophile d’Aqvox. Comme le montre Linus Tech Tips, Aqvox a pris un routeur D-Link, y a collé un autre logo, y a ajouté plein d’hologrammes un peu fous et une pierre de quartz, avant de commercialiser le tout avec beaucoup de blabla ésotérique, comme si c’était le nec plus ultra. À partir de la minute 15:04, on nous explique la raison pour laquelle un commutateur de réseau audiophile ne peut pas fonctionner, même en théorie.
Pourtant, le produit a de nombreux fans, et il a obtenu des avis enthousiastes. C’est dingue tout ce que les testeurs entendent (en anglais) ! On parle d’un « gain en taille de scène, en richesse de détails, en dynamique et en clarté », « les instruments gagnent en substance, semblent plus colorés et mieux définis. En même temps, un espace magnifique se forme autour des différents instruments. » Et surtout, « les caractéristiques sonores de l’AQVOX Switch décrites ci-dessus sont immédiatement et facilement audibles ». La nouvelle version serait même supérieure (en anglais).
Les deux comptes rendus de test cités rapportent aussi une préoccupation obsessionnelle pour l’équipement et des contacts avec le fabricant. L’un des testeurs s’est laissé amadouer durant une longue conversation téléphonique. C’est l’inverse d’un test à l’aveugle, puisqu’on prépare soigneusement le cerveau à ce à quoi il doit s’attendre. Ceux qui testent de cette manière ne peuvent pas dire qu’ils se fient seulement à leur ouïe !
Même dans les tests à l’aveugle de Linus, deux et trois sujets sur dix indiquent entendre une différence. 80 % préfèrent le commutateur non modifié à 30 dollars au commutateur audiophile à 800 dollars. Le simple fait de savoir qu’un élément censé améliorer la qualité a été activé fait qu’on entend un changement.
Lorsque les différences clairement audibles disparaissent, elles laissent la place aux facteurs psychologiques. Les fabricants d’appareils audio haut de gamme sérieux sont donc confrontés à deux problèmes. Premièrement, tous leurs efforts n’apportent aucune valeur ajoutée clairement perceptible. Même si la performance mesurable est meilleure que celle de la concurrence moins chère, elle n’est plus perceptible.
Deuxièmement, l’effet d’un tel produit ne peut plus être distingué de celui de produits douteux, et ce n’est pas ce qui manque sur le marché ! La réputation du secteur du haut de gamme en prend un coup. J’ai donc dessiné une troisième version de mon schéma prix-performance. Prenez-la avec des pincettes :
On voit que ce sont justement les produits les plus performants qui sont confondus avec les plus douteux. Ironique, non ? Pas étonnant que le sujet soit si controversé !
D’ailleurs, je teste actuellement un DAC de RME Audio coûteux. Le fabricant me semble très sérieux, et j’entends effectivement une différence par rapport à mon DAC à 70 francs suisses, mais là encore, ce n’est pas en test en aveugle. Mon cerveau invente-t-il une différence ? Je vous tiendrai au courant quand j’en saurai plus.
Photo d’en-tête : amplificateurs et haut-parleurs au BAV Hi-End Show, à Bangkok. Les Kharma Enygma Veyron 2 Diamond aux bords de l’image, à gauche et à droite, coûtent 375 000 euros. Source : Shutterstock/BrostockMon intéret pour l'informatique et l'écriture m'a mené relativement tôt (2000) au journalisme technique. Comment utiliser la technologie sans se faire soi-même utiliser m'intéresse. Dans mon temps libre, j'aime faire de la musique où je compense mon talent moyen avec une passion immense.