corrections acoustiques hifi

à l'égaliseur numérique

Behringer DEQ2496

 

Vahé Zartarian

janvier 2010, complété novembre 2010


Autres pages consacrées à la musique:

 


 

 

prologue

 

science et ésotérisme

J’ai toujours trouvé paradoxal le monde de la hifi, d’autant plus paradoxal que l’on monte en gamme : d’un côté les technologies les plus pointues pour parfaire le traitement des signaux ; de l’autre une foule de gadgets qui relèvent parfois carrément de l’ésotérisme et de l’autosuggestion. C’est que les systèmes d’écoute conçus en chambres sourdes pour être parfaits acoustiquement parlant procure souvent à l’auditeur, une fois installés dans son salon de musique, de telles insatisfactions voire désagréments qu’il fait ce qu’il peut pour retrouver un son satisfaisant et justifier à ses propres yeux son investissement. Cela passe :
- soit par une égalisation déguisée via des câbles, des supports, des cavités résonantes, etc., forcément inadéquate puisque rien n’est maîtrisé ;
- soit par un rejet de la technologie et un retour aux valeurs ‘sûres’, comme le vinyle et le tube ; autrement dit on préfère payer (souvent très cher) des appareils qui produisent des distorsions colossales et on est obligé de se justifier en qualifiant lesdites distorsions de ‘musicales’ !
Bien sûr on a tous les droits, et si les résultats à l’écoute sont satisfaisants, pourquoi pas. Mais ne qualifions plus ça de haute fidélité !

 

problèmes

Concrètement, l’audiophile est principalement confronté à deux types de problèmes :
1. du côté du grave, soit il n’y en a pas du tout, soit il est envahissant ;
2. la fatigue auditive.
Le premier relève le plus souvent de l’acoustique pure : mauvais placement des enceintes et phénomènes de résonances (même si dans certains cas la disparition du grave peut être due à une écoute à un niveau trop bas sans correction loudness : j’y reviendrai).
Le second relève de la psychoacoustique, principalement :
- l’accumulation d’harmoniques dans la zone de sensibilité maximale de l’oreille ;
- des déséquilibres du spectre, combinaison entre la réponse fréquentielle du couple sono-salle et de la courbe de sensibilité de l’oreille à un niveau d’écoute donné ; ce déséquilibre oblige soit à ‘tendre’ l’oreille inconsciemment pour retrouver des informations enfouies (de même que dans une salle bruyante l’on tend l’oreille pour suivre une conversation particulière), soit à augmenter le volume pour les faire ressortir mais au prix d’une accentuation des déséquilibres puisque toutes les autres fréquences sont aussi augmentées ; dans tous les cas cela se traduit par de la fatigue auditive.

 

solutions

Que ne s’est-on attaquer directement à ces problèmes plutôt que recourir à des distorsions musicales ou des gadgets ésotériques ? Je vois au moins deux raisons.
La première est la méconnaissance. Les concepteurs, s’ils sont indéniablement compétents en acoustique et traitement du signal, semblent souvent ignorer tout de la psychoacoustique. Quant aux auditeurs-mélomanes-audiophiles, ils ne connaissent en général ni l’une ni l’autre. Tous disent se fier à leurs oreilles. Certes. Mais comment obtenir des résultats valables et surtout durables si l’on ne sait pas comment elles fonctionnent ? savoir, par exemple, que leur sensibilité varie avec le niveau, que l’attente influence l’écoute (remarquons l’absence quasi totale de tests d’écoutes en aveugle dans les comparatifs qui fleurissent dans les magazines)…
La seconde raison qui a empêché de s’attaquer directement à ces problèmes est l’absence d’outils pour réaliser de telles corrections. Quoique ! En fait il en existe, et depuis longtemps, mais pas dans le domaine de la hifi, dans celui de la sonorisation et de l’enregistrement : les égaliseurs. Domaines pourtant connexes mais qui à ma connaissance n’ont jamais bien communiqué. Aucun nom ne me vient de constructeur travaillant dans ces différents domaines !

Il y a trois types d’égaliseurs que l’on peut utiliser en hifi entre une source et le préampli :

1. les égaliseurs graphiques analogiques classiques 2x31 bandes
Ils peuvent apporter un réel confort d’écoute (j’ai testé sur mon système un Behringer DEQ1024) en atténuant les résonances, corrigeant les déséquilibre spectraux, particulièrement dans la zone cruciale de sensibilité maximale de l’oreille, et effectuant des corrections loudness. Ils présentent toutefois quelques faiblesses qui, selon moi, les réservent à des chaînes hifi premiers prix, c’est-à-dire ne se caractérisant pas par une transparence très poussée ni une descente abyssale dans l’extrême grave :
- une perte de transparence qui, même si elle est légère, est parfaitement audible sur un système de qualité (due semble-t-il à des phénomènes de distorsion de phase) ;
- une précision insuffisante du réglage des fréquences (les fréquences sautent par tiers d’octave contre 1/60 d’octave sur un paramétrique ; les bandes ont une largeur d’un tiers d’octave alors qu’elle est réglable de 1/10 à 1 voire plus sur un paramétrique) ; cela rend difficile une correction des résonances et un réglage parfait du grave.

2. les égaliseurs paramétriques analogiques
De tels appareils sont plus rares, réservés en général au mastering des enregistrements. Ils n’induisent pas de distorsions de phase et permettent un réglage très précis des fréquences des filtres et de leur largeur. Le hic est qu’ils sont très chers. Sans compter que le nombre de filtres est limité (3 à 5 en général), ce qui est très insuffisant pour corriger tous les problèmes acoustiques.

3. les égaliseurs numériques
Conçus pour le mastering et/ou la gestion de systèmes de diffusion. On en trouve chez TC-electronic (modèles finalizer et EQ-station), DBX (drive-rack), Behringer (DEQ2496). Il s’agit en fait de calculateurs dédiés au traitement du signal. Ils sont très transparents car travaillant en 24bits-96kHz (contre 16bits-44.1kHz pour le CD). Comme les calculateurs aujourd’hui sont très puissants, et comme une fois un signal numérisé on peut procéder dessus à toutes les opérations qu’on veut sans introduire de distorsions, ces appareils permettent effectivement de tout faire. En particulier ils combinent égaliseur graphique 2x31 bandes et égaliseur paramétrique 2x10 bandes. L’idéal donc en hifi pour procéder à toutes les corrections qu’on veut.
Sauf qu’ils sont ou bien très chers (plusieurs milliers d’euros) ou bien pas au niveau des exigences d’un audiophile. Le DEQ2496 (www.behringer.com), tout en étant très recommandable en l’état à moins de 300€, pêche tout de même par la qualité insuffisante de son alimentation et de ses circuits d’entrées/sorties analogiques (il dispose aussi d’entrées/sorties numériques mais je ne peux m’en servir dans ma configuration). Tout problème ayant une solution, plusieurs sociétés vendent des DEQ2496 modifiés, qui en font au passage de véritables DAC audiophiles. Mon choix s’est porté sur un DEQ modifié par Simon Ashton (http://www.audiosmile.co.uk).
543£, soit 628€ au taux de change à la date de mon achat (05/01/2010), ne sont vraiment pas grand chose quand on voit tout ce qu’on peut faire avec, quand on écoute les résultats (faible bruit, grande transparence, corrections acoustiques et psychoacoustiques efficaces), et qu’on compare aux prix des gadgets à l’utilité plus que douteuse. Pour ceux qui y trouveraient à redire, considérant que ce n’est pas assez cher ou pas assez audiophile, il faut savoir qu’y a de vraies solutions audiophiles, évidemment dans une toute autre gamme de prix : par exemple les produits Tact (www.tactlab.com) ou Lyngdorf (www.lyngdorf.com). Il n’en sera pas question ici.

 

sommaire

Entre les imperfections de l’ampli, celles des enceintes, celles de la salle, et les problèmes issus de leur couplage, nulle surprise si la courbe de réponse de l’ensemble est loin d’être linéaire. Cela signifie que ce qui est diffusé n’est pas conforme à ce qui a été enregistré. Ajouté le fait que la perception des différentes fréquences change selon le niveau d’écoute, et l’on en arrive à ceci : ce qui est entendu n’est pas conforme au signal source.
Une correction acoustique a pour but de rendre la réponse globale du système salle+sono+auditeur la plus fidèle possible. Il faut tout de même être lucide : un égaliseur, aussi sophistiqué et de bonne qualité soit-il, ne saurait résoudre tous les problèmes. Il n’est qu’un facteur parmi d’autres, en particulier : la géométrie de la salle, les matériaux qui la constituent et qui la recouvrent, les objets qui l’occupent, la position des enceintes, la place d’écoute. Il faut commencer par agir sur tout ça (cf. http://www.lafontaudio.com ). Si on le peut, et sachant que ça va corriger certains problèmes (notamment les résonances et le niveau des graves) mais pas tous (pas ceux qui relèvent de la psychoacoustique). Et il arrive qu’on ne puisse pas. C’est mon cas à Chaudon : parce que la pièce est petite et qu’elle sert aussi de passage, je ne peux pas agir sur grand chose : ni sur la géométrie, ni sur les meubles, ni sur la position d’écoute, quant à la position des enceintes elle offre une faible marge de manœuvre ! Dans ces conditions mon seul recours est l’égalisation.

La suite de ce document comprend trois parties :

- la première est consacrée à quelques rappels d’acoustique et de psychoacoustique pour comprendre ce qu’il y a à faire

- la deuxième examine ce qui peut être fait avec un DEQ2496 et comment le faire

- la troisième est l’application de tout ça à mon actuel salon de musique

 


 

rappels d’acoustique et de psychoacoustique

 

 

ondes stationnaires

Toute cavité résonante est le théâtre d’ondes stationnaires. C’est grâce à ça que les instruments de musique émettent des notes à des hauteurs précises. En quelque sorte se produit un filtrage : toutes les fréquences qui ne sont pas accordées à la cavité s’atténuent très vite et donc s’éliminent ; sont au contraire amplifiées les fréquences dites de résonance. Écouter de la musique dans une pièce revient donc à écouter depuis l’intérieur d’un énorme instrument de musique qui émet ses propres notes lorsqu’il est acoustiquement excité (l’excitateur étant ici un haut-parleur au lieu d’un plectre, d’un archet ou d’une anche). Nulle surprise donc si les résultats musicaux ne sont pas toujours conformes aux attentes, particulièrement dans le grave où se situent généralement ces résonances étant données les dimensions habituelles d’une pièce d’écoute.

Précisément, entre deux parois parallèles distantes de L et réfléchissant les ondes acoustiques peuvent se former des ondes stationnaires à la fréquence v/2L, où v est la vitesses du son (environ 340m/s, variant avec la température), plus ses harmoniques, c’est-à-dire les multiples entiers de cette fréquence.
Voici en gros ce qui se passe :
- l’énergie rayonnée par un haut-parleur part dans diverses directions, et donc forcément une partie se propage selon un axe de la pièce ;
- sur la paroi, l’onde est réfléchie et repart dans la direction d’où elle vient ;
- au retour, elle croise les ondulations suivantes qui sont elles en route vers la paroi et leurs énergies se combinent :
- elles s’annihilent lorsqu’elles sont exactement opposées (la pression devient nulle et l’on parle d’un nœud de l’onde stationnaire),
- elles s’additionnent lorsqu’elles sont exactement superposées (on parle d’un ventre)
- le jeu se poursuit sur l’autre paroi, et ainsi de suite.
Tout se passe évidemment très vite, à la vitesse du son, si vite que l’on n’entend pas la montée d’énergie progressive de l’onde stationnaire mais son régime établi.

Résultats :
1. une augmentation considérable de l’énergie de l’onde à cette fréquence (comparativement aux fréquences voisines qui ne sont de ce fait plus entendues) ;
2. mais une distribution très inégale de cette énergie dans la pièce, avec des points (les nœuds) où l’on n’entend plus rien, d’autres (les ventres) où l’on n’entend plus que ça, et entre, toutes les situations intermédiaires.
L’expérience est facile à faire de se placer en différents points d’écoute, en s’intéressant particulièrement aux parois et aux coins…

Conséquences pratiques :
1. Un égaliseur ne va évidemment rien changer à la résonance d’une salle, laquelle résulte de sa géométrie. Tout ce qu’il peut faire, c’est filtrer les fréquences qui excitent les modes propres de la salle. Ces résonances existent toujours, mais n’étant plus excitées, les ondes stationnaires ne se forment plus ou du moins à un niveau suffisamment faible pour ne plus constituer une gêne.
2. Les matériaux dont sont faites habituellement les parois réfléchissent mieux les graves que les aigus, d’où une atténuation rapide des fréquences élevées et des problèmes de résonance qui se manifestent surtout dans les graves. Cela se traduit  à l’écoute par une amplification considérable prenant la forme d’un gros ronflement (au point parfois de faire vibrer portes et fenêtres, et de voir le haut-parleur de grave faire de telles excursions qu’on se demande s’il ne va pas être expulsé du caisson !). Il arrive aussi qu’en certains points précis on n’entende plus du tout ces fréquences.
3. Si le filtrage d’une résonance s’entendra bien de partout (les fenêtres ne vibreront plus !), en revanche une correction précise, c’est-à-dire une linéarisation de la réponse sono-salle dans le grave, ne sera valable qu’au point d’écoute.

Avoir un bon réglage du grave est important à plusieurs titres :
1. C’est là que se situe l’essentiel de l’énergie de la musique. Exemples glanés sur le web : dans american Life de Madonna, 24% de l’énergie acoustique totale est en dessous de 50Hz, et dans le baiser d’Alain Souchon, c’est 15% de l'énergie totale qui se trouve là. Sachant que peu de systèmes de diffusion passent grand chose en dessous de 50Hz, on imagine ce qu’on perd… Bien sûr, d’après le phénomène de hauteur liée à la périodicité, le cerveau est capable de reconstituer des notes graves en l’absence de la fondamentale grâce aux partiels. Mais d’une part cela ne vaut que pour des notes, c’est-à-dire des signaux acoustiques caractérisés par une hauteur précise, d’autre part cela reconstitue la sensation de hauteur mais pas l’énergie.
2. Les défauts dus aux résonances s’entendent très bien dans le grave, souvent trop !
3. Il n’empêche que les corrections sont difficiles à faire à l’oreille. En particulier lorsqu’il y a un caisson de basses. En l’absence d’un égaliseur pour réduire drastiquement le niveau des résonances, on a tendance à placer trop haut la fréquence de coupure et trop bas le volume du caisson. Cela ne sonne pas trop bien. Tandis que lorsque le raccord est bien fait entre le caisson et les enceintes principales, on constate que la fréquence de coupure a été abaissée et le niveau sonore du caisson augmenté.

 

 

courbe cible

Si l’on arrive à rendre parfaitement plate la courbe de réponse sono-salle sur tout le spectre, eh bien l’on n’est pas au bout de nos peines car le résultat sonne horriblement ! Je n’ai pas fait l’expérience mais tous ceux qui l’ont faite disent à peu près la même chose : c’est agressif, dénué de basses, pas naturel du tout. Je l’imagine bien. Où est l’erreur ?
Lorsqu’un son voyage dans l’air les aigus s’atténuent plus vite que les graves. Ce changement d’équilibre spectral est d’ailleurs un moyen qu’utilise notre cerveau pour évaluer la distance d’une source connue. Il est facile de vérifier l’existence du phénomène avec une chaîne hifi : écouter successivement la même séquence très près des enceintes puis le plus loin possible.
Nous sommes donc habitués à percevoir les différentes fréquences avec une courbe légèrement descendante en allant vers les aigus. Voilà au moins un point sur lequel tout le monde s’accorde. C’est quand on veut préciser de combien la courbe doit descendre que les difficultés commencent. Car des courbes cibles il en existe des tas. Par exemple :

1. Brüel et Kjaer n°1 : plate de 20Hz à 400Hz puis descendant linéairement de 1dB par octave de 400Hz à 20kHz

2. Brüel et Kjaer n°2 : plate de 20Hz à 200Hz puis descendant linéairement de 0.5dB par octave de 200Hz à 20kHz

3. Brüel et Kjaer n°3 : plate de 20Hz à 100Hz puis descendant linéairement de 0.5dB par octave de 100Hz à 20kHz

4. la norme ISO2969 pour auditoriums et salles de cinéma recommande une courbe plate de 20 à 2000Hz puis descendant linéairement de 3dB/octave de 2000 à 20.000Hz (soit une baisse de 10dB en tout)

5. la fonction AUTO-EQ du DEQ2496 dispose d’une option room correction qui modèle une courbe avec une pente de 1dB/oct

6. Tact de son côté propose sur ses ampli de nombreuses courbes, toutes descendantes, avec souvent un extrême grave proéminent…

La conclusion est claire : il n’y a pas de courbe cible idéale valable pour tous les goûts en tous lieux ! Ceci dit, comment faire en pratique pour choisir sans avoir à passer des heures et des heures en tests ? Voici quelques lignes directrices :

- plus la pièce est petite, plus la décroissance doit être forte du grave à l’aigu ;

- plus on écoute près des enceintes, plus la décroissance doit être forte du grave à l’aigu ;

- au-dessus de 1 ou 2kHz, essayer d’aller dans le sens de la réponse de la pièce et éviter les corrections démentielles pour obtenir à n’importe quel prix tel ou tel résultat.

Dans un second temps, on peut peaufiner, par exemple :
Rehausser un peu la courbe dans les aigus pour une sonorité plus brillante. Toutefois ce n’est pas la peine de relever exagérément l’aigu très extrême. D’abord il convient de vérifier qu’il est bien entendu (c’est facile avec des séquences de balayage de 20Hz à 20kHz) : personnellement je n’entends plus grand chose au-delà de 16kHz. Ensuite il faut vérifier la qualité de cet aigu, certains convertisseurs DA produisant des effets de moirage. Sans compter que cet aigu extrême ne vaut de toute manière pas grand chose en qualité CD 16bits-44.1kHz.

Si on les apprécie et qu’on a bien corrigé les résonances boum-boum, on peut rehausser un peu les graves. Mais attention :
- inutile de prolonger une courbe en dessous de la fréquence la plus basse que le système est capable de reproduire ;
- ne pas augmenter exagérément les graves si l’ampli et les enceintes ne sont pas capables d’encaisser : risque de casse !

On peut choisir aussi de creuser un peu le médium ou, ce qui revient au même, mettre en avant le grave et l’aigu. C’est intéressant avec des enceintes bas rendement qui passent mal la puissance, ou si l’on a l’habitude d’écouter à niveau peu élevé. Cela revient en fait à intégrer une correction loudness. Voilà qui fait le lien avec la psychoacoustique.

 

 

corrections psychoacoustiques

non-linéarité des courbes de sensibilité de l’oreille

L’expérience est très facile à faire avec les séquences de balayage de fréquences :
1. lancer la séquence 2800-3050-3300-3550 (ceci fait référence au cd test que j’ai réalisé ; il est décrit dans appareils_musiques-ea.pdf) et régler le volume de façon qu’elle soit tout juste audible ;
2. sans toucher au volume, écouter les autres séquences et constater lesquelles sont audibles et lesquelles ne le sont pas ;
3. augmenter très légèrement le volume et recommencer l’écoute de toutes les séquences…
Sachant que toutes les séquences ont été réalisées au même niveau d’intensité, ceci permet de constater que la sensibilité de l’oreille varie très fortement avec la fréquence et avec le volume : une fréquence d’une certaine intensité va être entendue tandis qu’une autre de même intensité ne le sera pas ; et quand on change le volume d’écoute, le tableau des fréquences entendues et pas entendues change aussi. Les courbes d’isosonie qui relient sensation d’intensité sonore, fréquence, et intensité de l’onde acoustique, récapitulent cela de manière plus précise. Les voici dans leur dernière version ISO226 de 2003 :

 

Conséquences :
1. Les fréquences extrêmes ne sont pas entendues du tout tant que le volume n’atteint pas un certain seuil.
2. Changer le volume d’écoute d’un signal acoustique complexe (c’est-à-dire constitué de nombreuses fréquences) revient à changer son équilibre spectral (c’est-à-dire la manière dont sont entendues les différentes fréquences qui le constituent). Certaines fréquences peuvent même sembler apparaître soudain ou disparaître complètement. Du coup on en arrive à interpréter comme changement de volume de simples modifications de l’équilibre spectral du son.
3. Quand le son est bien équilibré pour un certain niveau d’écoute, diminuer le volume de 3 voire 6dB n’est pas gênant. L’inverse n’est pas vrai car en augmentant le volume certaines fréquences élevées peuvent surgir au premier plan et perturber notablement l’écoute.
4. Lorsqu’on pense : " c’est trop fort ", il faut souvent interpréter : l’augmentation de volume a déséquilibré le spectre, faisant ressortir exagérément certaines fréquences qui elles, et elles seules, sont irritantes par leur intensité et font percevoir l’ensemble comme désagréablement trop fort. Notre perception des changements de volume et l’irritation qui peut en résulter est la plus forte dans la zone de sensibilité maximale 2000-5000Hz, d’où il s’ensuit que diminuer un peu l’intensité dans cette zone permet d’augmenter le volume global sans plus provoquer de gêne.
5. Notre système auditif pardonne plus facilement les défauts d’équilibre à bas qu’à haut volume (peut-être parce qu’il est capable de reconstituer jusqu’à un certain point des fréquences manquantes : cf. le phénomène de hauteur liée à la périodicité). Mais même si le message sonore reste ‘lisible’ (cf. la qualité ‘téléphone’ avec des voix et des intonations reconnaissables malgré une bande passante réduite), il est considérablement dénaturé, surtout pour la musique. C’est dans le grave jusqu’aux environs de 200Hz que se situe la majorité des fondamentales des instruments qui donnent à la musique son assise rythmique et son énergie. Couper cela, et la musique y perd considérablement.

 

correction selon le niveau d’écoute

La disparition des graves et des aigus à faible niveau d’écoute est connue depuis longtemps. Et exploitée depuis presque aussi longtemps : c’est la fonction loudness présente sur de nombreux amplis. Les résultats étant jugés pas toujours du meilleur goût par les audiophiles, elle est rarement mise en œuvre sur les amplis hi-fi moyen et haut de gamme, ce qui interdit pratiquement toute écoute à faible volume sur des enceintes à haut rendement (les enceintes bas rendement qui ne tolèrent pas en général les fortes puissances intègrent souvent dès leur conception un léger retrait du médium par rapport au grave et à l’aigu). Elle reparaît aujourd’hui sur quelques appareils haut de gamme, avancées en psychoacoustique et en traitement du signal aidant.
Pourquoi des résultats pas toujours satisfaisants alors que les courbes de réponse de l’oreille sont bien établies ? En fait pas si bien établies : les courbes actuelles ISO226-2003 présentent des écarts importants avec les plus anciennes, beaucoup moins précises, mais qui ont tout de même, faute de mieux, longtemps servi de référence pour concevoir des correcteurs loudness (courbes de Fletcher-Munson de 1933 et de Robinson-Dadson de 1956 à la base de la norme ISO226-1961).
D’autre part, pour être en mesure d’appliquer une correction, il faut savoir au moins d’où l’on part, c’est-à-dire connaître le niveau de référence auquel a été réalisé le master de l’enregistrement, ce qui est loin d’être toujours le cas. La courbe d’isosonie la plus plate est à 85dB SPL référence à 1kHz, soit par définition 85 phones. Cela devrait être théoriquement le niveau sonore normalisé. C’est le cas pour les films, pas tout à fait pour la musique. En fait, beaucoup d’enregistrements se situent nul ne sait où : cf. tous les vieux enregistrements, cf. les concerts sonorisés à crever les tympans transformés en CD voire en mp3, cf. des instruments descendant très bas dans le grave, là où la plupart des enceintes ne vont pas sans l’appoint d’un caisson de basses…
Et ce n’est pas le seul problème ! Il est difficile en pratique d’égaliser chaque programme musical pour tenir compte à la fois : du niveau d’écoute (lequel est d’ailleurs difficile à évaluer sans expérience ou sans un appareil de mesure), comparativement au niveau pour lequel a été réalisé le master de l’enregistrement (lequel est souvent incertain on l’a dit), sans parler des limites de la sono, de la sensibilité particulière de l’oreille de l’auditeur (les courbes d’isosonie sont des moyennes statistiques), sans parler non plus des écarts importants de dynamiques à l’intérieur d’un même morceau entre passages ppp et tutti fff (c’est pourquoi les appareils les plus récents incluent la dénomination dynamique pour signifier qu’ils adaptent dynamiquement les filtres qu’ils appliquent au contenu instantané du programme).

Malgré tout, il est possible d’obtenir des corrections satisfaisantes avec un égaliseur graphique. Il n’est pas très difficile de programmer quelques courbes correctives à appliquer en cas d’écoute à faible volume sur une chaîne hi-fi telle que la mienne qui n’est pas vraiment conçue pour ça (haut rendement, 92 dB pour 1W à 1m, et courbe de réponse en chambre sourde parfaitement plate). Le but est qu’au moins, dans ces conditions de jeu, elle donne autant à entendre qu’un minuscule baladeur à 30 euros pourvu d’un bass boost ! Considérant que les concepteurs de ces nouveaux appareils ont dû bien étudier la question, autant s’en inspirer. Voici les courbes du Tact qui peuvent servir de point de départ :

1. écoute à +6dB
2. courbe plate, niveau d’écoute de référence
3. écoute à -6dB
4. -12dB
5. -18dB
6. -24dB
7. -30dB
8. -36dB

Les tableaux suivants sont une adaptation des courbes 3 à 7 pour un égaliseur 31 bandes (le signe ~ signifiant une interpolation entre la valeur précédente et la suivante)

 

20

25

31.5

40

50

63

80

100

125

160

200

250

315

400

500

3

+2

+2

~

~

~

~

~

~

+1

~

~

~

~

0

0

4

+4

~

+3.5

~

+3

~

+2.5

~

+2

~

+1.5

~

+1

+0.5

0

5

+7

+6.5

+6

+5.5

+5

+4.5

+4

+3.5

+3

+2.5

+2

~

~

+1

+0.5

6

+10

+9.5

+9

+8.5

+8

+7.5

+7

+6

+5

+4

+3.5

+3

+2.5

+2

+1.5

7

+13

12.5

+12

11.5

+11

+10

+9

+8

+7

+6

+5

+4

+3

+2.5

+2

630

800

1k

1.25

1.6

2

2.5

3.15

4

5

6.3

8

10

12.5

16

20

0

0

0

0

0

0

0

0

0

+0.5

~

+1

+1.5

+2

+3

+3.5

0

0

0

0

0

0

0

0

+0.5

+1

+1.5

+2

+3

+4

+4.5

+5

0

0

0

0

0

0

0

0

+0.5

+1.5

+2

+3

+4.5

+6

+6.5

+7

+1

+0.5

0

0

0

0

0

+0.5

+1

+2

+3

+4.5

+6

+7

+8

+9

+1.5

+1

+0.5

0

0

0

0

+0.5

+1.5

+2.5

+4

+6

+7

+8

+9.5

+10

 

fatigue auditive

J’ai souvent remarqué une certaine fatigue auditive après avoir écouté de la musique sur ma chaîne hifi comparativement à une écoute non sonorisée (je n’éprouve jamais cela non plus lorsque je joue du saxophone, instrument pas vraiment réputé pour ses pianissimos). Cela apparaît sans avoir à pousser exagérément le volume. Parfois cela prend la forme d’une tension physique qui peut être en contradiction avec le genre de musique écoutée. Sans que ce soit éprouvant (ce n’est quand même pas comme passer une heure devant un mur d’enceintes à un concert rock), c’est gênant pour moi dans la mesure où cela fait perdre la sensation d’immersion dans le son que j’apprécie tant, un peu comme lorsqu’on réalise que l’eau du bain a refroidi et que ce n’est plus si agréable d’y rester. J’ai fini par identifier plusieurs causes à cette fatigue : l’une concerne une mise en avant du médium et sera traitée dans un prochain paragraphe, l’autre se situe dans les aigus et fait l’objet de celui-ci. Ce problème des aigus se scinde lui-même en deux: problème à la prise de son et problème à la reproduction.

prise de son
Le problème des aigus
commence dès la prise de son. J'ai fait cette découverte lors de mes recherches d'un micro pour enregistrer mon saxophone: les courbes de réponses de la plupart des micros sont loin d'être linéaires, avec une tendance générale à une remontée dans les aigus. Deux exemples:
- le SM58 de Shure, micro de scène quasi universel pour la voix (mais parfois aussi utilisé sur des instruments comme le saxophone):

- le Neumann U87 (ici dans la version Ai la plus récente), micro de studio de référence pour la voix. Courbe de réponse présentée ici pour la position ominidirectionnelle:

On note dans les deux cas une remontée très nette jusqu'à 5dB dans les aigus, commençant vers 5kHz avec un pic vers 8kHz pour le U87, et commençant vers 2k avec un maximum entre 3.5 et 6k pour le Shure. Notons que ce ne sont pas les pires, certains micros présentant des pics à près de 10dB. Et si des micros comme le U87 ci-dessus ont leur pic à une fréquence relativement élevée, un très grand nombre remontent dès 2kHz, parfois avant, avec un maximum en plein dans la zone de sensibilité maximale de l'oreille. C'est intentionnel évidemment, le but étant de faire ressortir davantage telle voix (ou tel instrument) dans le mix. Et comme tout le monde veux être entendu, comme le moindre enregistrement requiert aujourd'hui un grand nombre de micros, on assiste à une compétition qui aboutit à déséquilibrer l'enregistrement.

reproduction: distorsion harmonique
Le problème des aigus est amplifié lors de la reproduction à cause de la distorsion harmonique.
La plupart des instruments de l’orchestre ont une étendue qui rentre dans l’intervalle 50Hz-1500Hz (c'est-à-dire la fondamentale des notes) avec des incursions en deçà et au-delà pour quelques uns d’entre eux. Quant aux voix, de la basse à la soprano, elles s’étendent de 70 à 1000Hz environ. Dans la zone de sensibilité maximale de l’oreille qui s’étend elle de 2000 à 5000Hz, se situent à la fois les premiers harmoniques des notes aiguës et les harmoniques de rangs élevés des notes graves. Lors d’une écoute naturelle c’est-à-dire sans le biais d’une sono, l’oreille perçoit fort bien tous ces harmoniques. Loin d’en être gênée, ils contribuent à l’intelligibilité du message sonore, qu’il s’agisse de paroles ou de musiques.
Les choses se passent différemment lors d’une écoute à travers un système de sonorisation (que ce soit en direct ou en reproduction). La distorsion harmonique (DH) vient semer la zizanie. Cela peut sembler surprenant puisqu’on sait faire aujourd’hui des enceintes qui exhibent des taux de DH inférieurs à 1%, et des amplis à transistors des valeurs encore moindres (et même carrément nulles pour les amplis dits numériques). Un exemple va rendre cela compréhensible :

accumulation d’harmoniques dans la zone de sensibilité maximale
Pour rendre les choses plus explicites, partons d’une note assez basse, disons le la2 à 103.8Hz, que je m’empresse d’arrondir à 100 pour faciliter les calculs en rentrant dans le découpage ISO du spectre en tiers d’octaves. 100Hz, cela sonne grave, mais : beaucoup d’instruments et quelques voix descendent encore plus bas (on est encore à 2 octaves du bout d’un piano), et quasiment tous les systèmes de diffusion reproduisent sans problème cette fréquence.
Considérant la fondamentale comme une fréquence isolée, attribuons-lui une sensation de volume sonore de 65dB/40 phones ou 72dB/50 phones.
Que le système de diffusion produise de la DH signifie qu’en plus de cette fréquence de 100Hz il va fabriquer des fréquences harmoniques, jusqu’à, pourquoi pas, 3200Hz qui est situé dans la zone de sensibilité maximale.
Le processus est cumulatif et même doublement cumulatif : chaque harmonique produit par l’instrument est vu par l’ampli comme une fondamentale qui va à son tour générer des harmoniques ; et chacune de ces fréquences sortant de l’ampli est à son tour une fondamentale pour les hauts parleurs qui engendrent aussi leurs harmoniques. C’est ainsi qu’on retrouve étalées sur une bonne partie du spectre tout un tas de fréquences harmoniques qui ne sont pas présentes dans le signal sonore initial ou à des intensité bien moindres. La plupart ne perturbent pas l’écoute parce que, les taux de distorsion des appareils étant faibles, elles ne ressortent pas. Sauf celles qui tombent dans la zone de sensibilité maximale de l’oreille.
Si l’on se réfère aux courbes d’isosonie : à 40 phones, l’oreille est plus sensible d’environ 27dB à 3200Hz qu’à 100Hz. 27dB, cela représente un rapport de puissance de 502 (1.25927). Cela signifie qu’avec une intensité 500 fois plus faible (0.2%) que la fondamentale, l’harmonique à 3200Hz est perçue exactement au même niveau sonore. Et à 50 phones, l’écart est encore de 25dB, soit un rapport de puissance de 316, de sorte qu’un harmonique à 3200Hz dont l’intensité vaut seulement 0.3% celle de la fondamentale est perçue au même niveau.
Ce fait combiné avec le phénomène d’accumulation des harmoniques suggère qu’il suffit vraiment de peu de choses pour perturber l’audition. C’est ainsi qu’on peut se retrouver avec un aigu qui ressort exagérément dans la zone de sensibilité maximale au point de rendre l’écoute fatigante, et ce malgré des appareils de diffusion de qualité.

complément sur la zone de sensibilité maximale
On peut se demander pourquoi il est plus gênant que la bande 2000-5000Hz ressorte davantage qu’une autre, autrement dit pourquoi c’est irritant et pas seulement plus fort. La sensibilité est maximale dans cette zone à cause de résonances dans le conduit auditif. Voici une autre expérience facile à faire qui le confirme : sélectionner un morceau de musique assez riche sur l’ensemble du spectre, par exemple le chœur introductif de la messe en si de Bach qui comprend l’orchestre au complet, des voix de femmes et des voix d’hommes ; commencer avec l’égaliseur graphique complètement à plat, puis sélectionner une bande large d’une octave, trois tirettes donc, qui sont remontées à fond ; écouter, remettre les tirettes à zéro et passer à l’octave d’à côté… On remarque lorsqu’on arrive à la bande 2500-3150-4000Hz que l’effet est plus gênant qu’ailleurs, comme si effectivement il se passe quelque chose dans le conduit auditif, que le son en quelque sorte s’amplifie.

corrections
Il existe des systèmes de diffusion qui engendrent moins ces tensions que d’autres, et ce sans afficher des taux de distorsion plus faibles. Je soupçonne qu’un certain degré d’égalisation est introduit subrepticement, par exemple par un petit creux dans la courbe de réponse des enceintes, voire par les câbles.
Sinon il faut recourir à l’égaliseur. Le hic est qu’il intervient toujours avant le système de diffusion qui génère la DH (tous les égaliseurs à ma connaissance fonctionnent au niveau ligne et ne sont pas conçus pour encaisser les courants forts qui sortent des amplis). On est donc en droit de se demander s’il est d’une réelle utilité : étant donné cet ordre imposé, l’égaliseur ne peut agir que sur l’équilibre spectral du signal source encore dépourvu de DH, pas sur ce qui sort de l’ampli, et encore moins sur les vibrations des membranes des haut-parleurs. Tout ce qu’il possible de faire, c’est diminuer l’intensité des harmoniques naturels dans la zone critique de sensibilité maximale. Cela revient en quelque sorte à leur substituer des harmoniques artificiels générés par DH. Cela peut sembler radical, surtout pour un audiophile. Mais ce n’est finalement pas plus artificiel que les distorsions en tous genres que produisent les amplis à tubes (ce dont attestent incontestablement des mesures peu flatteuses en regard de leurs homologues à transistors) mais qui sont pourtant fort prisés desdits audiophiles pour leur musicalité. Sans compter les distorsions encore plus importantes générées par le simple fait d’écouter un morceau à un niveau différent de celui du mixage parce que les variations de sensibilité de l’oreille ne sont pas prises en compte. Tout dépend finalement de ce que l’on souhaite reproduire : des bits ou bien de la musique ? Corriger à l’égaliseur la zone 2-5kHz pour retrouver un niveau sonore plus ‘naturel’ dans cette zone ne me semble pas plus antimusical que tout ce qui vient d’être évoqué. D’où il s’ensuit qu’un égaliseur devrait faire partie de l’équipement de base de tout bon audiophile. Mais c’est une autre histoire… Quoiqu’il en soit il fait désormais partie de mon équipement.

Pour terminer, voici quelques courbes de correction pour commencer à jouer :

2k

2.5

3.15

4

5

0

-1.5

-2

-1.5

0

0

-2

-3

-2

0

 

Il y en a d’autres, par exemple les programmes music1 et music2 du correcteur acoustique Lyngdorf RP-1, destinées à l’écoute de la musique comme leur nom l’indique :

630

800

1k

1.25

1.6

2

2.5

3.15

4

5

6.3

8

10

12.5

 

0

~

-0.5

-1

-2

-2.5

-2

-1

-0.5

~

0

   

0

~

-0.5

~

-1

-2

-3

-2.5

-2

-1

~

-0.5

~

0

 

La comparaison avec les précédentes révèle de curieuses différences. Ces courbes ressemblent bien à des courbes de réduction des harmoniques dans la zone de sensibilité maximale de l’oreille. Mais on note qu’en dessous de 2000Hz elles ne s’accordent pas avec les actuelles courbes d’isosonie, lesquelles montrent une nette perte de sensibilité entre 1000 et 2000Hz. Une explication possible est qu’elles ne sont pas basées sur les dernières courbes ISO226-2003 compilées à partir des expériences les plus récentes, mais sur des anciennes beaucoup moins précises. Il est un fait que les classiques courbes de Fletcher-Munson de 1933, qui ont longtemps servi de référence (entre autres aussi pour des correcteurs loudness), n’exhibent pas ce sursaut entre 1000 et 2000Hz. Une petite remontée des courbes dans cette zone signifiant une légère baisse de sensibilité commence à apparaître sur celles de Robinson et Dadson de 1956 sur quoi repose la norme ISO226-1961. Quoiqu’il en soit, cela ne veut pas dire que ces deux programmes music1 et music2 ne sont pas intéressants. Je ne saurais en dire plus, je ne les ai pas testées. En tout cas leur présence sur un tel appareil me conforte quant à l’intérêt pour l’écoute de la musique d’une correction dans la zone de sensibilité maximale.

 

conclusions

Les corrections tenant compte de la sensibilité de l’oreille permettent :
- dans le grave et l’aigu de garder un contenu musical riche à faible volume,
- de corriger la zone 2000-5000Hz pour pouvoir écouter sans fatigue ni tension ni autres désagréments parfois subliminaux,
- de pouvoir écouter plus fort plus longtemps sans ressentir de gêne ni que le système auditif soit affecté.
Le but pour moi au final est de faciliter l’immersion dans le son, très importante dans les musiques de sons. À condition de résoudre un dernier problème, la fatigue auditive causée par le registre médium.

 

 

fatigue auditive, suite

Un petit tour sur les forums audiophiles révèle que la fatigue auditive n’est pas chose rare, y compris avec des matériels haut de gamme et sans qu’il soit besoin d’écouter très fort ni très longtemps (je ne parle pas bien sûr d’acouphènes et autres bourdonnements dus à une exposition prolongée à des très forts niveaux sonores). Outre l’accumulation des harmoniques dans la zone de sensibilité maximale que l’on vient d’étudier, il y a de nombreuses autres causes :
- des enregistrements abusant de la compression pour produire un son le plus fort possible (ce qui se neutralise facilement en baissant le volume mais doit être compensé par une correction loudness pour retrouver tout le contenu) mais surtout avec très peu de dynamique (écart de quelques dB seulement entre les sons les plus forts et les sons les plus faibles) ; résultat : l’oreille n’a jamais le temps de se reposer et elle finit par saturer ;
- la présence de bruits et autres parasites qui obligent à un effort de concentration pour extraire le message sonore (mais tous les bruits ne sont pas forcément gênants : les bruits de fond à spectre large des vinyles et des cassettes ne perturbent guère l’écoute, ils passent même inaperçus après quelques secondes) ;
- des distorsions provenant de non-linéarités prononcées du système lorsque les différents éléments ne s’accordent pas bien entre eux ou que l’un est de qualité médiocre ; cela se traduit par des creux et des pics dans la courbe de réponse qui rendent certaines fréquences plus audibles et d’autres moins, et font qu’on n’arrive jamais à trouver un réglage de volume correct ;
- de légères colorations de la source, de l’ampli, des enceintes, de la salle, qui, en s’additionnant, font que certains registres ressortent systématiquement, ce qui peut être flatteur dans un premier temps mais qui à la longue provoque de la fatigue auditive.
Ce dernier cas me concerne, avec, il me semble, une mise en avant du médium. Cela produit effectivement un très beau son, notamment sur les voix. Ce n’est pas une surprise sachant que les enceintes Araxe première génération ont été particulièrement travaillées pour le rendu des voix (dixit l’un des concepteurs, Christian Avedissian lors d’une communication personnelle), sachant qu’en outre l’ampli John Shearne phase2 favorise lui aussi le médium. Certes le grave est profond et dynamique, l’aigu bien filé, mais reste que dans l’ensemble le médium est privilégié.

Cette mesure (avant toute correction évidemment) de la réponse de mon système à un bruit blanc le confirme :

Un pic prononcé entre 400 et 1200Hz est très nettement visible (tout en haut à gauche). Notons aussi la remontée autour de 3700Hz, certes moins proéminente mais gênante parce que située en plein dans la zone de sensibilité maximale, et une autre encore autour de 6500Hz mais qui n’est pas gênante parce qu’il y a également remontée des courbes de sensibilité de l’oreille à partir de 5000Hz.
Cette mise en avant du médium peut aussi être interprétée comme un léger retrait des autres registres. D’où l’envie d’un peu plus de graves pour se sentir davantage immergé dans le son, et pour ce faire le réflexe d’augmenter le volume. Certes les basses s’en trouvent augmentées, mais le problème n’est pas résolu puisque le médium augmente dans les mêmes proportions. Et comme, à quelque niveau d’écoute que ce soit, l’oreille est plus sensible dans le médium que dans le grave, il reste toujours en avant. D’où finalement cette fatigue auditive qui s’installe.
Le problème n’est soluble qu’avec un égaliseur qui va permettre de rétablir l’équilibre sur l’ensemble du spectre.

 


 

utilisation du DEQ2496 pour la correction acoustique

 

 

méthode de correction

AUTO-EQ ou analyse séparée ?

Le DEQ2496 possède une fonction AUTO-EQ qui permet, en branchant dessus un micro de mesures et en se donnant une courbe de réponse cible, d’effectuer automatiquement à l’égaliseur graphique les corrections requises pour l’atteindre. Quoi de plus simple ? Eh bien, je préfère quand même ne pas l’utiliser pour un certain nombre de raisons :

1. La plus importante est que cette fonction agit sur l’égaliseur graphique, avec donc certains des défauts inhérents à ce genre d’appareil déjà évoqués : manque de précision dans le réglage des fréquences à corriger et manque de précision de la largeur de la bande corrigée autour de cette fréquence. Seul un égaliseur paramétrique est suffisamment précis pour corriger correctement des courbes de réponse tourmentées. Et avec le DEQ2496 il y a de quoi faire : 10 filtres (en mode stereo link ou 2x10 en mode dual mono) réglables chacun en fréquence au 1/60 d’octave, en largeur de 1/10 à 10 octaves, et en gain de -15 à +15 dB.

2. Si l’AUTO-EQ n’est pas utilisé, force est de séparer la chaîne de production de sons tests (source + égaliseur + ampli + enceintes + salle) de la chaîne d’analyse (micro + enregistreur + analyseur de spectre). C’est évidemment un peu plus compliqué. Mais cela présente aussi un avantage, celui de pouvoir opérer des corrections sur le DEQ et d’en observer immédiatement les effets.

3. De toute manière, le manuel du DEQ2496 recommande de ne pas employer l’AUTO-EQ en dessous de 100Hz à cause de possibles erreurs de calculs dans ce registre. Or c’est souvent là que se situent les principaux problèmes acoustiques : résonances de salle, et jonction entre les enceintes principales et le caisson de basses (lequel, pour compliquer les choses, possède en général ses propres réglages de volume et de fréquence de coupure). Donc, même si l’on se sert de l’AUTO-EQ pour corriger le médium et l’aigu, il faut une autre procédure pour corriger le grave (sauf bien sûr à avoir des enceintes qui ne descendent pas très bas et pas de caisson). Autant se simplifier et n’en avoir qu’une !

4. Enfin, je préfère travailler les corrections par couches successives :

1. corrections dans le grave (essentiellement au paramétrique),
2. corrections dans le médium et l’aigu avec application d’une courbe-cible (essentiellement au graphique, AUTO-EQ possible donc mais autant employer de bout en bout la même procédure),
3. corrections psychoacoustiques.

Tout ceci est possible en constituant deux circuits indépendants :
1. production du son : CD à DEQ à ampli à enceintes+caisson
2. captation et analyse : micro de mesures à interface audio à ordinateur + logiciel de traitement audio

Dans mon cas, l’interface audio comprend :
1. la loop-station Boss RC50, qui ne me sert en fait que pour son alimentation fantôme nécessaire pour faire fonctionner le micro de mesures,
2. l’égaliseur DEQ1024, qui me sert à corriger les petites irrégularités dans la courbe de réponse du micro,
3. un Phonic Digitrack, qui permet de prendre la sortie numérique du DEQ1024 pour l’envoyer dans l’ordinateur sur lequel tourne le logiciel d’édition audio Audacity (http://audacity.sourceforge.net).

On peut faire plus simple, j’en conviens. Disons que je fais avec le matériel dont je dispose. Mais la méthode exposée ici reste valable sans tout ça. Il faut juste une interface audio disposant d’une alimentation fantôme pour envoyer le signal capté par un micro de mesures dans un ordinateur. La correction de la courbe de réponse du micro peut alors se faire avec l’égaliseur graphique intégré à Audacity.

 

bruits tests

Qu’est-ce qu’on analyse ? Il existe en gros deux méthodes :
1. réponse à des signaux impulsionnels,
2. réponse à des bruits blanc et rose.

Dans les deux cas la chaîne hifi émet un signal acoustique, lequel est capté par un micro de mesures (micro spécial ayant une courbe de réponse la plus plate possible sur tout le spectre audible 20Hz-20kHz) et analysé avec un logiciel ad hoc. La première méthode est censée être beaucoup plus précise car, outre la réponse en fréquence, elle permet aussi la mesure de décalages temporels. On trouve aujourd’hui sur le web tout ce qu’il faut pour généré de tels signaux impulsionnels et analyser les réponses. C’est certes très précis mais pas facile à comprendre et à mettre en œuvre. Me sentant davantage musicien qu’audiophile, je ne tiens pas à passer un temps infini à régler d’infimes détails, pas toujours décelables à l’écoute d’ailleurs. Je préfère donc recourir à la méthode plus simple et éprouvé d’analyse de bruit, même si c’est plus grossier.

Un bruit est par définition un signal constitué d’un mélange de toutes les fréquences audibles. De là son intérêt en acoustique : pouvoir tester la réponse d’un système sur tout le spectre avec une seule séquence sonore. Le DEQ2496 dispose de son propre générateur de bruit rose. Mais il n’est pas utilisable dans ma configuration puisque je veux que les signaux qui passe à travers lui soient traités par les modules GEQ et PEQ. En outre je ne suis pas sûr de sa qualité : j’ai analysé un échantillon de bruit rose généré par son petit frère le DEQ1024 et il se révèle pas du tout conforme à un vrai bruit rose descendant régulièrement de 3dB/octave de 20Hz à 20kHz. Etant donné ce que je veux faire, le mieux est d’enregistrer des échantillons de bruits sur un CD. Ça permet :
- d’avoir des bruits rose et blanc parfaitement conformes, ce qui facilite l’analyse : j’y reviens dans un instant ;
- de pouvoir procéder à des corrections à la volée puisque le signal passe à travers le DEQ ;
- de tester toute la chaîne, du lecteur CD au local d’écoute ;
- de créer des échantillons séparant les canaux gauche et droit afin de mettre en évidence d’éventuelles asymétries (mon ampli ‘minimaliste’ ne dispose évidemment pas d’un bouton de balance !).

bruit blanc
Dans un bruit blanc, l’énergie est également répartie sur tout le spectre. Autrement dit, il y a autant d’énergie entre 0 et 10.000Hz qu’entre 10.000 et 20.000. Cela rend un tel signal approprié pour l’analyse de l’aigu. Affiché en mode linéaire, le spectre d’un bruit blanc donne ceci : une courbe plate.

 

Remarques :
- tous les échantillons de bruits utilisés ici ont été générés avec Audacity,
- et analysés avec l’analyseur de spectre de Audacity configuré sur la taille maximale de 16324 (employer la version 1.3.8 ou supérieure, l’analyseur de spectre est moins performant sur les versions antérieures) ;
- si ça semble un peu brouillon par rapport à des courbes de réponses présentées dans les manuels des constructeurs, c’est qu’elles ne sont pas lissées.

bruit rose
En comparaison, un bruit rose a une énergie également répartie par octaves. Il y a donc autant d’énergie entre 20 et 40Hz qu’entre 10.000 et 20.000Hz. Cela rend un tel bruit particulièrement approprié à l’analyse du grave et du médium. En affichage logarithmique, son spectre montre une descente parfaitement linéaire de 3dB/octave :

 

Remarques :
- ces deux graphiques révèlent à la fois : 1. la qualité de ces bruits générés par Audacity qui sont conformes aux définitions, 2. la précision de l’analyseur de spectre ; il est important d’être sûr de la qualité de ces outils tant il est vrai que toute imprécision se traduirait par des corrections inappropriées ;
- analyser un échantillon d’une durée d’une minute suffit à révéler avec une bonne précision la qualité d’un spectre de bruit, et deux minutes conviennent pour atteindre la précision maximale (c’est-à-dire que rallonger la durée n’apporte pas d’information supplémentaire).

CD de test
J’ai réalisé un CD comprenant divers échantillons de bruits tests. Ils ont été créés avec le générateur de bruit d’Audacity réglé sur un niveau de 0.6 et une durée de 6 minutes.

1. bruit rose gauche
2. bruit rose droit
3. bruit rose stéréo (G≠D)
4. bruit rose mono deux canaux (G=D)
5. bruit blanc gauche
6. bruit blanc droit
7. bruit blanc stéréo (G≠D)
8. bruit blanc mono deux canaux (G=D)

Les plages 1, 2, 5, 6 servent à tester séparément les voies de droite et de gauche afin de mettre en évidence d’éventuelles asymétries. Si elles sont importantes, alors il faut configurer le DEQ en dual mono et corriger chaque voie séparément.
Sinon on se contentera d’une correction globale en mode stereo link avec les séquences 3 et 7, voire 4 et 8.
Quelle différence entre un bruit stéréo et un bruit mono deux canaux ? Dans le premier cas les deux canaux diffusent un signal de bruit différent, tandis que dans le second c’est le même signal qui est émis à droite et à gauche. À quoi ça sert un bruit mono deux canaux ? Je ne suis pas sûr encore, peut-être à mettre en évidence certains petites asymétries via des phénomènes d’interférences ? Disons que c’est là à ma disposition mais que je compte surtout utiliser les séquences 3 et 7.

 

traitement des différents registres

grave
Lorsqu’il y a des résonances dans la pièce et qu’on règle un caisson de basses à l’oreille, voici en général ce qui se passe :
1. on règle le volume du caisson sur ces résonances pour qu’elles restent à un niveau tolérable ;
2. mais comme ces fréquences sont amplifiées par la salle plusieurs dizaines voire centaines de fois, on se retrouve avec des trous énormes à côté ;
3. on essaie de compenser le manque de graves en relevant la fréquence de coupure ;
4. d’où un recouvrement très imparfait avec les enceintes principales.
Pour un bon raccord entre le caisson et les enceintes, il faut plutôt abaisser la fréquence de coupure et rehausser le volume, mais ce n’est possible qu’en ayant au préalable atténué les résonances. Voici une procédure pour réaliser tout ceci :
1. utiliser comme signal test un bruit rose et analyser le spectre en affichage logarithmique pour repérer les fréquences de résonance ;
2. réduire très précisément et drastiquement ces résonances au paramétrique, remonter le volume du caisson, abaisser la fréquence de coupure ;
3. recommencer autant de fois qu’il faut en jouant de tous les paramètres disponibles (filtres paramétriques, filtres graphiques, gain du caisson, fréquence de coupure du caisson) pour linéariser autant que faire se peut la réponse du grave.

Remarque :
Les caissons Rel présentent la particularité de prélever leur signal sur les sorties enceintes de l’ampli (évidemment de telle manière à ne pas perturber le courant qui alimente les enceintes principales). Par rapport à une prise de signal sur la sortie de niveau ligne de l’ampli (tape out) cela a pour avantages : de ne pas avoir à rerégler le volume du caisson chaque fois qu’on touche à celui de l’ampli, et de donner au grave extrême une coloration similaire au grave diffusé par les enceintes principales. Dans ces conditions, pour rehausser le volume de l’extrême grave, c’est-à-dire en dessous de la fréquence limite basse des enceintes principales (60Hz dans mon cas), il est de beaucoup préférable d’agir directement sur le volume du caisson plutôt qu’augmenter les graves à l’égaliseur, avec pour conséquence un risque de surcharge de l’ampli principal.

médium
Dans la foulée, le même signal test est utilisé pour corriger les résonances éventuellement présentes dans le médium ainsi que d’autres accidents. Ces derniers se corrigent en général très bien à l’égaliseur graphique.

aigu
La réponse à un bruit blanc présentée en affichage linéaire permet simultanément de visualiser les accidents de l’aigu et de viser une courbe cible.

 

 

réglages globaux du DEQ2496

menus I/O et utility

I/O page1 > select input > main in
I/O page1 > samplerate > 96kHz
I/O page2 > select AUX/DIG out > main out
I/O page2 > dither > 24 bits
I/O page2 > B noise shaper
I/O page3 > select RTA input > main out
utility 1 > channel mode > selon comparaison des réponses à droite et à gauche
utility 1 > GEQ mode > true response
utility 1 > gain offset > voir paragraphe suivant
utility 1 > RTA noise correction > off
utility 1 > RTA/mic input > mic level +15V
utility 1 > RTA/mic mic level > -40dBv/Pa (pour le micro B5 avec sa capsule ominidirectionnelle)
utility 2 > MIDI > off

 

problème de gain

Le seul fait d’intercaler un DEQ2496 entre le lecteur CD et l’ampli (le tout en analogique ici), de l’allumer et le mettre en bypass fait perdre environ 6dB ! D’après Simon Ashton, cela vient du fait que l’appareil a la particularité de supporter des niveaux d’entrées analogiques très élevés avant de saturer. Je ne sais pourquoi cela a pour conséquence une diminution du niveau du signal à la sortie, mais voilà, c’est un fait.
Il y a deux façons de compenser :
1. avec le bouton de volume de l’ampli
Le problème est que 6dB représentent tout de même une multiplication par 4 de la puissance. Ce n’est pas négligeable pour un ampli qui n’est pas des plus puissants (2x50W seulement mais compensé par un bon rendement des enceintes) et qui a un bruit de fond assez élevé.
2. au niveau du DEQ avec utility 1 > gain offset > +6dB
Cette augmentation étant numérique, le risque cette fois est de saturation numérique (digital clipping). Risque évidemment diminué si le GEQ et le PEQ sont utilisés principalement en réduction.

Suggestions pour commencer :
- gain offset +4dB avec un programme qui réduit fortement les graves sur le DEQ (pour mieux les augmenter au niveau du caisson comme expliqué ci-dessus).
Pour voir si cela convient, écouter pendant quelques temps avec la fonction METER branchée sur output et lire à la fin le niveau maximal atteint (peak). Il y a aussi une diode de clip mais on n’a pas le regard toujours braqué dessus !

 

à propos de DynEQ

Le DEQ2496 comprend en plus 3 filtres dynamiques conçus pour rehausser ou abaisser le niveau sur une certaine bande de fréquence en fonction du niveau général du signal. Tous ces paramètres étant bien sûr à spécifier pour chaque filtre.
La première idée qui vient à l’esprit est de s’en servir en tant que correcteur automatique de loudness. En fait ça ne peut pas marcher car il faudrait que le réglage du volume d’écoute se fasse en amont du DEQ. Voici ce qui va se passer si on essaie quand même de programmer un filtre pour rehausser les graves lorsque le niveau global du signal tombe en dessous d’un certain seuil : au dessus de ce seuil, les graves ne seront pas augmentés et ne seront donc pas entendus puisque l’écoute se faible à faible volume ! et on risque de se remettre à les entendre en-dehors de ces passages forte !
En revanche il y a une logique à employer le DynEQ pour corriger la dureté du son dans la zone de sensibilité maximale de l’oreille. Il est évident en effet que plus le niveau du signal source est élevé, plus la présence de fréquences dans cette zone est irritante. La difficulté est de régler le seuil à partir duquel déclencher ce filtre sachant que tous les enregistrements sont différents. Quelques tests suggèrent qu’un seuil de -25dB devrait convenir. On pourra ensuite peaufiner. Par exemple en écoutant quelques temps avec l’afficheur sur DynEQ sur lequel sont visualisés le franchissement du seuil et l’ampleur de la correction.

 


 

application

 

configuration

mon système

- lecteur CD Yba special disposant uniquement d’une sortie analogique
- égaliseur Behringer DEQ2496 avec alimentation, module d’entrée analogique et module de sortie analogique modifiés par Simon Ashton / Audiosmile
- ampli intégré John Shearne Phase2
- enceintes BC-Acoustique Araxe première génération (rendement 92dB, bande passante 60Hz-20kHz à +/-3dB)
- caisson Rel Quake (descendant à 23Hz -6dB)

 

mon salon de musique

Il présente une géométrie très défavorable de double cube : longueur = 4.97m , largeur = 2.47 , hauteur = 2.53 , soit pratiquement 5x2.5x2.5. En théorie, les principales fréquences critiques se situent autour de 34, 68, 100 et 136 Hz.
La pièce étant petite, il y a très peu de marge de manœuvre sur le placement des différents éléments. Et pas davantage sur le point d’écoute, situé à une hauteur de 0.95m et une distance de 2.8m des tweeters de chaque enceintes.

 

réglages de la chaîne d’analyse

micro
Un Behringer B-5 muni de sa capsule omnidirectionnelle (il possède également une capsule cardioïde interchangeable) est utilisé comme micro de mesures. Il possède une courbe de réponse très plate sur tout le spectre. Mais il nécessite tout de même quelques corrections (explications dans appareils_musiques_ea.pdf) :
- dans l’aigu :

bande

6.3k

8k

10k

12.5k

16k

20k

correction

-1

-1

-1

0

+3

+5

- dans le grave :

bande

20Hz

25

31.5

40

correction

+3

+2

+1

0

attention : vérifier que le filtre low cut n’est pas activé

position
Le micro est placé au point d’écoute, dirigé vers les tweeters.

autres appareils
RC50 : fantom power on et sélectionner un patch avec input out sur main
DEQ1024 : low cut off et high cut off, égaliseur graphique avec courbe de correction micro ci-dessus

réglage des niveaux
ampli : 9h30 sans le DEQ2496
10h avec le DEQ2496 et gain offset +3dB
RC50 : mic level max et master level max
DEQ1024 : gain 0
Audacity : niveau d’enregistrement max

remarques :
- ne pas pousser davantage l’ampli, surtout pour la diffusion de bruits roses qui ont un très fort contenu en graves ;
- mettre des bouchons d’oreille car ça peut durer longtemps, c’est pas agréable d’écouter du bruit, et ça peut être fort (j’ai mesuré 80dB SPL sur bruit blanc au point d’écoute, dont je m’éloigne évidemment lors des enregistrements des séquences tests).

 

 

analyse au bruit rose

Réponses au bruit rose avant correction, successivement voie de droite seule, voie de gauche seule, et stéréo :

 

 

Premières conclusions :
- on observe bien quelques asymétries, mais elles me semblent assez faibles pour autoriser des corrections en mode stereo link ;
- les problèmes dans le grave sont flagrants et réclament des mesures de corrections importantes ; notons en particulier le trou de plus de 20dB entre les deux premières résonances.

 

corrections grave et médium

Résultat après corrections :

Les corrections consistent en ceci :

caisson de basses : volume 2 heures (contre 9h avant) et fréquence de coupure 10h30 (contre 12h avant)

PEQ : les 10 filtres disponibles sont utilisés

 

fréquence

BW/oct

gain

1

22.2

L12dB

-15

2

34.8

1/2

-12

3

29.9

3/4

-4

4

76.9

1/5

-15

5

99.1

1/7

-10

6

54.5

1/9

+9

7

120

1/10

+6

8

166

1/10

-4.5

9

240

1/10

-7

10

190

1/10

-4.5

 

GEQ, dans le grave

20Hz

25

31.5

40

-6

-3

-1

-4

 

GEQ, dans le médium

800Hz

1000

1250

1600

2000

2500

3150

-2

-5

-2

-3

-2

-1.5

-1

 

Remarques :
- étant donné que la baisse du grave est très importante, compensée par une forte remontée du volume du caisson, surtout ne pas bypasser le PEQ ;
- la linéarisation du grave n’est parfaitement valable qu’au point d’écoute ; mais la baisse drastique des résonances s’entend de partout, à ceci près :



corrections complémentaires

Comme je viens de le dire, tout ceci vaut pour le point d’écoute. Que se passe-t-il ailleurs ? Il est recommandé de vérifier que certaines fréquences ne sont pas surcorrigées pour le point d’écoute, avec pour contrepartie des gros boum-boum en d’autres points de la pièce et des excursions dangereuses des haut-parleurs de grave.
La meilleure méthode pour ce faire est de recourir à des fréquences de balayage en se déplaçant dans la pièce et en observant le mouvement des haut-parleurs.
De fait, il apparaît clairement que les 9dB de gain à 54.5Hz (6e filtre du PEQ) sont exagérés : à fort volume, les mouvements du haut-parleur du caisson de basse sont impressionnants, et en certains points de la pièce des ronflements épouvantables se font entendre. Une correction aussi importante provient probablement du fait que le point d’écoute doit être proche d’un nœud d’onde autour de cette fréquence. Quelques essais montrent qu’une correction de +3dB constitue un compromis acceptable entre une sensation au point d’écoute proche de la linéarité dans les graves, et une forte atténuation des ronflements ailleurs.

 
 

analyse au bruit blanc

Je n’ai hélas pas gardé l’enregistrement du bruit blanc stéréo au point d’écoute, c’est-à-dire à 2.8m, qui a servi à faire les corrections. À un détail près que l’on verra plus loin, la réponse suivante avant corrections enregistrée à une distance de 2.5m et affichée en mode linéaire montre la même tendance :


On remarque que la tendance générale est nettement à la baisse : environ 1dB par octave entre 20 et 10.000Hz. Autrement dit, la réponse naturelle de la pièce correspond déjà à une bonne courbe cible.
Ensuite la chute s’accélère : 9dB de 10 à 16kHz puis encore 9dB de 16 à 20kHz, soit 18dB sur la dernière octave.

On peut se demander si cette baisse brutale dans l’extrême aigu est bien réelle ou s’il ne s’agirait pas plutôt d’une sous-compensation du micro qui a une baisse de sensibilité dans ce registre. Étant donnés :
1. que le micro est déjà un peu compensé,
2. que la baisse observée est vraiment très importante,
3. que des mesures effectuées à différentes distances (successivement 2.3m, 2.5m, et 2.8m) montrent une baisse un soupçon moindre à mesure qu’on se rapproche de la source,
je pense que le phénomène est bien réel et demande compensation.

Toutefois, il n’est pas utile de surcorriger, considérant que mon oreille n’entend plus grand chose au-delà de 16kHz, et que le peu qu’il y a à entendre ne semble pas d’une grande qualité. Donc je me contenterai de ceci :

12.5k

16k

20k

+1

+1

inchangé

Résultat après correction au point d’écoute :

On remarque une chose qui n’apparaissait pas sur le graphique précédent : une succession régulière de creux et de bosses. On appelle ça un filtre en peigne pour des raisons que l’on comprend aisément. Le phénomène est dû à des interférences entre les ondes qui arrivent directement en provenance des enceintes et celles qui sont réfléchies par les parois (c’est pourquoi il est encore plus accentué sur le test avec bruit blanc mono deux canaux). Précisément dans ce cas, il s’agit très probablement de réflexions sur le mur du fond (derrière le point d’écoute donc) puisque le filtre en peigne n’apparaît pas sur les mesures effectuées à une distance des enceintes de 2.5m mais qu’il est là au point d’écoute situé 30cm plus loin. Or en s’éloignant des enceintes, on se rapproche du mur du fond, et comme la pièce est petite, la distance entre le point d’écoute et ledit mur se réduit à 1.4m. Une distance minimale de 2m est généralement recommandée, mais je n’ai pas le choix, je ne peux pas avancer mon fauteuil à cause de tout l’équipement placé devant qui sert à faire de la musique électroacoustique.
La vraie question est : est-ce gênant ? Pour tout dire je ne me suis jamais rendu compte de rien à l’écoute, et ce n’est qu’en comparant les deux graphiques précédents que j’ai découvert l’existence de ce filtre en peigne. Si un tel filtrage en peigne passe généralement inaperçu, c’est à cause d’un phénomène psychoacoustique appelé effet Haas ou effet de précédence.
Le premier son qui arrive à l’oreille sert à déterminer la direction de la source. Le cerveau élimine de lui-même tout signal semblable qui arrive dans un délai de 30 à 40 millisecondes. À 340m/s, le son met environ 3ms pour parcourir 1m, donc 30ms correspondent à 10m. Dans une pièce d’écoute moyenne, c’est largement plus que la différence de distance parcourue entre un son direct et un son réfléchi. Car au-delà de 30 à 40ms, le phénomène de masquage temporel disparaît et le son retardé commence à être entendu comme un écho distinct. Ajoutons encore que le masquage persiste en dessous de ce seuil temporel même si le niveau du son retardé est de 6 à 10dB supérieur au niveau du son direct.
Conclusion : les interférences entre son direct et son réfléchi qui créent un tel filtre en peigne ont assez peu d’effets sur la qualité du son, en particulier la précision de localisation des sources. J’en resterai donc là pour ce qui est des corrections acoustiques.

 

 

corrections psychoacoustiques

dans la zone de sensibilité maximale de l’oreille

Les explications ayant été données plus haut, voici directement les paramètres que j’applique au premier filtre du DynEQ :
M-gain : -6dB
threshold : -25dB
ratio : 1/10
attack : 0 (minimum)
release : 20ms (minimum)
mode : BandPass
frequency : 3169
BW : 1
Remarque : -6dB peut sembler une baisse importante, mais d’une part, le filtre étant dynamique, il s’agit d’une baisse maximale qui n’est appliquée que sur les sons les plus forts, d’autre part, si cela correspond à une diminution de puissance d’un facteur 4 (ce qui est bien pour les oreilles sensibles), la sensation d’intensité sonore quant à elle n’est diminuée que d’un tiers.

 

en fonction du niveau d’écoute

Pour effectuer une telle correction, il faut au préalable avoir une idée du niveau d’écoute. La fonction METER du DEQ2496 permet une telle mesure, il suffit de brancher un micro et de préciser sa sensibilité (-40dBV/Pa pour le B5 muni de sa capsule omnidirectionnelle). Voici les résultats pour divers échantillons de musiques écoutés à différents niveaux, et comment je les entends :
- entre 80 et 90 dB SPL, c’est une sensation de son fort ;
- entre 75 et 85 dB SPL, c’est un niveau moyen, confortable ;
- entre 70 et 75 dB SPL, cela sonne doux.
Cela suggèrerait de créer trois programmes : fort, moyen et doux. C’est possible mais je trouve ça un peu difficile à gérer, c’est-à-dire qu’il faut à chaque fois réfléchir avant d’écouter un disque au programme à charger. Je préfère avoir un programme normal qui sert dans la majorité des cas, et un programme loudness réservé à l’écoute à bas volume. Celui-ci reprend tous les réglages précédents, sauf :
1. utility > gain offset 0 (au lieu de +3)
2. DynEQ > M-gain -3 (au lieu de -6)
3. GEQ : un filtre low shelf de +3dB à 315Hz pour rehausser le grave de +3dB à 25Hz à 0 à 315Hz
4. GEQ : un filtre high shelf de +7dB à 5kHz pour avoir une augmentation linéaire de l’aigu de 0 à 5kHz à +4dB à 20kHz
remarque : je ne comprends pas trop les réglages à effectuer sur ces filtres pour obtenir les résultats voulus…

En tenant compte de toutes les corrections, voici ce que cela donne pour le paramétrage du GEQ (1 normal, 2 loudness) :

 

20

25

31.5

40

50

63

80

100

125

160

200

250

315

400

500

1

-6

-3

-1

-4

                     

2

-2.5

0

+2

-1.5

+2

+2

+1.5

+1.5

+1

+0.5

+0.5

       

630

800

1k

1.25

1.6

2

2.5

3.15

4

5

6.3

8

10

12.5

16

20

 

-2

-5

-2

-3

-2

-1.5

-1

         

+1

+1

 
 

-2

-5

-2

-3

-2

-1.5

-1

   

+0.5

+1

+2

+3.5

+4.5

+4

 

 

correction supplémentaire

Je l’ai dit, ma pièce d’écoute est petite et je suis obligé de me tenir plus éloigné des enceintes qu’il ne faudrait : le point d’écoute est à 2.8m tandis que les enceintes sont espacées de 1.4m, ce qui fait un angle d’ouverture de 30° seulement. On préconise en général 60° pour une séparation stéréophonique idéale, et on peut descendre à 45° si l’on veut privilégier l’écoute des sources centrales. Mais 30°, cela fait vraiment une scène sonore étriquée.
Le DEQ2496 a la solution, une fonction qui s’appelle WIDTH. Elle ne fonctionne qu’en mode stereo link et pas en dual mono, d’où mon insistance pour travailler dans ce mode. Elle permet de régler la largeur de la scène sonore (et aussi de corriger des asymétries, mais ces derniers paramètres ne me sont pas utiles). Donc je me contente du seul paramètre stereowidth que je mets sur +2.




post scriptum


un an plus tard…

Mon salon de musique n’a pas changé mais deux nouveaux éléments sont venus s’ajouter à mon installation : un disque dur et une interface Teac WAP2200 (http://www.teac.eu/fr/hifi-audio/wap-audio-streaming/system/wap-2200/). C’est que, entre-temps, j’ai numérisé toute ma cd-thèque. Pour ça je me suis servi du logiciel Exact Audio Copy (http://www.exactaudiocopy.de/) qui garantit, sauf CD très abîmé, un fichier conforme à l’original. Toute ma musique est donc maintenant sur un disque dur externe, soit plus de 200 gigaoctets en format non compressé wav. Pour l’écouter directement sur ma chaîne, il suffit d’intercaler un boîtier comme le wap de Teac (Logitec fait également un très bon produit, la squeezebox…).



réglages du DEQ2496

Le salon de musique n’ayant pas changé, il n’y a rien à toucher aux réglages d’égalisation, seulement à la configuration de l’entrée et au gain.

Pour régler l’entrée, c’est facile : I/O page1 > select input > digital optical puisque le wap dispose d’une sortie numérique optique qui permet de rentrer directement en numérique dans le deq.

Pour régler gain offset (dans le menu utility, page 1), c’est un peu plus compliqué.
Pour commencer, il m’a fallu comparer les niveaux à l’entrée du deq (meter>source input) en passant des séquences identiques alternativement avec le lecteur CD et le wap. Il apparaît qu’il y a 7.5 à 8dB de plus en numérique qu’en analogique (cela dépend de la séquence et de la mesure selon qu’elle est rms ou peak).
Il convient d’autre part d’avoir à l’esprit que les modules GEQ, PEQ et DEQ travaillent essentiellement à la baisse, hormis deux filtres du PEQ : +9dB à 54.5Hz sur 1/9 d’octave, et +7dB à 120Hz sur 1/10 d’octave. L’étroitesse de ces filtres suggère qu’on devrait obtenir à peu près le même niveau de sortie qu’à l’entrée en réglant gain offset sur 0dB (au lieu de +3 avec le lecteur CD). C’est vrai en général, mais de la saturation risque tout de même de se produire. Vérification faite sur eruption de Van Halen qui frôle en entrée un niveau de 0dB peak, ça clippe effectivement en sortie. Donc au final il est plus prudent de régler gain offset sur -3dB. Je verrai à l’usage si ça convient bien…


 


 

retour en haut de la page