La Voix (1962) — Alfred Tomatis

Article de fond d’Alfred Tomatis (1962) consacré à la voix humaine envisagée comme servomécanisme audio-vocal. En dix-neuf pages denses, illustrées de treize figures, il y déploie sa théorie complète de la régulation phonatoire — boucle d’auto-information, oreille directrice, transfert transcérébral, adaptateur de temps et adaptateur de gain — et en tire les conséquences pour la compréhension du bégaiement, de la dysphonie, du vieillissement vocal, des scotomes auditifs et de l’audition musicale. Cet exposé constitue, avant la parution de ses ouvrages de synthèse, l’énoncé le plus complet de la physiologie servomécanique de la voix selon Tomatis.

La Voix

par le D^r Alfred Tomatis

Tirage à part, pp. 225-243 (1962).

Introduction

La voix offre un tel pouvoir d’évocation, de transcendance, qu’elle peut mettre en jeu, dans son étude, des disciplines très diverses. Pour qu’elle soit, il a fallu un conditionnement merveilleux, fait d’une accommodation psycho-physiologique mettant en œuvre un servo-mécanisme grandement différencié. Étudier la voix, c’est tenter de saisir le jeu intime des éléments qui en assurent l’émission, l’entretien et le contrôle.

I. — Le servomécanisme audio-vocal

L’acte vocal procède d’un schéma cyclique : un acte cortical commande le centre de la phonation, lequel actionne les organes de phonation ; le son émis se propage dans l’air, parvient à l’oreille, qui le transmet au centre auditif ; celui-ci, par auto-information, en informe à son tour le cortex. La boucle est ainsi refermée et permet l’auto-régulation permanente de l’émission.

[Fig. I — Boucle servomécanique : acte cortical → centre de phonation → organes de phonation → air → oreille → centre auditif → auto-information → cortex.]

Le premier étage de ce contrôle est l’oreille. C’est sur elle que repose l’ensemble de la régulation. Toute altération imposée à ce capteur entraîne immédiatement une altération du geste vocal.

II. — L’asymétrie : l’oreille directrice

Loin d’être symétrique, le système auditif est latéralisé. Une oreille exerce un rôle directeur : la droite chez le droitier, la gauche chez le gaucher. C’est sur cette oreille que repose principalement la régulation de la phonation.

[Fig. II — Circuit d’auto-information chez le droitier : oreille droite (O.D.) → centre auditif gauche (C.A.G.) → centre de phonation (C.P.).]

Lorsque l’oreille directrice est l’oreille du même côté que la latéralité phonatoire, ou lorsque les rôles sont inversés, le circuit se déséquilibre et la régulation s’altère.

[Fig. III — Circuit déséquilibré : oreille gauche dominante chez un droitier — la voie ne passe plus normalement par le centre auditif controlatéral.]

Suppression expérimentale de l’audition directrice — par bouchage, masquage ou retard — entraîne aussitôt des désordres importants de la phonation.

III. — L’adaptateur de temps

La régulation suppose un délai de transfert transcérébral très court. Pour la syllabe française, dont la durée moyenne est de l’ordre de 0,15 seconde, ce délai doit rester sensiblement inférieur, sans quoi l’information de retour parvient hors temps utile : la phonation s’engage à l’aveugle. C’est précisément la situation du delayed feed-back expérimental : on retarde, par voie électronique, le retour du son à l’oreille du sujet, et l’on observe que le bégaiement apparaît dès lors que le retard franchit certaines bornes.

Les expériences de Lee, Black, Azzo et Azzi ont permis de cerner ces seuils :

retard T < 0,05 s : aucune perturbation notable ;
0,05 s < T < 0,10 s : bégaiement provoqué ;
0,10 s < T < 0,20 s : suppression du relais directeur ; le sujet bégaie ou perd le fil de son émission ;
T > 0,20 s : la voix poursuit normalement, le retour auditif n’étant plus pris pour information de régulation.

[Fig. IV — Schéma du retard expérimental entre l’entrée E et la sortie S, mettant en évidence la zone critique 0,10-0,20 s où la régulation s’effondre.]

Le bégaiement pathologique reproduit, sans dispositif extérieur, ce dysfonctionnement. Il traduit un défaut de l’audition directrice : l’oreille n’informe plus à temps. La pose, dans le circuit, d’un adaptateur de temps permet de corriger ce délai et, souvent, de faire disparaître le symptôme.

[Fig. V — Schéma servomécanique avec adaptateur de temps et adaptateur de gain interposés sur la boucle de retour.]

IV. — L’adaptateur de gain

Au temps répond une seconde grandeur : le gain. La phonation suppose non seulement que l’audition retourne à temps mais aussi qu’elle retourne à un niveau sonore convenable. Trop forte, elle envahit le circuit et fausse la régulation ; trop faible, elle laisse l’émission sans information de contrôle.

Deux capteurs C₁ et C₂, représentant les deux oreilles, se partagent ce contrôle. C₁, dont le trajet est court, arrive très rapidement ; son appréciation règle l’intensité, le timbre et permet un contrôle d’intégration. C₂ apporte un facteur complémentaire — un facteur temps, un délai — qui fait apparaître une troisième dimension : le relief sonore.

[Fig. VI — Représentation simultanée des deux trajets : E → S avec C₁, C₂ et les centres auditifs C.A.₁, C.A.₂ et le centre de phonation C.P.]

[Fig. VII — Profils temporels de l’entrée E et des deux capteurs C₁ et C₂, montrant l’avance temporelle de C₁ sur C₂.]

Un déséquilibre des deux capteurs — augmentation excessive du gain de l’un ou de l’autre — risque de donner trop d’importance au signal qui prend alors la direction de la régulation.

[Fig. VIII — Schéma anatomique avec voies sensorielles croisées entre oreilles et centres auditifs, et voies directes de moindre importance, illustrant les contre-réactions mutuelles de C₁ et C₂.]

Le relief sonore tient pour partie à la présence de deux oreilles ; mais l’on peut le percevoir d’une seule oreille, avec moins d’aisance, néanmoins avec certitude — car en dehors des voies sensorielles croisées (chaque oreille reliée au centre auditif opposé), il existe des voies directes de moindre importance qui assurent les contre-réactions mutuelles des deux capteurs.

Sans entrer dans le détail mathématique, on peut écrire — pour la formule reliant le gain G et le temps T des capteurs en sens inverse — qu’il existe une loi du type G·T = constante. La rupture du gain ou la rupture du temps de l’un des capteurs implique des troubles proches : pas de gain, pas de relais ; trop de retard, idem. Le sourd qui s’écoute trop fort s’enferme ainsi dans une auto-information détournée, et bascule vers le mutisme.

V. — Volume, intégration, analyse

Au-delà de la régulation, l’audition opère deux fonctions simultanées : une intégration globale qui décompose et contrôle, et une analyse plus détaillée, plus fine, qui porte sur une large bande sonore et exige un temps plus long. C’est par la combinaison de ces deux fonctions, et par leur jeu différentiel, que naissent les dimensions perçues du son : intensité, timbre, hauteur, et ce que Tomatis appelle volume — apport d’une troisième dimension, le relief.

De ce système découle naturellement la caractérisation des auditions du chanteur : ténor, baryton, basse répondent chacun à un mode d’écoute spécifique, à une bande passante propre, à un type d’auto-contrôle particulier.

VI. — Audiogramme normal et audition musicale

Le diagnostic clinique repose sur l’audiogramme. À l’aide d’un audiomètre — sorte de diapason électronique dont les intensités peuvent être dosées à volonté et qui permet d’apprécier à l’affinité effective pour certaines plages de l’audition — il est possible de caractériser chez un individu une oreille de chanteur.

Les audiogrammes des musiciens dessinent une silhouette particulière : zone comprise entre 500 cycles/seconde et 2 000 cycles/seconde (approximativement le ut médium et l’ut de la flûte). Il est possible d’y distinguer un surplus d’audition. La courbe audiométrique normale veut être linéaire : c’est l’une des normes adoptées.

[Fig. IX — Audiogramme normal type : courbe linéaire de 125 à 8 000 Hz.]

[Fig. X — Audiogramme du musicien type : ascension dans la zone 500-2 000 Hz, pente de 6 décibels/octave minimum, soit un gain de 10 % de la sensibilité auditive par octave.]

[Fig. XI — Défaillance auditive caractérisant une reproduction fausse.]

[Fig. XII — Schéma d’une audition parfaitement musicale.]

Être musicien, au sens le plus large du terme, c’est-à-dire entendre et reproduire juste, n’implique pas nécessairement que l’on puisse émettre des sons de qualité. Il existe dans l’audition, ou plus exactement dans la sensibilité auditive du sujet, une zone d’appréciation de la qualité du son à émettre. Cette zone, sensationnelle, permet à loisir de superposer, de filtrer ou d’encoder la quasi-totalité des informations auditives indispensables à la reproduction de toute qualité sonore.

Audition et registre répondent au même problème : les différents modes de contrôle, les différents diaphragmatiques effectivement aux ouvertures différentes, déterminent les bandes passantes inhérentes à chaque mode d’écoute (ténor, baryton, soprano, mezzo, contralto, etc.). En résumé, être musicien, c’est simplement avoir, à écouter, un détecteur auditif anormalement précis dans sa courbe de réponse et spécialement doté d’un pouvoir d’émergence pour tel ou tel son.

Dans un autre ordre d’idées, l’expérimentation a permis d’établir avec précision les bandes de sélectivité propres aux différentes nationalités, leurs caractéristiques, et de fait, nous avons été conduits à songer qu’il existait des adaptations de l’audition au milieu ambiant — notamment aux impédances de l’air. Le facteur plastique retenu, ce n’est pas la résonance acoustique ; c’est bien l’amortissement. C’est dans le bain acoustique du milieu — résonance et amortissement, plus ou moins forts — que l’oreille doit s’adapter et en exploiter au maximum les qualités physico-acoustiques.

VII. — Vieillissement, bruit, scotomes vocaux

Mais cette audition, cette perméabilité auditive dont nous venons de parler, ne peut-elle pas être modifiée ? Certes, sous l’influence de nombreux facteurs — notamment avec l’âge — le champ auditif se rétrécit, la bande de l’auto-contrôle se réduit à la bonne perception des graves, et la voix suit fidèlement l’oreille qui se rigidifie. Mais il n’y a pas que l’âge qui dénature l’oreille : il y a le bruit, fléau social des plus récents, qui détruit, vieillit l’audition, désarticule sa courbe auditive, mutilant les algos, réduisant la perception des graves, bloquant les relations avec l’extérieur, perdant la perméabilité d’information, réduisant la qualité de l’auto-information, désaccordant le sujet d’avec le milieu ambiant.

Cette destruction si spécifique, témoignage de l’agressivité du bruit sur l’audition, se traduit par une désorganisation de la courbe auditive qui cesse d’être linéaire pour laisser apparaître un échancrure en V dite scotome auditif, dont le siège s’installe directement vers les algues, au niveau de 4 000 hertz. L’expérimentation a révélé qu’à ce scotome auditif s’accompagnait systématiquement une altération du timbre vocal, qui se caractérise par l’apparition d’un scotome vocal au niveau des mêmes fréquences que le diagramme obtenu en pratiquant l’analyse spectrale — c’est-à-dire l’analyse harmonique de la voix.

[Fig. XIII — Courbe spectrale de la voix montrant le scotome vocal à 4 000 Hz, en regard de l’audiogramme du sujet qui révèle la même échancrure.]

Conclusion

Nous avons ainsi été amené à penser, puis à vérifier scientifiquement, que toute image vocale a son image audiométrique correspondante dans l’échelle des fréquences. Nous avons pu, à la suite, dans nos expériences, affirmer que « un sujet n’émet que les sons qu’il est capable d’entendre ». La constatation, d’une grande importance, nous permet, suivant le spectre vocal recueilli, de connaître avec certitude la manière d’entendre du sujet émetteur. À l’aide d’un enregistreur, nous pouvons toujours, en laboratoire, nous rendre compte à tout instant, au détour d’une carrière, du comportement auditif d’un individu, mieux encore, du son même de son émission vocale.

Maîtres de cet élément intime, propre au contrôle de chaque sujet, nous avons pu, par la suite, grâce à des jeux de filtres électroniques, modifier à volonté l’audition du sujet et assister ainsi à une transformation instantanée de sa voix, de son geste vocal, de son attitude, de son comportement.

Les modifications profondes, réflexes conditionnés, qu’enclenchent de tels procédés mériteraient d’être étudiées plus à fond, mais nous entraîneraient trop loin dans cet article. Nous n’en retiendrons que les enrichissements considérables qu’elles peuvent apporter à la sociologie du langage, à l’étude de la vie et de la mutation des mots, aux relations humaines, à toute information.

C’est dans ce cadre que nous pouvons inscrire l’étude de la psycho-physiologie de la musique en tant que langage exploitant une information sonore.

Il était trop bref, peut-être un peu téméraire d’aborder l’étude de la voix humaine, au début d’un article qui ne pouvait être qu’un résumé, et dont chacune des rubriques mises en cause exigerait un développement beaucoup plus large. Nous restons néanmoins persuadés que ce tour d’horizon aura à tout le moins permis une initiation aux travaux actuels de recherches sur la phonologie expérimentale et le large spectre de ses applications, notamment en matière de rééducation.

D^r Alfred Tomatis

Source : Tomatis A., « La Voix », tirage à part, 1962, pp. 225-243 (pagination interne 5-23). Document numérisé provenant des archives personnelles d’Alfred Tomatis. Treize figures référencées (Fig. I à Fig. XIII) accompagnent le texte original.