Spécial “10
e
anniversaire”
31
Acoustique
&
Techniques n° 42-43
Pour identifier les dimensions perceptives mentionnées
ci-dessus, l’une des procédures fréquemment utilisées
consiste à présenter toutes les paires de sons du corpus
étudié aux auditeurs, puis à leur demander de juger le
degré de ressemblance ou de dissemblance des membres
de ces paires. On utilise à cette fin une échelle numérique
ou analogique (p. ex. avec un curseur sur une échelle
continue entre «très dissemblables» et «très similaires»).
En faisant la comparaison entre toutes les paires on obtient
une matrice de dissemblance qui peut être analysée par
un algorithme d’analyse multidimensionnelle de proximités
(voir McAdams, [34] pour une revue de question à ce
sujet). Cette analyse ajuste les données perceptives à un
modèle mathématique de distance qui situe chaque son
dans un espace où les sons jugés comme similaires sont
proches et les sons jugés comme dissemblables sont
éloignés dans l’espace. Ensuite on essaie d’interpréter
les coordonnées des sons le long de chaque dimension
en termes de paramètres acoustiques dérivables du
signal sonore. Le modèle mathématique (appelé «espace
des timbres») devient donc une formalisation de la
représentation perceptive qui a servi à l’auditeur pour
comparer les événements et la corrélation avec les
paramètres du signal permet de comprendre son origine
acoustique.
Cette technique a été l’approche principale pour l’étude du
timbre musical [35 ; 36 ; 37 ; 38], mais sert également
à prédire les effets du timbre dans l’organisation de flux
auditifs [39 ; 40] et même la perception des intervalles de
timbre et leurs transpositions [41 ; 42]. En outre, cette
approche a permis de déterminer les attributs auditifs qui
correspondent à différents paramètres mécaniques des
sources sonores, comme la densité et l’élasticité [43], la
géométrie [44] et les propriétés des matériaux comme
les amortissements internes[45;43]. Des variantes de
l’approche multidimensionnelle ont également servi dans
l’étude des paramètres acoustiques qui contribuent à la
qualité sonore des véhicules et des bruits de circulation
[46], des ventilo-convecteurs [47] et des avertisseurs
sonores [48].
Perception et simulation de l’espace sonore
subjectif
On a longtemps pensé que la perception auditive spatiale
se construisait à partir du seul champ acoustique
présent sur les tympans. Les informations véhiculées
par les caractéristiques temporelles et fréquentielles
particulières du signal sont mises à profit pour établir une
sorte de carte neurale des sources sonores ; l’auditeur
apprend à utiliser cette carte pour situer les sources dans
l’environnement. Mais cette construction purement auditive
peut être fortement influencée par un certain nombre
d’autres structures ou fonctions, pas nécessairement
auditives. L’effet le mieux connu est celui de la vision,
dont on sait que les voies nerveuses interagissent avec
celles de l’audition. De plus, on a repéré l’intervention
de mécanismes cognitifs très discrets et très fins, par
exemple dans l’établissement de l’effet d’antériorité
[49] ; cet effet, souvent appelé «effet de Haas», régit la
direction apparente d’un son en présence d’échos, donc
la localisation dans une salle.
Cette complexité retarde les progrès de la simulation de
l’espace sonore subjectif, notamment par écouteurs. Une
telle simulation est pourtant bien utile dans la réalisation
d’environnements virtuels. La question fait d’ailleurs l’objet
de recherches poussées dans plusieurs laboratoires,
notamment ceux de France Télécom à Lannion (voir
par exemple [50], ou [51]). Les recherches actuelles se
concentrent entre autres sur la détermination de ce que
l’on appelle les «fonctions de transfert reliées à la tête»
(et plus fréquemment les HRTF, sigle de langue anglaise).
En effet, pour reproduire par écouteurs une impression
d’écoute en extérieur, il suffit en principe d’alimenter ces
écouteurs par un signal judicieusement filtré, de telle sorte
que le champ produit sur les tympans de l’auditeur soit le
même que celui que produirait une source réelle. Le filtrage
en question doit transformer le signal électrique d’une
manière analogue aux effets de diffraction et d’absorption
par le corps qui transforment le signal acoustique. La
mesure de cette transformation acoustique permet de
déterminer les fonctions de transfert indiquées ci-dessus,
et donc le filtrage à effet équivalent [52]. Mais cette
mesure soulève de très grandes difficultés. D’abord, les
HRTF individuelles diffèrent toutes les unes des autres ;
elles sont une empreinte auditive très personnelle et il faut
donc effectuer la mesure pour chaque auditeur intéressé.
De plus, la mesure nécessite un équipement rare et
coûteux (notamment une chambre sans écho), elle est
longue et pénible pour le sujet, surtout lorsqu’il s’agit de la
réaliser sur des enfants [53]. Les recherches s’orientent
donc maintenant dans deux directions qui contournent
la difficulté : la détermination par calcul (donc simulée)
de HRTF individuelles, et l’entraînement à la localisation
sur des indices erronés, en exploitant la plasticité du
système auditif c’est-à-dire l’adaptation des facultés de
localisation.
Le calcul de HRTF individualisées, effectué à partir
d’un nombre limité de mesures, est à l’étude chez les
spécialistes cités plus haut de France Télécom. Il est
basé sur un principe d’apprentissage statistique. Partant
d’un échantillon de HRTF représentatives de l’individu,
chacune correspondant à une direction sélectionnée,
on détermine toutes les autres fonctions en utilisant les
services d’un réseau de neurones préalablement entraîné.
À titre d’exemple, un ensemble complet de HRTF peut être
obtenu à partir de seulement 50 fonctions effectivement
mesurées. On peut aussi calculer des HRTF à la manière
de Fels et al. (2004) [53]. Ces auteurs procèdent d’abord
à une «photogrammétrie» de l’individu, permettant
d’établir un modèle assez précis de la tête et des épaules.
Un logiciel de dessin permet ensuite la numérisation des
données géométriques correspondantes. Enfin, le champ
acoustique que produirait une source à l’infini est calculé
(approximativement) en utilisant une méthode d’éléments
finis de frontière. On en déduit la fonction de transfert
entre le champ libre et les oreilles.
Mais un auditeur peut encore localiser assez correctement
une source alors que les informations directionnelles
atteignant ses oreilles sont faussées ; il faut pour cela un
certain apprentissage. Par exemple, Savel et Drake [54]
ont montré que des plongeurs assidus (auditeurs exposés
au milieu aquatique) identifient raisonnablement la
direction d’un son sous l’eau, dans des conditions où des
La psychoacoustique : science de l’audition, science du son