Jean-Marc Duchenne

 

 

 

 

Un acousmonef nommé désir

 

version française complète de l'article "An acousmonef named desire" paru dans le n° 24 de la revue

Sonic Ideas du Centre Mexicain pour la musique et les Arts Sonores, sur une proposition de Luis Naón

www.sonicideas.org et www.cmmas.org

 

- octobre 2020, première révision juin 2021, deuxième révision décembre 2022 -

 

 

 

 

l'acousmonef en juin 2021

 

 

 

 

 


Pour un compositeur de musique électroacoustique/concrète/acousmatique1, c'est à dire quelqu'un qui, à l'aide d'outils dédiés ou détournés, confectionne des sons qui sont produits et perçus au moyen de haut-parleurs, le désir de créer quelque-chose qui puisse être audible par un auditoire peut conduire à des cheminements plus ou moins complexes...

Comme pour moi ce "quelque-chose" représente un objet très concret, dans sa matière comme dans la manière dont il se manifeste dans l'air pour aller toucher les oreilles des auditeurs, il m'a fallu trouver au fil des années des moyens pour le faire, des mots pour le penser... et des lieux pour le vivre.

 

Ce document représente essentiellement un témoignage.

À travers ce mixage de titres (le célèbre "Un tramway nommé désir" de Tennessee Williams / Elia Kazan et le bien moins connu "Un astronef nommé péril" de Maurice Limat) sont rassemblés ce qui m'a fait cheminer durant tout ce temps : la dimension sensuelle, quasi charnelle du son qui prend corps dans l'air, et, grâce à des outils de science-fiction de série B, l'exploration des espaces haut-parlants, étape après étape, œuvre après œuvre.

 

Le parcours qui est relaté ici correspond bien-sûr à une approche personnelle, qui plus est solitaire, mêlant considérations techniques, informations historiques et avis esthétiques qui ne sont certainement pas totalement exempts de parti-pris mais que j'espère suffisamment argumentés (sans aller trop loin dans leurs détails malgré tout).

Il est forcément singulier, et donc difficilement partageable, mais je pense néanmoins que les questions qui y sont abordées peuvent concerner, ou au moins interroger toute personne qui est impliquée dans la création sonore haut-parlante, que celle-ci soit "fixée" ou liée à une pratique "live".

On pourra y trouver également un ensemble de réflexions sur ce que pourrait être une salle d'acousma, un type de lieu qui soit dédié à la diffusion des œuvres acousmatiques comme quelques-uns en rêvent depuis longtemps.

 

 

 

La place de l'espace

On me présente souvent comme un spécialiste de la spatialisation, auquel cas je répond généralement "non, j'essaie juste de consacrer à la dimension spatiale du son la même importance qu'à ses autres aspects". Je pourrais même ajouter que la notion de spatialisation telle qu'elle est généralement considérée et pratiquée est contraire ou au moins très différente de ce que représente pour moi le travail sur l'espace des sons et comment sa composition se combine avec celle du temps dans des créations qui, pour reprendre les termes utilisés il y a 70 ans par Pierre Schaeffer, prennent en compte dans le concret de l'audition ce qui peut exister dans la salle.

 

L'élaboration d'une œuvre de type concrète/acousmatique nécessite me semble-t'il l'articulation entre trois environnements complémentaires :

1. des moyens pour produire les sons (par capture microphonique ou par synthèse) ;

2. des moyens pour les composer dans le temps et dans l'espace, les transformer et de leur imprimer une écriture particulière (avec aujourd'hui ordinateurs et périphériques, logiciels et plugins...) ;

3. des moyens pour les entendre, c'est à dire un dispositif de haut-parleurs et comment ceux-ci sont répartis dans le lieu de la production en fonction de la manière dont ils le seront pour la diffusion.

Ces moyens s'inscrivent à l'intérieur d'un certain format auquel ils se conforment. La stéréophonie à deux canaux en représente le cas le plus simple et le plus répandu, mais .

 

L'intérêt porte le plus souvent sur le second, ce qui est tout à fait compréhensible puisque c'est celui qui supporte traditionnellement la plupart des actions dites compositionnelles.

Pourtant, curieusement, dans les définitions courantes de l'art acousmatique ou de la musique concrète (sur Wikipedia par exemple2), si le premier est rapidement cité on oublie presque toujours le troisième. Ceci laisserait penser soit qu'il est unique et invariant, soit qu'il peut être négligé car il ne constituerait qu'un contenant, une boîte conventionnelle à l'intérieur de laquelle serait placé le contenu, l'œuvre ?

À l'inverse, dans des domaines a-priori pourtant moins axés sur des créations sonores originales comme le cinéma et le spectacle en général, on va promouvoir la "révolution" que représentent le "surround" et maintenant la "3D immersive", "l'hyper réalité" ou juste le "Spatial Audio". Cet accent placé sur la situation d'écoute haut-parlante et ce qu'elle est sensée apporter à la production de contenus est en soi tout à fait légitime et bienvenue, même s'il est souvent bien exagéré par rapport à ce que cela représente réellement et que les intérêts commerciaux dépassent certainement ceux de la création... (voir l'introduction de la dernière partie).

Mais quoi qu'il en soit, ce sont bien dans tous les cas les interactions entre ces trois éléments qui permettent de construire une œuvre d'une manière sensible, et à ce titre, qu'on en ait conscience ou non, la troisième composante représente bien plus qu'un simple système de "monitoring".

Dans une composition qui tient compte des conditions d'écoute (cf. la citation de Pierre Schaeffer ci-dessous), selon le type de projet sur lequel on travaille (réalisation d'un média pour la diffusion domestique, installation, pièce destinée à être diffusée en concert...), celle-ci devrait participer activement à la conception de l'œuvre, dans ce va-et-viens constant entre le penser, le faire et l'entendre de la démarche concrète.

 

Dans ce cas, se pose alors la triple question : qu'est-ce que je fais, qu'est-ce que j'entends... et qu'est-ce que je souhaite donner à entendre ?

Celle-ci peut paraître triviale, et le fait est qu'on a vite fait d'y répondre si l'on crée pour et en fonction de l'écoute privée stéréophonique (ou binaurale).

Pourtant, si l'œuvre est non seulement musicale mais aussi plastique, si le son ne constitue pas que la concrétisation d'une intention mais aussi un phénomène original dans toute sa richesse, sa complexité et ses particularités, alors sa réalité haut-parlante n'est pas seulement un habillage mais fait partie de ce qui le définit.

Je rappellerai ici comment Pierre Schaeffer posait de manière extrêmement claire et pertinente cette interrogation au tout début de l'histoire de la musique concrète (le terme de "relief" correspond ici à cette dimension spatiale procurée par l'utilisation de plusieurs sources de diffusion) : « En quoi, en effet, le relief est-il lié à la musique concrète ? Il l'est, soit au départ, dans la conception même de cette nouvelle musique, soit à l'arrivée, dans l'exécution, par projection sonore, des œuvres concrètes. Dois-je dire qu'il y a, là aussi, une confusion possible ?

Dans la mesure où les objets sonores concrets impliquent une plastique, peut-être en effet qu'il ne suffit pas de réaliser des tracés de hauteur, de dynamique, et de timbre, sur un enregistrement qui ne se préoccuperait aucunement des conditions d'écoute. Ces tracés doivent ou ne doivent-ils pas correspondre, dans le concret de l'audition, à des tracés réels, perçus dans la salle par les trois dimensions de l'oreille ? Doivent-ils au contraire, comme dans la musique classique, se présenter à l'état pur, aspatial si l’on peut dire… » (Pierre Schaeffer : À la recherche d'une musique concrète, Seuil, 1952).

Pour des raisons techniques évidentes à cette époque, c'est cet "état pur" qui a été choisi et qui continue encore aujourd'hui, pour d'autre raisons3, de représenter l'approche la plus pratiquée dans le milieu acousmatique.

 

Pour ma part, l'expérience que j'avais acquise au milieu des années 80 des rapports entre composition stéréophonique et spatialisation en concert m'a fait me poser les questions "Pourquoi ne pas créer directement ce que je souhaite faire entendre ? Pourquoi ne pas considérer l'espace comme un élément du son que puisse composer plutôt qu'un moyen pour donner plus d'ampleur et de relief à des œuvres déjà composées ?", il m'a fallu trouver les moyens pour pouvoir déporter le relief habituellement généré lors de la diffusion publique vers le temps et l'espace de la composition, de la spatialisation du concert vers la spatialité de l'œuvre, ou, pour reprendre les termes introduits par Michel Chion dans son ouvrage L'art des sons fixés4, transférer le rôle alors dévolu à l'adaptation de son espace externe vers l'écriture de son espace interne.

Comme on peut le lire aujourd'hui dans la définition sur Wikipedia : « L’acousmatique est un art sonore. Les œuvres qui en sont issues ne se manifestent que par la lecture du support sur lequel elles sont enregistrées, fixées dans une forme définitive ». Si on n'oublie pas d'ajouter après "manifestent" quelque-chose comme "au moyen de haut-parleurs" c'est simplement ce que j'essaie de faire depuis...

 

 

Un acousmonef ?

Pour la création d'une œuvre acousmatique (je conserverai maintenant ce terme tout au long du texte), la nécessité de disposer d'un ensemble d'enceintes dont la répartition spatiale soit cohérente avec celle qui est prévue pour son écoute publique est celle, prosaïque, de pouvoir entendre ce que l'on est entrain de faire avec un rendu qui soit suffisamment représentatif de la moyenne des situations envisagées pour en assurer l'identité.

À la fin des années 80, tout comme durant les années 90, les studios qui étaient équipés pour une production multiphonique au delà de l'octophonie étaient extrêmement rares, et pas forcément bien adaptés... (sans parler de leur accessibilité). Même encore aujourd'hui, les lieux qui abordent la création spatiale se conforment le plus souvent à des formats liés à la production cinématographique ("surround", Dolby Atmos5...), à des environnements audio-visuels ou à des procédés techniques particuliers ("dômes ambisoniques"6), ou qui suivent simplement des contraintes pratiques et économiques (cercle octophonique).

Ce dont j'avais besoin c'était de pouvoir explorer plus largement et fondamentalement comment la prise en compte des espaces, quels qu'ils soient, pouvait accompagner mes projets et même donner naissance à des écritures, des perceptions, des émotions originales. Pouvoir accéder quotidiennement aux outils de production, de composition et d'écoute nécessaires, même a-minima concernant leurs caractéristiques techniques, représentait ainsi pour moi la seule possibilité envisageable.

 

L'acousmonef est le petit nom que j'ai donné à mon environnement de composition lorsque je me suis établi en 2018 dans l'ancienne salle de La Lyre Amicale à La Monnerie-le-Montel.

Depuis le début des années 90 je décrivais mon lieu de travail comme un "atelier-acousmonium7", un endroit où l'on façonne les sons et les œuvres destinées à la diffusion sur ensembles de haut-parleurs. Mais lorsque j'ai commencé à aménager ce dernier, le terme de Voyages en acousmonef que j'avais utilisé de temps en temps pour qualifier les diffusions que je proposais avec mon dispositif mobile s'est tout de suite imposé à moi pour définir le voyage que j'espérais y poursuivre pendant encore quelques années...

Comme ceux que j'avais occupé précédemment (notamment à Lyon et à St-Étienne), c'est un lieu qui rassemble les trois environnements cités plus haut, dans ce cas principalement configurés pour la création des œuvres destinées aux diffusions sous la forme de séances (ou de concerts). Il peut également accueillir temporairement mes autres travaux, notamment les installations qui utilisent des éléments matériels très différents.

 

Petite chronologie

Présenter les étapes8 du parcours qui m'a conduit jusqu'ici est peut-être la manière la plus simple pour comprendre ce qu'il représente.

1987 : les prémices

Après La cicatrice du geste qui avait été composée en stéréophonie en vue d'être spatialisée sur un acousmonium (certaines parties n'ont pas grand sens si elles sont écoutées en stéréo) et Gaïa, Helia, Selia composée en quadriphonie et nécessitant également une spatialisation, ma première œuvre conçue pour être diffusée directement est Quatre études d'espace composée en octophonie en 1987-88. La réalisation s'était effectuée sur un magnétophone 8 pistes (mais avec au départ une écoute uniquement stéréo...), et la configuration spatiale suivait l'arrangement par paires utilisée dans les acousmoniums :

En 1989, grâce à l'achat de nouvelles paires d'enceintes, la composition de Mobilis in mobile s'est faite selon la même disposition et a pu enfin s'effectuer avec l'écoute octophonique correspondante. Ce format sur huit canaux possédait déjà les capacités de créer des spatialités et des écritures sonores qui se situaient bien au-delà de ce que j'aurais pu obtenir avec une stéréophonie spatialisée. Il entérinait mon abandon de la spatialisation au profit de la composition, mais il était aussi encore très loin de permettre d'accéder au potentiel que laissaient entrevoir les acousmoniums courants. Conclusion : il fallait donc multiplier le nombre de canaux de fixation et d'écoute...

 

1990 : la mise en place

J'ai ainsi étendu mon dispositif à 12 canaux pour La route buissonnière puis pour Le temps des ambiguïtés, qui étaient toujours basés sur les mêmes paires "2D", mais avec tout de même l'utilisation de deux points "en douche" placés au dessus du public. La composition était répartie entre le magnétophone multipiste et un échantillonneur EPS + Cubase synchronisé à la bande magnétique, le premier étant dévolu aux points et plans fixes et le second à des masses spatiales9 plus libres et mobiles :

 

Cette première évolution changeait déjà énormément les possibilités d'écriture, et contribuait à apporter plus de subtilité et une meilleure stabilité aux masses et aux images spatiales. Cette étape marquait aussi le début "officiel" de mon atelier-acousmonium, de la dynamique qui a guidé son extension progressive... et de mes difficultés pour lui trouver un lieu approprié.

J'aurais pu continuer à ajouter d'autres points pour étendre encore et préciser ce plan horizontal, et arriver à couvrir d'une manière quasi optimale l'espace commun à la plupart des acousmoniums (chose que j'ai faite un peu plus tard avec les Six études polyphoniques sur 16 canaux), mais il m'apparaissait que ce type de disposition conçu pour l'élargissement de mixages stéréophoniques assujettis au champ visuel n'était finalement pas adapté pour faire entendre des compositions qui soient pensées en fonction de critères propres à l'audition pleine.

 

                                                                                                   

                              Quatre études d'espace (1988)             Le temps des ambiguïtés (1991)          Scènes de la réalité plus ou moins quotidienne (1993)

 

Le passage sur 16 canaux et l'abandon de la bande magnétique au profit d'un second échantillonneur pour Scènes de la réalité plus ou moins quotidienne en 1993 et surtout Formes et couleurs de la vie en 1994 a ainsi représenté pour moi une avancée majeure sur le plan des possibilités d'écriture et d'expression sono-spatiale.

Si le dispositif des Scènes possédait encore comme base le schéma de l'acousmonium (seulement six points étaient disposés en hauteur), celui des Formes et couleurs de la vie, avec son maillage "3D" irrégulier composé d'une cube convergeant (projection centripète) et d'un "arbre" central divergeant (projection centrifuge) sur quatre niveaux de hauteur, constituera le noyau autour duquel s'étendra progressivement mon dispositif fixe, jusqu'à celui de l'acousmonef.

Le même principe sera repris sur 24 canaux pour L'œil tactile lors de mon établissement à Lyon en 1996 (avec un troisième échantillonneur).

Formes et couleurs de la vie : 8 points extérieurs + 8 points intérieurs

 

 


L'œil tactile : 12 points extérieurs + 12 points intérieurs... et l'implantation pour sa composition dans l'atelier de Lyon en 1996

 

Parallèlement à ces compositions, ces années ont également vu l'élaboration du projet littéralement utopique "Douze essais pour explorer l'espace acousmatique" en 1991, un programme dont je n'ai pas encore fini d'explorer toutes les implications concrètes... Non réalisé en tant que tel, il a tout de même donné naissance aux différentes versions de l'Acousma-Parc, m'a amené à formaliser l'idée d'espace-objet et à définir un peu plus tard les critères d'espace de l'objet-sonore. En quelques mots, ces douze projets associaient intimement l'exploration des dispositions spatiales, des configurations d'écoute et bien-sûr des contenus, pour des lieux variés et jusqu'à 24 canaux.

 

quelques pages du livret du projet des "12 essais" ...

 

 

... réduit aux dispositifs des 9 pièces qui constituaient l'Acousma-Parc (1)

 

 

 

 

2004 : le retour et le développement

Après un temps consacré entre autres à la création vidéo et au multimédia (plus de lieu pour l'atelier...), j'ai repris progressivement le fil de mon désir en m'établissant à Pélussin où j'ai pu disposer à nouveau d'un espace de 40 m².

 

 

Cette période a été marquée principalement par la recherche de compatibilités des formats spatiaux en réponse directe aux difficultés rencontrées durant ces années pour trouver des diffuseurs (par qui, comment et où faire jouer mes œuvres ?), mais qui correspondait également à une réflexion plus globale et fondamentale sur les contraintes de la situation du concert.

Le modèle de l'acousmonium  semblait toujours représenter une voie envisageable, et j'avais légèrement modifié mon dispositif en fonction de ce que je pouvais en espérer (Deux Nocturnes, Ouverture, Peinture noire sur 16 canaux 2D).

                           

disposition "2D" compatible avec les acousmoniums et le format "3D" du 17.1

 

Mais le début des années 2000 a surtout vu l'émergence de nouveaux formats très intéressants autour de l'industrie du cinéma, d'abord le 17.1 pour le "wave" de Microsoft, puis le 22.2 de la NHK. Bien qu'uniquement périphoniques10, ils ont représenté pour moi durant les années qui ont suivi un riche support de créations (Constructions I, Espaces intimes et extraordinaires, Musiques de chambres, Les sons d'éternèbre, Les corps sonnants...), même si mon espoir que ceux-ci finissent par toucher le milieu acousmatique a été totalement vain...

Il a fallu attendre 2012 avec mon nouvel atelier à St-Étienne pour que reprenne vraiment l'évolution de mon dispositif haut-parlant fixe, par l'extension des formats cinéma vers une haute résolution hypothétique mais bien venue (Histoires fantacousmatiques sur 32 canaux), par le reprise de la disposition en "cirque" (Jeux de construction) jusqu'à 57.2 canaux en 2016 (Études pour membranes), et par ma première composition au format dôme sur 43 canaux pour la Satosphère de Montréal (SSoSFAGTiaCaGwaP).

 

Cette période a été aussi marquée par un nombre important d'œuvres non basées sur le dispositif de l'atelier-acousmonium, notamment les "miniatures" de Bibelots, Eaux-Fortes, Totems/Golems..., les dispositifs interactifs de Les pieds sur Terre et Grissonnages, et les installation Forêt fragile et Acousma-Parc 2.

 

             

"Totems/Golems" (10 canaux chacun) dans les souterrains de l'Hôtel-Dieu et dans la médiathèque du Conservatoire à Clermont-Ferrand

 

le plan de "Forêt fragile" au festival Musiques Démesurées (180 canaux / 194 enceintes, 2017)

 

2018 : l'aboutissement ?

Ce dernier changement de lieu, grâce à ses dimensions généreuses (130 m² en tout sur 6 m de hauteur), m'a d'abord permis d'étendre légèrement le dispositif précédent (59.3) et surtout de le recentrer sur ce qui faisait son originalité et qui avait marqué pour moi un point de non-retour en 1994 : la disposition en "cirque", notamment pour la finalisation de La Cage. La compatibilité avec les formats cinéma, dôme, maillage 3D et même l'acousmonium était bien-sûr toujours assurée.

L'année d'après, à l'occasion de la composition de Densités, l'extension à 70 canaux (67.3) a cette fois, peut-être, marqué l'aboutissement de mon désir d'espace, en tout cas sur le plan matériel...

 

 

 

 

 

Formats spatiaux et compatibilités

Avant d'aborder la description de l'acousmonef, il me faut préciser où il se situe parmi les types de productions possibles et leurs usages : espace privé/domestique, rassemblements publics sous la forme de spectacles, expositions/installations, interventions éphémères, objets haut-parlants... chacun permet de créer et de partager les sons de manière particulière et différente.

 

Mon désir d'explorer les particularités et la diversité de la création sono-spatiale a depuis longtemps trouvé son terrain privilégié avec les installations. Comme celles-ci sont généralement construites sur des principes originaux, tant en ce qui concerne les dispositions haut-parlantes que les éléments matériels qu'elles utilisent, ceci a en quelque sorte libéré la conception de mon dispositif fixe qui pouvait ainsi être consacré au cas spatialement plus contraignant de la séance haut-parlante.

Le principe bien connu, que l'on peut assimiler à celui d'un concert sans musiciens ou, plus justement, à celui d'une séance de projection cinématographique, repose sur une certaine indépendance entre les compositions et les conditions de leur diffusion : les œuvres doivent pouvoir être diffusées sur des dispositifs et dans des lieux différents, et un même dispositif / lieu doit pouvoir diffuser des œuvres d'origine diverse.

Ceci impose la notion de format spatial, tant pour la production que la transmission et la diffusion, et si cette contrainte est certainement moins draconienne que celle qui préside à la diffusion domestique (disque, DVD, radio, Internet...), elle nécessite néanmoins un certain niveau de normalisation qui doit être forcément pris en compte dès le départ. C'est là, bien-sûr, où la possibilité de conserver le format stéréophonique constitue un avantage certain... ;-)

 

Formes et formats

Heureusement, corollaire de cette normalisation, et contrairement à d'autres types de compositions et de situations d'écoute comme les installations, la question de la disposition précise des enceintes est ici relativement secondaire : ce qui compte c'est de pouvoir conserver les rapports qui existent entre les sons au sein de l'espace composé (la polyphonie spatiale chère à Patrick Ascione11) et comment ils sont présentés aux auditeurs. Il "suffit" donc de s'assurer que le type de disposition spatiale et la place du public sont cohérents par rapport à la conception et l'écriture des œuvres...

 

Le cas du dôme représente un bon exemple de cette relative indépendance à la quantité et même à la position des points haut-parlants : quel que soit le nombre d'anneaux concentriques en élévation et le nombre de points haut-parlants sur chacun d'eux, sa forme globale et son principe de diffusion restent les mêmes, c'est une surface qui entoure l'auditoire et la projection des sons est focalisée sur son centre.

Si la qualité du rendu effectif dépend bien-sûr du nombre et de la résolution de ces anneaux, toute composition réalisée pour un dôme devrait pouvoir être diffusée sur un autre sans altération essentielle de sa spatialité (en fonction tout de même de l'ambitus de son élévation, voir plus bas).

On pourra faire le même genre de constatation pour les formats cinémas "3D" (Auro-3D, NHK 22.2, Atmos...), pour les les maillages 3D ou même les acousmoniums : tant que l'on ne supprime pas une dimension, par exemple

  

l'élévation pour les formats cinéma ou le passage d'un maillage tri-dimensionnel à la périphonie, les seuls effets obtenus sont des changements dans la "netteté", dans la stabilité des espaces et dans l'étendue des points d'écoute convenables... ce qui, je le concède, n'est pas rien non plus !

 

De cette manière là, qu'elles soient réalisées sur 32 canaux comme Cordes frottées ou sur 42 comme Trois tableaux en quatre dimensions, toutes mes compositions au format cinéma sont jouables sur un dispositif de type NHK 22.212 ou même sur certains dômes. Celles qui sont réalisées pour le cirque pourraient être diffusées sur un système 4D-Sound13, pourtant basé sur un type de maillage assez différent (voir plus bas).

 

Il existe bien-sûr des cas ambigus, qui bien qu'ils semblent appartenir au même type spatial sont en fait très différents et peuvent faire basculer le rendu d'une composition du côté acceptable vers le côté impossible.

Par exemple, le "22.2" basé sur le cube permet un certain niveau d'écriture de l'élévation, de la verticalité (la zone frontale est constituée d'un plan possédant trois niveaux de hauteur), alors que format Dolby Atmos ne comporte qu'une surface répartie à l'avant et au dessus de la tête des spectateurs. Tous deux appartiennent à la catégorie des formats cinéma mais une écriture vraiment réalisée pour le premier perdrait une partie importante de son sens et de son intérêt une fois diffusée sur le second.

        

                                                      NHK 22.2                                                                                                       Dolby Atmos

 

Le(s) point(s) de vue

Un autre aspect important lié à ce type de diffusion est le rassemblement d'un auditoire immobile sur une durée déterminée.

Il conduit à une multiplication de points d'écoute statiques (on ne bouge plus une fois qu'on est assis...) qui pose la question cruciale du "point de vue", de son unicité ou de sa multiplicité : est-ce que tout le monde doit entendre exactement la même chose, ou au contraire est-ce que je m'attache à produire un espace et une écriture dont la perception puisse être différente mais cohérente pour l'ensemble des points d'écoute possibles ? Dans le premier cas cela conduit inévitablement à devoir restreindre la zone du public ou à accepter qu'il existe une distorsion de la spatialité perçue plus ou moins importante pour certains auditeurs (latéralisations, masquages, "figures d'espace" inaudibles etc.), et dans le second à changer certaines habitudes de représentation spatiale.

Le choix du type de disposition (périphonique vs maillé) comme celui des techniques employées (traitement ambisonique vs multicanal direct) est ici déterminant.

 

Pour illustrer rapidement cette histoire de compatibilités, je prendrai l'analogie de la musique instrumentale avec l'orchestre symphonique (après tout, on parle bien "d'orchestre de haut-parleurs"...).

Si l'on considère le grand orchestre du début du XXème siècle (celui de Ravel par exemple) comme disposant des ressources optimales pour l'écriture de l'orchestration, on peut se représenter ses déclinaisons moins complètes comme des sous-ensembles pouvant faire l'objet de compositions particulières. L'ensemble de cordes en constituerait par exemple le noyau commun, tout comme l'est la périphonie 2D pour cette catégorie d'espace haut-parlant, les bois, les cuivres et les percussions en représentant des enrichissements, comme l'élévation et l'espace intérieur.

Ainsi, de la même manière qu'un système 4D-Sound peut diffuser quelque-chose qui a été réalisé pour un dôme mais pas le contraire, un orchestre complet peut exécuter la Symphonie pour cordes de Britten mais un orchestre à cordes ne pourra pas jouer Daphnis et Chloé...

Ceci ne signifie évidemment pas que l'ensemble à cordes possède une moindre valeur musicale, juste que certains aspects de l'écriture des timbres lui sont totalement étrangers.

 

Pour résumer, nous aurions :

 

projection

dimensions

espace

symétrie

auditeurs

+

-

 dôme

périphonique

sphérique, focalisé

radiale

quelconque

facilité d'adaptation de la résolution, visuel "immersif"

espace creux,

"fausse 3D"

 cinéma

périphonique

2 ou 3

cubique, focalisé

latérale

rangées

cohérence visuelle scénique, verticalité possible

espace creux

 maillage 3D

multi-couche omnidirectionnel

3

cubique ou sphérique, relatif

(sans)

quelconque

espace "plein",

distances variables

non compatible avec le visuel traditionnel

 cirque

multi-couche

(centripète + centrifuge)

3

idem

radiale

anneau(x)

idem

idem

 acousmonium

périphonique

(+ multi-couche)

2 (3)

focalisé

latérale

rangées

cohérence visuelle scénique

généralement 2D,

peu reproductible

 

 

Comment l'acousmonef se situe-t'il par rapport ces contraintes ?

On l'a vu plus haut, la création et le développement de mon dispositif fixe n'a pas obéi à un quelconque "intelligent design" préalable, mais au contraire à une confrontation permanente entre des envies compositionnelles et la nécessité de leur procurer une écoute qui leur soit adaptée.

Une partie importante de mon travail, autant par mes créations que dans la conception de mes outils a été consacrée à explorer et à mettre en place quel pouvait être un "Plus Petit Commun Multiple" et un "Plus Grand Commun Dénominateur" à ces modèles14.

Initialement basé sur celui de l'acousmonium, s'étant développé par expérimentations et réflexions vers celui d'un maillage tri-dimensionnel irrégulier, ayant subit et intégré les influences des formats du cinéma, le résultat est une disposition assez complète et complexe, qui couvre un large spectre des écritures sono-spatiales et des formats que l'on peut envisager dans le cadre particulier de la séance haut-parlante.

Dans son implantation actuelle, l'acousmonef intègre avec une efficacité raisonnable les cinq types de dispositions rassemblés dans le tableau précédent. Ceux-ci peuvent être facilement rendus sans nécessiter de modifier quoi que ce soit dans son arrangement matériel : il convient juste de disposer les auditeurs selon l'espace de représentation requis par les œuvres, et éventuellement pour les formats focalisés comme le dôme, de compenser les écarts de distances entre les positions "idéales" et réelles (ce qui se fait aujourd'hui facilement avec nos outils logiciels).

 

   

               l'acousmonef complet (67)                                                                    un maillage de type 4D-Sound (48)                                                       le dôme de la Satosphère (31)        

   

                             le 22.2 de la NHK                                                                   le Dolby Atmos en 16.3.10                                                                         un acousmonium ? (22)     

 


         le "cirque"                                                                                                      le "dôme

le "cinéma"

 

Il me faut tout de même préciser qu'en ce qui concerne l'acousmonium, c'est pour l'instant un peu un vœux pieu : bien que basés sur des principes souvent voisins, il n'existe actuellement pas de concertation entre les dispositifs de diffusion que l'on peut regrouper sous cette dénomination qui permettrait de composer des œuvres originales qui profitent pleinement de leurs caractéristiques.

Il ne s'agit pas la plupart du temps de limitations matérielles (bien que le nombre d'enceintes de qualité disponibles et la manière de gérer les canaux de diffusion puisse dans certains cas limiter les formats) ni logicielles (les adaptations sont aujourd'hui faciles et rapides à réaliser avec quelques plugins bien choisis15) mais de différences de conception liées à la formule du concert : il est effectivement plus logique de privilégier une action de spatialisation réalisée en "live" en aval plutôt que la diffusion invisible de compositions à la spatialité entièrement fixée en amont.

Certains conjuguent toutefois les deux aspects16, et on peut espérer que cette situation évolue dans les prochaines années, car le principe multicouches sur lequel sont basés la plupart de ces dispositifs constitue une voie originale qui me semble équilibrer la dimension uniforme et un peu univoque des systèmes périphoniques habituels.

 

Si j'ai abordé assez longuement cette question des compatibilités c'est que, au-delà de son intérêt pratique, elle souligne l'importance du choix d'un dispositif spatial, qui même dans le cadre limité de la séance et du concert peut apporter une certaine diversité aux compositions, ou au moins s'accorder plus ou moins bien avec elles.

J'ai bien-sûr une préférence personnelle pour le maillage du cirque qui me permet, comme avec l'orchestre au complet, de pouvoir profiter de la palette compositionnelle et expressive la plus vaste, mais chacun présente des qualités qui sont intéressantes à exploiter.

Par exemple l'importance frontale et l'axe de symétrie latérale du modèle du cinéma offrent un espace de représentation mentale qui s'inscrit dans celui du champ visuel et qui s'accorde parfaitement avec l'idée de narration que je me faisais pour la composition des Histoires fantacousmatiques. Au contraire, la diffusion englobante et la possibilité d'écouter d'une manière allongée dans un dôme convenait bien au principe de l'immersion agitée de SSoSFAGTiaCaGwaP...

 

Le cirque

Un petit mot tout de même à propos de ce "cirque" dont je n'arrête pas de parler et qui constitue la disposition native de l'acousmonef sur laquelle les autres se sont greffées depuis 1994.

Contrairement à celle qui a été adoptée pour les représentations comparativement statiques du théâtre et de la musique puis du cinéma (le mouvement est à l'intérieur de l'image), elle prévaut pour les spectacles cinétiques - cirque, stade, boxe... - où les spectateurs entourent le lieu de l'action.

Ce que j'aime particulièrement dans le modèle du cirque c'est qu'il  comprend aussi bien la piste et les agrès des trapézistes que le chapiteau et la structure porteuse, tout ce qui fait que l'on est à la fois immergé et attentif. Le public peut d'ailleurs s'installer aussi sur la "piste" (pour les séances de L'œil tactile en 1996 les chaises étaient disposées en spirale) du moment qu'il se situe d'une manière à peu près équidistante des points les plus proches (voir plus bas).

En offrant à chaque auditeur un large panorama frontal tri-dimensionnel et multiplans ainsi qu'une immersion complète s'étendant jusqu'au sol, le cirque me semble apporter au domaine de la séance publique une réponse à la question du partage ou de la distribution des points d'ouïe que je trouve particulièrement adaptée à la situation d'écoute pleine (sans éléments visuels) : chaque place correspond à un angle différent mais toutes bénéficient d'un équilibre équivalent. C'est le contraire de ce que l'on obtient avec les alignement en rangées du cinéma ou du concert où chaque auditeur devrait partager le même point d'ouïe - ce qui est évidemment impossible - mais où chaque place produit un équilibre différent.

Pour revenir sur cette histoire d'unicité ou de multiplicité de point d'ouïe, la question se pose évidemment aussi durant la production : où se placer pour composer si le point central n'est pas représentatif de l'écoute du public ? Pour obtenir une moyenne cohérente je me situe généralement au niveau de l'anneau intérieur (les petits cercles sur le schéma de la page 20), mais le poste de travail étant sur roulettes il peut être facilement placé d'une manière plus excentrée et mis complètement de côté pour les écoutes. Et puis je dispose de suffisamment de sièges pour pouvoir tester toutes les places ;-)

 

 

 

Alors, concrètement...

La question de l'équipement qui constitue l'acousmonef sort un peu du propos de ce texte.

J'en aborderai tout de même quelques aspects plus loin, mais je dirai simplement en introduction que, pour des raisons de moyens financiers autant que de l'étalement des achats sur plus de trente ans, son parc matériel d'enceintes et d'amplificateurs est assez éloigné des critères d'un studio de production semi-professionnel...17

Mais il résulte aussi de choix : si les enceintes ne sont pas toutes identiques elles sont tout de même agencées par "familles" en fonction de leur timbre et de leur emplacement. Par exemple les 19 qui sont placées aux points les plus élevés sont de petites JBL d'un modèle voisin (SCS-178 pour la périphérie et Control 1 pour l'intérieur) et nous le verrons plus loin, celles qui couvrent la zone intérieure ont été patiemment sélectionnées... Cette relative diversité (qui n'a rien en commun avec la recherche de couleurs fortement marquées que l'on peut trouver dans certains acousmoniums) est associée à un soucis de cohérence, et les égalisations de la section de monitoring FX de Reaper sont assez nombreuses pour le rappeler (47 canaux sont traités sur les 67, certains très légèrement et d'autres d'une manière plus appuyée).

la série de plugins d'égalisation (par groupes ou séparés), et le notch à 150 Hz

 

Cela dit, il ne serait pas judicieux de juger de l'efficacité d'un tel équipement à l'aune du monitoring stéréophonique ou surround : on ne demande pas la même chose à chaque enceinte, et, d'une certaine manière, leur nombre compense leurs éventuelles faiblesses individuelles. Et si, lors d'une diffusion sur un meilleur équipement la composition sonne encore mieux que chez moi, ce n'est vraiment pas un problème ;-)

En ce qui concerne l'acoustique, les dimensions de la salle (environ 14 x 9 x 6 mètres) la situent à mi-chemin entre celle d'un grand studio de composition et d'une petite salle de spectacle. Ceci lui apporte une aération qui est très agréable et bien utile pour apprécier les masses et les reliefs, mais aussi quelques petits désagréments dus aux distances et à certaines réflexions. Mais à part une petite résonance à 150 Hz qui nécessiterait encore quelques basse-traps bien placés l'ensemble a été assez bien traité par des aménagements empiriques progressifs.

 

1. Combien ?

La première caractéristique qui est souvent mise en avant lorsque l'on décrit un dispositif haut-parlant est le nombre de ses points de diffusion.

Par exemple : l'Espace de projection de l'IRCAM à Paris 264 (carré WFS) + 75 (dôme), le Cube de la Virginia Tech 124, le SARC à Belfast 48, le dôme de la Satosphère à Montréal 157 (mais groupés sur 31 canaux), le Sound Dome de la ZKM 47 etc.

Et c'est bien normal car c'est ce qui justifie en grande partie le déplacement du public : on n'a pas ça chez soi...

Mais c'est surtout un bon indicateur de la richesse sono-spatiale que l'on peut attendre de ces dispositifs.

Bien-sûr, c'est comme pour un grand orchestre symphonique : le nombre des instruments présents ne garantit en rien que les œuvres jouées disposent d'une orchestration intéressante, mais à moins que la diffusion s'effectue d'une manière totalement virtualisée (WFS focalisée en haute densité18), cette valeur détermine malgré tout la limite supérieure de ce qui pourra être généré et entendu. Que l'espace produit en amont soit de type nodal (l'espace est échantillonné19 d'une manière linéaire ou non), qu'il soit traité comme un champ harmonique (l'espace périphonique est compressé en un point unique puis décompressé en fonction des points haut-parlants disponibles) ou décrit selon des informations paramétriques (des sons spatialement simples sont associés à des coordonnées spatiales) la résolution du dispositif de diffusion, et donc le nombre de point dont il dispose, détermine toujours sa réelle complexité spatiale en même temps que son efficacité dans l'écoute, en termes de précision et de stabilité notamment.

 

Petite apologie du nombre

Un des problèmes actuels est que nous raisonnons encore majoritairement a-minima, en référence au nombre de points haut-parlants réduit qui suit les contraintes de la diffusion domestique. Le résultat est que si nous recherchons une apparence de continuité spatiale, "d'immersion" dirons nous aujourd'hui, nous nous appuyons excessivement sur la production de masses spatiales fantômes, et si c'est mal fait (ou si on a un autre parti-pris) on dit "j'entend les enceintes", ce qui signifie plutôt dans ce cas "j'entend la technique plutôt que le son".

À une époque où l'on capture des vidéos en 4K ou même en 8K sur un smartphone, traiter le son en 7.1.4 ou en ambisonique d'ordre 3 n'est tout de même pas bien sérieux ;-)

Disposer d'un nombre de points élevé renverse cette tendance ainsi que la part dévolue aux fantômes, ou tout du moins à leur utilisation : si on a besoin d'eux c'est pour le flottement qu'ils apportent, pas pour combler des trous... Nous ne sommes alors plus condamnés à reproduire des images de champs acoustiques plus ou moins nettes, des phonographies qui soient uniquement basées sur des illusions, nous pouvons aussi créer des objets qui produisent des espaces dont la tangibilité peut soutenir la comparaison avec celle de notre réalité perceptive. C'est ce que redécouvre a minima L-Acoustics avec son système L-Isa20 en nommant "hyper réalité" le passage des deux canaux traditionnels de part et d'autre de la scène à... cinq !

 

À partir de quelle valeur s'effectue ce basculement ?

On ne peut le dire, mais pour moi il s'est effectué au début des années 90 autour de la valeur 16, et celui-ci a été suffisamment marquant pour que je n'ai de cesse de continuer à amplifier et affiner ce qu'il procurait.

Mais il y a également un moment où l'augmentation de la résolution ou de la densité21 n'apporte plus rien de substantiel : il y a de toute façon un nécessaire compromis à faire entre la place dévolue aux sons et celle que l'on réserve aux auditeurs...

 

Le dispositif haut-parlant de l'acousmonef comporte actuellement 70 canaux, répartis sous la forme d'un "67.3" (82 enceintes en tout, car certains points à l'intérieur sont constitués de deux ou quatre enceintes).

Sur ces 67 points, 40 sont situés sur la périphérie et 27 à l'intérieur de la zone d'écoute selon le principe du "cirque" (le chapiteau + la piste). On pourrait dire également qu'il est constitué d'un grand dôme sur 47 points répartis sur 4 niveaux et d'un petit dôme intérieur sur 18 canaux et 3 niveaux (+ 2 points au centre...), ou encore qu'il comporte quatre couches formées de trois anneaux concentriques22.

 

la disposition schématique des 67 points haut-parlants

 

l'affectation des canaux sur le plan à l'échelle (L0 vert, L1 bleu, L2 rouge, L3 jaune)

 

Cette valeur de "67" correspond au nombre de canaux d'écoute mais pas forcément à ceux de la production qui peut être différente et même lui être supérieure. J'ai par exemple composé Une pluie de toupie sur 124 canaux selon la disposition du Cube de la VirginiaTech23, et si j'étais loin de pouvoir apprécier le rendu de son carré inférieur de 64 points je disposais néanmoins d'une approximation suffisante pour en assurer l'écriture.

 

la répartition des 124 points du "Cube" sur deux bus 64 canaux dans Reaper

 

Je pourrais aussi pousser un peu au delà du nombre actuel.

Pour que cela apporte quelque-chose qui soit un tant soit peu significatif en terme de rendu, il me faudrait soit passer en maillage linéaire (5x5x5 + le sommet du dôme, voir Un volume plein plus bas), soit encore mieux multiplier l'ensemble de la résolution spatiale d'un facteur 1.5 environ. Compte tenu des différences de diffusion en fonction de l'élévation ou de la position intérieure/extérieure des points, et afin de conserver une zone de confort pour le placement des auditeurs, ceci conduirait à quelque-chose comme un "104.4"24.

Le jeu en vaudrait-il la chandelle ? Si j'avais 20 ans de moins, peut-être... mais ce n'est pas sûr car ça représenterait principalement un luxe, pas inutile mais néanmoins un peu superflu, et n'augmenterait en rien la qualité des œuvres pouvant y être produites.

Cependant...

 

Pour la disposition particulière du cirque, lorsque les auditeurs sont placés uniquement entre les anneaux extérieur et intérieur (les petites croix sur le schéma plus bas), il est possible d'ajouter quelques points additionnels dans la partie centrale. Ceci correspond à une sorte de sur-échantillonnage spatial localisé là où il y en a le plus besoin, c'est à dire à proximité en face des auditeurs. Dans cette zone où l'on ne peut pas jouer sur la convergence des ondes (projection centripète) pour "immerger" les auditeurs puisque ceux-ci l'entourent, on peut par contre augmenter la densité des points de radiation (diffusion centrifuge). L'enveloppe extérieure, correspondant pour eux aussi bien à "derrière" et à "plus loin devant" peut quant à elle se contenter d'une densité moindre.

Je n'ai pour l'instant fait qu'effectuer des tests sans aller jusqu'à les intégrer dans une composition, mais, sans surprise, leur apport est réellement appréciable pour tout ce qui est de l'ordre de "l'observation" plutôt que de l'immersion. Ils améliorent également la précision des profils cinétiques passant par l'intérieur (voir la question de la diagonale en page 21).

De là à systématiser ce "75.3", même avec des enceintes qu'il est facile de mettre de côté pour les configurations plus habituelles, je ne le pense pas, car cela aurait pour effet d'éloigner encore un peu plus les espaces composés de cette manière des systèmes de diffusion normalisés. Mais au point où j'en suis, je peux peut-être me permettre cette ultime fantaisie de temps en temps ? Après tout, c'est aussi un acousmonef nommé plaisir...

 

l'implantation des points additionnels à diffusion large (Mirage Omnisat) sur la piste du cirque sur trois niveaux d'élévation (en mauve)

 

 

Point trois ?

Traditionnellement relégués après le premier point dans la dénomination des formats spatiaux issus du cinéma, les canaux et les enceintes dédiés à la partie grave du spectre, sans être forcément indispensables, sont bien utiles non seulement pour générer les fréquences que des enceintes "normales" pourraient difficilement produire (c'est le cas dans l'acousmonef), mais aussi pour unifier la sonorité et lisser les mouvements grâce à leur répartition dans le lieu.

Ils sont au nombre de trois dans l'acousmonef, placés en un triangle irrégulier (numéros 68, 69 et 70 sur le plan) et ils reçoivent chacun un mélange différent de la partie grave en provenance de chaque canal (le bass management). Celui-ci est ajusté individuellement pour chaque enceinte en fonction de leur proximité spatiale et des caractéristiques propres à chacune.

Au fait, pourquoi "3" ? Seulement "2" ne permettraient pas d'obtenir une couverture satisfaisante, et pour "4"... il ne me reste plus que 3 canaux disponibles ;-)

 

les réglages de fréquence de coupure des filtres crossover et de gain d'envoi vers les 3 subs pour chaque canal

 

 

 

 

2. L'élévation et la "3D"

Le placement de points haut-parlants en hauteur par rapport aux auditeurs est loin d'être nouveau dans les installations, et même Disney l'avait déjà expérimenté en 1940 pour Fantasia et le Fantasound25 !

Mais il constitue maintenant la condition quasi sine qua non de la notion d'immersion et il a trouvé sa place aussi bien au cinéma qu'à la maison avec des labels comme Auro-3D, Dolby Atmos, DTS:X ou MPEG-H.

Pour la création sonore ceci constitue, après le "surround" ou l'octophonie en cercle, l'accès (enfin !) à la troisième dimension et ceci ne peut que me réjouir...

 

Cependant, le terme "3D" est éminemment trompeur car il confond le plus souvent la perception humaine et la production des sons, réduisant alors "l'espace" à ce qui peut se représenter comme une sphère perceptive26.

Il peut ainsi signifier aussi bien une simulation spatiale destinée à être écoutée au casque que l'organisation tri-dimensionnelle réelle de points haut-parlants dans un lieu. Le premier cas est d'ailleurs de loin le plus représenté, à tel point que lorsqu'on lit sur un site Internet ou dans une documentation les mots "espace + son + 3D + immersion" (ou "Audio Spatial") il y a toutes les chances pour qu'il ne s'agisse finalement que de reproduction binaurale, chose que l'on sait faire depuis Clément Ader27... Si au moins tout le monde s'accordait sur cette signification cela éviterait bien des confusions et ferait de cette image d'espace tri-dimensionnel l'équivalent direct et logique de l'image visuelle 3D. Car même avec un dispositif haut-parlant, ce terme peut parfois représenter une impression auditive vague sans pour autant signifier que la production ou la diffusion du son se fassent vraiment dans les trois dimensions de l'espace. C'est par exemple le cas avec certains dômes ou avec le format cinéma Dolby Atmos dans lesquels le niveau d'élévation le plus bas se situe déjà bien au-dessus de la tête des auditeurs : pour eux l'ensemble de l'espace du son consiste au mieux en une surface (2D) bombée.

Mais où est passée la troisième dimension ?

     

                     un dôme peut immerger plus ou moins complètement                                 l'implantation des enceintes en Dolby Atmos au cinéma

 

Là n'est pas l'endroit pour discuter de l'aspect géométrique des dispositions haut-parlantes, mais afin d'illustrer rapidement cette différence je prendrai le cas du dôme. Sa forme s'inscrit bien à l'intérieur d'un volume, mais c'est une surface et en tant que telle on n'a d'ailleurs besoin que de deux valeur pour définir la position des points que l'on va y placer : c'est l'azimut et l'élévation que l'on retrouve dans nos outils logiciels. Si on lui ajoute quelques-fois la distance celle-ci est alors virtuelle, il s'agit d'une image de distance (d'où la mention "2½" dans le tableau plus haut) comme l'est la profondeur en stéréophonie. Et cet espace à deux dimensions, même courbé, ne possède pas les propriétés d'un espace à trois dimensions : par exemple on ne peut pas y déplacer un point du bas vers le haut sans le déplacer en même temps de la périphérie vers le centre, on peut glisser sur sa surface mais pas pénétrer à l'intérieur autrement que sous la forme de fantômes... Comme toutes les dispositions périphoniques il projette en "3D" un espace "2D". Avec quelques autres du même genre, cette question constituait le propos initial des Paradoxes d'une sphère tronquée (dôme 43 canaux, 2016-18), les particularités qui en découlaient guidant et conditionnant l'écriture de la pièce.

 

Il faut tout de même rappeler que la perception dans l'axe vertical, excepté lorsqu'elle concerne des objets positionnés juste au-dessus de nos têtes, n'est pas évidente pour nous autres humains et qu'elle nécessite souvent en contrepartie d'être exagérée.

Sur cet aspect, je connais évidemment les contraintes qui existent pour placer des enceintes au dessous des auditeurs ! Mon seul véritable regret pour l'acousmonef est d'ailleurs qu'il ne puisse disposer d'un niveau inférieur, comme le Sonic Arts Research Center à Belfast ou le Spatial Sound Institute à Budapest...

Mais je sais parfois me montrer raisonnable, ce qui n'empêche que depuis les Formes et Couleurs de la vie en 1994 il est tout de même pour moi extrêmement important que le niveau le plus bas se situe au sol.

Ce placement possède certainement très peu d'incidence dans les grands lieux où les distances entre les auditeurs et les points haut-parlants rendent la différence angulaire entre un placement au sol ou à 1,50 m négligeable, mais il prend une toute autre importance dans de plus petits espaces, ou lorsque les auditeurs sont debout comme dans les installations.

Il est souvent objecté le risque de masquage des fréquences aigues, mais ce réflexe est sous-tendu par l'habitude de ne disposer que d'un nombre réduit de points haut-parlants sur un seul niveau de hauteur, et surtout par ne considérer que le cas de la reproduction d'une image de champ spatial, pas celui de la production d'un espace original.

Or, même avec des sources indirectes et partiellement masquées, nous faisons très bien la différence entre la présence et l'absence de ce plan sonore, comme du relief et de l'étendue des mouvements d'espace qu'il permet.

D'autre part, sans même parler de la localisation des sons, l'utilisation d'un niveau au sol a aussi pour effet d'abaisser l'ensemble de l'espace et de produire ainsi une spatialité vraiment "immersive".

 

Question subsidiaire : s'il faut des points au sol et d'autres en élévation au-dessus des têtes, faut-il en placer également à leur hauteur ?

Au cinéma comme dans la plupart des salles de concert, la réponse est quasi unanimement "non" car il faut pouvoir couvrir la surface du public aussi largement que possible, ce que favorise une projection plongeante (cf. la vue du Dolby Atmos précédente). Au contraire, en situation d'écoute domestique et en studio, on considère que c'est plutôt "oui", même avec les systèmes surround "3D".

On peut se représenter un maillage de points haut-parlants, qu'il soit réparti sur une surface ou qu'il s'étende dans les trois dimensions, comme une alternance de nœuds et de ventres qui déterminent la balance entre précision et diffusion selon la position d'écoute.

Dans un système périphonique la règle est simple : la position la plus équilibrée consiste à être à égale distance de tous les nœuds, c'est à dire qu'il faut se situer au milieu de tous les ventres, c'est le sweet-spot ;-)

Avec les maillages tri-dimensionnels c'est un peu plus complexe...

 

    

le maillage par triangulation du décodage ambisonique dans le plugin IEM AllRADecoder et une vue des "nœuds" d'un système 4D-Sound

 

Le cas du Spatial Sound Institute est à cet égard très intéressant : il dispose de quatre niveaux d'élévation, qu'on peut appeler -1, 0, 1 et 2, et si le niveau 0 correspond à celui des pieds le niveau 1 se situe bien au-dessus des têtes à 3 mètres. Comme les auditeurs sont généralement mobiles et debout cela garantit pour chacun de rester dans une zone où distance et présence s'équilibrent et évite certains effets liés aux variations de proximité ("zooms", ponctualisme etc.).

 

Dans l'acousmonef, où je le rappelle il n'y a pas de niveau -1..., le niveau médian se situe à 1,50 m, c'est-à dire un peu au-dessus des têtes lorsqu'on est assis, et un peu en-dessous lorsqu'on est debout, les niveaux intérieurs et extérieurs étant décalés afin de mieux répartir l'étagement de l'élévation en fonction de la position des auditeurs :

- niveau 0 (19 points, vert) : au sol partout

- niveau 1 (24 points, bleu) : à 1,50 m partout

- niveau 2 extérieur (12 points, rouge) : 3.80 m / intérieur (4 points) 3 m, très important pour conserver une présence qui fait souvent défaut dans les dômes hauts

- niveau 3, uniquement intérieur (le sommet du dôme ou du chapiteau, 7 points, jaune) : 4,80 m

- auxquels il convient d'ajouter la place du point central, sorte de niveau 1½ à 2 m

     

les petites croix et les petits cercles représentent les places les plus équilibrées pour des auditeurs assis28

 

En effet, pour en revenir à la perception de l'élévation, une manière d'aider les oreilles et le cerveau à décrypter ces informations est de décaler d'une manière plus ou moins prononcée l'alignement vertical des enceintes (cf. les travaux de Mike Williams29 pour la captation microphonique). Ceci est particulièrement efficace lorsqu'il s'agit de suivre des profils ascendants ou descendants qui profitent ainsi un peu des différences de phase et d'amplitude sur lesquelles la perception horizontale repose en grande partie.

En outre, un apport additionnel de ces décalages est de permettre en quelque sorte de simuler une résolution plus élevée, perceptible par exemple lorsque l'on réparti des profils d'animation sur deux niveaux de hauteur adjacents.

 

le déplacement apparent d'un objet sonore suivant la ligne en pointillés semble plus continu si les deux niveaux sont décalés

 

Dans l'acousmonef ces décalages sont liés avec les différences de résolution des trois ou quatre anneaux d'élévation :

- pour l'extérieur : 12 / 16 / 12, les niveaux 1 et 3 étant décalés de 15°

- pour l'intérieur : 6 / 8 / 4 / 6

La colonne centrale, elle (non représentée ici) est bien rectiligne...

du vert à l'orange, les 3 (périphérie) et 4 (intérieur) niveaux d'élévation et leur alternance très symbolique de nœuds et de ventres

 

 

 

3. Un volume plein

Pour créer un volume qui soit véritablement "3D" au niveau de sa production il ne suffit pas de projeter des sons vers l'intérieur, il faut aussi pouvoir les y placer réellement. Et si, en situation d'écoute domestique ou au cinéma on peut très bien se contenter des effets de la projection convergente pour simuler la proximité de sources sonores (l'effet "nearfield" tant recherché), pour que l'on puisse jouer concrètement avec elles et qu'une majorité d'auditeurs puisse en apprécier le résultat le plus simple est encore de disposer de points haut-parlants spécifiques d'où les ondes peuvent diffuser physiquement : c'est plus contraignant et moins élégant mais plus stable et beaucoup moins coûteux que la WFS focalisée ! En plus c'est aisément reproductible...

 

Une des particularités du dispositif de l'acousmonef depuis les Formes et couleurs de la vie est donc la présence de points de projection à l'intérieur de l'espace d'écoute.

La raison initiale était présentée dans le titre même de l'œuvre car si l'on sait traiter les "couleurs" sonores depuis longtemps, pour leurs "formes" c'était (et c'est encore) une autre histoire lorsque ce terme n'est pas pris au sens métaphorique mais selon sa signification la plus concrète possible d'objets organisés dans l'espace.

Le résultat dépend bien-sûr énormément de la nature des sons et de leur animation interne, mais même une simple ligne diagonale qui part d'un angle pour aboutir à l'angle opposé, si elle ne rencontre pas sur son passage quelques points-relais n'a aucune chance de se concrétiser dans l'audition du public. Dans l'acousmonef elle peut être supportée par un minimum de 5 points, ce qui est tout juste suffisant, mais s'il n'y avait que les deux points extrêmes, à la manière d'une paire stéréophonique distendue, il serait totalement impossible de percevoir les masses virtualisées à l'intérieur.

 

écouter, en se déplaçant, ce que produit une ligne diagonale est une bonne manière de tester l'efficacité d'un dispositif haut-parlant "3D" !

 

Mes formes de 1994 étaient évidemment limitées par le nombre de points d'échantillonnage spatial dont je disposais alors (16, voir le schéma au début de la petite chronologie) et pour qu'elles puissent prendre vie et corps dans les trois dimensions de l'espace - comme par exemple une arborescence se développant du point central en bas jusqu'à son déploiement en haut, ou des lignes rebondissantes rayonnant de l'intérieur vers l'extérieur - il m'avait fallu privilégier certains plans, certains axes de production et d'écoute où les phénomènes possédaient plus d'occurrences et nécessitaient une meilleure résolution.

 

Cette approche d'un maillage tri-dimensionnel non linéaire est toujours celle qui prévaut dans l'acousmonef.

C'est ce qu'on pourrait aussi appeler un maillage "pondéré" (comme peuvent l'être les courbes de réponse dynamique d'un matériel) car la résolution du dispositif est ajustée en fonction des capacités auditives humaines et des positions d'écoute assises qui sont prévues.

Comme je l'ai évoqué plus haut, l'équivalent en maillage linéaire basé sur le même schéma 5 x 5 que le plan médian actuel nécessiterait 75 canaux, pour une amélioration de la résolution à l'intérieur qui resterait assez faible (8 points contre 6 pour les niveaux 1 et 3).

Je reconnais par contre que la gestion des outils, la réalisation de certaines formes spatiales ainsi que les adaptations de formats seraient facilités car ils profiteraient d'un plus grand degré de symétrie.

 

le maillage non linéaire actuel de l'acousmonef sur 67 canaux, son équivalent en maillage linéaire sur 75,

et son extension en maillage "pondéré" également sur 75

 

Cette histoire de volume creux ou plein, bien qu'extrêmement importante pour la création comme pour le ressenti auditif, reste un domaine très peu abordé, voir totalement ignoré dans la majeure partie de la littérature spécialisée. La raison en est certainement que les productions sonores faites pour le cinéma et l'espace domestique sont basées sur le principe de la reproduction d'une image d'espace, où la place centrale de l'auditeur est bien-sûr tout à fait appropriée.

Il me semble néanmoins qu'elle reste pertinente pour les situations plus libres, notamment dans le domaine électroacoustique qui n'est pas assujetti aux contraintes de la distribution de masse et où l'inventivité peut normalement se déployer selon ses propres nécessités.

 

Mais placer des points de diffusion à l'intérieur de l'espace d'écoute pose non seulement la question de la place du public (et de la conception et de l'écriture spatiale correspondante) mais aussi celle de la nature de l'équipement matériel.

Les enceintes Hi-fi ou de sonorisation sont habituellement conçues pour projeter un faisceau plus ou moins étroit selon les fréquences qui est destiné à converger vers un point où une image d'espace cohérente va être reconstituée pour un auditeur idéal.

Cette méthode est assez efficace pour la stéréophonie (domestique ou en spectacle), le "surround" ou en liaison avec un codage ambisonique, mais elle ne possède plus le même intérêt si l'on considère au contraire une multiplicité de points d'écoute possibles. Dans ce cas on pourra lui préférer une diffusion par "radiation".

C'est pour cela qu'un système maillé comme celui du 4D-Sound est entièrement basé sur des enceintes originales qui permettent la production d'images fantômes aussi bien dans l'axe horizontal que vertical. Le compositeur et musicien Hervé Birolini travaille également sur ce principe avec des enceintes munies haut-parleurs multi-directionnels30.

 

Dans l'acousmonef seules les enceintes qui sont placées à l'intérieur de la zone d'écoute sont de ce type, les points périphoniques restant uni-directionnels. Je rappelle que cette disposition est consacrée aux diffusions sous la forme de séances à durée déterminée, où les auditeurs sont rassemblés et normalement assis à l'intérieur du périmètre circonscrit par les enceintes extérieures. Pour une installation où la déambulation serait la règle, et selon la place du dispositif dans le lieu, l'omni-directionnalité généralisée pourrait être plus adaptée.

À ce titre la colonne centrale est particulièrement importante dans le modèle spatial du cirque, car elle constitue le seul élément de référence qui soit identique pour l'ensemble des auditeurs : s'ils sont orientés vers le centre, cette colonne représente à la fois ce qui est parfaitement "en face" de chacun, le centre symbolique du lieu et un axe de symétrie fondamental pour les évolutions des masses spatiales. On y retrouverait presque le rôle de l'enceinte centrale du cinéma...

 

Dans Formes et couleurs de la vie (toujours) et L'œil tactile le point central était constitué de deux enceintes placées dos à dos en un cluster minimaliste. Mais avec des enceintes traditionnelles, nous avons besoin de bien plus que deux points pour assurer une diffusion qui soit égale sur 360°.

 

J'ai utilisé pour cela pendant quelques années d'anciennes enceintes AKAI hexagonales qui possédaient un haut-parleurs par face, et le résultat spatial était tout à fait correct... ce qui était moins le cas de leur sonorité comparée au reste de l'équipement.

L'étape suivante a consisté à les remplacer par un anneau de six petites enceintes puis de quatre enceintes bipolaires, qui procuraient une bonne diffusion horizontale mais avec un son encore un peu décevant, et j'ai fini par me fixer sur un groupe de quatre enceintes JBL Control Now spécifiquement conçues pour cette disposition en anneau.

Le son est cette fois très bien, et la diffusion horizontale est tout à fait satisfaisante.

 

                                

6 mini enceintes Onkyo                                                     4 JBL Control Now

 

Pour les six points qui forment la couronne au sol j'ai utilisé une autre technique qui consiste à positionner dos à dos deux enceintes bi-polaires, employées traditionnellement pour les points surround en home-cinema.

Il existe bien-sûr des irrégularités dans la diffusion circulaire des aigus que l'on peut percevoir lors des tests, mais celles-ci deviennent négligeables en situation sonore réelle. D'autre part la diffusion à ras du sol aide à la différentiation des niveaux d'élévation qui sinon peuvent avoir tendance à se fondre un peu trop.

 

les couples d'Eltax HT-2

 

C'est en effet une constatation commune à l'ensemble des configurations que j'ai pu réaliser durant toutes ces années que si une diffusion horizontale sur 360° est bien-sûr indispensable pour les points intérieurs, une diffusion verticale pouvait au contraire nuire à la lisibilité de l'élévation si les niveaux sont proches, et également en favorisant des réflexions sur le sol et au plafond. Évidemment ce phénomène est moins sensible dans un lieu plus grand et peut même être utile avec une acoustique très matte.

 

Ceci m'a conduit dernièrement à placer une surface partiellement absorbante entre les niveaux 3 et 4 de la zone intérieure.

Son intérêt ? Au-delà d'apporter une certaine correction acoustique pour cette partie du lieu, elle accentue légèrement la différentiation entre ces couches d'élévation et renforce ainsi la lisibilité de la polyphonie spatiale dans cette zone.

Si on a besoin d'une sonorité plus directe, par exemple pour le dôme, il est aussi aisé de la replier.

Je ne dis pas pour autant qu'il s'agisse d'une méthode que l'on puisse appliquer ailleurs...

 

Quant aux points du niveau médian, la solution que je trouve spatialement la plus efficace est apportée par les enceintes qui sont basées sur une réflexion horizontale, ici en deux voies avec les Kenwood Omni-7. Cette technologie qui est très largement utilisée dans les enceintes mobiles tend à produire un son un peu plus "coloré" que la moyenne, mais le spectre de diffusion à 360° est parfaitement constant.

J'utilise en complément pour le carré du niveau 3 de petites enceintes Mirage/Spherex qui sont basées sur ce même principe. C'est également ce type d'enceintes qui équipe mon Acousmobile31 pour les points intérieurs (Jamo S-25 et S-35), où celles-ci utilisent en plus une membrane convexe à la manière de celles du système 4D-Sound.

 

                                     

                                               Kenwood Omni-7                                                                         Mirage Spherex                     Jamo S-25 et S-35

 

 

 

4. Faire plus avec moins, ou moins avec plus ?

J'ai déjà abordé cette question plus haut : à moins d'utiliser une technique de diffusion qui soit entièrement virtualisée, la résolution (le nombre de points pour une dimension spatiale - ligne, surface ou volume) et la densité (la quantité de points pour une zone spatiale physique donnée) de la configuration haut-parlantes déterminent la richesse et la précision de l'espace qu'il est possible de produire.

Pour décrire ce à quoi il correspond dans l'audition il faut aussi tenir compte de la distance des auditeurs aux enceintes, de la manière dont elles diffusent les ondes sonores par projection ou par radiation, sans oublier de l'acoustique du lieu si celle-ci possède des caractéristiques particulières.

 

Dans l'acousmonef, les enceintes occupent une surface d'environ 110 m², ce qui donne pour le maillage 5 x 5 du plan médian une distance entre deux points qui n'excède jamais 3 mètres. Cela signifie que quelle que soit la place qu'occupe un auditeur il y aura toujours un point haut-parlant à au plus 1,50 m de lui...

Cette densité est assez élevée mais elle reste raisonnable : en-deçà de cette valeur la proximité haut-parlante pourrait devenir gênante...

On pourrait donc penser qu'il faille disposer de plusieurs dizaines d'enceintes et d'un lieu assez vaste pour pouvoir produire et faire entendre à un auditoire, d'une manière confortable et efficace, des œuvres possédant une certaine richesse spatiale.

Ceci n'est pas totalement faux, et cet aspect constitue d'ailleurs la dynamique qui m'a porté pendant 30 ans jusqu'à l'acousmonef : entre le dispositif 16 canaux de 1993 dans 20 m² et celui d'aujourd'hui, c'est finalement la seule chose qui ait vraiment changé. L'essentiel de son évolution a consisté à augmenter la résolution spatiale, donc, en fonction du lieu occupé, la densité haut-parlante, tout cela pour permettre des écritures de l'espace de plus en plus raffinées... jusqu'à m'amener aujourd'hui à diffuser mes œuvres sur des systèmes bien moins détaillés que celui qui a prévalu à leur composition !

La question qui se pose généralement pour moi n'est donc pas : "comment élargir l'espace de ma composition pour qu'il corresponde à celui de la diffusion" (comme par exemple devoir répartir une octophonie sur un acousmonium) mais "comment adapter l'espace que j'ai composé pour qu'il sonne au mieux pour cette diffusion" ? Car comme je l'ai rappelé à propos de la question des compatibilités, tant que l'on reste dans un type d'espace donné (cinéma, dôme, maillage 3D...), la réduction de cette résolution (sous-échantillonnage ou downscaling) peut s'effectuer aujourd'hui aisément, et ceci que l'on utilise des techniques multicanales simples ou que l'on passe par des représentations dites "indépendantes de la résolution" (mixage orienté objets ou traitement ambisonique si l'ordre est très élevé32).

À l'opposé, son augmentation (upscaling) nécessite des procédés complexes qui peuvent être intéressants sur le plan créatif mais qui conduisent à des résultats discutables en tant qu'adaptations de diffusion, et en tout cas toujours limités par rapport à ce que donnerait une production originale à la résolution équivalente. C'est exactement la même chose que ce qu'on connaît avec l'image : il vaut mieux réduire une photographie de 30 megapixels pour la placer sur la page d'un site Internet plutôt qu'essayer d'améliorer une vignette pour l'imprimer...

On aura donc ainsi toujours intérêt à viser plus haut durant la production, car même si cela peut être un peu frustrant j'en conviens (voir l'exemple du "Cube" sur 124 canaux plus haut...) cela ne pose pas de problème technique de composer par exemple sur 64 canaux33 même si on ne dispose pas du dispositif d'écoute correspondant34.

 

Alors, dans le cas d'une production réalisée en fonction de ce qu'offre l'acousmonef, jusqu'où est-il possible de réduire le nombre de points haut-parlants tout en conservant l'essentiel de l'écriture sono-spatiale ?

Cela dépend en partie de cette écriture : plus elle est "immersive", c'est à dire plus elle joue sur des phénomènes englobants et continus, plus cette réduction pourra être importante sans que l'on perde d'information essentielle. Au contraire, plus la polyphonie spatiale est détaillée, plus elle s'appuie sur des tracés ou des imbrications d'objets et plus le floutement de l'espace risque d'être dommageable.

Pour ma part, compte tenu de mon écriture plutôt "pointilliste", je considère qu'un maillage constitué de 39 canaux sous la forme de trois niveaux de 13 (8 + 4 + 1 par niveau) peut être tout à fait bien (mon dispositif pour les hivers en comporte 33), mais il est possible d'aller plus loin. Cela m'est en effet arrivé de ne conserver que deux niveaux de hauteur (au sol et au plafond) et de ne garder du niveau médian que le point central (13 / 1 / 13 = 27 canaux)35.

Quant aux pièces qui sont uniquement périphoniques il est possible de les réduire encore plus : pour les formats cinéma le 22.2 est idéal mais le 17.1 ou même l'Auro 13.1 peuvent encore convenir (mais pour moi pas le Dolby Atmos, cf. page 18), et pour les dômes il suffit de conserver l'ambitus d'élévation complet du sol au point zénithal. On peut d'ailleurs profiter de ces facilités d'adaptation pour la diffusion du cirque en le considérant comme un double dôme (voir la présentation de Scène aux champs en page 46).

 

quelques "dégradations" du cirque assez poussées...

 

Pour en revenir à la création multiphonique en résolution élevée dans un lieu aux dimensions limitées, une approche que je trouve meilleure consiste à ne pas réduire le nombre d'enceintes mais juste leur taille. Ceci permet de travailler peut-être à une échelle plus petite et donc moins confortable, mais de conserver malgré tout les proportions et la précision du retour d'écoute qui sont dans certains cas irremplaçables.

C'est ce que j'ai dû appliquer, faute de lieu, de 2000 à 2004 et entre 2006 et 2011, et continue d'appliquer encore durant les hivers depuis 2018 (l'acousmonef est difficilement chauffable !).

C'est ainsi avec des dispositifs plus ou moins miniatures que j'ai réalisé des œuvres dont l'espace pouvait être quelques-fois totalement disproportionné, tel Le soleil des bruits du monde composé en 2007 sur 16 canaux pour le Parc Champagne à Reims dans 9 m² mais avec tout de même 16 points (de petits systèmes 2.1 JBL Spot et Spyro...).

 

si le lieu est plus petit, il suffit d'utiliser de plus petites enceintes : l'atelier d'hiver, en cirque 33.1 sur 30 m² (on ne voit pas tout...)

 

À ce propos, la technique qui consiste à virtualiser un espace haut-parlant pour son écoute au casque peut bien-sûr être très utile, et je l'utilise volontiers pour partager des images sonores de mes œuvres à partir de l'enregistrement microphonique binaural de leur diffusion (voir plus bas).

Mais même avec des HRTF personnalisées qui en améliorent grandement la précision, et en dehors de cas très simples ou dans lesquels "l'immersion" est le facteur dominant, elle peut constituer pour moi un complément mais pas un remplacement de la situation haut-parlante. Notamment, la mobilité du corps, les variations de la matérialité du son en fonction des différents de degrés de proximité avec les haut-parleurs et bien-sûr, la complexité et la fragilité des formes spatiales tri-dimensionnelles que l'on obtient avec un maillage sont des composantes fortes qui sont irréductibles à ce qui est fondamentalement l'image d'un espace.

Il est néanmoins possible qu'avec les progrès réalisés dans les environnements ludiques de type 6DOF (Six Degrees Of Freedom) il devienne possible d'accéder d'une manière efficace à des contenus multiphoniques qui ne soient pas limités aux espaces focalisés (sans casque de réalité virtuelle !) et que la fiabilité du rendu soit compatible avec des écritures spatiales exigeantes.

 

Produire et composer les sons-espaces

Pouvoir jouer avec et fixer les interactions qui existent entre la production des sons, leur composition et leur écoute est ce qui justifie l'existence de l'acousmonef dans son ensemble.

J'ai décrit précédemment sa partie haut-parlante, celle qui, associée au lieu qui l'héberge, en constitue certainement l'aspect le plus singulier et qui a été le plus longtemps par moi désiré... mais qui ne servirait absolument à rien si les autres éléments de la chaîne ne permettaient pas de traiter cette dimension spatiale de la même façon.

Ces trois aspects se sont développés selon des contraintes technologiques et financières différentes, mais toujours en synergie si ce n'est en symbiose, et lorsque ça n'était pas possible, j'ai attendu qu'ils se synchronisent en faisant d'autres choses.

L'acousmonef n'est lié à aucune technologie particulière, et ne repose pour la production des œuvres comme pour leur diffusion ni sur un environnement matériel propriétaire (Dolby Atmos, L-Isa etc.) ni sur des modes de traitement spécifiques (par exemple l'ambisonique). Ceci est très important pour moi : j'aime pouvoir combiner les technologies pour ce qu'elles m'apportent, pas pour en être prisonnier...

 

Il dispose des moyens pour :

- explorer la vibration acoustique et la capture au moyen de microphones et d'enregistreurs, d'une manière fixe ou en mobilité, sous la forme de réseaux multicanaux, de systèmes coïncidents ainsi qu'en binaural

- générer des sons par synthèse multiphonique, avec des instruments physiques et des logiciels (plugins acousmodules)

- traiter la matière et l'espace des sons sans limite théorique de format et de complexité spatiale (idem)

- contrôler gestuellement ces traitements avec des contrôleurs divers et variés...

- fixer et organiser les sons dans le temps et l'espace selon les formats choisis, sans limitation théorique concernant leur type et leur résolution (multipiste)

- générer un média multicanal pour la diffusion, en effectuer des captations en binaural pour l'écoute sur Internet

 

À part l'enregistrement multi-microphonique qui n'est arrivé que tardivement, et compte tenu de l'évolution progressive de la résolution/densité spatiale dont j'ai déjà parlé, l'ensemble des moyens pour la réalisation multiphonique était disponible lorsque j'ai commencé ce travail. Ceci nécessitait par contre d'utiliser du matériel dédié et assez coûteux qui n'assurait aucune pérénité aux œuvres...

On l'a vu rapidement, après le court épisode du multipiste à bande à la fin des années 80, le support et le moyen de traitement des sons et des espaces que j'avais choisi était constitué d'échantillonneurs à sorties multiples. D'abord un (Ensoniq EPS/ASR10), puis deux (+ Roland S770), puis trois (+ Kurzweil K2000R), pour un total de 26 canaux.

Il y avait bien-sûr la contrainte draconienne de leur capacité mémoire qui limitait la longueur des sons initiaux, mais ils disposaient de possibilités de modulations pour le traitement spatial polyphonique qui possèdent encore quelques longueurs d'avance sur les logiciels les plus doués d'aujourd'hui (hors environnements modulaires évidemment).

La possibilité de traiter toutes les sources de modulation par des fonctions de transfert basées sur des rampes associée au contrôle de l'amplitude sur les sorties physiques permettait d'obtenir toutes sortes de figures spatiales, des plus simples et linéaires à la manière d'un "panner 3D" jusqu'à des profils de masses et des animations polyphoniques répondant aux gestes en liaison directe avec les sons.

 

utilisation des rampes sur les modulations de l'ASR10, illustration à propos de "Formes et couleurs de la vie" extraite du mémoire de maîtrise sur "La multiphonie en acousmatique" de Sandrine Lopez en 1997 (Lyon)

 

Quant à la composition temporelle de ces sons-espaces, c'était un simple séquenceur MIDI qui s'en chargeait.

Chaque séquence MIDI était un objet qui comportait d'une manière simple mais complète l'ensemble des données temporelles du contrôle des échantillonneurs, ceux-ci gérant quant à eux l'ensemble du sonore et du traitement spatial. Les contraintes de la gestion de la mémoire et du chargement automatique des fichiers étaient évidemment importantes mais le système était parfaitement efficace. Ce qui lui faisait par contre cruellement défaut c'était la génération d'un média de diffusion ! L'œil tactile qui avait été composé de cette manière est irrémédiablement perdu faute de n'avoir pu l'inscrire à l'époque sur un support unique...

Cette dissociation entre gestion du son et informations de contrôle n'est d'ailleurs pas sans rappeler les techniques de mixage orienté objets que j'ai évoquées plus haut. Celles-ci m'apparaîtraient même presque comme effectuant une sorte de retour en arrière par rapport à la réunification de l'objet sonore que les évolutions matérielles et logicielles ont permises jusqu'à aujourd'hui (voir la vidéo "Acousmodules + Reaper : travailler avec des objets sonores" https://youtu.be/VVL6Z5e1JL0).

 

Depuis une vingtaine d'années mes productions s'effectuent sur des ordinateurs équipés d'une interface audio-numérique disposant du nombre de sorties nécessaire36.

Pour la composition temporelle je m'appuie d'une manière traditionnelle sur un logiciel multipiste (DAW / STAN), qui a également la charge de supporter la dimension spatiale : matière, temps et espace se retrouvent idéalement (pour moi) réunis au sein d'un environnement unique. Si le réseau de haut-parleurs constitue la vraie "toile" sur laquelle je peint mes sons, le vrai support auquel j'accroche mes objets sonores, cet outil en constitue le relais visuel, le moyen de les manipuler, de mémoriser mes actions, d'en fixer et d'en transmettre le résultat.

Afin de permettre un travail multiphonique qui possède l'efficacité et la souplesse voulue, ce logiciel doit disposer d'une architecture multicanale adaptée et notamment doit pouvoir supporter des fichiers et des plugins disposant du nombre de canaux  adéquats.

Pour moi ça a d'abord été au début des années 2000 Nuendo et ses bus 12 canaux. Podium lui a succédé durant quelques années grâce à l'architecture 32 canaux qu'il était le seul à proposer, ce qui m'a permis de composer entre autres mes premières pièces au format 22.2. Enfin, Reaper a pris la relève avec ses bus 64 canaux, et si aujourd'hui cette limite me contraint un peu (voir la présentation des Préludes à l'espace) je dois avouer que l'acousmonef et mes compositions se porteraient beaucoup moins bien s'il n'existait pas37 !

 

La plupart des logiciels de ce type disposent maintenant d'outils qui sont dédiés au traitement spatial de base ("panners"), quelques-uns permettant même d'aborder les formats multicanaux tri-dimensionnels avec des résolutions élevées (Pyramix 256 canaux, Reaper 64, Sequoia 32...).

   

 

Pour ce qui est des fonctions plus évoluées ou créatives il faut soit se tourner vers des applications dédiées (spatialisation38, environnements modulaires...) soit pouvoir opérer directement au sein du multipiste grâce à des plugins, les deux méthodes étant bien-sûr cumulables.

Cette dernière approche possède pour moi l'avantage de l'intégration (la réunification dont je parlais plus haut) et de la quasi absence de limites grâce à sa modularité, au moins théoriquement39 : l'ensemble du phénomène audible peut être considéré et traité comme un objet unique, complexe, mais dont la gestion reste relativement simple.

D'autre part, comme il ne requiert aucun pont audio pour relier les applications, le principe des plugins apporte une pérénité et une indépendance aux techniques et aux systèmes importante que j'apprécie énormément ;-)

1. Les acousmodules

J'ai commencé à travailler sur cet ensemble de plugins en 2003 lorsque, après quelques années passées à une certaine distance des questions spatiales (faute de lieu et de perspectives de diffusions...), je me suis de nouveau attelé à la composition acousmatique.

L'audio-numérique sur ordinateur disposait alors de la puissance nécessaire pour traiter de nombreux canaux (disons 24...), mais les quelques outils logiciels disponibles étaient loin de pouvoir traiter ces espaces de manière satisfaisante.

En plus, il ne s'agissait que de modules de spatialisation simples basés sur l'idée d'extension du panoramique stéréo alors que j'avais surtout besoin d'outils qui puissent traiter l'ensemble des aspects des sons d'une manière multiphonique.

 

C'est le logiciel Synthedit40, basé sur le même genre d'environnement graphique que les plus connus Max/Msp, Bidule et autres Reaktor, qui m'a apporté la solution par sa possibilité de créer assez simplement des plugins VST pour Windows. Pour quelqu'un qui est (hélas) réfractaire aux lignes de code mais adepte de la connectique et du paramétrage des synthétiseurs modulaires c'était proche de l'idéal.

Par chance il ne s'est pas arrêté d'évoluer, et depuis 2018 il peut produire des plugins 64 bits aux formats  VST3 pour Windows et Audio Units pour MacOS (mais pas pour Linux...).

Évidemment, comme je n'ai pas l'esprit d'un programmeur et que Synthedit ne dispose pas de toutes les fonctions souhaitées, certains plugins présentent des limites parfois importantes et ils ne couvrent pas (encore) la totalité des traitements envisagés. Mais l'essentiel est que ceux-ci puissent s'insérer directement dans les hôtes multipistes, et qu'au final les actions d'écriture sono-spatiale ne soient pas bien plus compliquées à réaliser que si l'on composait en stéréophonie ;-)

 

la multiphonie conduit évidemment à effectuer beaucoup de traitements d'une manière parallèle... ce qui n'est guère optimisé dans Synthedit

 

Ma première composition a en avoir profité a été Souffle, Métal, Ivresse sur 16 canaux en 2004, et toutes les œuvres suivantes ont été en grande partie ou totalement réalisées grâce à eux.

Un avantage qu'il y a à fabriquer ses propres outils, qu'il s'agisse de plugins ou de patches dans un environnement modulaire comme Usine Hollyhock ou Max/Msp, est qu'ils peuvent répondre à des besoins dont l'objet serait trop spécifique pour qu'il puisse intéresser un développeur, ou trop pressant pour que l'on puisse attendre sa prise en  compte hypothétique. La possibilité de pouvoir apporter des solutions au moment où un problème se pose, où un manque se fait sentir (enfin, une fois que l'outil est fait, ce qui peut prendre pas mal de temps...), est particulièrement adaptée à la diversité et la spécificité des tâches liées au traitement spatial.

Dire que sans le travail régulier de Jeff McClintock, l'auteur de ce logiciel, et celui des développeurs indépendants qui l'enrichissent de leurs modules additionnels, pas grand chose de mes œuvres de ces dix-sept dernières années n'existerait est un euphémisme! Ces outils logiciels, associés à l'hôte approprié, constituent le pendant direct et indispensable du dispositif haut-parlant, ils représentent, pourrait-on dire, la moitié de l'acoumonef, celle qui permet de produire ce qui peut être entendu.

 

La série des acousmodules forme un ensemble modulaire dédié à la création multiphonique sur haut-parleurs, sans compressions spatiales, simulations ou virtualisations41. Un certain nombre de ces plugins sont plus efficaces avec les dispositions maillées comme celle de l'acousmonef, mais ils ne sont pas pour autant liés à un type d'espace particulier et ils fonctionnent pour la plupart sur 64 canaux (ou plus) avec une disposition totalement libre des points haut-parlants dans les trois dimensions.

Ils sont nombreux (très...) et sont regroupés en séries ou familles qui couvrent, pour reprendre les termes traditionnels, les catégories de spatialisation, d'effets et d'instruments, sans oublier les indispensables utilitaires... 

Cet étalage de plugins me fait assez penser à la panoplie des outils d'un artisan, où chacun est assez simple et dédié à un type de geste et de résultat particulier : c'est le contraire du couteau suisse et du logiciel-qui-fait-tout.

 

"les outils de menuisier et de sabotier de D. Manac’h"

 

Un facteur qui a conduit à cette prolifération est d'abord la nécessité de répondre à la diversité des situations et des actions spatiales, dont nous verrons quelques aperçus dans la dernière partie de ce document. Mais elle résulte surtout du fait que les plugins n'ont pas pour but de s'insérer lors de l'étape finale d'un mixage en spatialisant des sources sur lesquelles on aurait déjà appliqué des effets traditionnels mais au contraire à associer ces traitements entre eux, aussi finement que possible, durant les différentes étapes d'une création. Et là, selon le degré de complexité spatiale initiale des sons, le nombre des combinaisons croît exponentiellement !

Mais ici n'est pas le lieu pour détailler toutes ces fonctions, vous en trouverez la liste sur la page http://acousmodules.free.fr/guide.htm, et la vidéo "What spatialization can mean" en présente les principales applications (https://youtu.be/qN8elweNIhM?t=1).

 

La conception des plugins a suivi logiquement l'évolution de mon atelier ainsi que celle d'autres dispositifs plus originaux, dans un aller-retour à trois composantes où l'outil pouvait s'adapter et même anticiper et générer des projets compositionnels. Certaines œuvres n'auraient ainsi pas vu le jour sans certains plugins, non seulement parce que les traitements employés n'existaient pas mais aussi, souvent, parce qu'ils m'ont dévoilé des possibles sonores auxquels je n'aurais sinon pas songé.

Par exemple je me suis lancé au début de l'année 2019 dans la création d'une famille de plugins de synthèse sur 64 canaux pour la composition de l'installation Anatomie d'un cube (basée sur le maillage à quatre niveaux du Spatial Sound Institute) : ils répondaient aux besoins que j'avais envisagé pour cette pièce, mais en jouant avec eux ils m'ont aussi amené à découvrir des phénomènes que je n'avais pas anticipés et qui surgissaient simplement par la distribution des processus de synthèse sur ce grand nombre de canaux, ou grâces aux interactions qui se produisaient "spontanément" entre les modulations spatiales, timbrales et morphologiques42.

De même, au début 2021 (décidément les hivers sont propices à la génération d'acousmodules...), c'est la réalisation des versions 64 bits des plugins basés sur l'échantillonnage qui a conditionné l'élaboration du projet en cours Le jeu des Possibles.

 

À peu près la moitié d'entre eux s'appuie sur des représentations symboliques de dispositions haut-parlantes et/ou des canaux constitutifs des sons.

J'insiste un peu sur ce point car dans ce document je suis amené à user sans cesse de captures d'écrans qui pourraient laisser penser que celles-ci nous informent sur l'espace du son alors qu'elle ne font que donner des indices de sa production. Ces représentations sont des métaphores d'espaces dont la fonction est de faciliter l'utilisation de certains types d'outils, d'aider à leur prise en main, de guider les gestes qui les contrôlent. Elles représentent l'outil, pas son effet : le son et l'espace c'est ce qu'il y après les haut-parleurs...

Par exemple il m'est courant de disposer les symboles correspondants aux points haut-parlants de manière très différente de la place qu'ils occupent dans l'espace physique afin d'obtenir des masses spatiales ou des profils d'animation particuliers. C'est pour cette raison que le positionnement de ces points ne s'effectue jamais dans un éditeur dédié mais dans l'interface principale des plugins et que j'ai choisi un mode de traitement des amplitudes dans lequel les variations de ces placements contribuent d'une manière importante à l'effet produit.

 

Quelques mots à propos du "DBAC"

La première application de ces plugins consiste à traiter la masse spatiale des sons et à en permettre l'écriture dans l'hôte. S'il existe de très nombreuses manière de le faire (voir les exemples plus bas), certains peuvent se comporter à la manière de "panners" traditionnels, c'est à dire permettre de placer, déplacer ou animer une source mono, stéréo ou multiphonique au sein d'un espace haut-parlant en simulant une continuité entre les point physiques par le jeu de leurs amplitudes43.

À l'époque où j'ai commencé leur réalisation mon modèle a été le panoramique surround du logiciel Samplitude, et la plupart de mes plugins qui sont basés sur ce type d'interface métaphorique suivent toujours ses principes.

    

le "panner 5.1" original de Samplitude au début des années 2000, et une disposition libre en ligne

 

Chose encore assez rare aujourd'hui il permettait de placer librement les représentations des points haut-parlants (seulement cinq...) et il utilisait une méthode de calcul des amplitudes qui était exclusivement basée sur la distance entre les points symbolisant les entrées et les sorties. Selon les réglages de "divergence" ("Area" dans les acousmodules) et de profil, et selon la disposition de ces points il était possible de l'utiliser comme un "panner 2D" (c'était tout de même son but...) mais aussi d'obtenir des variations de la masse spatiale qui pouvaient sculpter l'espace du son d'une manière plus originale.

On retrouve cette méthode dans le ReaSurround de Reaper (mode "Absolute" sans normalisation) et dans quelques autres logiciels, mais elle ne fait généralement pas partie de l'arsenal des logiciels de spatialisation car elle ne garanti pas une sortie à puissance constante, nécessaire pour que les mouvements panoramiques n'interfèrent pas avec l'amplitude du son. Qui plus est, elle impose de considérer les représentations graphiques en fonction de l'effet que l'on souhaite obtenir plutôt que comme l'image d'une disposition physique, ce qui peut être troublant au premier abord (cf. la vue du 5.1 de Samplitude ci-dessus).

Parmi les autres modèles existants, le VBAP et ses variantes (Vector Based Amplitude Panning44) est un des plus utilisés mais il n'est applicable que pour les espaces périphoniques. En effet, la version dite "3D" effectue ses calculs sur trois points, donc sur une surface ("2D"), et comme nous l'avons vu à propos d'un volume plein il lui est ainsi impossible de placer les sons à l'intérieur d'un espace tri-dimensionnel.

Pour cela le DBAP (remplacer "Vector" par "Distance") serait tout à fait approprié puisque qu'il est basé sur les rapports de distance entre une source et l'ensemble des destinations, quelles que soient leurs positions respectives. Cependant il conduit à des alternances de resserrement et de diffusion de la masse lorsque la source coïncide avec une sortie ou lorsqu'elle s'en éloigne qui sont pour moi généralement indésirables car non déterminées par l'utilisateur.

le "soleil" représente le site apparent du son en fonction des valeurs d'amplitude (non représentées) des points actifs (lignes en gras)

 

Le mode qui conviendrait le mieux aux possibilités de l'acousmonef serait le KNN (nearest-neighbor amplitude panning), qui comme le DBAP est compatible avec toute disposition haut-parlante mais qui permet par contre de réduire sa zone d'extension et d'être ainsi parfaitement maîtrisable. Mais je lui préfère malgré tout le vieux système de Samplitude qui permet de garder un contrôle complet sur ce que l'on souhaite obtenir plutôt que d'en confier le choix à un algorithme (le pire pour cette approche étant l'utilisation du codage ambisonique ou "AEP").

Comme ce qui n'a pas de nom n'existe pas, j'ai pris l'habitude ces dernières années pour en parler d'utiliser les acronymes "DBAC" pour "Distance Based Amplitude Control" et "LBAC" pour "Layer Based Amplitude Control", où le terme de Control remplace logiquement celui de Panning.

 

Les plugins concernés comportent les paramètres suivants :

- l'aire représente la zone d'influence (pour reprendre le terme utilisé dans le ReaSurround de Reaper) qui s'étend autour des points, d'une manière sphérique pour les versions "3D" et horizontale pour les versions "Layers"

- le réglage de forme (Shape) qui va de très exponentiel à très logarithmique détermine le profil de l'aire et comment chacun des points va pouvoir se recouvrir avec ses voisins selon leur proximité

- les réglages d'aire individuels peuvent être utilisés pour compenser les écarts de distance graphique entre les points (qui suit ou non celle des points haut-parlants correspondants) ou pour obtenir des effets de masse spatiale particuliers (variations de la densité, étalements...)

- ainsi que dans certains cas des réglages de "compensation du centre" (pour les dispositions périphoniques) et de "compensation du volume" (pour contrôler si et comment les variations de l'aire s'accompagnent de variations du volume)

En combinant ces trois paramètres il est ainsi possible d'obtenir aussi bien des objets parfaitement ponctuels que largement étalés, de les contraindre à des sites coïncidents ou à générer des fantômes de formes diverses, ainsi que de produire toutes sortes de types de "lignes" qui vont du pointillé à profil variable jusqu'à des masses très denses, en passant bien-sûr par les formes plus conventionnelles et continues des modes de panoramique classiques : c'est la plume et l'encre plutôt que le stylo à bille...

 

(les barres verticales représentent les valeurs de contrôle des amplitudes en fonction de la position de la source et des réglages d'aire)

 

 

 

 

 

Quelques exemples de plugins :

 

La petite série "Sweet~" est la seule qui fonctionne en énergie constante et qui n'utilise donc pas le DBAC. Le contrôle des amplitudes s'effectue en mode Azimut/Distance + Elevation (jusqu'à 6 niveaux) où la Distance s'applique à des cercles concentriques pour les dispositions multicouches. Le calcul s'effectue en quelque sorte en "1D" (le long des cercles) selon deux systèmes complémentaires de "layers" (les cercles d'élévation et les cercles de distance). Chaque cercle peut être affecté indépendamment à une suite de 1 à 16 points connectés séquentiellement aux sorties du plugin, ce qui constitue une manière assez simple et rapide pour s'adapter à des dispositions différentes tant qu'elles restent régulières.

 

Le principe de traitement et l'interface utilisateur du "Spat3D" sont partagés par un grand nombre d'acousmodules, toutes catégories confondues, car comme je l'ai abordé précédemment c'est une méthode qui est particulièrement souple pour créer toutes sortes de masses spatiales.

Plus la représentation symbolique se rapproche d'un maillage régulier et plus il est efficace et simple à utiliser... ce qui veut dire aussi que son application à des dispositions périphoniques ou très irrégulières peut être plus délicate...

 

La série "Layers" utilise le DBAC comme méthode de calcul sur le plan horizontal et un simple panoramique d'amplitude pour les transitions entre les couches d'élévation. C'est cette méthode que j'utilisais principalement depuis 2004 dans les anciennes versions 32 bits des acousmodules et qui s'appliquait parfaitement aux différentes configurations de mon atelier-acousmonium, notamment pour la composition des pièces aux formats cinéma et dôme.

Son avantage par rapport aux versions "3D" est que l'on peut jouer sur des valeurs de masses fantômes séparément pour chacune des couches sans que cela interfère avec les autres, ce qui est particulièrement utile pour les dispositions périphoniques et plus généralement pour permettre des effets de volume de masse qui n'affectent que la dimension horizontale.

 

En dehors de travaux de retouche ou en complément de séquences principales, j'utilise en fait assez peu les plugins qui ne font que traiter la masse spatiale. Cela provient peut-être de la manière dont j'ai travaillé jadis avec mes échantillonneurs, mais je conçois rarement le traitement de l'espace sans que le geste soit à la fois responsable de l'écriture de la matière et de sa spatialité, ce qui s'applique parfaitement avec les effets et les instruments.

Dans ces derniers, les plugins basés sur l'échantillonnage correspondent particulièrement à mon approche de peintre et de sculpteur de sons, et parmi les multiples déclinaisons que j'ai réalisé, le PolySpatSampler est peut-être celui qui représente le mieux la continuité et la poursuite de cette approche.

Il est conçu pour être joué à partir d'un contrôleur de type MPE (initialement Multidimensional Polyphonic Expression) très à la mode aujourd'hui.

Avec par exemple un Sensel Morph (voir la section consacrée aux contrôleurs gestuels un peu plus loin) chaque doigt peut contrôler d'un façon indépendante la position en X, en Y et en Z de chaque voie de polyphonie. Ceci réclame bien-sûr un peu d'apprentissage mais cela apporte des possibilités pour modeler les masses sonores de l'intérieur d'une manière intuitive et en liaison intime avec l'audition que je trouve irremplaçables.

 

Car un aspect important pour moi est la prise en charge des sources multiphoniques, des sons dont la masse spatiale initiale peut provenir de captures multi-microphoniques (voir plus bas) ou de traitements effectués précédemment avec d'autres outils, et qui peuvent donc comporter de multiples canaux (jusqu'à 64). Comment alors gérer cette multitude de composantes d'une manière qui reste techniquement simple mais qui puisse procurer des résultats pertinents et, si possible, audibles ?

La série Mass~ que l'on retrouve à travers les différentes catégories de "spatialisation", effets et instruments, répond à cette question par le regroupement des canaux d'entrée selon des formes simples - cube, lignes, cercles, sphère, plans, chaos - qui peuvent être à leur tour déformée, mélangée et souvent animées à volonté à l'aide d'un nombre limité de paramètres (en tout cas moins que s'il fallait contrôler la position en X, Y et Z de chaque canal séparément !).

 

 

Mais attention, comme nous l'avons vu à propos du "test de diagonale", ce genre de traitement n'est vraiment efficace que pour les espaces haut-parlants basés sur des maillages tri-dimensionnels, qui plus est qui disposent d'une densité suffisante pour que son effet soit perceptible. Il faut aussi rester vigilant pour ne pas se laisser prendre au piège tendu par les formes visualisées, car en dehors des cas les plus simples (et en l'absence de polyphonie) il est rare que la perception des sons coïncide avec l'affichage des outils : leur effet est toujours beaucoup plus riche et subtil, d'autant qu'il est fortement lié à la place qu'occupe l'auditeur ! Mais après tout est-il nécessaire de reconnaître un accord de 7ème diminuée pour en apprécier la couleur et pour le différencier d'une 7ème majeure ? Lorsque l'on travaille d'une manière interactive avec ses oreilles c'est l'effet perçu qui guide les gestes qui modèlent les masses spatiales...

 

MassSampler, SpectraShaper et MultiMass : différentes applications du principe du traitement groupé des entrées

 

Il existe bien d'autres approches, comme celles qui sont proposées avec les séries Focus~ (voir la présentation de Auscultation d'un rire) ou Space~.

Dans cette dernière, des plugins comme le SpaceRotator, le SpaceShifter ou le SpaceMorph traitent les 64 canaux d'entrée/sortie comme un tout à l'aide d'un ou deux contrôleurs pour pivoter, pousser, étirer ou compresser l'intégralité de l'espace haut-parlant. Les valeurs sont ici calculées simplement deux par deux avec une puissance constante, mais seules certaines dispositions sont supportées.

   

 

Les canaux discrets

J'ai parlé jusqu'à présent principalement des plugins qui étaient basés sur des représentations graphiques, qui aident à traiter les masses spatiales d'une manière continue et qui sont généralement assez intuitive à utiliser, mais comme je l'ai évoqué plus haut à peu près la moitié des acousmodules n'est pas basée sur ce principe. Très souvent les canaux audio sont simplement considérés comme des composantes du son ou des points haut-parlants quelconques, les uns et les autres pouvant être librement et arbitrairement liés d'une manière directe, avec ou sans référence à un placement dans l'espace physique particulier. Au niveau du traitement il n'y a dans ces cas là pas d'interpolations d'amplitudes, pas de mélange inter-canal autre que celui qui est effectué dans l'air par la combinaison des sorties des haut-parleurs.

Cette approche correspond en premier lieu à des choix d'écriture, mais elle s'accorde aussi avec l'évolution de la résolution spatiale de l'acousmonef. En effet, si l'on ne dispose que de 5 ou 7 points haut-parlants cela conduit inévitablement à une simplification de la notion d'espace, mais avec 50 ou 70 on est alors très loin de ce qui est souvent présenté comme une répartition nécessairement fixe et figée : comme pour l'image ou la conversion audio analogique/numérique, plus la résolution de l'échantillonnage est élevée et moins on a besoin d'effectuer du lissage. La clarté et la lisibilité de la génération des sons ou de leurs traitements, qu'ils soient spatiaux, temporels ou spectraux, est préservée au mieux tout en permettant d'obtenir une granularité spatiale très fine.

Par exemple :

- le SpatKeys offre une manière très simple pour placer le son entrant sur une ou plusieurs sorties : chaque note MIDI "ouvre" à l'aide d'une enveloppe un VCA connecté sur une des sorties. Cela ressemble un peu à ce que permet une console de diffusion, mais avec une virtuosité et une polyphonie difficile à concurrencer (il y a aussi un arpégiateur !).

- le Scatterizer dispose de 64 lignes à retard, filtres et routages de canaux dont les paramètres sont contrôlés globalement selon des courbes où chaque point représente une valeur par canal ;

- le KaleidoSampler (un des plugins que j'ai le plus utilisé) effectue un brassage granulaire sur un fichier audio où l'affectation de chaque fragment à une sortie s'effectue selon des modulations qui peuvent combiner leur position dans le son, leur durée, leur hauteur, leur filtrage etc.

- le Concatenator découpe et recolle les morceaux de multiples sources selon des formes et des vitesses variables ;

- le MiniRez dispose de 64 résonateurs qui peuvent s'appliquer sur une jusqu'à 64 entrées ;

- le MultiSynth comprend 32 modules de synthèse soustractive dont les paramètres peuvent être ajustés d'une manière commune et subir individuellement des déviations linéaires ou aléatoires, leurs sorties pouvant être regroupées ou étendues sur 1 à 64 canaux.

 

   

Enfin, la dimension cinétique constitue évidemment un aspect important du travail sur les sons-espaces qui est souvent mise en avant dans les logiciels dédiés à la spatialisation comme SparGRIS ou SoundTrajectory. Pour moi elle résulte le plus souvent d'un traitement multiphonique des sons comme on a pu l'appercevoir dans les exemples précédents, mais elle peut s'appliquer également aux masses spatiales seules. Dans ce cas là elle peut être gérée simplement par l'enregistrement des gestes d'automations effectués sur les paramètres des outils "statiques", mais un certains nombre de plugins disposent de générateurs d'animations autonomes pour des effets plus complexes ou plus originaux, mais dans lesquels l'animation spatiale reste fortement liée à la nature des sons et aux actions qui découlent de leur audition.

Par exemple :

- le SpatLine déplace une source le long d'une ligne virtuelle pouvant être comporter jusqu'à 64 points qui sont généralement disposés spatialement dans un plugin situé après. On peut la parcourir par jeu direct (avec un contrôleur ou un clavier) en combinaison avec l'animation d'un LFO et d'une enveloppe : c'est simple mais les combinaisons sont quasi infinies... ;

- plus avancé, à la manière des synthétiseurs modulaires, l'AnimaSpat et ses cousins comme l'AnimaSynth ou l'AnimaSampler utilisent de multiples LFOs et des modulations en série ainsi que certaines caractéristiques du signal lui même (amplitude et hauteur) pour animer et transformer interactivement les formes de base de type SpatMass.

 

Si j'ai pris un peu de temps pour cette présentation des acousmodules (qui en nécessiterait évidemment beaucoup plus pour faire le tour de ce qu'ils proposent !) c'est qu'ils se situent au centre de l'intrication qui existe entre les moyens de production, de composition et de diffusion lorsque l'espace audible fait partie de la conception des œuvres. Cela ne veut pas dire, heureusement, que chacun en aie besoin ou qu'il doive fabriquer ses propres outils !

Malgré tout, plus on souhaite travailler les sons dans leur totalité perceptive et plus il est nécessaire d'intégrer les multiples approches du traitement spatial en amont de la composition proprement dite. Et là ce ne sont pas d'outils de spatialisation dont nous avons besoin mais bien de reconsidérer l'ensemble des moyens de production d'une manière originale, ce qui touche également la création des sons, que ce soit par synthèse ou, beaucoup plus souvent dans mon cas, au moyen de l'enregistrement microphonique.

  

 

 

2. Les microphones

Longtemps pour moi reléguée à un désir un peu fou et flou, l'idée de créer l'espace physique des sons dès l'étape de l'enregistrement microphonique n'a pu commencer à se développer qu'il y a une quinzaine d'années, lorsque j'ai acheté mon premier ensemble de huit microphones (Behringer C2 à 50€ la paire !).

La raison principale de cette introduction tardive était bien-sûr la disponibilité des systèmes d'enregistrement multicanaux et le coût des microphones, mais il fallait aussi pouvoir traiter ensuite ces sons avec suffisamment d'efficacité pour que le résultat se démarque de ce qu'on pouvait obtenir d'une manière nettement plus simple et économique en transformant des sons originellement mono ou stéréo. Toute une branche des acousmodules a ainsi été développée spécialement pour ces applications.

C'est surtout la pièce Tournages qui, en 2009, avec ses 18 canaux disposés en disque a marqué un tournant, si je puis dire, à la fois quantitatif et qualitatif. C'est la première fois où j'ai pu expérimenter l'idée de la correspondance 1:1 entre les points de captation et les points de diffusion : certains tournages étaient réalisés avec 18 micros placés exactement là où les enceintes devaient se situer (et en plus dans le même lieu...).

 

la composition de Tournages : essentiellement du mixage de fichiers issus des tournages effectués sur 1, 2, 4, 8 et 18 canaux

 

Cette expérience m'a confirmé d'une part que les sons-espaces obtenus lorsque l'on dispose d'un nombre relativement important de microphones (et que ceux-ci ne sont pas "mixés" par la suite) pouvaient présenter une richesse et une matérialité justifiant totalement cet effort, et que, de la même manière que pour l'arrangement des enceintes, le jeu sur leur disposition permettait d'obtenir des spatialités originales dont l'exploration constituait en elle-même un acte de création.

Le journal vidéo qui a accompagné les "Études pour membranes" en 2016 relate en grande partie les liaisons qui peuvent exister entre l'arrangement spatial des membranes des microphones (jusqu'à 32), des haut-parleurs... et celles de nos oreilles (http://sonsdanslair.free.fr/letempsdufaire.htm).

 

L'acousmonef dispose aujourd'hui d'une soixantaine de microphones installés d'une manière fixe, ainsi qu'une série consacrée à l'enregistrement de corps sonores (jusqu'à 16 canaux), des ensembles destinés aux captations mobiles dont des microphones compacts coïncidents pouvant être encodés en ambisonique en ordre 1, 2 ou 3 (voir la présentation de Scène aux champs plus bas), sans oublier une petite collection de micros de contacts, de capteurs électromagnétiques et d'hydrophones.

La constitution progressive de cet ensemble de microphones a obéi aux deux mêmes impératifs que celui des enceintes : le nombre bien sûr mais aussi l'économie ! Même si je dispose de quelques micros solistes de qualité respectable, l'essentiel est formé par des productions chinoises achetées en Allemagne (merci à Th.....n)45...

 

Les utilisations

Depuis l'achat de mon premier ensemble de 8 micros j'organise principalement leurs regroupements pour créer des objets ou des images multiphoniques, éventuellement liés à des corps sonores particuliers (voir la présentation de Entre les cordes et de Des chiffres et des gestes). Chaque son-espace possède ainsi sa propre forme issue de la disposition initiale des micros, qui peut ensuite être placée à l'intérieur d'un espace haut-parlant global en la respectant plus ou moins. Généralement de petites distorsions de la géométrie ne changent pas la nature de l'objet sonore, mais il est aussi possible, comme l'on joue sur la hauteur ou la vitesse d'un son enregistré, de déformer volontairement son espace pour en obtenir de nouveaux.

Par exemple une ligne de 8 ou 16 microphones, en dehors de dispositifs spéciaux pour les installations, aurait très peu d'intérêt à être reproduite telle quelle sur un dispositif de séances où disposer d'une ligne droite de 8 points ou plus est assez rare (à par dans le Cube de la VirginiaTech !), mais elle se prête particulièrement bien à toutes sortes de nouvelles mises en forme, cercles, spirales, lignes brisées ou même surfaces ou volumes. La plasticité des sons-espaces ne cesse de m'émerveiller ;-)

 

deux dispositifs microphoniques utilisés pour les Études pour membranes en 2016 : centré (20 canaux) et maillé (24 canaux)

 

Mais j'ai aussi parlé à propos de Tournages de la "correspondance 1:1" entre dispositif microphonique et haut-parlant.

Cette idée d'échantillonnage de l'espace au moyen d'un maillage de points de captation qui soient reliés un à un à ceux de la diffusion représente ce qu'on pourrait appeler une photographie de l'espace plutôt que celle d'un point d'observation, fût-il multicanal (croix IRT, arbres Decca et MMAD etc.). Elle ne possède évidemment pas grand intérêt pour la reproduction domestique d'enregistrements mais elle apporte un champ d'exploration et de nouvelles possibilités à la palette de création d'espace sonores.

Ceci ressemblerait plutôt aux techniques multi-microphoniques utilisées pour certains enregistrements d'orchestre... si au lieu de mixer ces multiples sources à l'intérieur de la stéréophonie on conservait leurs positions relatives sur un orchestre de haut-parleurs (qui ici mériterait bien son nom), et c'est exactement ce qu'Alain Français réalise dans ses installations "Learprint"46.

 

J'avais déjà employé cette méthode avec un certain bonheur dans mon précédent atelier à St-Étienne sur 32 points (cf. les vidéos) et j'avais aussi effectué quelques tournages à l'acousmonef sur 24 points (que l'on retrouve dans l'Interlude de La Cage). Sans surprise, cette résolution était trop faible pour que la "restitution" du tournage puisse supporter correctement de multiples angles d'écoute : pour certains emplacements l'illusion est parfaite, et pour d'autres il se produit des aimantations ou des sauts de fantômes plus ou moins importants.

Au moment où j'écris ces lignes l'installation des soixante points de captation dans l'acousmonef n'est pas encore terminée, et beaucoup de questionnements restent en suspens. Ils ne sont pas de l'ordre du "est-ce bien raisonnable ?" car ça ne l'est évidemment pas du tout, mais du "le jeu en vaut-il la chandelle ?". C'est à dire d'un côté est-ce que le maillage sera suffisamment serré pour que le gain de définition sonore et de stabilité spatiale soit réel, et de l'autre est-ce que les spatialités obtenues seront pertinentes au delà de quelques cas particuliers ?

Idéalement, il faudrait pouvoir ajuster l'échelle de l'ensemble du dispositif microphonique pour qu'il puisse s'adapter à la nature des sources sonores et comment elles sont produites et animées, ce qui n'est pas vraiment faisable ici... Il est malgré tout possible d'ajuster a posteriori certains des effets dus à la proximité ou aux distances à l'aide d'acousmodules spécifiques, comme par exemple pour accentuer la localisation et réduire la diffusion acoustique avec le SpatMass (manuellement) et l'UniComp (automatiquement), ou au contraire pour lisser d'éventuels "trous" avec la DiffuseVerb47.

Mais se pose surtout la question de quoi enregistrer de cette manière.

Les dimensions du lieu et son acoustique conditionnent ou peuvent s'accorder avec certains types de sons et de tournages mais en excluent la plupart qui possèdent leur méthode tout à fait appropriée avec les systèmes distribués ou groupés. Si le projet en cours Fiction ! doit être en grande partie réalisé de cette manière, si quelques pièces des Préludes à l'espace doivent profiter de l'ensemble, il est également possible de n'en sélectionner que certaines zones ou parties qui peuvent alors être considérées comme des versions plus étendues de dispositifs-objets, lignes, surfaces et autres volumes.

Telle est du moins l'idée...

 

quelques-uns des 60 couples enceintes/microphones qui sont placés dans l'acousmonef (les 7 points du 4ème niveau en sont exclus)

 

l'affectation des soixante microphones dans l'acousmonef : au sol des micros de surface omni-directionnels, sur les côtés (L1 et L2) des cardioïdes et à l'intérieur des omnis. Certains micros de la périphérie du niveau médian peuvent aussi être configurés en omnis pour des effets hors-champ.

 

Enfin, il ne faudrait pas oublier la captation binaurale, qui en dehors de la réalisation de projets originaux permet de "phonographier" un espace de diffusion. Pour des œuvres qui ne peuvent exister que par leur manifestation aérienne ceci constitue la seule manière d'en donner des aperçus qui soient raisonnablement représentatifs de leur réalité : "dans l'acousmonef, comme si vous y étiez" (ou presque...) ;-).

Je dispose de plusieurs têtes de mannequins équipées de couples de microphones différents (Sennheiser ME-102, Lom Usi, Soundman OKM-II et ma vieille Sennheiser MKE-2002) dont je teste encore les rendus.

  

enregistrement binaural d'une diffusion dans l'acousmonef

 

 

 

3. Les contrôleurs gestuels

Cela ne m'est pas possible de faire le tour de mon "désir" sans aborder rapidement la question du geste et des contrôleurs. Depuis La cicatrice du geste composée en 1984, constituée en grande partie de sons obtenus par le jeu au synthétiseur (mon regretté Roland Jupiter 6) et destinée à être spatialisée gestuellement en concert, le geste instrumental à toujours constitué une manière privilégiée pour façonner mes sons, puis mes espaces, d'une manière sensible.

 

Comme je l'ai abordé plus haut, le traitement et l'écriture sono-spatiale durant les années 90 passait pour moi nécessairement par le geste puisque ils étaient réalisés entièrement au moyen d'échantillonneurs.

Les contrôleurs étaient simples mais la plupart du temps suffisants : un clavier avec pression polyphonique, les traditionnelles molettes de hauteur et de modulation, un petit joystick, deux pédales d'expression, et, si ça ne suffisait pas, un contrôleur de souffle.

Mais contrôler par le geste des outils qui modèlent les sons dans un espace à trois dimensions n'est pas simple si l'on souhaite accéder en même temps à d'autres paramètres de traitement ou de synthèse. Le nombre de degrés de liberté nécessaires augmente vite et la pertinence et l'efficacité des gestes diminue d'autant... (voir en fin de document l'exemple de La pelote de laine après le passage du chat).

De quels gestes s'agit-il d'ailleurs ?

De gestes paramétriques, telle ceux qu'offre la traditionnelle console de diffusion, qui dissocient les phénomènes en éléments simples et discrets ?

De gestes métaphoriques souvent liés aux contrôleurs de jeu et qui sont facilement associés aux représentations graphiques "3D" des outils de spatialisation traditionnels ?

Ou de gestes holistiques, qui associent de multiples dimensions et sont souvent complexes et délicats à maîtriser, mais qui permettent de retrouver les interactions globales de nos instruments acoustiques et de façonner les sons-espaces comme un tout ?

 

Depuis une quinzaine d'années, comme avec les microphones, l'acousmonef s'est enrichi peu à peu d'un nombre de contrôleurs matériels assez diversifiés. Certains sont spécialisés pour la musique mais la plupart constituent des détournements de leur finalité initiale. C'est notamment le cas avec les contrôleurs de jeu qui sont souvent déjà voués à l'espace, où les actions du joueur consistent à se déplacer ou à faire se déplacer quelque-chose.

                                                                                                        

LeapMotion (pour les mains)    Breath&Bite Controller (pour la bouche et la tête)   3D Rudder (pour les pieds)   GameTrak (pour tout le corps !)

 

      

       Sensel Morph                                                                                    Embodme Erae Touch

 

Un certain nombre d'acousmodules sont conçus pour tirer parti de ces possibilités gestuelles en essayant de trouver pour chacun un lien original entre le geste et le traitement spatial des sons. Quelques-uns attendent ainsi depuis des années... Il faut dire qu'au quotidien j'utilise principalement les solutions les plus simples (surface de contrôle + pédales), mais avec le développement de la famille des contrôleurs compatibles "MPE" que j'ai évoqués plus haut48, c'est un domaine en pleine effervescence et je dois le dire particulièrement excitant pour moi et qui complète parfaitement le développement de l'acousmonef.

 

 

 

Un exemple d'interactions entre projet, dispositif haut-parlant et outils : Préludes à l'espace

On vit actuellement une période de course à l'espace. Celui-ci ne s'étend souvent pas beaucoup plus loin que le tour de notre tête mais qu'importe, comme je l'ai déjà évoqué dans l'introduction, les déclarations sont époustouflantes, dythirambiques, truffées d'amazing et autres superlatifs, avec une énergie dépensée à promouvoir un produit qui peut conduire allègrement à la désinformation pure et simple. Nous avons déjà connu un phénomène analogue, avec quasiment les mêmes termes lors de l'avènement de la stéréophonie, puis plus tard celle du "surround" et c'est maintenant le tour du "son 3D immersif" et de l'Audio Spatial.

Le côté positif, en dehors de l'accès pour le public à des productions qui pourraient être innovantes et réjouissantes, c'est que ce qui se dessine actuellement pour les formats médias chez Dolby, Apple, Sony49 et quelques autres, ou pour le spectacle vivant avec par exemple L-Acoustics, Meyer, D&B ou Amadeus50 est l'occasion pour les créateurs de prendre conscience du potentiel d'une partie de leur art qui a été longtemps mise de côté ou même ignorée.

L'espace sonore semble être aujourd'hui mûr pour son ultime extension, on peut juste espérer que le résultat n'en soit pas une fermeture des possibles mais qu'au contraire elle permette une réelle exploration de nos espaces physiques et mentaux...

 

J'ai commencé la réalisation des Préludes à l'espace en 2019 conjointement à l'installation Densités avec qui ils partagent de nombreux éléments, les deux étant basés en partie sur les travaux effectués pour les Études pour membranes de 2016.

Cette œuvre représente d'un certaine manière, trente ans plus tard, le prolongement des Quatre études d'espace dans lesquelles je lançais quelques-unes des pistes qui m'ont occupé durant toutes ces années.

Si j'espère que Préludes à l'espace n'est pas ma dernière composition (!) je suis malgré tout bien conscient de la position qu'elle occupe car elle ne sera logiquement pas suivie par un nombre très important d'opus, et elle endosse forcément un statut de bilan... Mais elle devrait aussi marquer une ouverture vers ce que je n'ai encore qu'entrevu, tout juste expérimenté, et qu'il me démange de creuser plus avant.

 

Comme souvent chez moi, c'est un projet qui obéit à la règle du "faire d'abord et disposer ensuite", et il s'appuie logiquement sur les possibilités qui sont offertes par la disposition complète du cirque 67 canaux de l'acousmonef51. À ce titre ceci n'est pas bien différent d'écrire une partition pour grand orchestre sans en avoir reçu la commande ou effectué les démarchages préalables... on risque fort de la conserver dans un tiroir.

Ici, le handicap est d'une certaine manière moins important - il est autrement plus facile et moins coûteux de rassembler 70 voies de diffusion plutôt que 70 musiciens - mais il possède tout de même un gros bémol : ce genre de "grand orchestre" est d'un modèle qui se situe quasiment à l'opposé de ceux qui sont (un peu) répandus, et les lieux qui seraient potentiellement aptes à diffuser ce genre de travail sont très peu nombreux.

Le seul qui dispose actuellement d'un système haut-parlant du même type (un maillage 3D) est le Spatial Sound Institute à Budapest. J'imagine aussi que l'Espace de projection de l'IRCAM, avec son grand dôme associé à la virtualisation du plan horizontal en WFS serait techniquement capable d'en faire entendre certaines parties.

Mais en même temps, il ne manque pas grand chose à la plupart des dômes pour en faire des cirques tout à fait convenables : ils disposent déjà du chapiteau ! Il suffirait donc de leur ajouter une "piste", où 8 points haut-parlants bien placés permettraient déjà d'apporter une bonne compatibilité avec certaines de ces pièces.

 

Mais tout n'est pas perdu car je dispose d'une version mobile de l'acousmonef ;-) et d'autre part je suis quasiment sûr que ce type de conception maillée de l'espace va faire son chemin dans les années qui viennent (bon, Paul Oomen parle de décénies, il n'a peut-être pas tord...52).

Quoi qu'il en soit, c'est le choix que j'ai fait pour cet ensemble de pièces et je l'assume complètement, d'autant que pour d'autres composition comme Le jeu des possibles j'explore au contraire les formats les plus normalisés...

 

"Densités" au CIM de Bar-le-Duc en octobre 2020, avec l'acousmobile en version cirque/maillage 3D 51.4

 

 

 

Préludes à l'espace est un hommage aux cahiers de Préludes pour piano de Claude Debussy, qui restent pour moi des modèles de rigueur dans la liberté et d'exploration d'espaces sonores. Le titre fait également référence au roman Prélude à l'espace d'Arthur C. Clark, qui, s'il n'est sûrement pas son meilleur ouvrage, possède quelques connotations qui font écho au parcours qui m'a conduit à l'acousmonef...

 

Ce recueil devrait comporter entre vingt et trente pièces qui possèdent de nombreux liens formels et sonores entre elles  mais qui sont indépendantes et peuvent être regroupées librement pour les diffusions.

J'en présente ici rapidement quelques-unes qui me semblent bien illustrer les rapports qui peuvent exister entre un propos, des techniques de génération des sons (ici des tournages microphoniques), un choix d'outils et bien-sûr leurs rapports à l'espace haut-parlant qui a été défini.

Il va sans dire que parler de sons et d'espaces sans pouvoir rien entendre est pour le moins paradoxal et conduit à donner aux représentations visuelles beaucoup trop d'importance...

Cependant des enregistrements en binaural devraient être peu à peu disponibles sur mon site à partir de l'adresse http://sonsdanslair.free.fr/preludes-a-lespace.htm.

Note : au moment de l'écriture de ce texte cette œuvre est en cours de réalisation et certains éléments sont susceptibles de changer d'ici sa finalisation.

 

 

1. Entre les cordes (9'45)

Cette pièce est basée exclusivement sur des tournages multi-microphoniques réalisés dans le vieil Erard situé dans l'acousmonef.

Seize microphones cardioïdes ont été disposés à proximité des cordes selon une répartition à peu près équidistante, c'est à dire en partant du clavier : 5 x 4 x 3 x 2 x 2 = 16.

 

les 16 microphones : 12 tBone SC-140, 2 SC-150 et 2 Sennheiser K6/ME64

 

Les fichiers 16 canaux ont été ensuite répartis directement sur 16 des 25 points haut-parlants de la couche d'élévation médiane du dispositif (L1), selon la même configuration géométrique. Ceci constitue en quelque sorte l'agrandissement original du piano où dans l'acousmonef il représente une échelle d'environ 6:1, légèrement étirée en longueur.

Il est encadré de part et d'autre, c'est à dire au sol (L0) et au plafond (L2/3), par des versions ralenties (x0.5 en bas) et accélérées (x2 en haut).

Celles-ci subissent également une rotation d'un tiers de tour, soit avec interpolations soit en connexions directes, pour former ce que l'on pourrait se représenter comme une large hélice constituée par trois grands pianos empilés.

 

     

l'affectation des 16 canaux de captation sur la couche d'élévation médiane ainsi que leurs rotations sur les couches basse et haute

 

Les sons ont été produits par des gestes effectués dans les cordes à l'aide de différents excitateurs : main, plumes, tiges de plantes sèches, boule presse-papiers en verre et cafard électrique (jouet pour chats...). Le seul traitement qui a été appliqué pour certaines prises a été une expansion dynamique (avec l'UniComp 64) afin d'atténuer les résonances et d'accentuer les localisations. Une réduction de souffle a aussi été utilisée de temps en temps pour les phénomènes les plus discrets (avec le plugin d'Acon Digital Denoise53).

C'est une pièce qui est très simple sur le plan technique car une fois les séquences réparties sur chaque couche le travail de composition ne consiste qu'en un montage traditionnel, toutes les masses spatiales et leurs animations apparentes provenant du jeu initial entre les cordes. Compte tenu de la répartition spatiale particulière et globalement fixe les différences entre les points d'écoute sont très intéressantes, plus immersive ou plus cinétique selon les cas...

 

 

 

2. Des chiffres et des gestes (4'20)

Dans cette pièce, les murs, le plafond et le sol de l'acousmonef sont considérés comme les faces d'un cube sur lesquelles sont disposés des points, de 1 à 6 suivant le modèle du dé, auquel s'ajoute une septième zone pour le volume intérieur (ce n'est pas un dé creux !).

À chacune des faces est associé le tracé sonore des nombres de 1 à 6, et à l'intérieur celui du numéro 7. Ceux-ci sont égrenés au début et à certains moments pour délimiter la structure de la pièce mais ils forment peu à peu un contrepoint qui s'entremêle avec les autres sons-gestes.

À ces sept zones (six surfaces et un volume) sont associées sept matières qui partage un même type de sonorité bruiteuse (frottements et souffles) produites par sept gestes capturés par des dispositifs microphoniques différents mais toujours en grande proximité si ce n'est par contact direct :

1. frottement d'un archet sur le bord d'un carton (micro Schœps CMC5 + KM21)

2. frottements sur des surfaces diverses (papiers, plastiques...) de deux petits micros Lom Usi suspendus par leur fil

3. souffles de clarinette, 6 micros répartis du bec au pavillon, ici regroupés 2 par 2

4. tracés d'un stylet sur la surface d'une petite valise à la surface rugueuse, 4 micros de contact K+K Hot Spot sont placés aux angles

5. glissements d'une poignée de graines de quinoa au fond d'une petite cuvette en plastique, 5 micros de contacts sont fixés en dessous

6. frottements d'une brosse sur le parquet de l'acousmonef avec 16 micros de surface placés au sol

7. jeu avec une bombe à poussière au sein d'un ensemble convergeant/divergeant de 28 ou 32 micros, regroupés dans la zone centrale

À part la 6 qui a été réalisé ultérieurement, les différentes prises proviennent du travail sur les Études pour membranes en 2016 et sont relatées dans les vidéos du Temps du faire54.

la répartition des sons-gestes sur chacune des faces du "dé"

 

En ce qui concerne le placement de ces sons-gestes sur les surfaces, le point unique du "1" au plafond ainsi que les 28 ou 32 de l'intérieur coïncident simplement avec des points haut-parlants, mais la répartition des canaux sur les autres faces peut faire intervenir un nombre de points légèrement différent selon leur proximité.

le placement des points sur la face Nord, Sud et sur l'intérieur du cube

 

L'origine des chiffres remonte elle à 2005 pour la pièce Constructions I et ils ont été utilisés plusieurs fois depuis.

Ils ont été obtenus par frottement d'une pierre sur différentes surfaces, le son n'étant capturé que par un seul micro qui suivait le geste à proximité : l'énergie du trait était enregistrée mais pas sa forme.

Le dessin spatial des chiffres a été réalisé par automation en pas à pas en fonction de la disposition des points haut-parlants sur les surfaces correspondantes, ensuite rendu en tant qu'objets multiphoniques.

 

 

Le résultat est une polyphonie à six voies de tracés et de matières qui se répondent de face à face, liés parfois par la 7ème du volume intérieur. La perception rigoureuse des chiffres ou la reconnaissance des alignements sur les faces ne sont absolument pas nécessaires, mais ils souffriraient néanmoins d'une réduction de résolution ou de l'absence de surfaces planes si la diffusion s'effectuait dans un double dôme.

Mais les six faces sont également matérialisées par des résonances synthétiques issues du travail réalisé pour Anatomie d'un cube en 2019. Elles sont constituées de 64 canaux qui sont ici repliés à la manière d'un mille-feuilles sur les points existants. Ceci leur confère un aspect à la fois très denses et transparent, et, en contraste avec la nature bruiteuse des sons-gestes et des chiffres, très coloré qui, comme la surface d'un dé par rapport aux points qui y sont gravés, en accentuent le relief. Elles apportent aussi un élément de continuité qui peut adoucir le caractère quelque-fois brutal des interventions des autres sons.

 

 

3. Scène aux champs

Cette scène aux champs n'a pas grand chose à en commun avec celle de Berlioz (à part peut être quelques roulements de tonnerre, accords d'orchestre et notes sifflées au loin ?). Car si elle fait bien entendre quelques champs et prés d'Auvergne et d'ailleurs (habités de vaches, brebis, corbeaux et autres insectes...) le titre fait principalement référence aux champs acoustiques et notamment à leur degré de proximité ou d'éloignement.

C'est une des rare pièces de ces Préludes qui aurait presque pu être composée sur un autre dispositif que celui de l'acousmonef, et qui d'ailleurs pourrait être adaptée pour un dôme (à condition tout de même que l'anneau inférieur se situe au niveau du sol) car elle est uniquement composée d'enregistrements réalisés au moyen de microphones quasi-coïncidents dédiés à la capture de champs sphériques.

Ceux-ci ont été réalisés sur une période d'environ six ans avec les modèles suivants (par ordre d'apparition dans l'acousmonef, en italique ceux qui l'ont quitté) : Zoom H2n, Brahma, Tetramic, Zylia, Ambeo, Zoom H3-VR, Twirling 720 Lite 2 et Voyage Audio Spatial Mic. Parmi eux, le H3-VR n'est objectivement pas le meilleur mais c'est par contre celui qui est responsable du plus grand nombre de sons car il est de loin le plus pratique à emporter avec soi et, grâce à l'enregistreur incorporé, le plus simple à utiliser...

                           

                    Twirling 720 Lite           H3-VR : ambisonique o1       Spatial Mic : 8 canaux et HOA o2        Zylia ZM-1 : 19 canaux et HOA o3

 

Bien que ces microphones soient pour la plupart employés conjointement avec un traitement ambisonique, la production est faite comme toutes mes autres pièces en multiphonie directe, ce qui permet ici de pouvoir profiter d'un "décodage" particulier pour chaque son plutôt que de l'appliquer d'une manière uniforme sur l'ensemble du mixage pré-encodé.

Car avec cette technique cette étape est toujours extrêmement importante, déjà pour que les sons puissent être diffusés sur un système haut-parlant donné, mais aussi pour en optimiser les effets qui sont particulièrement décisifs pour la spatialité autant que pour la qualité sonore globale. Ce décodage représente pour moi une action de création qui prolonge et même dépasse souvent celle de la captation. Il est assez analogue au procédé de développement d'une photographie argentique, où les durées passées dans les bains façonnent l'image selon le résultat que l'on souhaite obtenir plutôt que de simplement en "révéler" l'origine.

C'est est d'autant plus vrai pour la capture acoustique multi-directionnelle que celle-ci est confrontée à un niveau de complexité et d'ambiguïté bien plus important qu'avec les systèmes maillés. À ce titre, et selon mon expérience, les prises de proximité comme les champs proches en général ne fonctionnent pas bien voir pas du tout avec cette disposition quasi coïncidente des capsules associée au traitement ambisonique, même en ordre 3. Si l'image de présence est évidemment reconnaissable la diffusion spatiale devient vite chaotique et paradoxale dès que l'on s'éloigne un tant soit peu du sweet spot idéal.

 

C'est là qu'un traitement paramétrique effectué lors du décodage, en permettant de doser la répartition entre champs proche et champs diffus, peut s'avérer très précieux. Le résultat peut sembler quelques-fois moins "naturel" et des transformations spectrales plus ou moins prononcées peuvent apparaître, mais en en dosant l'effet quasiment pour chaque son il est généralement possible de trouver un bon équilibre. J'ai ainsi utilisé pour le "développement" de la plupart des sons provenant des micros encodés en ordre 1 les plugins Compass UpMixer et Compass Decoder55.

Quant au "tirage", il aurait pu s'effectuer seulement sur la partie périphonique du cirque - les 47 canaux qui en constituent le dôme - et c'est ce que j'avais prévu initialement. Mais j'ai tenté de dissocier certains champs proches et diffus en les répartissant sur les deux pseudo-dômes concentriques de l'acousmonef, et avec ce qui se passait il ne m'était plus possible d'y renoncer...

Sans atteindre ce que peut offrir une captation maillée tri-dimensionnelle, le résultat peut apporter un degré de réalité assez comparable, et surtout une tangibilité des phénomènes de proximité et des mouvements d'images remarquable lorsqu'on sait qu'elle ne provient que d'un petit micro équipé de quatre capsules. En plus on peut ainsi retrouver la multitude des points d'écoute et dire (quasiment) adieu au sweet spot, même large : le dôme n'est plus creux :-)

       

l'upscaling de l'ordre 1 vers l'ordre 3 et son décodage sur le dôme 47 canaux                                                                        

 

le principe du décodage des ondes diffuses pour le dôme extérieur et des ondes directes pour le dôme intérieur

 

Parallèlement à cela, certaines captations réalisées avec le Voyage Audio Spatial Mic (8 capsules) et avec le Zylia (19 capsules) ont été aussi utilisées directement en tant qu'enregistrements multiphoniques avec les acousmodules dédiés plutôt qu'après conversion et décodage ambisonique.

 

            

 

De cette manière on évite les artefacts introduits par la conversion "A vers B" (bruit de fond, atténuation des transitoires et de la précision des aigus notamment) et la qualité initiale des enregistrements est conservée. On gagne en définition sonore ce qu'on perd en précision spatiale, ce qui pour les champs proches diffusés sur le dôme intérieur - qui est autant centrifuge que centripète - ne constitue pas un problème.

en bleu la projection convergente pour le décodage paramétrique simple en ordre 3 et pour la partie diffuse du double décodage,

en orange la diffusion omni-directionnelle de la partie proche du double décodage et pour la multiphonie directe

 

À l'heure actuelle, Scène aux champs est encore en chantier et est en passe de devenir un des Préludes sur lequel j'aurai passé le plus de temps ! La difficulté de composer les images en est une raison, mais les subtilités de leur traitement spatial m'auront bien occupé...

 

 

4. Emboîtements (5'40)

Ce prélude représente d'une certaine manière l'antithèse de Scène aux champs : également basé exclusivement sur des tournages microphoniques que l'on pourrait qualifier selon une ancienne terminologie d'anecdotiques, ils représentent ici des tranches d'espace autant que des tranches de vie, qui sont juxtaposées et emboîtées pour former une construction totalement artificielle. Chacune occupe un emplacement au sein du maillage qui peut être réduit à un seul point ou s'étendre sur une zone plus ou moins large, sans mélanges au niveau de leur production : le "champs" se créé dans l'air à partir de la combinaison de leur diffusion.

Ce principe de composition spatiale s'apparente assez à celui de Des chiffres et des gestes par le positionnement fixe et définitif de ses éléments, mais d'une façon beaucoup plus subtile, plus proche de celle d'un bouquet de fleurs que de celle des faces d'un cube...

J'avais déjà travaillé sur ce type d'espace cloisonné dans la troisième des Six études polyphoniques de 1996 où les seize canaux (en 2D, la pièce était composée pour acousmonium) étaient répartis sur six zones contiguës possédant de 1 à 4 canaux. Comme il peut se produire avec un montage de photos découpées provenant d'origines diverses, grâce à leur nombre réduit et à leur large étendue spatiale, chacune conservait son individualité dans une polyphonie qu'il était facile de suivre malgré son caractère hétérogène.

Dans Emboîtements le maillage est nettement plus serré et le nombre des images bien plus élevé (16, que je ne détaille pas ici). Surtout, elles sont réunies par un soucis de quasi vraisemblance qui fait que même s'il est évident que, comme souvent au cinéma "ça ne peut pas exister vraiment comme ça", leur rassemblement représente une situation plausible.

La référence est ici multiple : le roman La vie mode d'emploi pour la métaphore de l'immeuble, la simultanéité et l'apparente indépendance des activités de ses occupants, le film Fenêtre sur cour pour ses perspectives extérieures, et le moins connu mais génial Tango de Zbigniew Rybczynski56 pour la répétition dans un espace restreint (mais sans aller aussi loin !).

Le thème de cette pièce pourrait être "l'ai-je bien ou l'ai-je vraiment entendu ?". Il est énoncé par le personnage central ici placé dans le quart sud-ouest ("c'est pas des cloches que j'entend ?"), celui de ma grand-mère dans sa célèbre "scène du petit déjeuner" que l'on retrouve à des degrés divers dans plusieurs de mes œuvres depuis les Scènes de la réalité plus ou moins quotidienne de 1993 et bien sûr dans les Cinq portraits de Marie-Louise57.

Les entrées successives laissent le temps à l'auditeur d'apprécier les contours, la texture et l'éclairage de chaque image, mais elles possèdent suffisamment d'ambiguïté dans leur matière et dans leurs émergences qui jouent quelques-fois sur les limites de l'audition, pour que des liens de causalité ou au moins de coïncidence se créent au fil de l'écoute.

 

les entrées successives des 16 images/zones

 

La plupart des sons sont placés directement sur une sélection de canaux, et même si l'étendue réelle de certaines aires n'est pas représentée sur la figure ci-contre on peut supposer qu'un grand nombre de points ne sont pas utilisés. À la différence du Tango de Rybczinski, il y a pas mal d'espace non occupé, ce qui est pour moi assez usuel : à partir du moment où l'on dispose d'un nombre de points haut-parlants suffisant, le travail sur l'espace ne consiste généralement pas tant à le remplir qu'à savoir où y faire les trous qui vont lui apporter le relief et la lisibilité nécessaires (en dehors de propos spécifiques bien entendu).

Ceci constitue une autre différence avec Scène aux champs où chaque phonographie recouvrait l'ensemble du dispositif haut-parlant, apportant une immersion qui s'accordait avec l'unicité des images dont la composition s'effectuait la plupart du temps sur une seule voie.

L'écriture est ici très polyphonique. Elle consiste en un contrepoint d'empreintes spatiales où les images de distance, de lieux, de mouvements et de médias s'emboîtent et se combinent en fonction des différents points et angles d'observation.

 

 

 

5. Auscultation d'un rire (3'50)

Cette pièce est basée sur une unique capture microphonique d'un long rire (19 secondes) qui a été décomposé en de multiples éclats par le procédé NMF Demix (Non-negative Matrix Factorisation58).

D'une manière très différente de ce que l'on obtient avec un découpage spectral comme celui que produisent les acousmodules de la série Spectra~59, cette technique utilisée pour les applications de "démixage" permet de dissocier des composantes qui sont à la fois focalisées sur une hauteur (lorsqu'elle existe) et dynamiques.

Cette opération est effectuée ici sur 64 canaux, c'est à dire bien au delà du raisonnable, et les composantes obtenues peuvent sonner individuellement d'une manière assez synthétique, surtout pour les plus bruiteuses. Mais une fois regroupées, c'est à dire lorsque tous les canaux sont simultanément audibles, on retrouve quasiment le son d'origine, déployé par contre d'une manière complexe dans l'ensemble de l'espace, associant d'une manière arbitraire mais étroite la masse spectrale et la masse spatiale.

un aperçu de la répartition spectrale des 63 composantes (le canal 1 n'est pas utilisé)

 

Ces composantes sont réparties des plus bruitées vers les plus pures, des plus graves vers les plus aigues à partir du niveau bas vers celui du haut en suivant une sorte de spirale, dans deux versions : l'une est le résultat direct de la décomposition initiale où chaque canal présente le plus souvent des émergences morphologiques plus ou moins isolées, l'autre a subit en plus une sorte de dilution temporelle avec la petite application Mammut60 afin d'obtenir une texture plus continue où chaque canal contient une fine tranche agitée du rire.

C'est la combinaison variable de ces deux masses qui est ensuite "auscultée" avec le plugin FocusMass.

À la manière d'une passoire dont on déboucherait les trous un à un ou selon une zone plus ou moins large aux bords plus ou moins progressifs, pouvant aller jusqu'à son volume total, il permet d'explorer cette sorte de cartographie tri-dimensionnelle du phénomène initial d'une manière très libre. C'est exactement le contraire d'une opération de spatialisation classique : il ne s'agit pas de donner l'illusion d'un déplacement en répartissant la masse constante d'un son d'un point à un autre, mais de laisser apparaître, de dévoiler des parties plus ou moins larges des canaux qui constituent un son complexe, selon des couleurs qui sont liées d'une manière fixe à un site spatial. Le jeu sur l'espace s'apparente ainsi à un jeu mélodique scalaire où les successions de "notes" suivent les emplacements sélectionnés, où les "accords" résultent de leur étalement.

 

le fichier issu de la décomposition initiale, et la composition par montage/mixage des fichiers 63 canaux issus du jeu avec le FocuMass

 

Il serait difficile d'adapter cette pièce très pointilliste et volubile pour un nombre de canaux plus réduits car l'essentiel de son écriture est basé sur l'existence de points d'espace séparés qui se combinent dans l'air à la manière d'une mosaïque.

Chose intéressante : si l'on peut bien-sûr l'écouter (et peut-être l'apprécier... elle est un peu irritante tout de même) tout en étant assis, c'est en se déplaçant à l'intérieur du dispositif que l'on prend la mesure de cette mosaïque, où l'on effectue un autre niveau d'auscultation.

 

6. La pelote de laine après le passage du chat (2'20)

J'aime à penser ici au film La corde d'Alfred Hitchcock qui est constitué d'un seul plan séquence, sans montage apparent, un fil qui se déroule et s'entortille selon une intrigue que l'on suit linéairement pas à pas.

Cette pièce est peut-être celle qui se rapprocherait le plus de l'idée de spatialisation telle qu'on la présente souvent : un son, monophonique, que l'on anime selon une "trajectoire" à l'aide d'un "panner 3D", même s'il s'agit plutôt ici d'un long chemin capricieux fait d'attentes et d'élans, qui s'étire et s'emmêle à loisir.

La matière qui constitue le fil est formée d'un enchevêtrement d'une trentaine de sons issus de traitements de type FFT (effectués avec même logiciel que dans l'exemple précédent) qui leur confère une forte unité de couleur et de hauteur tout en conservant certaines caractéristiques initiales de leurs différentes énergies et épaisseurs. C'est une laine très bariolée...

Le jeu et l'enjeu consiste à "dérouler" ce fil dans l'espace haut-parlant tout en lui appliquant des sortes d'effilochements et de déchirures par le biais d'un modulateur en anneau (le plugin UniRing, dont l'animation permet d'accrocher l'audition qui sinon se fatigue vite), tout cela si possible en une seule prise, sans raccord !

J'avais commencé ce travail avec un plugin SpatLayers, mais je lui ai finalement préféré une version spécialement faite pour l'acousmonef du SweetSpat qui, avec son mode de spatialisation à puissance constante et la simplicité de ses contrôles convenait mieux à la linéarité de l'effet du geste que je recherchais. Le jeu a été effectué dans Bidule61 afin de pouvoir traiter les 67 canaux directement.

 

le dispositif logiciel très simple pour la réalisation de la séquence

 

J'ai abordé plus haut la question des contrôleurs matériels qui peuvent répondre à un geste effectué dans les trois dimensions de l'espace, et les solutions pour contrôler la position en X, Y et Z d'une source monophonique sont aujourd'hui assez nombreuses.

J'en ai essayé plusieurs qui me paraissaient adaptés à ce cas particulier afin de trouver celui qui se prêterait le mieux au type de tracé sono-spatial que je souhaitais créer. En voici mes conclusions :

- tablette (pad X/Y) + pédale ou bague HotHand (Z) : c'est mon outil privilégié au quotidien, mais je me doutais bien que la dissociation entre le geste 2D et celui de l'élévation allait constituer ici un léger handicap. Ça marche et c'est précis, mais il manque un côté plus direct, plus intuitif, pour que les mouvements imprimés au point mobile soient vraiment "ressentis".

- LeapMotion62 : là, pas de problème pour le caractère intuitif et sensible du geste, mais avec une légère instabilité et l'éventualité, comme avec tout capteur optique, qu'un décrochement ou un blocage se produise de temps à autre. Mais c'est surtout la nécessité pour ce travail très précis de regarder à la fois la main et l'écran, sans oublier l'autre main et les pieds pour le contrôle des paramètres du modulateur en anneau qui m'ont paru trop risqués et qui rendaient la concentration sur l'écoute difficile.

- GameTrak : ce contrôleur dédié au jeu de golf semblait être un bon candidat car il dispose à la fois du nombre de degrés de liberté nécessaire (2 x 3), et possède une grande précision spatiale grâce à l'étendue possible du geste sur plus de deux mètres ainsi qu'au retour musculaire donné par la tension des fils. On peut ici vraiment se focaliser sur l'écoute et le ressenti, mais le contrôle de la modulation en anneau avec l'autre bras devenait carrément acrobatique !

- Falcon : c'est une sorte de joystick 3D placé à l'horizontal et motorisé. Bien que son périmètre de jeu soit assez réduit, bien plus petit que celui du LeapMotion, et que sa motorisation par trois axes rende les bords du cube spatial quelque peu cabossés, c'est le seul qui m'ait permis de sentir précisément le lien entre mon geste et l'objet sonore très fin que je déplaçais du bout des doigts à l'intérieur du réseau des enceintes, à la manière de ce que procurerait le grossissement d'un pantographe tri-dimensionnel.

 

Je conçois que cette dernière retranscription d'expériences avec les contrôleurs gestuels puisse, en elle-même, ne concerner le lecteur que moyennement... mais elle me semble néanmoins bien souligner l'interdépendance qui peut exister entre le penser, le faire et l'entendre, entre les recherches et les hasards qui accompagnent nos choix d'environnement matériel et la volonté d'obtenir quelque-chose d'unique et de nécessaire, dans le domaine de l'écriture de l'espace comme dans celle du son dans son ensemble. Nous sommes ici, me semble-t'il, de plain-pied dans cette démarche concrète pour laquelle la sono-fixation représente le moyen de capturer, d'organiser et de reproduire des phénomènes uniques.

 

 

 

En guise de conclusion

Traiter de questions techniques, quelque-fois historiques et souvent esthétiques sous un angle personnel est un exercice qui peut conduire à une certaine confusion et à aborder d'une manière partielle et même partiale des aspects qui nécessiteraient d'être mieux développés, argumentés ou illustrés.

Néanmoins, bien qu'elle représente, j'en suis conscient, un cas qui peut être jugé comme étant un peu extrême, l'approche qui est décrite dans cet article montre qu'il est possible pour une personne motivée par la création haut-parlante, en dehors des institutions et au même titre qu'un écrivain qui possède chez lui le crayon ou la machine à écrire qui lui permet d'inscrire ses mots sur la page blanche, de disposer au quotidien des moyens d'inscrire dans l'espace tous les sons qui lui passent par les oreilles et entre les mains. Spécialement en acousmatique où les notions d'auteur et de fixation des œuvres sont prééminentes, il peut être bon de rappeler qu'il n'est finalement pas difficile de composer les sons dans toutes leurs dimensions et de les offrir ainsi sous leur forme "définitive" aux auditeurs.

Un autre point qui me semble important aujourd'hui où les techniques sont mûres et facilement accessibles, c'est que ce qui importe ce n'est pas tant la spatialisation que l'on applique sur les sons mais comment on peut jouer avec la spatialité qu'il comportent. Dans le domaine de la création libre, c'est à dire non assujétie à un média de diffusion particulier, l'œcuménisme technologique est un bon moyen pour rester maître de ce jeu, pour contourner les limites propres à chaque technique et continuer d'inventer des modes de composition et de diffusion qui puisent dans le fait sonore leur raison d'être.

Mon seul petit regret à cet égard est que le choix que j'ai fait pour cet article de me focaliser sur la production d'œuvres qui soient adaptées à la formule de diffusion de la séance (ou du concert) renforce l'image dominante de la création sono-spatiale, qui a tendance à masquer toute la diversité des espaces composables, comme si l'on ne considérait comme genre littéraire que le roman, en oubliant la nouvelle, le recueil de poésie, l'essai etc.

Or ces cas particuliers, composites et non calibrés, dont j'ai cité quelques exemples dans la petite chronologie, représentent peut-être la part la plus originale de ce type de création, celle qui mêle le plus intimement les dimensions plastiques du son, des haut-parleurs et des lieux.

Enfin, pour terminer, je voudrais revenir sur cette question que Pierre Schaeffer posait durant ses premières années d'exploration et que j'ai rappelée en début d'article : "Ces tracés doivent ou ne doivent-ils pas correspondre, dans le concret de l'audition, à des tracés réels, perçus dans la salle par les trois dimensions de l'oreille ?".

Je ne me risquerai évidemment pas à utiliser le verbe "devoir", mais il me semble en tout cas que l'on puisse maintenant répondre : "si on le désire, oui, sans soucis".

 

Un grand merci à Luis Naón pour avoir permis l'écriture de ce long article, et au Centre Mexicain pour la musique et les Arts Sonores d'en avoir publié la version anglaise !

 

 

 

 

 

 

 


1 électroacoustique, concrète, acousmatique, cinéma pour les oreilles, musique-de-sons-fixés etc. les termes ne manquent pas

2 définition Wikipedia : https://fr.wikipedia.org/wiki/Musique_concrète

3 la facilité de production et  la malléabilité de la diffusion en sont une, l'intégration dans le milieu musical contemporain en est une autre

4 Michel Chion "L'art des sons fixés" http://michelchion.com/books/free

5 Dolby Atmos :  https://www.dolby.com/technologies/dolby-atmos/

6 dôme + ambisonique : le dôme est un type de configuration haut-parlante où les sons peuvent être traités selon n'importe quelle technique, alors que l'ambisonique est une technique de traitement spatial spécifique. L'association des deux termes peut signifier que la répartition des enceintes est optimisée pour certaines méthodes de décodage (t.design) ou que les sons sont exclusivement obtenus à partir de captures microphoniques codées en ambisonique.

7 acousmonium :  dispositif haut-parlant dédié à la diffusion des œuvres acousmatiques, ou dans une définition historique plus restreinte : https://fr.wikipedia.org/wiki/Acousmonium

8 cette présentation est développée sur ce document de 2012 : http://sonsdanslair.free.fr/documents/Compositions-dispositions.(Duchenne).pdf

9 voir À la recherche des critères d'espace : http://sonsdanslair.free.fr/documents/A_la_recherche_des_criteres_d'espace.pdf

10 périphonique : ce terme rassemble ici toutes les configurations haut-parlantes qui sont disposées uniquement autour des auditeurs, y compris au-dessus

11 Patrick Ascione a été un des plus fervents explorateurs de la composition spatiale acousmatique au début des années 90 : https://fr.wikipedia.org/wiki/Patrick_Ascione

12 NHK 22.2 : https://en.wikipedia.org/wiki/22.2_surround_sound

13 4D-Sound : dispositif de diffusion et de production inventé par Paul Oomen basé sur un maillage tri-dimensionnel de points haut-parlants omni-directionnels. Il équipe notamment le Spatial Sound Institute à Budapest : https://4dsound.net/SPATIAL-SOUND-INSTITUTE

14 les techniques de mixage, de transmission et de diffusion "orientées objets" qui fleurissent actuellement (Dolby Atmos ou MPEG-H par exemple) ne changent en rien la nécessaire compatibilité entre les types d'espaces haut-parlants, mais comme elles n'en gèrent généralement qu'un seul (sphérique) et qu'elles automatisent certains aspects des conversions, notamment la réduction du nombre des dimensions spatiales, elles sont tout à fait indiquées pour les diffusions de médias à grande échelle (moins pour le respect de certaines écritures spatiales...)

15 pour adapter une œuvre multiphonique à un dispositif haut-parlant non sphérique l'outil le plus rapide est le plugin "SpaceMaster" du GRM, ou, un peu plus précis mais un peu moins simples les acousmodules de la série "SpaceConvertor" et le "ReaSurround" de Reaper (tous gratuits), sans oublier le logiciel "SpatRevolution", l'extension Spat de l'IRCAM pour Max/Msp et les nombreux systèmes propriétaires

16 l'acousmonium de BeAST est (ou était ?) peut-être le plus impressionnant à cet égard, mais celui de Musiques & Recherches est également très ouvert sur le principe de la diffusion des œuvres multiphoniques : https://econtact.ca/2_4/Beast.htm

et http://www.musiques-recherches.be/fr/acousmonium/dispositions-techniques

17 voir la liste du matériel de l'acousmonef sur la page http://sonsdanslair.free/fr/l.acousmonef-dispositif.htm

18 la technique de diffusion spatiale de Wave Field Synthesis permet, lorsque la densité des points de projection est très élevée, de focaliser des fronts d'ondes pouvant simuler la positions de sources sonores à l'intérieur de l'espace délimité par les haut-parleurs, que l'on peut assimiler à des points haut-parlants omni-directionnels virtuels

19 espace échantillonné

20 L-Isa : https://l-isa-immersive.com/technology/overview/

21 résolution = nombre de points pour une (ligne ou surface) ; densité = nombre de points par unité (mètres)

22 cette conception par couche se retrouvera aussi dans les outils de création avec la technique des "layers" utilisée dans les acousmodules depuis une quinzaine d'années.

23 le Cube de la Virginia Tech : https://icat.vt.edu/events/2020/cube-fest-2020---call-for-high-density-loudspeaker-array-music.html. La pièce est écoutable en enregistrement binaural effectué dans l'acousmonef : https://youtu.be/sjTUNx5b0sk

24 l'acousmonef en "Super High Definition" (!) posséderait : L0 16 + 12 + 1 / L1 24 + 16 + 1 / L2 16 + 8 + 1 / L3 8 + 1 = 104

25 le Fantasound : http://www.widescreenmuseum.com/sound/fantasound1.htm

26 voir par exemple l'ouvrage "3D Audio" de Paterson et Lee - CRC Press

27 le Théâtrophone de Clément Ader : https://fr.wikipedia.org/wiki/Th%C3%A9%C3%A2trophone

28 dans cette configuration en double anneau une quarantaine de personnes peuvent prendre place dans l'acousmonef et bénéficier de la même qualité d'écoute

29 MMAD : http://www.mmad.info/Collected%20Papers/Multichannel/24th%20ICP%20Banff%202003%20Paper%20(16%20pages).PDF

30 Hervé Birolini : http://hervebirolini.com et les enceintes Technysound Star10 : http://www.europsonic.fr/pdf/notices/STAR10-N.pdf

31 l'acousmobile : http://sonsdanslair.free.fr/acousmobile.htm

32 ambisonique, le point de vue de Jean-Marc L'Hôtel : https://www.afsi.eu/articles/12932-ambisonique-pour-les-nuls

33 produire en résolution élevée pour la situation de séance haut-parlante est évidemment peu pertinent et utile si la destination est volontairement limitée, comme par exemple avec la quadriphonie : https://quark.cykik.com/faq/

34 l'approche du mixage orienté objets consiste justement à

35 en effet, s'il y a pour moi un niveau d'élévation à sacrifier c'est bien celui du milieu, car même si l'audition ne fonctionne pas de la même manière dans le plan horizontal et vertical, comme en stéréophonie je préfère conserver les extrémités et transformer le plan intermédiaire en zone fantôme : on y perd peut-être un peu en précision, mais on y gagne en étendue et en équilibre (toujours l'importance du sol).

36 des RME Digiface en PCI

37 la seule alternative serait Ardour, mais la complexité de sa gestion multicanale et son ergonomie générale réduiraient énormément mes capacités compositionnelles...

38 les logiciels autonomes dédiés à la spatialisation peuvent être (SpatRevolution, ServerGRIS, Zirkonium...) ou être dépendants d'un environnement matériel particulier (L-Isa, Holophonix, D&B, ...)

39 il m'est coutumier de traiter simultanément de nombreux fichiers multicanaux, qui en possèdent souvent 64, et si ces traitements devaient s'effectuer dans une application différente du multipiste ils nécessiteraient plusieurs centaines de canaux de communication et un routage dont je n'ose pas imaginer la complexité

40 Synthedit : http://www.synthedit.com

41 il est facile d'en effectuer des conversions vers le binaural avec le plugin GRM-Tools SpaceVR ou vers l'ambisonique avec le plugin IEM MultiEncoder, tous deux gratuits : https://inagrm.com/en/showcase/news/598/nouveaux-spaces

42 voir le texte Synthèse de sons, synthèse d'espaces sur le site http://sonsdanslair.free.fr

43 l'utilisation de délais est également possible mais peu applicable en tant que telle avec un maillage tri-dimensionnel, et trop fragile pour l'écoute selon des positions multiples

44 VBAP : la version "2D" effectue les calculs entre deux points, c'est à dire une ligne (= 1D) et ne permet donc pas placer le son sur une surface

45 voir la liste des microphones sur la page

46 Alain Français https://www.learprint.fr/learprint

47 la DiffusVerb en mode "dry" permet d'étendre l'ensembles des points d'entrée/sortie qui sont toujours coïncidents en fonction de la distance avec leurs voisins

48 voir la vidéo "Les contrôleurs gestuels 3D" https://www.youtube.com/watch?v=DRAI2VBjIEU

et "ZyliaTouch" https://www.youtube.com/watch?v=WZbraaxuGQQ

49 Dolby Atmos, Apple Spatial Audio, Sony 360 Reality Audio...

50 L-Isa, Holophonix, Soundscape...

51 ce qui, tant que les bus de Reaper restent limités à 64 canaux, entraîne quelques complications comme la nécessité d'utiliser deux Masters (61 + 6 canaux) et d'effectuer également les rendus sur deux fichiers.

52 https://spatialsoundinstitute.com/P_A-New-Approach-to-Spatial-Sound-Reproduction-Synthesis

53 Acon Digital : https://acondigital.com/products/restoration-suite/

54 Le temps du faire : http://sonsdanslair.free.fr/letempsdufaire.htm

55 suite SPARTA et Compass : http://research.spa.aalto.fi/projects/sparta_vsts/

56 Tango de Zbigniew Rybczynski : https://vimeo.com/533588889

57 écouter les enregistrement binauraux sur la page http://sonsdanslair.free.fr/ecouter.htm

58 NMF Demix : http://mdsp.smartelectronix.com/2005/11/simple-demixing/

59 la série Spectra est basée sur le découpage fréquentiel d'un signal en bandes spectrales au moyen de filtres crossover à pente variable, ou de FFT, chaque bande pouvant ainsi être traitée spatialement (site, aire, animation) d'une manière autonome

60 Mammut : http://archive.notam02.no/arkiv/doc/mammut/

61 Bidule est une application autonome mais peut aussi fonctionner en tant que plugin. Je l'utilise de temps en temps pour des traitements avec les acousmodules qui disposent de plus de 64 canaux : https://www.plogue.com/products/bidule.html

62 LeapMotion : https://developer.leapmotion.com/get-started