Posts Tagged ‘En Écho’

ENTRETIEN SUR LA MUSIQUE ÉLECTRONIQUE (2002)

Monday, January 19th, 2009

Quels ont été vos premiers travaux dans le domaine électroacoustique ?

 

J’ai suivi des études classiques au Conservatoire, comme tout compositeur devrait le faire : fugue, contrepoint, harmonie, analyse… Je me suis intéressé ensuite à l’informatique musicale par le biais de la formalisation par ordinateur. Dans les années soixante-quinze, j’avais suivi les travaux de Pierre Barbaud qui, avec Iannis Xenakis, fut un pionnier des premiers prototypes de formalisation. Nous allions à Rocquencourt, à ce qui s’appelle aujourd’hui l’Inria — l’Iria à l’époque —, où il était chef de projet pour travailler sur ces problèmes. Nous travaillions à l’époque encore sur des cartes perforées ! Cela s’appelait la « composition automatique » ; on tentait de formaliser des processus de composition sous forme d’algorithmes ; le résultat était ensuite retranscrit sur partition pour être joué par des instruments. Il n’y avait donc pas de son de synthèse. J’avais fait une composition pour piano, une autre pour quintette à cordes ; je ne les ai jamais incluses dans mon catalogue car je ne trouvais pas le résultat esthétique intéressant. Je ne pense pas que l’on puisse formaliser la totalité des choix que nous faisons lorsque nous composons. Les règles explicites de la composition ne sont que « la partie visible de l’iceberg ». Il faut dire qu’au Conservatoire, j’avais été dans la classe de Michel Philippot, qui avait une formation poussée de mathématicien, et s’était lui aussi intéressé aux processus de formalisation. Le problème n’était d’ailleurs pas nouveau, il y avait la « tabula compositoria » à l’époque baroque et même Mozart avait eu l’idée de composer des valses à l’aide de dés… En revanche, je n’avais pas été très intéressé par la classe du Grm. Cette démarche était pour moi trop intuitive, et manquait de fondements théoriques.

Aujourd’hui, la situation est différente, mais à l’époque il existait une barrière entre ceux qui écrivaient pour les instruments et ceux qui composaient pour l’électronique. À dire vrai, plusieurs de ces derniers n’avaient guère de connaissances musicales. Bref, tout le monde se détestait cordialement. Celui qui m’a réellement ouvert les yeux sur la musique électronique — sans que je le connaisse personnellement à l’époque —, c’est Karlheinz Stockhausen. Il venait chaque année en France, à l’invitation de Maurice Fleuret, au Théâtre de la Ville. J’ai donc pu assister aux grandes créations telles que Mantra, Hymnen, Kontakt… J’écoutais cette musique, mais je ne la pratiquais pas encore. Après mes études à Paris, je suis parti au Brésil prendre l’air pendant quelque temps. L’Ircam venait de se créer ; j’avais déposé un projet de recherche musicale sur les sons inharmoniques.

Lorsque je suis revenu en France, à ma stupéfaction, ce projet, purement théorique, avait été retenu. Je n’étais pas très connu à l’époque et l’Ircam recherchait justement des jeunes compositeurs… J’ai donc conduit ce projet jusqu’à ma première pièce, Zeitlauf, (1978/79), créée en 1980. J’ai donc appris ici, à l’Ircam, toutes les techniques de synthèse, pour produire des sons électroniques et des transformations, notamment, dans Zeitlauf, sur les percussions et les voix. Bien sûr, les appareils sur lesquels j’ai travaillé n’existent plus. Il en traîne peut-être encore plusieurs au fond d’un couloir… L’ordinateur 4X avait la taille d’une grande armoire, aujourd’hui il suffit d’un simple MacIntosh et d’une carte son, et bien sûr de pouvoir y raccorder des haut-parleurs.

 

La voix a-t-elle été votre premier domaine de recherche ?

 

Non, avant cela, j’avais composé une série de pièces pour soliste et ordinateur : Jupiter (1987), Pluton (1988) et Neptune (1991) et pour ensemble instrumental et ordinateur : La Partition du ciel et de l’enfer (1989). Je me rappelle d’une séance de travail en 1981 à laquelle assistaient Pierre Boulez, Giuseppe di Giugno — l’inventeur de la 4X — et Laurence Beauregard, flûtiste de l’Ensemble Intercontemporain, mort depuis. C’est là que nous avons pris conscience qu’on pouvait faire comprendre à un ordinateur ce qui était joué sur un plan instrumental. Le système Midi existait encore à peine, mais les techniciens avaient développé un système de captation du jeu instrumental. C’est à partir de là que j’ai réalisé les possibilités offertes par la machine. J’ai vu que l’on pouvait synchroniser un instrument avec l’électronique, donc être libéré de la bande magnétique. L’ordinateur suivait désormais, le jeu instrumental pas à pas, peu importe qu’il soit joué lentement ou rapidement — l’interprète ayant la liberté du tempo, libre à lui de faire des points d’orgue, des accélérés, des ralentis… Le mathématicien américain Miller Puckette a été, à cet égard, très important pour moi ; il est à l’origine du programme Max, fort connu aujourd’hui et que le monde entier utilise. Nous avons travaillé ensemble pendant dix ans. Ensemble, nous sommes partis de pratiquement rien, si ce n’est des modules de transformation du son, des systèmes de réverbération, de spatialisation, de transposition, mais il existait peu de choses dans le domaine de la synthèse en temps réel. Après Jupiter, j’ai pensé réaliser une autre pièce, pour piano, cette fois, puisque c’est mon instrument, que j’ai appelée Pluton. Ici, l’ordinateur reconnaît non seulement ce qui est joué, mais également la manière dont c’est joué. Si l’on joue « forte » ou « piano », cela peut avoir une incidence sur la spatialisation ou la qualité du son qui sort des haut-parleurs. Du coup, la qualité du son est prise en compte. Ensuite, tout mon travail a été de rapprocher la sensibilité humaine — dans Pluton le jeu, le toucher du piano — avec un programme d’ordinateur.

 

Vous êtes donc passé du monde instrumental à celui de la voix…

 

La voix, pour moi, n’est pas un instrument. Il y a celle de Montserrat Caballé, mais aussi celle d’Elisabeth Schwarzkopf ; des voix différentes. Dans En Écho (1993/94), pour soprano et système électronique, le timbre même de la voix est reproduit et analysé en temps réel. Suivant le timbre de la voix, la pièce change de couleur, puisque ce qu’enregistre et analyse l’ordinateur ce sont les formants de la voix, la couleur des voyelles… On touche ici à l’articulation du son et aux caractéristiques intimes de la voix de la chanteuse. J’ai utilisé le terme de « partition virtuelle », pour ce rapprochement du geste instrumental — une interprétation est, par essence, impossible à déterminer à l’avance avec exactitude —, codifié plus ou moins précisément par l’écriture, avec des systèmes qui puissent l’analyser et en déduire des configurations musicales.

 

L’un de vos autres domaines de recherche est celui de la spatialisation…

 

Lorsque l’on est dans un studio, les haut-parleurs sont placés idéalement par rapport à l’auditeur. Dans une salle de concert, on a des groupes rassemblés près de l’un de ses haut-parleurs, avec une perception sonore déséquilibrée. Donc, j’ai réfléchi à une diffusion sur plusieurs échelles. Dans En Écho, par exemple, on trouve une mélodie qui est un récitatif de la voix. Elle n’est pas accompagnée par l’électronique, mais c’est la voix qui est transformée. À certains moments, lorsque l’interprète chante dans l’aigu, les sons sont projetés à l’avant et lorsque la voix atteint le grave, à l’inverse, le son est dirigé vers l’arrière et au milieu. Donc, si la voix se déplace très rapidement dans l’aigu, on entend physiquement un balayage — ainsi se créent des situations dramatiques. Plus récemment, dans l’opéra 60e Parallèle et dans le second, K…, en 2001, j’ai utilisé des synthèses de chœurs, notamment pour une scène dans une cathédrale. Des accords de chœurs sont successivement projetés dans trois acoustiques différentes : assez proche, plutôt lointaine et très lointaine, ainsi que devant, au milieu et derrière. Je souhaitais recréer l’acoustique d’une cathédrale. Imaginez quelqu’un marchant dans une grande cathédrale tandis que, dans un coin, plusieurs personnes chantent. Suivant la position géographique de celui qui se promène, il va entendre plus ou moins le son direct, et celui qui va lui revenir par des réflexions différentes, ou plus lointaines. Dans un tel cas, se produisent plusieurs interférences et illusions sonores, en relation avec l’architecture du lieu. Donc, le public de l’Opéra Bastille avait vraiment l’impression d’être à l’intérieur d’une cathédrale, à l’écoute d’un chœur à des distances variées — un peu comme un voyage à l’intérieur du chœur, sauf que c’est le son qui voyage. On arrive aujourd’hui à placer plusieurs catégorisations sonores dans différentes acoustiques. La notion d’espace est beaucoup plus facile à traiter grâce à l’électronique ; on peut superposer plusieurs plans sonores, les dégager les uns des autres, sans qu’ils s’annulent. Dans K…, une scène se passe dans le bureau où travaille Joseph K, elle est très courte, près de trois minutes et on entend des bruits de machines à écrire, produisant une sorte de samba avec l’orchestre. C’est groupé en plusieurs séquences, et chacune d’elle est scandée par un retour chariot. Plusieurs haut-parleurs sont placés au-dessus de la scène afin que l’on puisse entendre ce « retour chariot », de droite à gauche — ce qui, à la Bastille, représente une vingtaine de mètres. On ne voit pas ce chariot, il est purement virtuel, mais on entend sa masse importante se déplacer. J’ai pu obtenir également des trajectoires du son, qui va non seulement de gauche à droite, mais aussi de l’arrière jusqu’à l’avant. Mais, compte tenu des dimensions de la salle de l’Opéra Bastille, il est nécessaire de pouvoir disposer d’un certain nombre de haut-parleurs, pour obtenir une réelle continuité sonore. On peut faire en sorte que le son vienne d’un endroit où il n’y a pas de haut-parleurs, en en calculant la phase. On obtient ainsi des sons qui « balayent » la totalité de l’espace.

 

Lorsque vous êtes sur votre partition, de quelle manière envisagez-vous ce qui est instrumental et électronique ?

 

Il vaut mieux avoir une solide formation de compositeur, même lorsque vous écrivez une partition d’orchestre — comme lorsque j’ai composé Sound and Fury pour l’Orchestre de Chicago —, de façon à entendre intérieurement ce qui se passe… Je ne dispose bien évidemment pas de l’orchestre lorsque je compose, je dois imaginer le son à la seule lecture de ce que j’ai écrit sur partition. Avec l’orchestre, on dispose d’un bagage culturel. En revanche, avec l’électronique, on est vierge. Je ne sais même pas si l’on possédera, un jour, une connaissance identique à celle que nous avons des instruments, parce que c’est un terrain mouvant. Les choses évoluent, changent, se modifient. Il y a bien quelques principes qui se stabilisent, mais notre connaissance se forge essentiellement à partir de l’expérimentation, que l’on ne cesse d’acquérir.

Lorsque je travaille à une nouvelle composition, après avoir délimité les matériaux à utiliser, je passe plusieurs semaines à tester le résultat. Par exemple, en ce moment, je suis sur un opéra de chambre, La frontière, qui sera créé en octobre 2003. Il y a tout un passage qui se déroule pendant une guerre. J’ai donc recueilli une cinquantaine de bruits de mitrailleuses, canons, etc., pour montrer qu’il se passe une guerre en arrière plan. Ce ne sont pas seulement des bruits de théâtre, anecdotiques, mais des sons musicaux, comme des instruments de percussions. C’est une certaine vision de la musique concrète.

Donc, je passe plusieurs heures, plusieurs jours à essayer de transformer ces sons de manière à ce qu’ils puissent avoir suffisamment de prégnance musicale, pour que l’on oublie qu’en fin de compte c’est un bruit de mitrailleuse. Je cherche une forme de déréalisation. Il y a un objet concret, on en retire la substance réaliste, pour n’en garder que l’abstraction musicale. De manière générale, le son concret, en lui-même, n’a pas assez d’information esthétique pour être séduisant sur un plan musical.

 

Vous travaillez à l’Ircam depuis près de vingt ans ; qu’en retenez-vous ?

 

Bien sûr, l’Ircam m’intéresse pour les recherches que l’on y fait, mais aussi pour les contacts avec les compositeurs. Il y a toujours ici six ou sept musiciens en permanence ; j’ai ainsi pu connaître Magnus Lindberg, Jonathan Harvey, Gérard Grisey, … ou les plus jeunes qui arrivent. J’y ai même croisé des figures plus atypiques telles que Steve Reich, Frank Zappa… On n’imagine peut-être pas assez que c’est aussi un lieu de rencontre. On y discute, on peut poursuivre la conversation en allant déjeuner. On dispose de temps pour pouvoir partager des idées, des expériences ; il arrive parfois que l’on montre son travail… Il est important que l’Ircam demeure ce lieu de prospection. Plusieurs techniques d’analyse et de synthèse du son, couramment utilisées aujourd’hui, ont été initiées ici ou dans des universités américaines (à Stanford ou Berkeley) — qui ont été les modèles pour la création de l’Ircam —, avant de partir ailleurs… et revenir…

 

Vos recherches portent-elles toujours sur le geste instrumental ?

 

Tous mes travaux portent sur ce geste instrumental. D’ailleurs, c’est curieux de constater que les plus ouverts à ce type de recherche sont les « performers ». Face au temps réel et à la captation, la plupart des compositeurs classiques sont plutôt timides, sur la retenue ; ils préservent une culture « livresque », basée sur la partition écrite, durable. En revanche, les « performers » ou ceux qui pratiquent l’improvisation, ont développé beaucoup de choses dans l’interaction en temps réel. Si je ne partage pas souvent leurs goûts esthétiques, ni leur direction, en revanche, je suis sensible à leur approche de la captation instantanée du jeu instrumental par l’électronique. Un chercheur tel David Wessel, par exemple, aux Etats-Unis, qui travaille la performance et l’improvisation avec des musiciens indiens, ou de jazz a été très important pour moi. Je suis dans une position contradictoire, pas toujours facile, essayant d’intégrer des techniques nouvelles dans une esthétique qui leur est étrangère.


Auteur de l’entretien : inconnu.

Extrait de “En écho” (Juliana Snapper, soprano)

Saturday, November 15th, 2008

Sur “En écho” (avec Donatienne Michel Dansac, soprano)

Saturday, November 15th, 2008

Entretiens avec Claire Malroux sur musique et poésie (2004)

Thursday, October 23rd, 2008

CM : Philippe Manoury, vous êtes un grand concepteur et réinventeur de formes, de la sonate (votre op.1) jusqu’aux œuvres complexes de ces dernières années, parmi lesquelles figurent des opéras, dont le plus célèbre à ce jour est K. Ce qui me frappe, c’est que vous avez toujours entretenu des rapports étroits avec la littérature. Non seulement vous avez écrit des opéras à partir de grands textes, comme Le Procès de Kafka d’où est tiré K…, mais nombre de vos autres compositions qui ne font pas appel à la voix ont été aussi inspirées par des formes littéraires. Je pense par exemple à Aleph  On pourrait citer également Proust ou Faulkner… Pouvez-vous me dire rapidement où vont vos préférences dans ce domaine et ce qui provoque le déclic menant à la création ? 

Ph M  C’est ce que je nommerai  «  les vertus de la transsubstantiation ». Il s’agit de la confrontation avec une expérience artistique autre que la mienne. Si cela me provoque, c’est qu’il doit y avoir des liens profonds entre ce qui est exprimé dans un poème, un roman, une peinture, une pièce de théâtre ou un film, et ce que je veux exprimer en musique. Si une idée franchit le cap des conditions dans lesquelles elle a été conçue et émise, si elle résonne en moi, alors c’est qu’elle touche à quelque chose d’essentiel. Je ne recherche rien, je n’ai pas de préférences, ni aucune stratégie. Je laisse les choses venir d’elles-mêmes. Georges Steiner a merveilleusement décrit ce mouvement dans « Réelles présences » sous l’ancien vocable de « cortesia » : être prêt à l’accueil, au ravissement, et aussi à la critique. Une présence arrive. Rien n’est forcé. C’est un processus d’imprégnation lent mais durable.

CM : J’observe que dans les diverses expérimentations qui ont à voir avec la voix et le langage ou l’écriture, vous ne vous êtes tourné qu’assez récemment vers la poésie. Il y a eu d’abord En écho, œuvre que vous avez composée sur des poèmes d’Emmanuel Hocquard, en 1993/4. Votre seconde approche de la poésie a eu pour résultat une pièce intitulée Noon, créée le 3 décembre 2003 à Paris en clôture de l’année Berlioz, à partir de poèmes d’Emily Dickinson.  Pouvez-vous nous dire pourquoi vous avez choisi dans un premier temps de mettre en musique de la poésie contemporaine française.

Ph M : Ma première expérience a porté sur des textes en allemand de Georg Webern pour Zeitlauf en 1980. Treize ans plus tard, j’ai collaboré avec Emmanuel Hocquart pour En écho.  Le français est ma langue. Je ne voulais pas me soustraire à la difficulté bien connue de la traiter musicalement, pas plus que je ne voulais revisiter les auteurs classiques. Je pensais, naïvement, qu’une collaboration avec un auteur vivant aurait été possible sur une création musicale et poétique. Mais cela n’a pas été vraiment le cas. Je ne pense pas que cela soit réellement possible. Il faut qu’il existe une liberté et une indépendance totale chez les deux parties. Je ne me vois pas demander à un poète : « Pouvez-vous me faire quelque chose de très rythmé dans lequel il y ait le mot « soleil », par exemple. Pas plus que je ne voudrais qu’il me demande de faire tel ou tel type de musique.  Donc il n’y a pas de réelle collaboration comme je peux en avoir avec des gens de théâtre. Dans l’opéra, il faut constamment s’adapter aux conditions dramatiques, pas dans la poésie. La contemporanéité est probablement un handicap dans ce genre d’entreprise. Je ne connais guère de réelles collaborations fructueuses entre des poètes et des compositeurs. Webern a travaillé personnellement avec la poétesse Hidelgarde Jones, mais c’est dans Trakl qu’il a trouvé le véritable équivalent de sa musique. Peut-être faut-il du temps et de la distance pour que cette « cortesia » dont je parlais tout à l’heure s’opère.

C.M. : Quels sont dans cette œuvre les rapports entre poésie et musique ? Avez-vous cherché à les faire fusionner ou l’une n’est-elle là que pour mettre l’autre en valeur ?  (J’ai personnellement l’impression que la musique élargit considérablement le texte, en est un écho très amplifié ), alors que l’érotisme qui l’imprègne aurait pu susciter une œuvre très intimiste.

Ph.M ; Emmanuel Hocquart m’avait fourni ce que j’appelais des matériaux poétiques. C’étaient des propositions sur des sujets très centrés. Je lui avais simplement demandé d’écrire des textes à contenu érotique, parce qu’il n’en est pratiquement jamais question dans la musique dite savante. Il y a inclus sa mythologie personnelle : les tables, l’Amérique, la photographie, etc. Ensuite, j’ai agencé ce matériau suivant mes besoins formels. Il y a beaucoup de correspondances d’images que j’ai créées en répartissant un passage dans différents textes successifs. Ainsi une image initiée dans une mélodie se complète dans les suivantes, et avec elle, toute la structure musicale. Comme un développement qui a lieu après-coup. Le parti pris intimiste n’a jamais été pour moi un sujet de préoccupation dans cette œuvre.  Je pensais à cette magnifique phrase que Diderot place dans l’ouverture de son Neveu de Rameau : «  Mes pensées sont mes catins ».  C’est le récit que fait une jeune fille de ses expériences amoureuses, sans rien en cacher. C’est pour cela que j’ai placé à la toute fin de l’œuvre les mots « bien gentiment, bien simplement » comme une sorte d’autodéfinition de ce personnage. Il ne s’agissait pas d’amplifier, mais de ne rien dissimuler.

C.M : Quel rôle joue en l’occurrence le langage dans la composition ? Il me semble que vous avez surtout travaillé sur des variations de hauteur et d’intensité plutôt que sur le matériau brut fourni par les sonorités du poème.

Ph.M  C’est vrai que je me suis surtout attaché au sens des textes plutôt qu’à leur potentiel sonore. Sans doute est-ce dû au fait que les textes qu’Hocquart m’avait fournis n’étaient pas complètement achevés. Je ne pense pas non plus que ce soit un poète qui soit particulièrement attaché à cet aspect-là. C’est un grand lecteur de Wittgenstein.

CM : Votre approche de  la poésie d’Emily Dickinson est d’une tout autre nature, me semble-t-il. Pour En écho, vous avez sollicité Emmanuel Hocquard et il a écrit les poèmes en fonction d’un schéma que vous lui avez indiqué (L’œuvre de Nabokov, Lolita, est présente dans cette œuvre à l’arrière-plan).  L’inverse s’est produit dans votre seconde rencontre avec la poésie. Cette fois, c’est la poésie et la poésie en langue étrangère qui vous a sollicité, vous. Qu’avez-vous découvert dans les poèmes d’Emily Dickinson, Américaine du XIXe siècle, qui vous a poussé à écrire une de vos œuvres les plus récentes, Noon ? 

Ph.M : Ce sont à la fois les sonorités musicales, mais aussi l’hermétisme lié à cette écriture. Je voudrais m’expliquer sur ce terme. Je pense que les poètes, comme les compositeurs, ne « parlent pas comme tout le monde ». Ils trouvent dans la matière qu’il leur est donné de travailler des correspondances qui sont le fruit d’une expérimentation. Pour les poètes, cela peut être la grammaire, mais aussi des associations d’idées ou d’images qui n’existent pas dans le langage courant. C’est en cela que résident leur richesse et la richesse qu’ils offrent à la langue. Les compositeurs également ont le devoir d’inventer, comme le disait Stravinsky. Soit en créant de nouveaux matériaux, soit en  mettant des matériaux déjà existants dans des rapports non fixés par les conventions. C’est la confrontation de ces mots usuels insérés dans des contextes imaginatifs et étranges qui  a suscité ma première attirance pour la poésie d’E.D. Je dois dire également que c’est aussi dans les traductions françaises que vous en avez faites que j’ai ressenti les premiers chocs.

CM : Vous avez déclaré au cours d’une émission radiophonique que c’est Pierre Boulez qui a provoqué cette découverte : « Lorsque la traduction des poèmes et de la correspondance d’Emily Dickinson a paru aux éditions José Corti, Pierre Boulez a acheté ces livres dès leur sortie en librairie. Il m’a dit : « Tu devrais lire ça ». Il venait lui-même de les découvrir, et il a ajouté : « C’est dommage qu’Anton Webern n’ait pas connu cette poésie-là, car il aurait sans doute pu composer sur ces poèmes. »

Ph.M : On pourrait en effet imaginer une telle rencontre. Webern aurait été totalement séduit par cet univers. J’ai cité plus haut sa rencontre avec la poésie de Trakl. Mais Trakl était un poète violent qui cherchait à faire éclater les cadres, ce qui devait plaire au jeune Webern. Le Webern de la maturité, en revanche, recherchait plutôt une harmonie – fût-elle étrange – et penchait fortement vers une sorte de panthéisme goethéen pour donner une assise théorique et historique à l’incroyable révolution qu’il a opérée dans nos habitudes d’écoute. Dans cet ordre d’idée, la poésie d’E.D. l’aurait comblé. Il y a aussi une certaine naïveté qui les habite tous les deux et qui ne m’est pas désagréable. Webern aurait pu y retrouver ce monde clos et rigoureux, presque médiéval, qui le fascinait tant, en même temps que ce désir de transcendance qui le poussait dans les expérimentations les plus osées pour son époque. 

C.M : Dans vos entretiens avec Daniela Langer, parus sous le titre Va-et-Vient, vous dites justement à propos de Webern que les « progressions sous-entendues rejoignent l’idée d’une musique qui se serait déroulée ailleurs d’où ne parviennent à nos oreilles que des fragments ». Est-ce le caractère fragmentaire, inorganisé, non chronologique, de la poésie d’E.D. qui vous a séduit ?

Ph.M : Cette poésie exige une recherche de la part de qui la lit. Le sens n’est pas donné dès l’abord, mais existe néanmoins. Il faut le reconstituer, ou mieux, en reconstituer un pour soi-même. Il y a donc une continuité de la pensée, mais qui ne s’exprime que par des fragments, comme ces points sonores chez Webern. Lorsqu’on entend les dernières mesures de la 9e Symphonie de Mahler, on est saisi par une continuité mélodique interrompue par de grands silences. Il ne fait aucun doute que Webern soit parti de là. Il a poussé l’idée jusqu’à ses limites : ne montrer que les points saillants d’une grande  ligne virtuelle. Là aussi, il faut que l’auditeur construise une trajectoire mentale imaginaire entre ces points.

Cette invitation d’E.D. à la recherche d’un sens au travers d’une construction par ailleurs sonore me semble un des fondements de toute poésie. Ensuite il y a bien sûr ces fameux tirets qui ont valeur de silence pour le musicien que je suis. Et un musicien sait qu’il peut y avoir autant de valeurs de silence qu’il y a de valeurs de son. Chez E.D., ces tirets sont autant d’incitations à l’isolement, à la méditation, au souvenir. En musique, chaque silence est encore coloré par le son qui le précède et produit un effet immédiat sur la mémoire à court terme et sur le comportement psycho-physiologique de l’auditeur (sa respiration, son expectation…). Les tirets chez E.D. étaient autant de questions musicales qui se posaient à moi. Enfin il y a l’association des couleurs sonores réparties sur différents mots qui ont une valeur immédiatement transposable en musique.

CM : Dans cette même émission, vous avez donné deux raisons pour expliquer votre fascination à l’égard de la poésie d’E.D. :  « Au-delà du choc historique, j’ai été surtout conduit à m’interroger sur le « jeu » des sonorités. Ce phénomène m’intrigue davantage que l’hermétisme du texte. En définitive, ce que j’aime dans la poésie ou toute autre chose qui me fascine, c’est le questionnement incessant auquel elles donnent lieu, non la saisie immédiate d’un univers. Emily Dickinson a été pour moi une révélation dans ce sens-là. »  Pouvez-vous dire comment vous avez répondu à cet intérêt, d’abord pour les sonorités (ce qui est assez naturel de la part d’un musicien, mais que vous abordez de façon originale) et qui me touche, moi, plus particulièrement, puisque vous travaillez sur une langue étrangère comme moi, traductrice. Je me sens proche de vous dans la mesure où je travaille aussi pour rendre des « sonorités ». Où se situe la part de « traduction » chez le compositeur ?

Ph.M : Je peux vous citer deux exemples. Dans le premier, il s’agit de cet extraordinaire poème de deux vers entièrement construit sur la sonorité coupante du « S ». Il y est fait allusion d’ailleurs à un sabre !

Soft as the massacre of Suns                                    

Evening’s Sabres slain

 

(Suave comme le massacre de Soleils

Occis par les Sabres du Soir)

J’y entends très nettement des sons de maracas et de cymbales métalliques.  Ce texte possède également une froideur glaçante et extrêmement provocatrice. Comment peut-on considérer la suavité d’un massacre ? 

Le second, au contraire, est tout imprégné de l’épanchement et de la durée des « a » et des « i » :

It’s like the light

A fashionless Delight

It’s like the Bee

A dateless – Melody

Je suis très sensible à ces rapports dans la langue. En allemand, vous dites « Eine Stadt steht hier » pour dire « une ville est ici » et « Ein Dorf liegt hier » pour dire « un village se trouve ici ». Vous retrouvez ces « S » coupants qui se dressent brutalement en hauteurs comme les villes, alors que le « I » de « liegt » évoque l’étirement du temps et la douceur de la campagne. La poésie d’E.D. est entièrement habitée par cette adéquation profonde entre les sons et le sens. Lorsque je prends deux mots tels que Bee  et Melody qui se terminent tous les deux par un « I » plus ou moins long, je peux les traiter soit en leur conférant une même hauteur, soit en les coloriant avec un timbre identique, par exemple celui de flûtes et de violons. Ces poèmes ont été, en quelque sorte, la matrice d’une carte des timbres que je devais respecter. C’est pour cela que j’ai décidé de mettre le chœur à l’intérieur de l’orchestre et non plus derrière, comme cela se fait traditionnellement. Les voix se mélangent bien mieux aux sons de l’orchestre et, je l’espère, cela favorise l’imprégnation du sens et des sons.

CM : Et comment rétablissez-vous la continuité indispensable pour saisir le sens global des poèmes ?  Vous avez, je crois, construit Noon autour de l’idée de cycle ?

Ph.M : Il faut considérer que Noon est inachevé à ce jour. Pour des raisons de durée à l’intérieur d’un concert qui comportait également une cantate de Berlioz, je n’ai pas achevé le plan que je m’étais fixé. Mais tout est organisé en cycles. J’ai repris le même procédé formel plus récemment dans « On-Iron » sur des textes d’Héraclite. Je regroupe plusieurs textes en fonction de leur thématique commune. Chez E.D., il y a les poèmes qui concernent les heures, ceux qui sont liés aux saisons, à la mort et ceux que j’ai regroupés autour ce que j’ai appelé « les géométries divines » car ils traitent de proportions, de circonférences, de diamètres. Il y a donc un cycle qui traite du matin, puis un autre de midi, du soir, de minuit, et à nouveau du matin car rien n’est jamais figé chez E.D. Entre ces cycles viennent s’intégrer d’autres cycles, car je ne les ai pas regroupés en mouvements, mais déroulés sur toute la durée de l’œuvre. Au début j’ai inventé « le cycle des cycles » en choisissant un poème évoquant une mer qui s’écarte pour révéler une mer nouvelle, belle métaphore de l’éternité. Dans la version actuelle, la fin ne me satisfait pas car elle se situe dans le cycle de la Mort. Je ne veux pas de fin dramatique comme celle-là. Elle est contraire au sens général de ces poèmes. La véritable fin sera un second « cycle du matin ». Je n’ai rien composé non plus sur les cycles des saisons. Il s’agira de compositions pour petit effectif, comme de la musique de chambre, sans le grand orchestre, ni les chœurs, ni la musique électronique.

C.M : Il y a d’autre part le  « le questionnement incessant » auquel la poésie (comme toute chose qui vous fascine, dites-vous) donne lieu. En quoi la poésie se distingue-t-elle à cet égard des textes en prose qui vous ont également inspirés ? Quelle sorte de fascination peut-elle exercer sur un musicien ? 

Ph.M : C’est, de toute évidence, par sa dimension musicale que la poésie se distingue de toute autre forme de textes. Elle repose, comme la musique, sur des considérations d’ordre rythmique et sonore. Parfois elle s’en rapproche également en raison d’une tendance à l’abstraction, ou plus exactement par le fait que le sens ne se donne pas d’emblée.

CM : Avez-vous l’intention de poursuivre dans cette voie ? Et, le cas échéant, composerez-vous toujours à partir d’une poésie de langue étrangère ? Ou, idéalement, quel type de poésie française retiendrait votre attention ? Qu’est-ce qui motiverait votre choix ? Sur quel type d’expérimentation inédit pourrait-elle déboucher ? 

Ph.M :Je n’ai jamais dit que je ne composerais que sur des poésies étrangères. Comme je le disais au début, je ne suis pas à la recherche de quelque chose de précis. Par exemple, je vais travailler sur une nouvelle œuvre, qui sera créée à New York en septembre prochain, à partir  des textes préexistants de Jerome Rothenberg, poète new-yorkais qui habite comme moi à San Diego. Il écrit une poésie incantatoire, répétitive, proche du mouvement de la beat generation, à laquelle il était d’ailleurs lié. Nous nous voyons très souvent et il a lu ses poèmes chez moi. C’est comme cela, au gré de ce genre de rencontres, que les choses se font. Mais je reviendrai très certainement sur la poésie d’E.D., ne serait-ce que pour terminer Noon.

 

Interview parue dans le numéro 120 de la revue Poésie

 

 

Les partitions virtuelles

Wednesday, October 22nd, 2008

Deux univers coexistent dans mon activité de compositeur : celui de la musique instrumentale et celui de la musique électronique. Aussi loin que je puisse me souvenir, la question de leur confrontation et de leur intégration s’est toujours posée pour moi. Cette question n’est pas de celles qui appellent des réponses rapides ni simples car tout destinait ces musiques à suivre une chemin indépendant, un peu comme c’est le cas pour le cinéma et pour le théâtre. Les personnalités qui oeuvraient dans ces deux disciplines provenaient d’horizons et d’éducations parfois très différents, leurs expériences musicales n’était pas du tout du même ordre et leurs rapports à la composition ne se posaient pas dans les mêmes termes. Les compositeurs se séparaient en deux catégories très distinctes qui, non seulement ne se confrontaient pas, mais s’opposaient complètement : ceux qui composaient pour les voix ou pour les instruments et ceux qui produisaient de la musique pour bande magnétique. Les premiers ne voyaient dans les seconds que des “bricoleurs” plus ou moins habiles mais totalement ignorants des lois de la composition et de l’écriture, quant aux seconds, ils tenaient les premiers pour des musiciens prêts à entrer dans un musée conservateur et académique. Les personnalités qui, en France, ont réalisé les premiers travaux dans ce que l’on appelait alors la musique concrète, n’avaient, pour la plupart, qu’une culture musicale très rudimentaire. Cette naïveté par rapport à la composition leur a permit d’oser des expériences que, peut-être, des musiciens plus expérimentés auraient dédaignées mais elle ne demeure pas moins un trait caractéristique que le temps ne fait qu’accentuer. Cette opposition se reflète en particulier dans la querelle qui opposa des musiciens tels que Pierre Boulez ou Jean Barraqué au groupe qui s’était formé autour de Pierre Schaeffer dans les années 50. Les cultures étaient trop différentes et trop inégales pour pouvoir parvenir à un mode de pensée commun. Quelques tentatives de composition “mixtes” ont vu le jour parmi lesquelles ont peut citer Désert de Varèse ou Poésie pour pouvoir de Boulez. Dans le premier cas, le discours était basé sur une simple opposition entre ces deux supports, le second cas a été abandonné car il ne satisfaisait pas son auteur. Mais le problème de la confrontation de la musique instrumentale et de la musique électronique avait été posé. Karlheinz Stockhausen est de ceux qui trouvèrent le moyens les plus originaux dans ce domaine car, quoiqu’il ne réalisa ses oeuvres mixtes que plus tardivement, il proposa, dès ses premières oeuvres de musique électronique, une prise en charge de l’utilisation des moyens de la synthèse et du traitement des sons concrets dans une optique formelle qui trouvait une correspondance avec ses conceptions élaborées dans ses oeuvres instrumentales. Si la nature des sons et des techniques utilisées différaient d’un domaine à l’autre, ses oeuvres s’inscrivaient dans une logique d’une très grande cohérence formelle qui, le plus souvent, faisait défaut ailleurs. Ce fût, pour moi, le premier exemple qui m’ouvrit réellement les yeux sur les possibilités de confrontation de ces deux supports.

Vers les années 70 apparurent les premiers programmes de synthèse sonore par ordinateur dont le rôle allait être déterminant. Ils permettaient, d’une certaine manière, d’approcher certaines conditions de l’écriture musicale. La gestion et la formalisation de paramètres numériques contrôlant les différents composants du son pouvait, en quelque sorte, reproduire le phénomène de la composition instrumentale qui, lui aussi, est basé sur une élaboration et un traitement d’éléments distincts servant de matériau de base à une composition. En cela, cette méthode attira rapidement une catégorie de compositeurs plus habituée à ce mode d’approche qu’à celui consistant à travailler de manière plus intuitive, “à l’oreille” pourrait-on presque dire, sur le matériau musical comme c’était fréquemment le cas dans les musiques électroniques analogiques. Si l’on pouvait faire un parallèle entre la formalisation des programmes et celle de la composition, ces deux démarches proviennent néanmoins d’une situation culturelle très différente. Les personnes qui mirent au point ces premiers programmes n’étaient pas, dans la majorité des cas, des gens ayant une grande expérience de la composition. La distinction que j’ai opérée plus haut entre musiciens “acoustiques” et “électroniques” continuait d’être toujours visible. Mais, en cela, cette situation n’était guère différente de celles qui prévalaient dans toutes les autres disciplines dans lesquelles les machines électroniques s’étaient immiscées. Cependant quelque chose incitait également au rapprochement de ces deux modes d’expression. Des oeuvres avaient été composées dans ce sens et on voyait, ici et là, des musiciens appartenant à l’une ou l’autre de ces catégories se poser des questions. Ce sont ces échanges permanents d’une discipline vers l’autre, dont l’Ircam allait vite devenir le lieu privilégié, qui m’ont amené à concevoir ce que j’ai appelé les partitions virtuelles.

Il ne s’agit pas d’une méthode de composition à proprement parler, avec ses règles et ses lois, mais plutôt d’une conception de la composition dans un sens assez général. Le terme de partition virtuelle me semble avoir été prononcé pour la première fois par Pierre Boulez au cours de conversations que j’ai eu avec lui pendant les années 80. Ce n’est que vers 1986-1987 que je commençais à en définir la signification que je lui donne aujourd’hui. Je ne prétend pas, en cela, avoir résolu définitivement la question de l’intégration des musiques instrumentales et électroniques, mais avoir apporté une contribution assez précise sur ce que devrait être, à mon sens, la composition lorsqu’elle est confrontée aux technologies du temps-réel. A un niveau théorique, mais aussi pratique, ce principe est basé sur une volonté d’unification de ces deux univers au sein d’une approche plus ou moins identique. Cette unification passe, bien entendu, par l’abolition de certaines frontières qui n’ont pas manquées de s’ériger, soit entre ces deux univers, soit au sein même de l’un des deux. Ce qui était autrefois nécessaire au développement d’une idée ou d’une technique et nécessitait, pour ce développement, un certain isolement ou repli sur soi, n’est devenu, avec le temps, qu’une accoutumance à un mode de pensée ou de fonctionnement qui ressemble plus à une forteresse identificatrice qu’à un lieu d’échange fructueux. Ces frontières sont, d’une part, celles qui divisent la conception de la composition suivant le fait qu’elle est notée sur partition ou produit avec les moyens de la synthèse et d’autre part, à l’intérieur même de l’univers technologiques, le produit de cloisonnements qui existent de par la diversité des techniques dont on se sert pour produire le son. Ces techniques, d’abord utilisées séparément, coexistent désormais au sein des mêmes oeuvres. Elles n’ont cependant pas de mode d’approche unifié et remplissent des conditions très spécifiques. Enfin il y a un clivage qui, malgré les apparences, a la vie dure alors qu’en analysant de près la situation, il ne devrait, du moins théoriquement, ne plus poser de problèmes : c’est la séparation entre le temps différé et le temps réel. Comme on le verra, cette séparation est plutôt le fruit d’un choix technologique car, d’un point de vue strictement musical, rien ne semble la maintenir ni ne l’imposer dans le processus conceptuel de la composition. Ce choix technologique cependant conditionne grandement l’aspect esthétique et cette vision catégorielle des choses finit par encombrer inutilement le paysage musical alors qu’une plus grande simplicité dans l’unification des modes de pensée serait souhaitable. Il vient un moment ou toutes ces catégories, qui deviennent obsolète dans leur trop grande spécificité, doivent être dépassées. Pour moi, ce moment est arrivé. Les partitions virtuelles sont une réponse à cette question que je me pose depuis longtemps : pourquoi ne pourrait-on pas composer de la même manière, que l’on ait en face de soi, du papier réglé ou un ordinateur ? D’autres réponses doivent bien sûr exister, celle-çi m’est simplement personnelle.

Le principal problème, et il est de taille, qui continue de séparer ces deux supports est celui de la représentation. La représentation est évidemment un moyen de communiquer avec les instruments, une méthode pour fixer les idées, mais c’est aussi bien plus que cela. On sait parfaitement que le traitement et le développement d’une situation quelconque est éminemment conditionné par son mode de représentation. En quelque sorte, on peut affirmer que les développements que l’on fait subir à un matériau sont contenus dans son mode de représentation. Pour un musicien, ces modes de représentation peuvent avoir la forme d’une partition traditionnelle, mais aussi d’une liste de nombres, d’images graphiques, etc. Il y a cependant une distinction importante à faire quant à ces modes de représentation et quant à leurs natures respectives. On ne peut pas minimiser le rôle fondamental qu’a tenu l’écriture, non pas les différentes techniques d’écriture, mais le fait même d’écrire la musique, dans l’invention musicale. L’absence d’écriture dans la musique électronique est probablement un des phénomènes qui assura une parfaite étanchéité entre ces deux modes d’expression. Il y a ici un problème dont, pour des raisons de commodité évidentes, on persiste à penser qu’il n’a pas à se poser dans le contexte d’une musique basée sur des sons de synthèse mais qu’il va falloir, un jour où l’autre, aborder car il conditionne la pensée musicale toute entière et son développement. Il existe bien évidemment des modes de représentation sur lesquels travaillent les musiciens qui font de la synthèse électronique. Ces modes ne se situent cependant pas du tout au même niveau conceptuel que ceux qui définissent la notation musicale traditionnelle. La question de la représentation est au coeur de la problématique qui divise encore fortement musique instrumentale et électronique. Il est indispensable de l’aborder.

 

Symbolisme, perception et virtualité dans l’écriture musicale.

La notation musicale est de nature symbolique. Elle est, de ce point de vue assez proche de l’écriture dont certains travaux ont montré qu’elle était issue d’une représentation visuelle du phénomène qu’elle était censée représenter (pictogrammes), pour aboutir après de nombreuses évolutions (idéogrammes), à une conception symbolique dans laquelle toute idée figurative avait disparue (écritures phonétique et syllabique). On ne constate évidemment pas le même chemin dans la notation musicale, beaucoup plus récente, mais on peut y voir le même pouvoir d’abstraction de l’écriture en ce qu’elle n’est pas une description mais une représentation du phénomène sonore. Cela peut sembler curieux car la notation musicale ne représente qu’un phénomène d’essence tout à fait abstraite qui est le son et le parallèle avec l’écriture peut paraître alors un peu forcé. Cependant, dans son mode de représentation, il est clair que la notation musicale ne représente que partiellement le contenu sonore qui va en être déduit. Elle ne rend pas compte de la totalité perceptuelle de ce contenu mais que d’une partie, certainement la plus décisive pour le compositeur. Il est évident que, lors de la composition, le phénomène sonore n’est pas toujours totalement formé dans l’imagination. On connaît bien sûr l’exemple de Mozart disant que la musique se formait entièrement dans sa tête et qu’il ne lui restait plus ensuite qu’à la coucher sur du papier. Schoenberg s’est aussi expliqué sur ce fait dans Style et Idée : ” Il y a quelque quarante ans, j’écrivit mon premier quatuor à cordes op 7. J’avais pour habitude de me promener à pied chaque matin et de composer de tête 40 à 80 mesures complètes dans la quasi-totalité de leurs détails. Il ne me fallait ensuite que 2 ou 3 heures pour reporter sur le papier ces importants fragments déjà fixés dans ma mémoire”. Il n’y a aucun doute à avoir à propos de ces facultés mentales de conceptualisation. Cependant il paraît évident que l’imagination sonore, même lorsqu’elle semble à ce point ancrée dans le seul mental, est quand même située, d’une manière ou d’une autre, en référence à un écrit. Même dans ce cas, l’écrit reste bien évidemment la seule forme de représentation possible, ne serait-ce que pour la simple opération de mémorisation. La création musicale fonctionne également souvent par étapes successives, chacune des ces étapes pouvant être une nouvelle approche de l’objet final. Mais, même le processus créateur totalement achevé, l’écriture n’est toujours pas la description complète du phénomène sonore qui sera perçu. Elle est moins que cela. Il lui manque tous les éléments que l’interprète va y greffer afin de constituer un véritable objet musical. Or, comme on va le voir, ces éléments, pour la plupart, ne sont pas notables. En cela, la notation laisse le champ libre à l’interprétation. L’écriture musicale est basée sur un vocabulaire de signes extrêmement simple en regard de la réalité sonore. C’est même cette économie de moyens qui la caractérise qui a permit d’élaborer des constructions formelles d’une grande complexité. Il est probable que si l’écriture avait du rendre compte du phénomène sonore dans sa totalité, de telles constructions n’auraient jamais pu voir le jour. En quelque sorte, la notation musicale est une sorte de métonymie du phénomène sonore : le tout est exprimé par une partie seulement. Cette représentation symbolique possède un pouvoir similaire à celui du mot sur les choses : elle permet d’abstraire des catégories, de les manier, de les construire, elle permet surtout la déduction et toutes les opérations qui n’auraient pu avoir lieu si la représentation n’avait pas été dégagée de sa substance matérielle, c’est à dire la réalité sonore. Cette abstraction symbolique propre à la notation, est la condition même d’une grande partie de l’évolution musicale depuis les neumes grégoriens jusqu’à nos jours.

Une représentation quelconque, n’a cependant de véritable puissance créatrice que lorsqu’elle peut provoquer l’imagination de celui qui la travaille. Cette valeur existe pour le musicien lorsqu’il possède la faculté de se représenter “mentalement” ce qu’il écrit, en d’autres termes, lorsqu’il peut “entendre” intérieurement ce qui est représenté sur la partition. Il existe un lien perceptuel entre la notation musicale et sa réalité sonore un peu comme la lecture d’un texte peut provoquer des images dans l’esprit de celui qui lit. Cette faculté est grandement fonction de l’éducation et de l’entraînement du musicien. 1. Il faut en effet qu’il y ait dans la lecture de la musique le complément nécessaire à l’écriture puisque l’interprétation n’existe pas. Dans ce cas l’interprétation est imaginaire. Elle est provoquée par l’accoutumance à la lecture, par la faculté de percevoir les timbres instrumentaux, par exemple, par la seule lecture d’une partition. Chacun peut mesurer l’écart qui existe entre la lecture et sa propre facilité à en percvoir le contenu. Ainsi, beaucoup de compositions actuelles, comme celles de Helmut Lachenmann, utilisent des modes de jeu instrumentaux non traditionnels. Il a fallu pour cela inventer une sorte de “tablature” qui, d’ailleurs, varie grandement d’un compositeur à l’autre. L’écoute interne de la lecture de telles partitions est d’autant plus difficile quand ces oeuvres ne reproduisent plus les cas auxquels notre oreille a été éduquée (reconnaissance de hauteurs, d’intervalles, d’instruments …). Ces cas de figures anticipent, en quelque sorte, sur ceux que nous verrons  à propos de la musique électronique.

Un autre faculté propre à la notation musicale est sa virtualité. L’observation des conditions de l’écriture et de l’interprétation dans différentes partitions du répertoire est riche d’intérêt. Ces conditions forment d’ailleurs la base même de toute la tradition musicale occidentale. Un rapide survol historique montre clairement que, au fil des époques, l’écriture se fait toujours dans le sens d’une plus grande précision. C’est à dire qu’elle supplante progressivement tout un savoir qui provenait de traditions orales. De telles traditions finissent par devenir, au bout d’un certain temps, des “mauvaises habitudes” qui n’ont plus lieu d’être lorsque que le langage et la stylistique ont évolués 2. Si l’on prend, par exemple, la notation utilisée à l’époque baroque, on constate que n’y figurent, ni indication de tempi, ni indication de dynamiques, ni indication de phrasé… La notation est réduite à très peu de choses ce qui n’empêche nullement la grande complexité de certaines de ces oeuvres. Or l’interprétation de ce style de musique est fondé sur un grand nombre de ces valeurs qui ne sont aucunement notées dans la partition. Les compositeurs notaient ce qui était pour eux “les noyaux durs” de leur style propre, ce qui faisait que, dans le contexte de leur époque encore chargé de tradition orale, leur musique demeurait personnelle. Leur écriture comportait des éléments absolus ou relatifs suivant les cas,  qui allaient être “gauchis” et complétés par l’interprète. La somme des éléments qui vont donner naissance au phénomène musical n’est donc pas quelque chose qui est intégralement inscrit dans la partition. Bien que les traditions orales deviennent de plus en plus rares au fur et à mesure que l’écriture se précise, il est évident que cette dualité entre notation et interprétation continue de fonctionner quelque soit le style où l’époque. Il est important, à ce stade, d’observer où se situent les marges entre notation et interprétation et surtout de définir à partir de quelles conditions l’on peut parler d’interprétation.

L’interprétation agit sur des zones, mentales pour la plupart, à l’intérieur desquelles vont se trouver les valeurs qui détermineront les phénomènes sonores. Cette incertitude est la conséquence de l’imprécision, ou disons de la relativité de l’écriture. Les trois niveaux classiques sur lesquels se base l’écriture sont, par ordre de complexité : les hauteurs, les durées et les dynamiques. Le premier niveau est celui ou le pouvoir discriminateur de l’oreille est le plus fin : on peut ordonner une grande quantité de sons du grave à l’aigu sans problème. Mais, hormis les instruments à sons fixés tels que les claviers, on constate une zone d’acceptation assez grande de ce qui est une hauteur lorsqu’on entend un ensemble de cordes jouer à l’unisson ou même lorsqu’on examine la courbe d’un vibrato 3. La notation des temps est beaucoup plus floue en regard de la perception. Au delà d’un temps assez bref (que l’on peut avoisiner autour de deux secondes) il est déjà pratiquement impossible d’avoir une idée d’une durée si l’on ne la décompose pas en valeurs plus fines. De plus, un grand nombre d’études l’ont montré, le temps, dans une interprétation musicale, est soumis à une constante variation qui peut dépendre du contexte mélodique, harmonique ou stylistique. En tout état de cause, on ne peut pas ordonner un grand nombre de durées de manière aussi facile qu’en ce qui concerne les hauteurs. Quant aux dynamiques, le maximum semble avoir été atteint avec la célèbre étude de Messiaen Modes de valeurs et d’intensités. Ce cas de figure n’est même concevable que “très théoriquement”. Non qu’il soit impossible de percevoir plus de sept valeurs différentes échelonnées du ppp au fff, mais il est rigoureusement impossible d’exiger d’un interprète d’en définir plus. Ces exemples donnent une excellente description du caractère relatif de la notation musicale en regard de la perception. Si l’interprétation est fortement conditionnée par la notation, elle ne commence que lorsque l’autre n’intervient plus. Ces deux entités que sont la notation et l’interprétation se définissent par le choix de la nature absolue ou relative des composants. Mais, en tout état de cause, l’écriture interprétable ne se définit qu’à l’intérieur de zones plus ou moins floues. Ces valeurs sont virtuelles et ne deviennent réelles qu’au moment ou l’interprète les produit. On ne peut rigoureusement parler d’interprétation que lorsqu’il y a une incertitude sur la valeur réelle qui va intervenir.

Cette richesse de possibilités est offerte par un mode de représentation et ne pourrait pas exister sans lui. Le lien entre représentation et potentialité d’un matériau sonore est à la base de toute une réflexion qui a lieu en ce moment au sujet de la musique conçue pour ou par ordinateur, que cette musique soit destinée aux instruments traditionnels ou aux sons électroniques. C’est le second cas qui m’occupe ici bien évidemment car dans le cas des instruments acoustiques, quelque soit le mode de représentation que l’on s’est fixé au départ, on retombe fatalement dans la notation traditionnelle. On va voir que, si variées et si perfectionnées soient-elles, les méthodes de représentation dont on se sert pour composer de la musique de synthèse, n’ont pas du tout les mêmes valeurs que celles qu’on utilise dans la tradition vocale ou instrumentale.

 

Les modes de représentations sonores de la musique électronique.

On peut distinguer deux familles de représentation musicale dans le cadre de la musique électronique : celle qui traite des sons eux-mêmes, de leur morphologie, et celle, beaucoup plus abstraite qui traite de la composition des structures musicales. Le problème qui se pose concerne la nature des objets représentés dans le domaine de la musique de synthèse qui sont beaucoup plus variés et beaucoup moins standardisés que dans celui de la musique instrumentale. Ces objets ne sont pas obligatoirement réductibles aux catégories offertes par la notation traditionnelle, même s’ils peuvent les contenir. Il est important aussi qu’une représentation graphique soit en étroite relation avec la représentation mentale qu’on se fait de l’objet. Un compositeur organisant le schéma harmonique d’une composition instrumentale utilisera une notation rudimentaire qui ne tiendra compte, pour l’instant, que des phénomènes de hauteur à l’exception des durées, dynamiques, orchestration, phrasés, etc. Dans son esprit, et à ce stade de l’esquisse, l’objet sonore qu’il travaille n’est mentalement constitué que de ces relations harmoniques. C’est dans un stade ultérieur qu’il affinera cet objet en lui donnant une morphologie plus complète. L’ordre dans lequel ces opérations ont lieu n’est ici pris que comme exemple et peut fort bien être différent. Le même exemple pris dans le cas de sons de synthèses peut être comparé. Si l’on veut dépasser en finesse les catégories de hauteurs offertes par la notation traditionnelle, c’est à dire si l’on veut obtenir des coupures plus petites que le demi ou même le quart de ton, il n’y a guère qu’une représentation numérique qui s’impose. Elle a l’avantage de se prêter à toutes les opérations de calcul mathématique, sous quelque forme algorithmique que ce soit. Sa limitation cependant vient du fait qu’elle n’offre aucune base intuitive à partir de laquelle on pourrait extrapoler. Rien n’est moins convainquant, pour un compositeur, qu’une suite de nombres lorsqu’il cherche, dans la représentation des événements sonores, une vision imaginative.

Une autre possibilité actuelle consiste à créer des représentations graphiques du son  qui permettent, suivant les cas, d’opérer des manipulations diverses. La représentation sous forme de sonagramme permet d’obtenir une “coupe” dégageant les raies spectrales constituées par les différents partiels. On peut réécrire ou effacer ces raies spectrales afin de changer certains aspects du timbre. D’autres types de représentation graphiques, telles que celle qui donne le profil dynamique du son an amplitude et permettent des “zooms” pouvant aller jusqu’au sinus, c’est à dire au plus petit constituant possible, sont très efficaces dans les techniques de montage et de mixage. Ces méthodes ont l’avantage de proposer une représentation plus “intuitive” et plus directement “parlante” du son.

Il est clair que de tels outils relèvent plus de ce que l’on pourrait appeler une description morphologique que d’une écriture au sens ou on l’a définit précédemment. La situation est très complexe car on ne peut pas nier non plus que ces outils conceptuels existent ou, du moins, qu’il existe réellement des recherches dans cette direction. Tout ce qu’a apporté, depuis une vingtaine d’années, les modèles logiques et algorithmiques de l’informatique à la musique en sont la preuve. L’automatisation, partielle ou même totale, des processus compositionnels n’a, d’ailleurs, pas attendu l’invention des ordinateurs pour exister. Les machines étant, par nature, tout à fait adaptées à ce mode de travail, il aurait été inconcevable qu’elle ne le traite pas. En l’occurrence, les premiers essais utilisant les machines pour fabriquer de la musique ont été faits dans ce sens, les recherches purement sonores n’étant venues qu’après 4. On peut cependant faire la remarque suivante. Ces modes de représentation, logiques ou algorithmiques, peuvent comporter une puissance conceptuelle indéniable, ils présentent, en comparaison de l’écriture musicale traditionnelle, un désavantage de taille en ce qu’ils n’ont pas de valeur perceptuelle. Ils n’offrent pas la possibilité de se faire une représentation, sinon mentale, du moins perceptuelle du phénomène qu’ils engendrent. Ils sont, de ce point de vue aussi éloignés de la perception musicale que les représentations graphiques y sont noyées. Il y a là un fossé entre le travail sur les manipulations sonores et sur les structures compositionnelles que les méthodes de représentation diverses n’arrivent pas à combler ni à unifier. Il est un fait qu’un code numérique, ou une représentation graphique quelle qu’elle soit, n’est jamais parvenu à nourrir l’imagination d’un compositeur en vue d’en tirer des conséquences musicales. Ils ne sont que des méthodes de gestion de paramètres ou de manipulations qui, aussi puissante soient-elles, se révèlent incapables de représenter mentalement un contenu sonore réel. Il ne s’agit pas là d’un problème d’inacoutumance à un mode de représentation nouveau mais d’une différence de nature fondamentale entre la notation symbolique qui est celle de l’écriture traditionnelle et celles, numériques ou graphiques, dont on se sert avec les outils de synthèse. Les notations utilisées dans le cas des sons électroniques ne permettent pas de représentations mentales, au sens ou un musicien peut “entendre” intérieurement une partition par la seule lecture. Une représentation numérique ou graphique n’est pas, et ne sera jamais une partition, au sens ou la conçoit un compositeur. Ces différences ne donnent pas pour autant la suprématie d’un mode de représentation sur un autre. Ils indiquent les natures fondamentalement différentes qui existent entre la conception musicale qui prévaut pour les instruments traditionnels et celle qui est utilisée pour les outils de synthèse.

Les modes de représentation et les signes dont nous nous servons lors de la représentation des événements de la synthèse sont, pour le moment, très illustratifs et descriptifs de la réalité sonore. Or, on l’a vu, la force même de la représentation musicale dans l’écriture tient grandement à son caractère symbolique et métonymique et non exhaustivement descriptif. Dans l’état actuel de notre situation vis à vis des matériaux de la musique électronique, nous avons du mal à concevoir un type d’écriture qui rejoindrait, par son aspect symbolique, certaines possibilités de l’écriture traditionnelle telle que je l’ai décrite plus haut. Il est clair que la non-standardisation des objets est un obstacle de taille. Cependant, ce n’est pas tant les objets qui nous importent dans le problème de la représentation que les méthodes de transformations et de développements. Comme on le verra par la suite, l’idée d’une standardisation et d’une unification des méthodes diverses n’est pas impensable. Lorsque le vocabulaire général, qui est encore très éclaté, se réduira autour de conceptions globales des techniques diverses de la musique électronique, la possibilité d’une écriture symbolique se fera peut-être jour. Il est probablement trop tôt pour l’affirmer, mais il est grand temps de commencer à se poser le problème. Très certainement, nous n’avons pas encore découvert les principes de ces nouveaux modes de représentation et rien n’indique, pour l’instant, qu’il seront graphiques. Ils sont encore dans un type de représentation qu’il reste peut-être encore à inventer. Le passage de la description figurative à la représentation symbolique me semble un problème qu’il sera indispensable, à un moment ou à un autre, de traiter. Je n’ai, pour l’instant, aucune idée sur la manière d’y parvenir, simplement l’intuition qu’il faudra y parvenir. De ce point de vue, et en acceptant une certaine ironie vis à vis de la situation, nous sommes un peu comme ces peuples de Mésopotamie qui, 3000 ans avant notre ère, inventaient les premiers signes qui permirent non seulement de fixer, mais aussi de faire évoluer notre pensée.

 

Les partitions virtuelles.

En l’absence de ces outils conceptuels, il reste cependant à gérer la situation présente. Il semble acquis, vu la convergence d’un grand nombre d’oeuvres, que la mixité, c’est à dire l’alliance de l’électronique et de l’instrumental, triomphe de la solution qui consistait à n’offrir que de la musique conçue pour support synthétique. Si une nouvelle technologie se doit d’apporter de nouveaux concepts dans la discipline qu’elle sert, elle doit également intégrer le savoir-faire qui est en cours dans cette discipline. Ce savoir-faire est construit, selon moi, dans cet échange permanent entre l’écriture et l’interprétation. Les systèmes en temps-réel autorisent bien évidemment ce que l’on nomme du terme très prisé actuellement, voire même abondamment galvaudé, d’interactivité. Comme la virtualité était présente dans le couple écriture/interprétation depuis toujours, l’interactivité n’est pas non plus une chose nouvelle en musique. L’image des quatre musiciens d’un quatuor à cordes dont chacun produit de la musique tout en étant constamment à l’écoute de ses trois partenaires en est, entre autre, un exemple bien réel. Il ne s’agit cependant ici que d’interprétation mais au départ l’enjeu se situe bien là : faire entrer l’interprétation dans le contexte de la musique électronique. L’interprétation,  commence là ou s’arrête l’écriture, et est rendue possible par la nature même de cette écriture, son aspect métonymique. C’est en partant de l’analyse de ce que sont les conditions de l’écriture et de l’interprétation dans la musique traditionnelle que j’ai déterminé ce qui devait constituer, selon moi, les bases théoriques de la musique électronique en temps-réel. L’intrusion de l’outil technologique dans la création musicale bouleverse une quantité de choses. Il est normal que certaines données de la composition soient modifiées sans quoi la technologie ne serait rien de plus que ce qu’est la calculatrice électronique au calcul mental : une façon de faire la même chose avec plus de sûreté, plus de rapidité et moins de réflexion. Artistiquement, cette situation ne présente pas le moindre intérêt. Mais il est aussi normal l’outil technologique puisse s’adapter à une culture et s’intégrer à des pratiques qui sont à la base de cette culture. C’est dans ce mouvement d’adaptation réciproque, à double sens, que je conçois l’alliage de la technologie avec la pratique musicale. C’est pourquoi, quelque soit le sens que l’on donne aux termes de partitions et d’interprétation, je conserve la conception des données absolues et relatives comme concept de base dans les partitions virtuelles.

Les partitions virtuelles posent, comme prémisse, une donnée qui me semble être la base même de ce que l’on appelle le “temps réel” et qui est fondée sur la possibilité de détecter et d’analyser des événements produits en temps réel, c’est à dire, en musique, des événements produits par l’interprétation. Dans un premier temps, il s’agit de faire entrer les critères d’interprétation dans la musique électronique mais il va de soi que ces critères sont intimement liés à une stylistique particulière, voire à une époque, à des modes tout autant qu’à une analyse du texte à interpréter. Dans le cas d’une musique en devenir, les critères d’interprétation ne peuvent pas être du même ordre que dans celui d’une musique déjà codifiée culturellement. Il n’existe pas, à proprement parler, de critères d’interprétation en soi. Dès lors que l’on veut capter et faire interférer des phénomènes d’interprétation dans un contexte nouveau il semble évident que la conception du texte ou de la partition doit être également différente. Cependant ces partitions virtuelles sont basées sur la même appréciation que celle que j’ai donnée au sujet des partitions traditionnelles : elles ne donnent pas la totalité du contenu sonore, mais une partie seulement. Cette partie, qui  est codée dans la mémoire de la machine, demeure invariable quelque soit la manière dont l’interprète agira. La part manquante est déterminée par les relations qui sont établies entre l’interprète et la machine. C’est l’analyse en temps-réel des données instrumentales, ou vocales, qui définira les valeurs réelles qui serviront à produire le son. La musique, dans ce contexte déterminé, ne peut surgir que lorsque les données captées de l’interprète entrent en connexion avec celles qui sont fixées dans la machine. Elles sont, on l’a vu, organisées à l’intérieur de zones et non en tant que valeurs réelles puisque c’est comme cela que fonctionne l’interprétation. La partition virtuelle est donc une partition dont on connaît, a priori, la nature des éléments qui vont être traités mais dont on ignore les valeurs exactes qui vont définir ces éléments.

L’influence de données de l’interprète sur le programme est déterminée par le choix de ce qui constitue les valeurs absolues ou relatives du contexte musical dans lequel on se situe. Les valeurs absolues sont celles qui, d’une exécution à l’autre, ne varient pas. La connexion entre l’interprète et cette partie des paramètres fixés est inexistante car, quelque soit la manière dont l’interprète agit, ces valeurs restent rigoureusement identiques. Pour parler en termes anthropomorphiques on pourrait dire que, dans ces cas là, la machine “n’entends” pas ce que produit l’interprète. Les valeurs relatives, elles, seront soumises au contrôle de l’interprète. La machine les “entends”, les détecte, les analyse, les convertit en paramètres et les utilise dans les calculs nécessaires à la production de tel ou tel composant du son. Imaginons un instrument virtuel produisant de la synthèse. On considère que, parmi la grande quantité de paramètres nécessaires à la production du son, une partie d’entre eux soient “verrouillés”, c’est à dire qu’ils ne sa placent pas dans le champ d’influence de l’interprète. Les valeurs affectées à ces paramètres sont alors déterminées une fois pour toute dans une liste que le processeur viendra lire le moment venu. L’autre partie de ces paramètres est fournie par une détection et une analyse des comportements instrumentaux et variera continuellement soit en reproduisant à l’identique les résultats de cette analyse, soit en les modifiants par le biais de fonctions de transfert. A un autre moment, le verrouillage et le déverrouillage porteront sur une autre distribution de paramètres. Cette situation, on le voit, comporte deux aspects : l’un fixe et l’autre mobile. On y reconnaît ce qui, dans l’écriture, était invariable et ce qui était soumis à de déviations, des modifications, à tous les éléments que l’interprète produit, en temps-réel pourrait-on dire, et qui n’étaient pas inscrits dans le texte.

Cette dimension indéterministe peut avoir des conséquences plus ou moins importantes sur la morphologie du discours musical. Cette marge aléatoire peut être, au moins, celle qui définit les conditions traditionnelles de l’interprétation, à savoir ce qui détermine une qualité sonore, un phrasé, une attaque, une durée, etc., elle peut être, au plus, responsable de la structure entière du discours musical qui, dans ce cas, sera organisée en fonction des données reçues par l’interprète. Dans ce dernier cas, cela confine au statut de l’oeuvre ouverte et de la musique aléatoire, et peut aller, en bout de course, jusqu’à l’improvisation. C’est là une affaire de choix compositionnel et de choix esthétique que je ne veux pas traiter dans ce contexte. Ces choix sont avant tout d’ordre esthétiques mais sont également tributaires du type d’analyse que l’on effectue sur le son de l’interprète.

 

Reconnaissance et suivi.

L’organisation des partitions virtuelles est basée sur deux principes qu’il est important de distinguer : celui de la reconnaissance et celui du suivi. Par reconnaissance, il faut entendre la possibilité de se repérer dans un contexte déjà connu à l’avance mais qui risque d’être perturbé. C’est le cas de ce que l’on nomme improprement “suivi de partition” et que l’on devrait appeler “reconnaissance de partition”  La reconnaissance d’une partition jouée par un interprète se borne généralement à se repérer dans une succession chronologique d’événements tout en admettant une certaine tolérance à l’erreur. On attend un événement déjà mémorisé et le processeur doit le reconnaître instantanément. La partition instrumentale est déjà codée à l’avance, et le processeur compare les événements détectés avec ceux qu’il est censé reconnaître chronologiquement. En général cela se fait au moyen d’une “fenêtre d’analyse” qui joue sur la reconnaissance non d’événements isolés, mais d’une collection d’événements. C’est ce qui permet d’introduire une clause de tolérance à l’erreur car si trois événements sur cinq sont reconnus, par exemple, le processeur n’interromps pas son travail et en “déduit” que la partition détectée est bien ressemblante à celle qui est codée dans sa mémoire. C’est un des cas les plus délicats à traiter car, suivant les instruments utilisés, il est nécessaire de choisir des options différentes. La reconnaissance d’une partition monodique peut très bien se faire de manière acoustique : un micro capte le signal puis, grâce à une analyse du spectre, en calcule la fréquence fondamentale. Si cette fréquence correspond à la note attendue, alors l’événement est reconnu et le système reproduit la même opération et ainsi de suite. La reconnaissance d’une partition polyphonique pose beaucoup plus de problèmes car  lorsque quatre notes sont jouées simultanément, il est très difficile de déterminer à quelles fréquences fondamentales appartiennent la superposition de tous les composants des spectres. Des recherches existent dans cette direction [5.Miller Puckette, à l’Université de San Diego, réalise actuellement des recherches sur la détection acoustiques des instruments à corde. Ces instruments pouvant produire plusieurs sons à la fois, en tout cas deux de manière tout à fait simultanée, le problème de la détection polyphonique est abordé.] mais, pour le moment, on en est réduit à utiliser un type de détection purement mécanique tel que le code MIDI. La différence entre ces deux types de détections, acoustique et mécanique, n’a guère de conséquences sur la suite de la composition car il ne s’agit pas encore ici de contrôler quoi que ce soit mais de se repérer dans une partition. L’avantage de la reconnaissance de partition est cependant de tout premier ordre dans la gestion temporelle de la musique car, une fois cette étape maîtrisée, s’offre la possibilité d’introduire autant de points d’ancrage temporels que l’on désire entre la partition instrumentale et la partition électronique. A chaque événement reconnu, pourra être synchronisé tel ou tel type de son, de traitement, de processus dont certains, tels que l’échantillonnage en temps-réel, doivent obéir à une précision de l’ordre de quelques millisecondes. C’est la condition sine qua non pour en finir avec la rigidité temporelle des anciens systèmes et pour donner à la musique électronique une souplesse temporelle au moins égale à celle qui existe dans le monde instrumental.

Le suivi est d’un tout autre ordre. Par “suivi” on doit comprendre la détection d’événements qu’on ne connaît pas à l’avance. Le processeur détecte des valeurs mais ne les compare pas avec une liste déjà établie a priori. Il ne fait, sauf cas particuliers, aucune comparaison et accepte tous les événements comme également valables. Le suivi peut porter indifféremment sur n’importe quel composant sonore, hauteur, enveloppe dynamique, catégories spectrales, comportements acoustiques divers etc. C’est à ce niveau que s’opèrent toutes les opérations de contrôle qui permettent de modifier en temps-réel les paramètres de synthèse ou de traitement. C’est à ce niveau également que la dimension de l’interprétation peut servir de modèle pour l’élaboration des sons électroniques. C’est ici que le compositeur peut introduire dans sa partition la virtualité qui fait que le processeur peut mesurer l’écart qui existe entre la notation et le phénomène sonore produit à partir de cette notation. Un exemple simple, tiré de ma composition En écho pur soprano et système en temps reel 5, peut donner une explication de ce phénomène. Une voix humaine peut produire des voyelles à partir de la simple notation d’un texte sous des notes. Les voyelles sont définies acoustiquement par ce que l’on nomme les formants dont les fréquences se situent dans des zones assez bien connues. Il est cependant absolument impossible d’exiger d’un chanteur qu’il produise ses formants sur ces fréquences données. Cela fait partie de ces catégories sonores qui sont productibles mais absolument pas notables car “humainement” impossibles à contrôler. C’est exactement l’écart qui existe entre la complexité du phénomène sonore et son écrit. Cela dit, un processeur peut très bien faire l’analyse de ces formants et en opérer un suivi de façon tout à fait continue et exacte. Aucune valeur précise n’est attendue puisque l’interprète n’a pas la possibilité de les fournir avec exactitude. Ces valeurs détectées sont alors envoyées à un algorithme de synthèse qui les utilise en temps-réel. Le timbre de ces sons de synthèse reproduit alors une qualité qui est celle de la voix au moment ou l’interprète les chante. On reconnaît les différentes couleurs des voyelles dans les accords produits électroniquement. Ces sons de synthèse sont, d’autre part, définis harmoniquement sous une forme totalement fixée qui ne variera pas quel que soit la manière dont chante l’interprète. D’un côté on a des valeurs absolues, fixées une fois pour toute, de l’autre des valeurs relatives qui détermineront des qualités sonores en fonction de l’interprétation. Cette dualité entre valeurs absolues et relatives, qui définit les conditions de l’écrit et de l’interprétation dans la musique instrumentale et vocale, a déjà évoquée précédemment mais, dans le contexte de la musique électronique, détermine deux catégories qui continuent d’alimenter une grande querelle qui, à mon sens, n’a plus lieu d’être : celle du temps-différé contre le temps-réel.

 

La querelle des temps.

On observe un important clivage entre les compositeurs qui se réclament des techniques en temps différé et ceux, beaucoup moins nombreux, qui optent pour une utilisation du temps réel.  Ces deux termes, d’ailleurs, doivent être pris avec précaution. Comme on le verra, une grande partie des musiques qui se définissent comme appartenant à la catégorie du “temps réel” ne proposent finalement qu’un aménagement pratique des vieilles méthodes de studio en “temps différé” tout comme les musiques réellement conçues avec les techniques du “temps réel” acceptent une grande part de prédétermination absolue dans leur constituant, ce qui est la marque du “temps différé”. On peut résumer rapidement les situations dépendant du temps-réel et du temps-différé en disant que dans le premier cas, l’analyse des données de l’interprétation modifient la totalité ou une partie des aspects morphologiques du discours musical, alors que dans le second cas, ceux-çi restent identiques quelque soient les critères d’interprétation comme c’était le cas dans les anciennes musiques pour bande magnétique.

S’il est un élément fondamental qui détermine ces clans que sont le “temps réel” et le “temps différé”, c’est bien le Temps lui même. Non pas le temps psychologique mais le temps musical objectif, celui qui détermine les conditions de synchronisation et de coordination entre les événements. Le problème s’est tout de suite posé lorsqu’on a voulu faire dialoguer un temps immuable, celui des bandes magnétiques, avec un temps modulable, celui des instruments dans les premières musiques mixtes. Plusieurs cas de figures ont été tentées pour résoudre ce délicat problème de superposition. Un chef d’orchestre , ou des instrumentistes, peuvent suivre le déroulement d’une musique couchée sur support fixe “à l’oreille” si certains éléments sonores agissent comme des signaux de repérage. En y réfléchissant, c’est un peu le cas très classique d’un chanteur d’opéra attendant un “repère” dans l’orchestre soit pour prendre son intonation, soit pour chanter, soit pour accomplir un geste scénique. Dans un second cas, lorsqu’une précision rythmique beaucoup plus grande est demandée, comme dans le cas de modifications des tempi dans lesquels il faut synchroniser parfaitement les instruments et les événements électroniques, une autre solution consiste à diffuser un “click-track” (un bruit de métronome enregistré) que le chef écoutera par l’intermédiaire d’un petit écouteur placé sur son oreille. Cela permet d’être renseigné continuellement sur le bon tempo mais offre, outre le sentiment désagréable de jouer “au métronome”, le désavantage de rendre impraticable les continuelles variations de tempi qui, même lorsqu’elles ne sont pas inscrites sur la partition, sont nécessaires à l’interprétation. La troisième solution, qui ne devrait être qu’un cas particulier mais que l’on rencontre malheureusement très souvent, est de ne vouloir aucune synchronisation précise entre ces deux discours. Il est clair que les choses ne sont pas aussi tranchées dans la réalité d’aujourd’hui. On ne compose plus guère pour supports fixes tels que les magnétophones qui se sont vus remplacés progressivement par des systèmes sur disques durs. Ainsi sont souvent présentées comme “musiques en temps-réel” des oeuvres qui, quelque soient leurs qualités musicales intrinsèques, reproduisent le vieux schéma des musiques mixtes dans lesquelles le tempo de la bande était le maître du jeu. La seule chose qui soit remise en question, par rapport aux musiques sur bande magnétique, est la faculté de déclencher des séquences de manière synchrone avec un son instrumental. Mais, une fois la séquence déclenchée, le jeu de l’interprète n’aura plus d’incidence sur le devenir de l’oeuvre avant le prochain déclenchement. Tout au plus peut-on démarrer et stopper les séquences pré-composées avec plus de liberté. Cela est dû, pour l’instant, grandement à des impératifs technologiques qui font que, si l’on veut qu’une oeuvre puisse être jouée avec la même facilité que n’importe quelle oeuvre instrumentale, on est obligé de faire appel à une technologie largement divulguée par les outils du commerce qui ne permet pas, en général, de produire des musiques dans lesquelles la part de l’interprète puisse avoir une responsabilité sur l’oeuvre à un niveau équivalent à celui de la musique instrumentale. En contrepartie, les oeuvres mettant en jeu une dimension interprétable conséquente ne sont, pour le moment, possible que sur une technologie encore peu divulguée limitant ainsi les potentialités d’exécutions. Cette situation évolue, bien évidemment, dans le sens d’une plus grande accessibilité aux performances technologiques puissantes, mais contribue largement à entraver une évolution de la pensée musicale qui devrait remettre en question certains fondements même de la composition lorsque les moyens théoriques et techniques existent pour cela. Il n’y a aucune raison de se limiter à des catégories de temps aussi grossières que les seuls démarrages et arrêts de séquences dès lors que les outils technologiques le permettent car cela revient, musicalement parlant, à concevoir une oeuvre dans laquelle les points de synchronisation sont beaucoup plus espacés et soumis à un contrôle beaucoup plus lâche que dans n’importe quelle autre oeuvre. Imaginons, pour donner un exemple concret de cette situation, une pièce d’orchestre dans laquelle l’écriture ne prendrait en compte que la synchronisation du début de plusieurs séquences mais ou il n’y aurait plus de contrôles temporels internes dans leurs superpositions. Ces cas existent bien évidemment et ils peuvent avoir une raison d’être tout à fait valable (Zeitmasse  de Stockhausen ou Pli selon pli et Rituel de Boulez explorent systématiquement ces principes d’indépendance temporelle entre les structures) mais ils ne peuvent, en aucun cas, constituer une norme qui régirait une condition générale d’écriture. Cette dualité de situations impose finalement un choix entre une technologie en temps-différé et une autre en temps-réel et ce choix technologique provoque fatalement des répercussions sur un choix esthétique. Ce choix limitatif est souvent la conséquence d’oeuvres dans lesquelles on constate un choc stylistique entre une écriture instrumentale basée sur une articulation précise et une partie électronique qui ne peut pas bénéficier de la même finesse d’articulation et se concentre alors sur des événements plus massifs et plus monolithiques.

Les séquences pré-composées en studio ne bénéficiant que des options de déclenchement et d’arrêt en temps-réel appartiennent totalement au temps-différé, tandis que les musiques qui acceptent une part de mobilité dans leur constitution dépendent du temps-réel. Cette part de mobilité, qui n’est pas obligatoirement comparable à ce qui constituait les musiques aléatoires est identique à la mobilité qui est de fait dans toute musique instrumentale. Pendant longtemps, et non sans raison, les partisans de la musique en temps-différé avaient une attitude critique quant au manque de finesse et de raffinement qu’offraient les moyens de synthèse en temps-réel. Cette critique tend aujourd’hui à n’avoir plus de viabilité car les systèmes en temps-réel offrent désormais une puissance de calcul qui permet d’avoir un contrôle d’une très grande finesse. Le dilemme entre ces deux choix semble plus le produit d’une conception, d’une part, héritée des techniques de studio classiques dans lesquels les compositeurs étaient habitués à tout fixer (le vieux réflexe de la bande magnétique) et de l’autre, chez des musiciens pour qui l’écriture instrumentale était naturellement soumise aux gauchissements de l’interprétation. Cette querelle du “tout-temps-réel” ou du “tout-temps-différé” me semble pouvoir être définitivement levée car, comme dans tous les cas semblables, ce ne sont jamais les positions extrêmes qui aboutissent aux résultats les plus intéressants. Il est clair que la composition comporte énormément de cas de figures qui sont inaccessibles au temps-réel, en particulier dans tout ce qui concerne les constructions qui demandent une prédiction sur ce qui va se passer. Un trajet complexe de spatialisation, une évolution calculée de paramètres de synthèse nécessitent souvent une mise au point définitive à laquelle la situation du temps-réel pourrait être fatale. Il est clair aussi que la précision qu’un compositeur peut exiger d’un interprète soit également valable pour un processeur. On veut exactement telle chose et non une autre. Une composition, on l’a vu, peut aussi bien comporter des éléments qui ne varieront pas quelque soit la situation de l’interprétation, que des éléments qui seront soumis à ces variations d’interprétation. La distinction doit se faire ici entre le choix des valeurs absolues et des valeurs relatives qui formeront la composition. Si l’on raisonne au niveau des systèmes en temps-réel, il est évident que rares sont les cas de figures dans lesquels rien n’est fixé à l’avance. La distinction montrée plus haut entre les éléments absolus d’une partition instrumentale et les éléments relatifs à l’interprétation peut très bien servir de base à l’édification de partitions électroniques qui sont basées sur ce même modèle. C’est dans le choix conceptuel des objets musicaux qui constituent l’oeuvre que doit se faire la distinction entre ces deux entités et non dans une prise de position par rapport à une technologie qui appliquerait d’elle-même cette décision. L’indépendance temporelle des événements superposés dans une composition mixte, dès lors que les outils théoriques et pratiques existent pour cela, doit être aujourd’hui la conséquence d’un choix esthétique plus que celle d’une limitation technologique. “Mon paletot aussi était idéal”, cette phrase de Rimbaud reprise par Boulez dans Penser la musique aujourd’hui est malheureusement toujours d’actualité. La prise de position pour le temps différé ou pour le temps réel, en d’autre termes la répartition des événements constitués de valeurs absolues ou relatives, doit désormais cesser d’être un choix technologique pour devenir un choix compositionnel.

 

Le paramètrage numérique comme valeur de métamorphose.

Un des grands intérêts de la situation offerte par le principe de la détection et de l’analyse des sons instrumentaux dans le cadre du temps réel me semble résider dans la possibilité d’opérer des métamorphoses d’une catégorie sonore dans une autre. Cela est rendu possible par la conversion des valeurs analogiques en paramètrages numériques. Pour un processeur, toute valeur détectée dans un signal acoustique peut être paramètrée de manière numérique. Pour lui, toutes ces valeurs numériques sont égales comme on dit que le sont tous les citoyens devant la loi. C’est au compositeur d’en déterminer une hiérarchie et d’en déduire une structure de relations. Que ce soit une valeur de hauteur, de temps où de dynamique mais aussi des valeurs plus fines portant sur l’analyse spectrale d’un son que ce soit par son contenu fréquentiel ou formantique, le résultat est codé numériquement. Cette faculté de réunir des composants acoustiques différents sur une même échelle de valeurs permet de les faire s’influencer mutuellement, et de faire en sorte qu’une catégorie sonore puisse contrôler une autre catégorie sonore, voire un ensemble de catégories. Ainsi une valeur de temps ou de durée, peut influencer une valeur de transposition de hauteurs, l’analyse d’une enveloppe dynamique peut diriger un trajet de spatialisation. Un tel mélange de catégorie sonore est, bien entendu, totalement impensable dans la musique instrumentale. Grâce au paramètrage numérique il existe une équivalence de représentation des différents composants sonores qui peut très bien servir d’étalon autour duquel seront déterminés différents aspects du discours musical. L’interprétation, dans ces cas, n’est plus du même ordre que dans celui de l’acception classique de ce terme car elle pénètre entièrement la morphologie de la partition. Dans Pluton, j’ai utilisé des valeurs dynamiques comme critères de définition d’un choix d’échelles d’intervalles et dans Neptune, c’est le processeur lui-même qui, par le fait de calculs aléatoires, produit des déviations d’ambitus et de tempi sur lesquels sa basent les interprètes. En y réfléchissant bien, le cas de catégories s’influençant mutuellement n’est pas nouveau dans la musique : une acoustique particulière peut orienter un choix de tempo qui lui-même détermine des valeurs dynamiques et rythmiques. Mais dans le cas cité précédemment, la détection des valeurs d’interprétation peut aller jusqu’à la prise en charge d’éléments fondamentaux du discours musical. Là encore, l’importance que l’on voudra bien accorder à l’influence de ces critères temps réels sur la conception même de la musique est une affaire de choix esthétique.

 

Échantillonnage, transformation et synthèse : passé et avenir.

Trois domaines partagent actuellement la somme des travaux qu’effectuent compositeurs dans la musique électronique : l’échantillonnage, les transformations des sons instrumentaux ou vocaux et la synthèse sonore. Les deux premiers reproduisent la dualité qui existait dans les années 50 entre la musique concrète, spécialité du club d’essai de la R.T.F. à Paris, et la musique électronique pure sur laquelle le Studio de Cologne a fait les premières expérimentations. Ces deux démarches opposées au début se sont unifiées, dès 1955/56, dans le Gesang der Junglinge de Stockhausen. Ce n’est que dans les années 70 (pour la synthèse) et 80 (pour l’échantillonnage) que ces techniques apparurent dans l’informatique musicale. mais elles restèrent l’apanage du temps différé.

La synthèse sonore, de ce dernier point de vue, est l’instrument le plus puissant car, suivant les modes de synthèse utilisés, on peut construire le son en autant de paramètres que l’on veut qui seront autant de variables indépendantes pour déterminer tels ou tels aspects du son. Le problème qui se pose fréquemment pour les compositeurs est celui d’une relativement grande inertie du son lorsque la gestion des paramètres n’est pas suffisamment complexe. Lorsque l’on analyse l’aspect acoustique d’un son instrumental dans le temps, on est frappé par l’immense diversité et variabilité des comportements qui, lorsqu’ils doivent être reproduits par les méthodes de synthèse pure, demandent un contrôle d’une extrême complexité. De ce point de vue, la synthèse, définie comme un calcul de paramètres totalement préétabli, est une technique relevant complètement du temps différé puisqu’il n’y a aucune détection ni analyse d’un signal en temps réel.

L’échantillonnage a connu d’emblée un grand succès par le fait même de pouvoir combler en variété de comportements les difficultés que posent la synthèse. Cependant, si la technique de l’échantillonnage permet d’obtenir un résultat sonore satisfaisant de manière assez rapide, elle perd, en possibilités de contrôle, tout ce qu’offrent les techniques de synthèse. Ses potentialités de transformation et de développement sont d’ordre globales et ne pénètrent pas la structure interne du son. On peut lire un échantillon dans différents sens (à l’endroit, à l’envers, par traitements granulaire …), à différentes transpositions, dans des tempi variables, le filtrer, mais on ne peut pas le décomposer en petits atomes qui sont comme autant de petits instruments participant d’un son total. Il est vrai que la composition, souvent, peut très bien se satisfaire de cette restriction. Il n’y a pas toujours de corrélation évidente entre ce que l’on entends par “richesse sonore” et par “complexité conceptuelle”. Synthèse et échantillonnage sont, en quelque sorte, les compléments l’un de l’autre et il est évident que c’est souvent dans le sens d’une complémentarité qu’ils sont utilisés. En schématisant quelque peu, on peut s’apercevoir que la synthèse est plus fréquemment utilisée dans la gestion des structures continues, tandis que l’échantillonnage se révèle efficace dans un contexte plus ponctuel, discontinu et rythmique. La preuve en est que les premières oeuvres de synthèse par ordinateur, comme celles qu’ont composées John Chowning et Jean-Claude Risset, portent exclusivement sur des évolutions continues tout comme les premières pièces de musique concrète pratiquaient sans concession la rupture de ton. C’est le combat de la continuité des nombres contre le coup de ciseau 6. La transformation des sons instrumentaux est apparue aux USA sur des instruments analogiques mais c’est encore Stockhausen qui en donnera une première vision cohérente dans Mantra en 1970. Le traitement des sons est aussi un procédé très global en ce sens qu’il affecte la totalité du spectre soit par addition (techniques du frequency-shifter ou du ring modulator), soit par soustraction (filtrage) soit par transposition (harmonizer) ou réverbération et spatialisation. Répons de Boulez, en 1981, en fera une première utilisation plus complexe et maîtrisée par l’outil informatique. Ces techniques de transformation sonores, mise à part la réverbération et la spatialisation, ont été à la base de tout les systèmes en temps réel et c’était même, il y a quelques temps, ce qui en constituait l’essentiel.

Ces trois catégories étaient au début très séparées. On ne les utilisait qu’une à la fois. Bien que plus intégrées dans un même discours de nos jours, elles n’en restent pas moins assez séparées quant aux modes de composition qu’elles développent. Il est clair que, au bout de la chaîne de calcul qu’effectue un processeur pour les réaliser, le procédé est plus ou moins identique. Ce sont les modes d’approches qui diffèrent ainsi que les types de contrôles qu’on y effectue. Dans la plupart de mes compositions mixtes, j’ai eu l’occasion d’élaborer des principes qui reposent sur une hybridation de ces différentes méthodes. Le cas d’un synthèse sonore dont l’évolution, soit formantique, soit prélevée de l’analyse en temps réel d’un son instrumental ou vocal participe également du domaine du traitement et de la synthèse. Quant au procédé d’analyse/resynthèse sur lequel est développé actuellement un effort considérable, il permet dans certains as de reproduire avec une qualité confondante l’image sonore d’un son enregistré mais avec toutes les possibilités de contrôles puissants que permet la synthèse 7. La synthèse en temps réel, parvenant à rivaliser en qualité sonore avec la techniques de l’échantillonnage se substituera à cette dernière lorsqu’il sera possible d’effectuer également ces analyses complexes en temps réel. Ceci n’est qu’une affaire technologique qui, comme les autres, fonctionnera lorsque les processeurs de calcul auront la puissance suffisante. Ce cas est aussi ancien que l’existence des machines.

L’abolition de tous ces catégories est, selon moi, inéluctable, et il est souhaitable que ces catégories, tout comme celles du temps réel et du temps différé, finissent par se fondre en une seule et même technique unitaire relevant à la fois du traitement ou de l’échantillonnage mais dont les modes de contrôles seraient ceux de la synthèse dont une partie des paramètres serait géré par une analyse en temps-réel. Une fois cette unification réalisée, je pense que la question de la représentation symbolique, telle que je l’ai exprimée plus haut, pourra trouver un terrain propice à son développement. Mais, d’ores et déjà, les arguments théoriques existent et les barrières technologiques finiront par tomber. Le principe des partitions virtuelles est une des possibilité de cette unification. Il y en a certainement d’autres. Encore faut-il qu’un nombre suffisant de compositeurs en prenne conscience et surtout accepte de travailler dans ce sens, ce qui signifie, bien entendu, une limitation des exécutions musicales car de tels systèmes ne seront pas immédiatement accessibles commercialement dans tout les studios du monde. Ce dernier point, particulièrement ne me semble pas assuré. En ce qui me concerne, mon choix est fait depuis longtemps. Mon paletot n’est plus idéal.

                                                                           Philippe Manoury. Paris, Juin 1997.

 

  1. Luciano Berio, dans un entretien, disait que l’étude du contrepoint était le meilleur moyen de relier l’oreille au crayon. On constate malheureusement de nos jour une grande déficience dans cette capacité de représentation mentale de l’écriture. La raison en est probablement que, depuis quelques décennies, l’étude des disciplines d’écriture classique telles que l’harmonie et le contrepoint a été fortement délaissée. Bien qu’il soit clair que ces disciplines ne sont plus utilisées dans les compositions contemporaines, il n’existe, à ma connaissance, aucun autre moyen aussi efficace pour “relier l’oreille au crayon”.
  2. Ce n’est pas autrement qu’il faut entendre les agacements de Wagner dans l’interprétation de la musique de son époque. Ce n’est pas autrement non plus qu’il faut interpréter le soin que mettaient Mahler ou Stravinsky dans la précision de leurs partitions. Cette précision n’a pas été dans ces dernières années, il faut bien le reconnaître, sans quelques exagérations.
  3. Les interminables polémiques que l’histoire de la musique a vu surgir au sujet des différents tempéraments acceptant, par exemple, comme quinte, deux accordages différents, en sont une des preuves les plus évidentes.
  4. A la Renaissance, et jusqu’à J.S. Bach, des compositeurs utilisaient la “Tabula compositoria”, une sorte de matrice pour générer les relations polyphoniques. Athanasius Kircher, au XVIIème siècle, utilisait, après Zarlino et Mersenne, des procédés mathématiques relevant d’une tradition médiévale. Il y a également le “Wurfenspiel”, sorte de jeu de dés, que Mozart utilisa pour composer des petites valses. L’alliance de la combinatoire et de la musique est très ancien et serait trop long à développer ici. Au XXème siècle, c’est à Lejaren Hiller que l’on doit les premiers travaux de formalisations musicales par ordinateur en 1956. Ce n’est qu’une dizaine d’années plus tard que Max Matthews mettra au point les premiers programmes de synthèses des sons.
  5. Le cycle Sonus ex Machina comportant Jupiter, Pluton, La Partition du Ciel et de l’Enfer ainsi que Neptune à été réalisé avec le mathématicien Miller Puckette à l’Ircam. Ces pièces furent conçues pour le processeur 4X mis au point par Guiseppe di Guigno. En Écho, toujours réalisé avec Miller Puckette été composé pour la Station d’Informatique Musicale de l’Ircam élabore par l’équipe de Éric Lindeman.
  6. Il est intéressant de remarquer à quel point les outils ont laissé leurs marques sur les oeuvres. On peut aussi faire l’analogie avec le cinéma qui, dès ses débuts, a pratiqué un style très hachuré comme dans les premiers films d’Eisenstein pour ensuite développer des techniques de continuité comme les plans-séquences chers aux premiers films de Welles.
  7. Des expériences fort prometteuses sont actuellement en cours. Les travaux qu’effectue David Wessel à l’Université de Berkeley sont, à ce titre, très impressionnants par la qualité sonore de la resynthèse en temps réel d’un signal vocal complexe.

Considérations (toujours actuelles) sur l’état de la musique en temps réel

Wednesday, October 22nd, 2008

En guise d’introduction

Voilà plus d’un quart de siècle que mon esprit ne cesse d’être préoccupé, hanté même, par cette invention qui, un autre quart de siècle auparavant, a provoqué une fissure dans le monde de la musique : celle de l’électronique.

Mes premiers contacts avec la musique électronique ont eu lieu au cours des années soixante-dix. Ce serait un euphémisme que de dire qu’à cette époque, en France, les musiques électroniques et instrumentales ne faisaient pas bon ménage. La querelle qui, dans les années cinquante, opposa les « compositeurs de l’écriture »  (Barraqué, Boulez  et Stockhausen principalement) à ceux de « l’intuition expérimentale » (incarnés par le GRM de Pierre Schaeffer) n’est que la plus célèbre de toutes. Pour être bref, les premiers reprochaient aux seconds de n’être que des analphabètes musicaux, tandis que les seconds auraient aimé reléguer les premiers dans les greniers poussiéreux de la tradition. Provenant d’horizons culturels très différents, les compositeurs œuvraient soit dans l’une, soit dans l’autre de ces catégories, mais rarement dans les deux. Élevé dans la tradition de l’écriture instrumentale, je n’en éprouvais pas moins une réelle attirance pour les possibilités offertes par la musique électronique. Ce furent les fréquentes venues de Stockhausen à Paris, au cours des années soixante-dix, qui me firent prendre conscience de la possibilité et du grand intérêt qu’il y aurait à relier ces deux conceptions musicales en une seule. Je découvrais qu’on pouvait à la fois composer de la musique d’orchestre et de la musique électronique, et parfois, au sein d’une même œuvre. La création parisienne de Mantra, en 1973, fut pour moi un moment initiatique. J’y découvrais la richesse potentielle de l’unification des mondes instrumentaux et électroniques au sein de ce que l’on aurait pu, déjà à cette époque, appeler « la musique électronique en temps réel ». Mais cette œuvre, aussi emblématique qu’elle fut, n’en demeurait pas moins, à mes yeux, inégalement proportionnée quant à l’usage de ces deux modes d’expression. La partie électronique ne consistant qu’en une transformation passive des sons des deux pianos, à aucun moment, elle ne possédait une structuration formelle autonome, comparable dans sa construction à celle des instruments. Dans ses œuvres précédentes, ce même Stockhausen avait magistralement montré dans quelles mesures les textures électroniques pouvaient être rigoureusement composées. Mais, à l’époque de Mantra, l’état de la technologie rendait encore impossible une telle complexité dans le contexte du temps réel. Le seul support possible pour composer des formes évoluées avec les matériaux électroniques demeurait la bande magnétique. 

C’est donc avec une certaine frustration, due à la difficulté de réunir ces deux modes d’expression, que j’entrepris mes premiers travaux. Autant les potentialités sonores de la musique électronique m’attiraient, autant la rigidité de son organisation temporelle n’en finissait pas de me poser problème. Ce n’est qu’au début des années quatre-vingt, avec la construction des premiers modèles de synthétiseurs en temps réel par Guiseppe di Guigno à l’Ircam, que j’entrevis immédiatement une ouverture possible vers une plus grande souplesse temporelle qui libérerait la musique électronique de ce temps figé qu’imposait la bande magnétique. Je me souviens tout particulièrement d’une séance de travail autour de Pierre Boulez et « Peppino » di Guigno, au cours de laquelle la preuve fût faite que ce que jouait le flûtiste Lawrence Beauregard pouvait être identifié par un ordinateur, et ce, quelque soit le niveau de virtuosité instrumentale. Je vécu ce jour-là comme une sorte de second moment initiatique : il était donc possible de synchroniser automatiquement la musique électronique avec le jeu instrumental. Le point le plus important de cette avancée consistait dans le retournement de la situation habituelle dans laquelle l’instrumentiste était l’esclave du déroulement automatique et inexorable d’une bande magnétique. Dorénavant ce serait l’instrumentiste, le maître du temps. Il pourrait jouer à son propre tempo, accélérer, ralentir, faire des points d’orgue, bref, retrouver toute la respiration et la liberté qui était la sienne depuis que la musique existe, l’électronique le suivrait désormais. Au cours des dix années qui suivirent, je menais, avec la collaboration du mathématicien Miller Puckette, une série de recherches dont le premier résultat allait être Jupiter, pour flûte et électronique. Cette œuvre, composée en 1987, était la première à utiliser un suiveur de partition et développait de nombreux principes d’interactivité entre la flûte et les sons de synthèse 1. Elle marquait le début du déclin de la musique sur bande magnétique qui, malgré quelques positions nostalgiques, voire d’arrière-garde, allait finir par disparaître. Ensuite naquirent successivement Pluton, La partition du Ciel et de l’Enfer, Neptune et En écho, œuvres dans lesquelles je développais de nouvelles relations avec le monde instrumental tout en cherchant d’aller aussi loin que possible dans les modes de communications interactifs. Pas à pas, j’entreprenais une sorte de « recherche du temps perdu », celui, continu, organique et flexible, de la musique jouée par les musiciens, et que je cherchais à réintégrer dans les musiques électroniques. J’ai alors porté tous mes efforts sur le développement de structures musicales électroniques élaborées, dépassant le simple procédé de la transformation passive des instruments, et pouvant être soumises au temps flexible d’un interprète. En d’autres termes, je voulais doter la musique de synthèse de la possibilité d’être interprétée.

 

Pourquoi le temps réel ?

Une critique contre le temps réel a souvent été formulée, pointant une qualité sonore insuffisante, inférieure à celle qui était produite par les moyens de l’électronique traditionnelle sur bande magnétique. Cette critique était fondée dans les débuts, mais n’a plus lieu d’être aujourd’hui car le raffinement auquel sont parvenus les moyens de la synthèse sonore n’a désormais plus rien à envier aux anciennes méthodes. Une des premières commodités du temps réel a été l’instantanéité des résultats dans des calculs parfois complexes. C’était un avantage considérable si l’on se souvient des nuits interminables, passées autrefois à attendre que les machines aient terminé leur travail avant de constater que le résultat n’était pas à la hauteur des espérances et qu’il fallait relancer les calculs pendant autant de nuits successives qu’il était nécessaire. La rapidité des calculs n’entraînait pas pour autant une plus grande rapidité dans le processus de composition. C’était parfois même le contraire. Mais lorsqu’un compositeur est à sa table de travail, ce qu’il note sur sa partition « sonne » dans sa tête et il bénéficie ainsi d’une sorte de « temps réel virtuel » qui guide son intuition et son imagination. Ce n’était pas le cas quand l’écoute du résultat n’intervenait que très longtemps après  l’écriture. D’autant plus que cette « écriture » n’était en fait qu’un langage fait de nombres et de valeurs numériques, ce qui est la manière la moins intuitive qui soit pour composer de la musique. Malgré l’affirmation de Leibnitz, selon laquelle « toute musique est un calcul inconscient », il restait difficile d’appréhender une qualité sonore à la simple vue d’un listing de colonnes chiffrées. Ce fût un autre atout du temps réel, plus important que ce simple gain de temps, que d’avoir profondément modifié la manière dont un musicien transmet ses idées à une machine. Avec les premiers programmes en temps réels – et je pense particulièrement à l’invention du programme Max par Miller Puckette – l’utilisation de curseurs graphiques et virtuels a permis d’intégrer des éléments gestuels comme outils de contrôle de l’ensemble des qualités sonores. Il n’était plus besoin de formaliser numériquement une structure de timbre, car on pouvait la construire et la faire varier d’une façon analogue à celle d’un musicien qui produit le son par une variation de souffle ou une pression de l’archet. De fait, ces machines commençaient alors à ressembler à des instruments de musique, du moins dans les manières avec lesquelles on communiquait avec elles.

Enfin, le temps réel a ouvert la voie à l’interactivité entre les instruments acoustiques et les machines. Or, si de nombreux pas ont été faits pour ce rapprochement, le mode de communication qui domine le plus souvent n’est, pour le moment, qu’une sorte de « code morse ». De temps en temps, pour les besoins d’une captation ou d’une synchronisation, s’ouvre une communication entre instrument et machine, qui se referme une fois le processus de captation achevé, laissant instruments et électronique continuer de manière indépendante sans plus de relations entre eux. Ainsi ce que l’on a parfois appelé « temps réel » s’avérait souvent n’être que des séquences musicales pré-composées, comme des petits morceaux de bandes magnétiques mis bout à bout, que l’on pouvait, certes, démarrer au moment propice, mais dont le contrôle dans le temps nous échappait. On entrait dans le temps musical par de petites fenêtres, qui s’ouvraient par intermittence, pour se refermer aussitôt. Pour obtenir une véritable continuité dans la communication entre instruments et électronique et faire en sorte que la réaction de cette dernière soit non seulement instantanée, mais aussi suffisamment riche pour s’adapter aux différentes situations et se modifier dans le temps d’une œuvre, il existe un outil fondamental. L’artisan majeur d’une réussite en la matière est, sans aucun doute, le suiveur de partitions.

 

 A l’approche du Temps retrouvé.

 Un suiveur de partitions est un programme qui a mémorisé une partition et cherche à la reconnaître lorsqu’elle est jouée. Cet outil possède plusieurs niveaux de tolérance car des erreurs peuvent toujours intervenir pendant une exécution. Il est celui qui suit, pas à pas, le déroulement de la musique dans le temps et permet aux événements électroniques de se synchroniser avec une précision à laquelle l’oreille (ou une quelconque action humaine) ne peut pas atteindre. Si, depuis son invention, il a permis de retrouver une partie de ce « temps perdu », il faut bien avouer que nous sommes loin du « Temps retrouvé ». En amont de ce suiveur de partitions se dresse l’épineux problème de la détection, de la reconnaissance et de l’analyse en temps réel des sons instrumentaux. Plusieurs poches de résistances se sont trouvées sur ce chemin, certaines naturelles, comme l’extrême complexité du fonctionnement des instruments de musique, d’autres technologiques, comme la difficulté d’analyser et de reconnaître des éléments polyphoniques, d’autres enfin psychologiques : beaucoup de compositeurs hésitaient à se lancer sur une voie aussi complexe et jonchée de tant d’embûches technologiques.

Les instruments de musique ne sont en rien comparables aux objets standardisés que notre époque aime tant à produire. Mis à part les instruments du quintette à cordes, chacun possède son propre mode de fonctionnement. Flûtes, hautbois, clarinettes, bassons, cors, trompettes, trombones et tubas, bien que réagissant tous au souffle, ne possèdent guère de caractéristiques mécaniques communes. La richesse de leur diversité nous pose des problèmes d’une grande complexité lorsque l’on veut les accoupler avec la technologie moderne. Il faut souvent inventer autant de manières différentes, pour capter leurs informations, qu’il y a d’instruments. On a mis des capteurs pour détecter les doigtés sur une flûte, d’autres sous les touches d’un piano ou d’un vibraphone, on a utilisé des systèmes de vidéo pour analyser tel ou tel geste de percussionniste, on a placé des antennes pour mesurer la position d’un archet ou utilisé des méthodes spécifiques pour analyser sa pression sur une corde. D’abord purement mécaniques, les systèmes de captations ont ensuite utilisé les moyens audio, vidéo, les capteurs sensitifs, la gravitation… et souvent, c’est par le couplage de deux ou trois de ces méthodes que nous arrivons à construire des systèmes qui nous donnent satisfaction, souvent au prix d’un fouillis de fils, de câbles, de caméras et autres micros. Si l’absence de standardisation gouverne le fonctionnement de nos instruments, elle gouverne également l’attitude de ceux qui les utilisent. Tel pianiste aimera parfois enfoncer silencieusement les touches de son instrument avant de plaquer un accord, tel violoniste tiendra son archet d’une façon différente de tel autre, tel flûtiste produira un staccato beaucoup plus bref que ses collègues… La variété de gestes et de comportements est pratiquement infinie. Pour cela, nous avons appris à nos machines à apprendre, et à s’adapter à telle ou telle personnalité ; de réelles avancées ont été accomplies dans ce domaine depuis les dix dernières années.

Une des méthodes les plus unifiée pour reconnaître ou analyser les signaux acoustiques consiste à transmettre à une machine ce qui est capté par un simple micro. On peut ainsi identifier non seulement quel son est joué mais aussi quelle est sa structure et comment il évolue dans le temps. La vitesse de réaction des machines est parfois effarante dans des traits de très grande virtuosité et dépasse de beaucoup les capacités de l’oreille humaine la plus exercée. Cela permet, en outre, de capter la voix humaine sans imposer une chirurgie quelconque sur un chanteur ou une chanteuse afin de leur greffer des capteurs. Cela a toutes les apparences d’une plaisanterie, mais que l’on se souvienne de nos castrats et de ce qu’on leur faisait subir pour l’amour du beau chant ! La méthode audio semble la plus riche de toutes… jusqu’au moment où on demande à l’ordinateur d’identifier deux sons superposés. Une polyphonie, même minimale, semble pour l’instant hors des possibilités actuelles de détection audio, car deux sons qui se superposent, mélangent tous leurs harmoniques et l’on ne sait plus à quelles fondamentales chacun appartient. Seuls les instruments monodiques peuvent être utilisés avec ce procédé. Ce n’est donc pas par reconnaissance des hauteurs que l’on arrive à suivre une partition polyphonique, mais en ayant appris à une machine tous les spectres sonores qui proviennent d’une interprétation et en lui demandant de les reconnaître au moment de l’exécution. Dans le début de son roman Sound and Fury, Faulkner présente un jeune garçon atteint de débilité qui capte, néanmoins avec beaucoup de sensibilité, tous les événements qui lui parviennent mais sans pouvoir les nommer. C’est à peu près ce que fait un suiveur de partitions actuel. Il reconnaît ce qu’il a appris mais est encore incapable de nous dire s’il s’agit d’un « do » ou d’un « ré ». Ce n’est pas d’une importance capitale tant qu’on ne lui demande rien d’autre que de reconnaître. Mais il serait parfois intéressant de pouvoir augmenter le « niveau d’intelligence » de ces systèmes pour pouvoir effectuer des opérations qui seraient basées sur l’analyse fine d’un discours musical. Ainsi dans ma Partita I pour alto et électronique, il a été totalement impossible de reconnaître des doubles sons qui devaient être joués dans un ordre aléatoire. La partition prévoyait un espace de liberté de navigation dans lequel l’altiste pouvait, à son gré, modifier la musique électronique suivant le chemin qu’il prenait. Seul un système pouvant identifier « musicalement » ce qu’il captait aurait pu venir à bout de ce problème. J’ai dû alors me résoudre à adopter un ordre déterminé dans l’enchaînement de ces séquences. La recherche de méthodes fiables capables d’analyser le contenu d’une situation polyphonique me semble être l’une des priorités majeures sur laquelle les chercheurs devraient se concentrer aujourd’hui.

À cette série de problèmes, il faut ajouter un autre, d’ordre plus psychologique, pour faire le tour de ces poches de résistances qui ont freiné le développement du temps réel tel qu’il aurait dû avoir lieu. Force m’est de constater que, parmi tous les musiciens qui se sont approchés du temps réel de façon décisive, ce n’est pas dans ma famille esthétique proche – celle des compositeurs – que j’ai trouvé l’engagement le plus conséquent, mais dans un courant esthétique beaucoup plus éloigné de mes orientations artistiques : celui des musiques improvisées et des « performers ». Cette curieuse situation m’a laissé assez isolé pendant longtemps, car cette union d’orientations esthétique et technologique qui était la mienne, n’était que rarement partagée par d’autres. Le seul compositeur chez qui j’ai pu observer, durant ces années, un intérêt soutenu dans la nécessité de construire un temps réel véritablement puissant et interactif, n’est autre que Pierre Boulez. Alors directeur de l’Ircam, il fit du temps réel la priorité de recherche de cet institut et mit l’utilisation du suiveur de partition au centre de ses intérêts, comme en témoignent les œuvres Explosante-fixe et Anthème II. Ce manque d’intérêt de la part des compositeurs pour le développement d’une technologie du temps réel puissante et du suivi de partitions créa, pour de longues années, une situation stagnante. C’est une sorte de principe démocratique qui sous-tend généralement la recherche : moins un champ d’investigation est partagé par un grand nombre de personnes, moins il évolue car c’est sur la diversité des expériences que fleurissent les développements. Ce fut le cas du suivi de partition, et de celui de l’interactivité entre les instruments acoustiques et les méthodes de synthèses sonores. En revanche, l’attrait du temps réel, pour la construction de musiques de synthèse interactive, a par contre été immédiat chez les musiciens improvisateurs. Ce fût chez eux que les recherches ont avancé le plus vite. Ces musiciens concentraient tous leurs efforts sur des procédés d’analyse du son en temps réel, afin de construire des musiques de synthèses réactives à la manière dont les « performers » produisaient le son. Mais, n’écrivant pas leur musique, ils n’ont pas eu à se préoccuper d’une quelconque synchronisation avec une partition. Les compositeurs de musique écrite demeuraient réticents face à cette absence de prédétermination qui consistait à attraper, « à la volée » dans le jeu instrumental, les éléments nécessaires à la création des sons électroniques. Eux voulaient fixer, et avec le maximum de précision, les configurations sonores de leur invention afin que se reproduise le même résultat au cours de différentes interprétations de la même œuvre. Cette attitude est évidemment en accord avec la pratique contemporaine de la musique instrumentale qui est basée sur des notations de plus en plus précises. De par ma formation et mes orientations esthétiques, c’est dans cette dernière direction que s’inscrit ma démarche et non dans celle des musiques improvisées.

L’improvisation m’a toujours semblé ne prendre un réel sens artistique qu’à partir du moment où certains éléments étaient au préalablement déterminés. La musique classique indienne ou la tradition du jazz en sont des exemples connus. Les musiques entièrement improvisées, si prisées de nos jours, mettent souvent en œuvre un « performer » et un ordinateur. La plupart du temps, rien n’est prédéterminé. La machine est censée réagir au contenu acoustique de ce que le musicien joue, ce qu’elle fait généralement très bien. C’est la toute puissance de nos calculateurs qui est alors mise sur scène. On sait qu’ils réagiront d’une façon ou d’une autre à ce que le musicien inventera sur le moment. Mais lorsque aucune structure musicale ne sert de base à la création spontanée, la musique reproduit des archétypes formels souvent simplistes, standardisés, et connotés. Trop fréquemment le résultat bascule tantôt du côté d’une complexité maximale, tantôt dans celui d’une simplicité désarmante. Et l’on sait qu’au niveau de la perception, ces extrêmes se rejoignent. On y décèle des comportements, que l’on pourrait qualifier de basiques car, quand bien même ils partageraient un large spectre d’expressions musicales avec les compositions écrites, ils sont présentés dans la simplicité d’une succession linéaire, comme pour une démonstration. On y reconnaît l’imitation, l’influence, le contraste, la progression vers une tension qui sera obligatoirement suivie par une détente avant une nouvelle progression… Tous ces phénomènes existent aussi dans les musiques écrites, mais, à la différence de ces improvisations, ils peuvent être insérés dans des formes temporelles élaborées. Les formes temporelles des musiques totalement improvisées, bien qu’il s’y produisent parfois des réussites sonores indéniables, sont pareilles à un nuage qui change constamment d’aspect, dans une pure linéarité, avant de disparaître. La raison en est simplement qu’un discours musical élaboré est une chose beaucoup trop complexe pour être inventé et présenté sur le champ. Les phénomènes de mémoire, de prémonition, la construction de formes hybrides, les stratégies de préparation et de conclusion, les transitions, les proportions, les courts-circuits ne peuvent s’improviser. Cela demande une réflexion critique, des esquisses, des biffures, des recommencements, et je ne pense pas qu’il existe un seul cerveau humain capable d’organiser toutes ces formes, parfois simultanément, dans l’instant même où elles sont présentées. L’ordre dans lequel apparaissent les différents éléments d’une composition musicale ne respecte pas obligatoirement, peu s’en faut, celui dans lequel ils sont nés dans l’imagination du compositeur. Une introduction peut très bien naître d’une transition, comme un motif peut être déduit de ce qui aura valeur de son propre commentaire. Le « temps réel » de la composition, qui est le propre de l’improvisation entièrement spontanée, est impuissant à même imaginer de telles constructions, encore plus à les mettre en œuvre.

Il faut, à mon sens, qu’il existe une partie du discours musical déjà déterminée d’une manière ou d’une autre. Et s’il fallait relever encore une différence fondamentale entre les musiques improvisées et écrites, je dirais qu’elle se trouve dans le fait de déterminer et de séparer ce qui doit être fixé, de ce qui ne l’est pas, ou ne peut pas l’être. On peut vouloir concevoir des musiques de synthèse comme on conçoit des partitions écrites, et déterminer ce que l’on veut exprimer avec le maximum de précision. Ce sont là des attitudes artistiques tout à fait respectables. Mais si la partition instrumentale est un support fixe et non modifiable, la façon dont elle va être interprétée ne rentre pas dans ces catégories de reproductibilité à l’identique. L’interprétation, par définition, n’est pas déterministe. On ne peut raisonnablement pas parler d’interprétation lorsqu’on connaît d’avance exactement ce qui va se produire. L’interprétation n’est pas, non plus, totalement aléatoire. Elle se situe dans une région intermédiaire entre les deux et se produit « en temps réel ». Ces notions de temps réel et de temps différé ne sont pas une chasse gardée de la technologie informatique, mais appartiennent aussi à la pratique musicale traditionnelle. La séparation entre valeurs fixes et variables, déterminées et indéterminées, constitue sans doute l’élément le plus important de toute cette problématique. On  ne peut pas faire l’économie d’un examen attentif de cette situation si l’on veut, tout à la fois, sortir définitivement de la rigidité et du déterminisme hérité de la musique sur bande sans tomber pour autant dans une pratique qui relèverait de la seule spontanéité. Pour continuer ce rapprochement entre les musiques instrumentales et électroniques, il n’y a pas meilleure méthode qu’examiner le contexte traditionnel de nos partitions musicales.

 

La partition, son interprétation et les ordinateurs.

Une partition fixe des valeurs que l’on pourrait considérer comme « absolues » car, idéalement, on devrait pouvoir les vérifier lors de chaque nouvelle interprétation. Ce terme de valeur « absolue » n’a, à bien y regarder, de réalité que dans le seul cadre d’un écrit. Mais c’est aussi suivant le degré de mécanicité des instruments que ces valeurs tendront à devenir absolues. La hauteur et l’évolution dynamique d’un son joué sur un violon, n’ont évidemment rien absolu car elles sont à tout moment modifiables par le mouvement d’un doigt sur une corde ainsi que par la variation d’une pression de l’archet. À l’opposé, sur un orgue, ces dimensions sont déjà mécanisées et ne dépendent d’aucun geste physique. Plus on substitue une mécanique au geste physique, plus on limite les possibilités d’interprétation. Le temps devient alors la seule variable possible dans un tel système hautement mécanisé. Pour écrire des partitions, on a créé des symboles comme les notes de la gamme et les indications de dynamiques et de durées. Ces symboles représentent en fait plus des champs que des valeurs absolues. On accepte comme un « la »  toute une bande de fréquences, gravitant autour de 440 Hz. On détermine un « mezzo forte » comme un champ d’énergie sonore, encore plus vaste et imprécis que le précédent, situé entre les champs « piano » et « forte ». Les ambitus de ces champs varient selon le pouvoir discriminateur de l’oreille. Des oreilles très bien exercées reconnaissent, de façon immédiate et sans ambiguïté, un « la » d’un « la + ¼ de ton », mais divergeront grandement lorsqu’il faudra déterminer ce qui est un « piano » ou un « mezzo forte ». Une partition comporte donc des champs, plus ou moins vastes, mais qui ont la particularité d’être fixés et que l’on doit respecter.

Cependant, l’écriture d’une partition, aussi élaborée fût-elle, ne pourra jamais déterminer intégralement touts composants nécessaires à la production de la musique. La somme des phénomènes sonores que nous entendons dépasse largement celle qui provient de la notation. En d’autres termes la notation peine à déterminer la fréquence exacte d’un vibrato, la durée exacte d’un son comme la courbe exacte d’une transition entre deux sons. Elle propose un cadre qui, par son impuissance même à tout déterminer, ouvre tout un espace à l’interprétation. Il suffit de prendre l’exemple des suites pour instruments seuls de Bach, dans lesquelles ne figure aucune indication de tempo, de nuances ou d’expression, pour se faire une idée de tout ce qu’un interprète se doit de compléter pour produire un discours musical pourvu d’un sens. Une grande part d’oralité se greffe sur l’écrit pour que la musique advienne. Il ne s’agit pas d’improvisation ; mais de l’espace de l’interprétation. Ce temps de l’interprétation est fondamentalement un « temps réel » qui n’est pas fondé sur une prédétermination totale. Ces deux grandes entités, valeurs absolues ou fixes, et valeurs relatives ou mobiles, qui séparent l’écriture de l’interprétation, se trouvent aussi dans la manière dont fonctionnent les ordinateurs.

Dès leur invention, il existait deux manières fondamentales de les faire fonctionner :

1-    On leur donnait une série d’instructions précises qu’ils exécutaient au moment voulu ; nous étions alors dans le pur déterminisme.

2-    On leur faisait produire des nombres aléatoires que l’on acceptait ou refusait selon les cas ; nous étions dans l’indéterminisme le plus total.

Depuis l’invention des machines en temps réel 2 et grâce à de nombreux développements technologiques, il existe maintenant une troisième manière de les faire fonctionner : on leur demande de capter des informations dans le monde extérieur et de les traiter selon des règles prédéfinies. Mais dans tous les cas nous observons une séparation entre déterminisme et indéterminisme, entre ce qui est fixé et ce qui ne l’est pas, qui me semble correspondre à la séparation qui existe entre la partition et son interprétation. Ce qu’on appelle alors « temps réel » dans la composition musicale serait un abus de langage puisqu’une part des composants musicaux est souvent déjà fixée, et n’a pas pour vocation à varier d’une interprétation à l’autre. Il doit donc exister une manière de composer de la musique électronique dans laquelle, à l’image de la musique instrumentale, certains composants sont préalablement déterminés, et certains autres, soumis à des variations plus ou moins importantes selon ce que nous cherchons à exprimer. On entre alors dans ce que j’appelle « les partitions virtuelles ».

 

Les partitions virtuelles.

J’ai donné à ce terme la définition suivante : une partition virtuelle est une organisation musicale dans laquelle on connaît la nature des paramètres qui vont être traités mais pas toujours la valeur exacte qu’ils vont recevoir le moment voulu. Une partie de ces paramètres sera fixe et ne changera pas d’une interprétation à l’autre [3. Dans la plupart de mes œuvres électroniques, la notion de « temps réel » se vérifiera cependant toujours, car les procédés de synthèse que j’utilise ont tous en communs de n’être pas des enregistrements préalables mais d’être calculés au moment même où je le décide dans le cours de l’œuvre. Même si certains de ces paramètres ont le statut de valeurs fixes, ils ont la possibilité d’être modifiés pendant les répétitions pour s’adapter aux conditions acoustiques de telle ou telle salle de concert. Il s’agit d’un temps réel technologique mais pas musical.], une autre sera influencée par la captation d’événements extérieurs (un micro, par exemple), qui sera analysée et traitée suivant certaines règles de composition. En ce sens, toute partition ne peut qu’être virtuelle puisque son rôle est d’être interprété et de ne jamais être reproduit de manière identique. Voici quelques exemples de partitions virtuelles, dans lesquelles la musique se crée par le mariage de paramètres déjà inscrits dans la mémoire de la machine avec d’autres, qui proviennent de l’analyse en temps réel du son instrumental pendant le concert.

Lorsque j’ai composé Pluton, pour piano et électronique, en 1987, j’ai conçu des partitions dans lesquelles j’ai déterminé les seules les hauteurs des sons de synthèse. Un suiveur de partition permet de passer d’une configuration harmonique à une autre en se synchronisant avec le jeu du pianiste. Tous les autres composants sonores, nécessaires à la création des sons de synthèse, sont déduits de l’analyse du son du piano pendant l’exécution de l’œuvre. L’ordinateur effectue, au moment où joue le pianiste, une sorte de « film », constitué d’une succession rapide de petites « photographies sonores », dans lesquelles sont représentées les énergies sonores du piano, c’est-à-dire la répartition des sons en composants graves, médiums et aigus à chaque instant. Ces énergies sont appliquées à la liste des harmonies, fixées au préalable dans la mémoire de la machine. La musique de synthèse produit alors une musique dont les composants harmoniques diffèrent de ce que joue le pianiste, mais dont la distribution des énergies dans le spectre reproduit celle du piano. Les différentes attaques des sons, leurs durées, leurs intensités, le jeu des pédales et les résonances viennent nourrir, en temps réel, l’ordinateur qui applique l’image sonore du piano, dans toutes ses évolutions spectrales et temporelles, sur les sons de synthèse. La partition du pianiste est écrite avec suffisamment de liberté rythmique pour que ce dernier puisse, à son tour, réagir à ce que produit la musique de synthèse. Il y a donc une interactivité de part et d’autre.

Dans une autre section de cette même œuvre, le pianiste joue une « toccata » comme une sorte de perpetuum mobile dont chaque note est analysée en termes de hauteur, durée et intensité. La machine reproduit, en temps réel, ce que joue le piano tout en y introduisant des variations d’ordre des notes, suivant le principe des chaînes de Markov et dans une boucle infinie. À divers endroits, le pianiste intervient et, selon son jeu, cette « toccata » électronique change de timbres, de registres, se contracte, s’étire et, pour finir, se fige en grands accords jusqu’à ce qu’elle meure. J’ai utilisé un procédé similaire dans Neptune, pour 3 percussions et électronique, composé en 1990. La machine produit un autre perpetuum qui va être découpé en séquences de proportions diverses par les instruments. Selon le niveau dynamique qu’un des joueurs de vibraphone produit, ces séquences découpées varieront en longueurs, tempi et intensités. Dans ces deux cas, c’est par l’analyse de l’interprétation que cette forme de musique électronique se créé. Il s’agit de la distorsion du temps mécanique de la machine par le temps flexible de l’interprète humain.

Dans En écho, pour soprano et électronique, composé en 1991, une petite partie des paramètres nécessaires à la production des sons de synthèse, est déterminée en valeurs absolues dans le programme. L’ordinateur effectue une analyse en temps réel des variations de hauteurs et d’intensités des formants de la voix de la chanteuse et transmet instantanément le résultat au programme de synthèse. Les formants étant ce qui caractérise les différentes voyelles, les sons de synthèse produisent des harmonies complexes, mais dont le timbre épouse celui des voyelles chantées et de leurs transitions.

Enfin, dans Partita I, pour alto et électronique, composé récemment en 2006, j’ai utilisé une méthode qui permet de mesurer l’accélération d’un mouvement d’archet sur les cordes. La musique de synthèse, lorsque le soliste ne joue pas, n’est qu’une sorte de « bain sonore » tournoyant lentement sur lui-même dans un registre medium. À chaque poussée de l’archet, certains de ces sons sont propulsés dans un registre aigu tout en opérant une accélération continue de leurs rotations. Plus la poussée est forte, plus les sons accélèrent leurs tournoiements et plus ils parviennent dans les régions suraiguës.  Ici, c’est l’énergie physique du soliste qui est convertie en énergie de propulsion sonore, comme lorsqu’on lance des toupies volantes en l’air.

Dans tous ces cas, la part déterminée de la musique de synthèse est réduite, car l’essentiel des composants provient de l’analyse en temps réel du signal instrumental ou vocal. Il est important de souligner que c’est grâce à la nature fondamentalement indéterministe de l’interprétation que ces configurations peuvent avoir lieu. L’ordinateur est capable d’analyser 127 manières différentes d’attaquer une note sur le piano et il serait utopique de demander au soliste de jouer précisément une valeur exacte. Je lui indique, tout au plus, un champ « mezzo forte » sachant que la valeur absolue interviendra lors de l’analyse du son. De la même manière, il serait « inhumain » de demander à une chanteuse de poser les formants de sa voix sur une fréquence précise. Je compose une mélodie sur un texte, sachant que la machine analysera tous les contenus sonores des voyelles et produira la musique de synthèse en fonction de la manière dont cette chanteuse articulera sa partie vocale. Enfin, je ne connais pas à l’avance la durée exacte des poussées d’archet qui propulseront les rotations sonores dans l’aigu, mais j’ai déterminé que dans tels champs de durées, les sons auront un comportement dont je peux prévoir les contours généraux. Il n’y a pas d’improvisations dans ces partitions virtuelles, mais une analyse précise des conditions, toujours vastes, de l’interprétation. L’idée d’un rapprochement de ces deux formes que sont la musique instrumentale et électronique trouve son plus grand intérêt dans l’intégration des phénomènes d’interprétation d’un écrit. C’est ainsi que je parviens à donner à la musique électronique la possibilité d’être interprétée. À tout moment cependant, je peux décider que tel paramètre sera déterminé au préalable et non plus influencé par des événements extérieurs. Ce sont des « verrous » que l’on peut ouvrir ou fermer. Lorsque tout est ouvert, nous sommes dans un monde proche de celui des improvisateurs, lorsque tout est fermé nous retrouvons les conditions de notre vieille bande magnétique. D’un extrême à l’autre nous naviguons entre rigueur et liberté, intuition et construction mais c’est le subtil dosage des échanges entre toutes ces catégories qui me semble le plus fécond.

S’il est possible de construire des structures sonores dotées d’un grand pouvoir de réactivité au jeu instrumental, on perçoit encore une grande résistance à la réunion des musiques acoustiques et électroniques dans un temps musical commun. Une frontière semble encore opaque entre ces deux conceptions temporelles et qui tient à la nature même du contrôle du temps dans la musique. La raison en est que l’être humain utilise des moyens plus visuels que sonores dans ce qui constitue certainement l’élément majeur du contrôle musical du temps : la possibilité de prédiction.

 

La prédiction temporelle.

Il existe une différence fondamentale entre le temps organisé par des machines et celui de l’être humain. Le temps produit par des machines est soumis à de multiples horloges qui le découpent en tranches suffisamment fines pour qu’il soit perçu comme un continuum, tout comme le cinéma nous donne une illusion de la continuité visuelle en déroulant 24 images fixes par secondes. Grâce à des procédés élaborés, on parvient parfois à faire intervenir des mécanismes de mémorisation et de prédiction qui rendent plus souple ce contrôle temporel. Mais, fondamentalement, le temps des machines est celui des horloges et le restera. Le temps psychologique humain, à la différence de celui des machines, est incapable d’une telle finesse dans le découpage temporel en unités si petites. Mais lorsqu’un musicien contrôle le temps, il le fait dans la continuité d’un geste ou d’une respiration. Il a aussi une conscience du passé et du futur, il fait intervenir la mémoire et surtout la prédiction. Le fait que des musiciens puissent jouer à l’intérieur d’un temps commun est un phénomène grandement visuel. C’est par un petit signe de la tête ou du bras qu’ils commencent ensemble. La continuité du geste du chef d’orchestre envoie, sans interruptions, des signaux prédictifs qui orientent les actions musicales dans la direction d’un futur proche. On devine où va « tomber » le deuxième, le troisième puis le quatrième temps. Certes, un musicien est souvent conduit à compter le temps, mais il le fait dans des proportions beaucoup plus larges et, pourrait-on dire, dans une situation de polyphonie. Il a une conscience simultanée des durées des temps et de celles de ses divisions internes. À ce titre, le temps des machines et celui de l’humain paraissent, dans leurs essences, incompatibles. Il serait vain d’attendre des premières qu’elles réagissent avec psychologie, comme des seconds qu’ils puissent compter en millièmes de secondes. Il nous faut donc pouvoir représenter, du mieux qu’on pourra le faire, le temps des machines à l’image de celui des humains. Cette fusion sera rendue possible lorsque ces machines seront capables de suivre et de reconnaître, dans sa continuité, le flux musical produit par des musiciens vivants. Nous savons très bien organiser les dimensions de hauteurs, de timbres et de spatialisations dans la musique électronique, mais nous sommes encore impuissants quant à l’organisation d’un temps qui serait véritablement musical. J’évoquerai, pour cela, une situation concrète.

Lors des répétitions de mon opéra  La frontière, composé en 2003, dans une des sections devait se superposer, dans le même tempo, des glissandi de cordes à d’autres glissandi de sons de synthèses. Pour des raisons dramatiques, il a fallu accélérer le tempo de cette section. J’ai donc dirigé plus vite l’ensemble et me suis évidemment trouvé décalé avec la musique électronique qui se déroulait suivant les durées indiquées dans un programme prédéterminé. Toutes les durées de ces glissandi de synthèse (et il y en avait un certain nombre) étaient rigidement figées en valeurs exprimées en millisecondes qu’il m’a fallu recalculer dans toutes leurs proportions une nuit durant. Cette situation aurait pu être résolue d’une manière plus élégante si les outils de notation qui me servaient à composer cette musique de synthèse avaient été plus proches  de ceux que j’utilise depuis que je compose de la musique. Il est curieux de constater que dans les deux grandes « écoles » qui utilisent la technologie pour faire de la musique, les méthodes de synthèse en temps réel et les systèmes d’aide à la composition musicale, ces derniers sont dotés d’outils de représentation musicale proches de ceux de l’écriture traditionnelle qui font complètement défaut aux premiers. La représentation temporelle dans les systèmes temps réel ne bénéficie d’aucun moyen symbolique qui permettrait de noter des noires, des croches, des triolets ou des indications de tempi. Le système temps réel ne connaît que des valeurs absolues et il est encore impossible de changer globalement un tempo ou de noter un accelerando. Les systèmes en temps réels ne connaissent bizarrement encore que les millisecondes ! Quand bien même ma partition électronique, après son recalcul, se trouverait temporairement mieux adaptée aux circonstances, elle n’est restée pas moins figée comme si elle avait été reproduite sur une bande magnétique. Les musiciens, qui suivaient ma battue des yeux, étaient déjà renseignés sur le moment où allait se produire le temps suivant et la continuité de mon geste était le garant d’un suivi de tempo et de toutes ses déviations possibles. Ce pouvoir était évidemment inaccessible à l’ordinateur, et il le reste, du moins dans l’état actuel de son application à la musique 3.

Si des outils de représentation du temps musical avaient existé dans les programmes en temps réel, il aurait été possible d’adapter le temps courant en suivant, par des moyens visuels, la battue du chef. La dimension visuelle est d’un grand secours pour suivre une musique qui n’est pas fondée sur une fixité de tempo. Il existe cependant des cas de figures où un système de reconnaissance visuel ne serait pas approprié. Pour suivre les variations de tempi dans une pièce pour piano il n’y a guère que le son qui pourrait être pris en compte. De réelles avancées ont été faites dernièrement dans ce domaine 4 mais le jour où il sera possible de suivre, avec des moyens purement sonores, les contours temporels d’un simple prélude de Chopin ou de Debussy, un grand pas aura été accompli. Il existe cependant de nombreux cas où la prédiction temporelle est difficile. Lorsqu’on enregistre en temps réel une phrase musicale ou même parlée, et que l’on veut n’en développer qu’une seule partie, nous sommes dans l’incertitude totale des proportions qui vont être inscrites car nous ignorons pas le tempo exact de cette phrase. Un outil de représentation graphique, qui pourrait analyser en temps réel cette phrase afin de repérer automatiquement le moment recherché, devrait être inventé dans ce but.

 

Peut-on inventer une véritable notation pour la musique de synthèse ?

Il s’agit d’un vieux rêve auquel se sont attelés beaucoup de compositeurs. Stockhausen a poussé la précision de la notation de la musique électronique fort loin dans des œuvres telles que  Kontakte ou Telemusik. Mais l’écrit, dans ces conditions, n’a pas le même statut que celui qui gouverne la pratique instrumentale, car il intervient après le processus de composition, comme une notation a posteriori. En ce sens, il est exhaustif et ne nécessite aucun complément oral. J’ai souvent pensé que l’écriture musicale était l’une des plus merveilleuses inventions de l’humanité. Elle est tout à la fois un langage symbolique, un outil conceptuel, une méthode de mémorisation, un système d’interprétation, un moyen d’écoute et un support de la pensée. À quoi ressemblerait une écriture nouvelle pour la musique de synthèse qui permettrait également d’être un outil puissant pour la composition ? Avec Miller Puckette, à l’Université de San Diego en Californie, nous nous sommes à nouveau penchés sur cette question. L’idée première était de limiter au maximum toute représentation de style numérique au profit de systèmes purement graphiques. Ainsi pourraient être dessinées des valeurs fixes, des courbes représentant des évolutions temporelles, des profils dynamiques, des glissandi, des niveaux d’entrée d’un son dans des modules de traitement, des évolutions de paramètres, etc. Un tel outil pourrait être complété par une bibliothèque de fonctions permettant d’opérer des transformations, des étirements, des contractions, des transpositions, des duplications, le tout étant unifié dans le même type de représentation. Il nous est d’abord apparu que, vu l’énorme quantité de paramètres qu’il nous faudrait représenter, une meilleure solution consisterait à garder la représentation numérique pour toute valeur qui ne serait pas variable dans le temps. Ensuite, de nombreuses questions se sont posées. Comment représenter des évolutions micro-tonales dans un système de coordonnées cartésiennes (les hauteurs en abscisse et le temps en ordonnée) tout en conservant la lisibilité de toutes les voix ? Comment écrire chaque voix, comportant elle-même une grande quantité de paramètres, sur une seule « partition » ? Jusqu’à quel point peut-on intégrer la notation musicale traditionnelle et comment l’unifier avec une notation différente dans les cas où cette première serait insuffisante ? Comment exprimer le temps d’un événement qui nous est connu (lorsqu’il fixé comme dans le cas d’une bande magnétique) par rapport à un autre qui ne l’est pas (lorsqu’il doit être déterminé par l’interprétation) ? Ce sont là des interrogations qui sont encore devant nous. Mais il me semble évident qu’un tel outil permettrait de résoudre de nombreux problèmes, ceux, principalement, qui concernent les structures de temps comme les changements et les variations de tempi.

 

En guise de conclusion: une théorie des « verrous ».

Faut-il le préciser, la musique de synthèse n’a de sens que là où s’arrêtent les possibilités de la musique instrumentale. Le monde sonore qu’elle porte en elle n’a pas les mêmes fondements, le même statut historique ni les mêmes attributs expressifs. Les sons instrumentaux restent chargés d’histoire et s’effacent souvent devant le discours musical. Lorsque nous entendons une symphonie classique, nous ne procédons pas systématiquement à une série d’identifications qui nous ferait dire : ici, joue une clarinette, ici une contrebasse, là un trombone… Nous avons même tendance à oublier qui joue pour nous concentrer sur  ce qui est joué.  Dans l’univers des sons de synthèse, il est parfois difficile de distinguer les éléments qui portent le discours du discours lui-même car, très souvent, ces éléments ne nous sont pas connus et nous ne pouvons donc ni les nommer, ni les identifier. Cette situation ne changera probablement jamais, à moins qu’une volonté de standardisation à très grande échelle soit un jour entreprise pour des raisons de classification mercantile d’étiquetage. Cela n’est pas impossible, mais il ne sera plus question d’art. On a pris conscience, au fil des années, de la nécessité d’intégrer une certaine dose d’historicité dans les sons électroniques, d’adjoindre aux sons électroniques des attributs que l’on puisse nommer et de les doter d’un aspect qui les rapproche d’une catégorie ou d’une famille connue. Que l’on compare les musiques qui se faisaient au temps des premiers programmes de synthèse sonore (Chowning, Risset) avec celles qui se composent aujourd’hui et la preuve sera évidente. Ce rapprochement entre des types morphologiques séparés n’a pas pour but de rendre totalement invisibles leurs différences. Il s’agit qu’un même champ morphologique recouvre les deux univers  musicaux qui continuent de se distinguer par ailleurs. Si l’on veut affiner ce rapprochement, il me semble que l’attitude mimétique que l’on a constatée au niveau des qualités morphologiques des sons doit être conservée lorsqu’on se penche sur les structures de fonctionnement et les modes de composition. La partition et son interprétation nous fournissent un excellent modèle de ces structures. Les ordinateurs, quant à eux, deviennent des instruments à part entière, à la différence près qu’ils ne sont pas uniquement manipulables par des gestes, ou par des informations extérieures, mais peuvent se comporter comme des automates. Ils peuvent, ou non, être « sensibles » au monde extérieur. Sur l’immense chaîne des circuits qui se partagent son activité, on peut poser des « verrous » qui permettent ou interdisent l’accès du monde extérieur. C’est au compositeur de décider de la marge de liberté et d’interactivité qui doit être introduite. De ce fait les catégories du temps réel et du temps différé n’existent, pour ainsi dire, plus. La totale liberté des improvisations et la rigidité fixe de la musique entièrement calculée – reproduisant la bande magnétique – sont les extrêmes de cette situation. Dans les premières, tout est déverrouillé, dans les secondes, tout est cadenassé. Le compositeur, quant à lui,  peut organiser son monde de contraintes et de libertés. C’est ainsi qu’il l’a toujours fait.

 

Philippe Manoury, San Diego, septembre 2007

 

 

 

 

  1.  J’utiliserai le terme « son de synthèse » ou « musique de synthèse » pour représenter tous les sons qui sont produits par les moyens technologiques. Dans la réalité, ils peuvent appartenir au monde de la synthèse pure, mais aussi à celui du traitement. Je considérerai qu’ils sont tous produits par un synthétiseur.
  2.  Ce terme est, bien sûr utilisé par commodité car il faut toujours un temps pour le calcul. En musique, il suffira que ce temps soit suffisamment court pour que l’oreille ne puisse pas le percevoir.
  3. Dans le domaine militaire, le calcul de la trajectoire future d’un missile, en vue de le faire exploser en plein vol, est un problème qui est réglé depuis longtemps. Il peut, à tous moments, être repéré dans toutes ses coordonnées spatio-temporelles et, instant par instant, on peut adapter la trajectoire de l’objet qui devra le percuter. La somme d’énergies et d’efforts qui ont été mis à la disposition de ce type de recherche, comparé à celui de la musique, ne se situe évidemment pas dans le même ordre de grandeur.
  4. Je pense particulièrement aux travaux d’Arshia Cont à l’Ircam.