Le son binaural, c’est quoi ?

Depuis deux ans, on entend par­ler abso­lu­ment par­tout du son binau­ral. La pre­mière fois que j’ai réel­le­ment décou­vert ce que cela signi­fiait, c’é­tait à l’oc­ca­sion d’Uto­pie Sonore 2016, où un groupe de participant·e·s avait pu réa­li­ser quelques expérimentations.

Plus récem­ment, c’est à Lon­gueur d’ondes 2019 que j’ai assis­té à une démons­tra­tion de mixage pour l’é­coute binau­rale.

Le monde de la radio et du son en géné­ral est en véri­table effer­ves­cence au sujet de ce qui est annon­cé par beau­coup comme une véri­table révo­lu­tion… On peut écou­ter des émis­sions à ce sujet, et même en écou­ter sur le site de Radio France dédié au son 3D

Mais qu’est-ce que c’est, le son binau­ral ?

[Le son binau­ral] est une tech­nique qui res­ti­tue l’é­coute natu­relle, en trois dimensions.

Son binau­ral : la 3D sonoreLe numé­rique et nous, Cathe­rine Petillon, France Culture, mai 2017

Cette pré­pa­ra­tion spé­ci­fique du son per­met de res­sen­tir une impres­sion d’im­mer­sion très réa­liste. On se retrouve au cœur d’un uni­vers sonore, bien plus qu’a­vec la sté­réo classique. 

Pour com­prendre com­ment ça marche, il faut reve­nir un tout petit peu en arrière, et expli­quer com­ment notre sys­tème audi­tif fonc­tionne pour loca­li­ser les sources des sons. 

On écoute avec deux oreilles

Je ne revien­drai pas ici sur ce qu’est un son, ni sur la ques­tion du spectre audi­tif. Si ces ques­tions vous inté­ressent, je vous invite à consul­ter le début de l’ar­ticle que j’a­vais écrit sur la musique et les mathé­ma­tiques.

« Le son que je viens d’en­tendre a‑t-il été pro­duit devant moi, au des­sus, sur la gauche, der­rière ? À 2 mètres, à 10 mètres ? » Les humains, comme beau­coup d’autres ani­maux, sont capables de loca­li­ser très pré­ci­sé­ment une source sonore dans l’es­pace environnant.

Pour cela, on uti­lise prin­ci­pa­le­ment nos deux oreilles. Une à gauche, une à droite. Comme elles sont pla­cées de chaque côté de notre tête, et comme le son avance dans l’air ambiant à une vitesse de 340 mètres par seconde, il y a donc quelques mil­li­se­condes de dif­fé­rence dans la per­cep­tion du son par les deux oreilles. En ajou­tant à cela l’at­té­nua­tion natu­relle de l’in­ten­si­té due à la dis­tance, on a donc une légère dif­fé­rence de niveau sonore dans la per­cep­tion du son entre les deux oreilles. Cela per­met de situer effi­ca­ce­ment un son dans le plan horizontal.

La loca­li­sa­tion dans le plan ver­ti­cal du son est quant à elle per­mise par la forme par­ti­cu­lière de nos oreilles, nos épaules, notre tête, etc. En effet, ces struc­tures ont ten­dance à réflé­chir ou à fil­trer cer­taines fré­quences, ce qui entraîne une modi­fi­ca­tion du spectre fré­quen­tiel per­çu. Cer­taines fré­quences sont atté­nuées, et d’autres ampli­fiées sui­vant la direc­tion d’où vient le son.

La per­cep­tion de la dis­tance est notam­ment per­mise grâce aux dif­fé­rences per­cep­tibles entre le son qui arrive direc­te­ment à nos oreilles, et celui qui arrive après avoir été réver­bé­ré par l’en­vi­ron­ne­ment.

Enfin, puisque ces dif­fé­rentes per­cep­tions sont par­fois déli­cates, nous avons éga­le­ment ten­dance à réa­li­ser des micro-mou­ve­ments de la tête, non contrô­lés, qui aide­ront le cer­veau à affi­ner sa per­cep­tion de la loca­li­sa­tion de la source, en uti­li­sant plu­sieurs esti­ma­tions suc­ces­sives à des orien­ta­tions différentes.

Si vous vou­lez en lire plus sur ces ques­tions, je vous invite à par­cou­rir l’ar­ticle sur le site cochlea, que je trouve très pédagogique.

Simuler un son naturel

Quand on uti­lise un dis­po­si­tif d’en­re­gis­tre­ment et de res­ti­tu­tion du son, on cherche donc à simu­ler un son natu­rel, pour per­mettre à l’au­di­teur de le per­ce­voir loca­li­sé dans l’es­pace ambiant. À cha­cune des étapes de l’en­re­gis­tre­ment, du mixage, et de la dif­fu­sion, on doit donc réflé­chir à la manière de spa­tia­li­ser le son.

Multi-sources

La manière la plus simple de spa­tia­li­ser le son, mais qui est peu uti­li­sée, consiste à pla­cer une enceinte à l’en­droit de cha­cun des sons que l’on veut simu­ler. C’est ce qui est fait au théâtre par exemple, où l’on pour­ra pla­cer une enceinte dans le lan­dau pour faire entendre un bébé qui pleure. Les spec­ta­teurs enten­dront le son venir exac­te­ment du bon endroit.

Évi­dem­ment, cette tech­nique n’est pos­sible que si l’on peut posi­tion­ner une enceinte pour cha­cune des sources sonores que l’on veut simu­ler. C’est assez uto­pique, et impos­sible pour un dis­po­si­tif d’é­coute personnel. 

La tech­nique la plus cou­rante est donc la dif­fu­sion du son en sté­réo, voire en 5.1. Je ne pren­drai pas le temps de détailler les sons 5.1 et ses alter­na­tives pour le ciné­ma, mais on peut les entendre comme une exten­sion du son stéréo.

Le son stéréo

Studio de montage stéréo
Stu­dio de mon­tage stéréo

Le son sté­réo fonc­tionne très bien avec deux enceintes, pla­cées de part et d’autre de l’au­di­teur, à dis­tance égale, géné­ra­le­ment en for­mant un tri­angle équi­la­té­ral à 60°.

En mixant le son pour la sté­réo, on uti­lise prin­ci­pa­le­ment les écarts d’in­ten­si­té entre les deux canaux pour simu­ler un son gauche/droite. Par­fois, on ajoute à cela un léger délai entre les deux signaux, pour aug­men­ter encore l’im­pres­sion de spa­tia­li­sa­tion. Mais on va rare­ment au delà, car la per­cep­tion réelle de l’au­di­teur dépend beau­coup de la posi­tion de ses enceintes.

Pour enre­gis­trer du son pour la sté­réo, on pour­ra par exemple uti­li­ser un couple XY, ou encore un couple ORTF, sui­vant les besoins et envies.

Il est inté­res­sant de noter que l’é­coute au casque d’un son mixé pour la sté­réo sem­ble­ra géné­ra­le­ment moins bien spa­tia­li­sé, parce que les sources sonores seront col­lées aux oreilles, et non plus éloi­gnées signi­fi­ca­ti­ve­ment de l’au­di­teur. En dif­fu­sant un son uni­que­ment dans l’en­ceinte droite, on a tou­jours une écoute sté­réo, l’au­di­teur per­çoit l’en­ceinte à 45°. À l’in­verse, en ne dif­fu­sant un son que dans l’o­reillette droite d’un casque, on pro­po­se­ra à l’au­di­teur un mix qui n’a rien de natu­rel (on n’en­tend jamais un son que d’une seule oreille). De plus, avec un casque, impos­sible de pro­fi­ter des micro-mou­ve­ments de la tête.

Le son binaural

Le prin­cipe du son binau­ral est de conce­voir un son pour une écoute au casque, la plus fidèle pos­sible à ce que l’on pour­rait per­ce­voir en envi­ron­ne­ment réel : délai entre les deux oreilles, dif­fé­rence d’in­ten­si­té, modi­fi­ca­tion du spectre de fré­quences, afin de simu­ler au mieux les choses.

Tête de man­ne­quin et micros-oreilles.

Il existe dif­fé­rentes tech­niques pour pro­duire un tel son : soit en cap­ta­tion binau­rale, en uti­li­sant deux micros pla­cés au niveau des oreilles de l’o­pé­ra­teur ou d’un man­ne­quin, soit en uti­li­sant des plu­gins de spa­tia­li­sa­tion de son dédiés, où l’on place la source dans l’es­pace ambiant, et où l’on simule un son binaural.

Les limitations du son binaural

Si sur le papier cette approche semble très pro­met­teuse, il est tout de même impor­tant de rap­pe­ler quelques limi­ta­tions, qui font que cette tech­nique n’est pro­ba­ble­ment pas aus­si for­mi­dable que ses défen­seurs veulent le faire entendre.

Tout d’a­bord, notre écoute s’ap­puie beau­coup sur les micro-mou­ve­ments de la tête pour affi­ner la loca­li­sa­tion des sources de son. La seule manière de simu­ler cela dans le cadre d’une dif­fu­sion binau­rale est de réa­li­ser un sui­vi en temps réel de la tête de l’au­di­teur, et d’a­jus­ter le mix qui arri­ve­ra à ses oreilles en temps réel. Cela n’est pos­sible qu’a­vec un son réa­li­sé vir­tuel­le­ment avec des plu­gins de spa­tia­li­sa­tion, et ne sera pas pos­sible avec un son natu­rel enre­gis­tré en binaural.

D’autre part, une grande par­tie de la per­cep­tion spa­tiale dépend de la forme pré­cise de nos oreilles et de notre ana­to­mie en géné­ral (forme de la tête, forme des épaules, etc.). D’une per­sonne à l’autre, le filtre fré­quen­tiel que subit le son peut varier de manière signi­fi­ca­tive. Ain­si, si j’en­re­gistre en binau­ral depuis mes oreilles, et que vous écou­tez ensuite l’en­re­gis­tre­ment, vous pour­riez per­ce­voir un son au des­sus de vous, alors que je l’au­rais enre­gis­tré face à moi. La seule manière pour contour­ner cette limi­ta­tion est de réa­li­ser un mix dédié à chaque audi­teur, ou à chaque famille d’au­di­teurs. C’est pro­ba­ble­ment un che­min qui sui­vra l’in­dus­trie du son. 

En atten­dant, on a donc à notre dis­po­si­tion des sons binau­raux mixés pour qu’ils satis­fassent au plus grand nombre. Si vous êtes proches des pro­prié­tés mor­pho­lo­giques de la moyenne, vous aurez alors une per­cep­tion très fine de la spa­tia­li­sa­tion. À l’in­verse, si vous en êtes éloi­gnés, vous per­ce­vrez aus­si une spa­tia­li­sa­tion, mais pro­ba­ble­ment inco­hé­rente avec celle ima­gi­née par le producteur…

Conclusion

Ce que je regrette beau­coup dans la com­mu­ni­ca­tion à outrance que l’on voit ces der­nières années sur les tech­no­lo­gies binau­rales, c’est que les défen­seurs de ces tech­niques se placent en évan­gé­li­sa­teurs, pré­sen­tant la tech­nique comme une révo­lu­tion for­mi­dable, qui per­met des merveilles. 

Même si cette tech­nique apporte des sen­sa­tions vrai­ment inté­res­santes pour l’au­di­teur, je pense qu’il est impor­tant de rela­ti­vi­ser, d’une part sur les per­for­mances de simu­la­tion réa­liste de l’ap­proche, comme nous l’a­vons vu ci-des­sus, mais aus­si sur le fait que cette approche est fré­quem­ment exploi­tée par les gens qui réa­lisent un mix, même pour la sté­réo. Ce n’est donc pas une révo­lu­tion, mais plus une évo­lu­tion des pratiques…