LE TELEPHONE ET L'ART DU CINEMA

« On découvre au téléphone les inflexions d'une voix qu'on ne distingue pas tant qu'elle n'est pas dissociée d'un visage où on objective son expression» Marcel Proust

Certains objets font de la figuration. D’autres, intégrés à la narration, caractérisent les personnages, dynamisent le rythme ou infléchissent le scénario.
Petit tour d’horizon de ces «machins» du quotidien qui, au fil de scènes cultes, ont marqué nos imaginaires. Aujourd'hui, le téléphone.
Le téléphone a révolutionné le XXe siècle en annihilant la notion de distance. Pas étonnant que, le cinématographe, né à la toute fin du XIXe, ait porté son attention sur cet accessoire. Les mises en scène téléphoniques ont ainsi offert des rôles de choix, tant sur le plan dramaturgique que scénaristique en intégrant progressivement ses évolutions technologiques: fil, sans fil puis portable.
S’il est une caractéristique, propre au téléphone, qui fait fantasmer les metteurs en scène, c’est sans conteste l’ubiquité. Etre ici et ailleurs simultanément. Mise en abîme du statut de spectateur, qui observe en voyeur une vie étrangère, cet objet permet à un personnage d’assister à distance (au moins auditivement) à une scène à laquelle il n’était pas convié.
Depuis Hitchcock, le téléphone est utilisé comme fil conducteur de nombreuses histoires ou comme outil créatif, tant sur le plan de l'image que du son. Cet appareil a aussi pris une place importante lors de l'apparition de l'écran fragmenté (split screen) en 1913, quand les cinéastes en ont fait usage pour montrer les différents interlocuteurs en même temps à l'écran.
54 extraits de films défilent en 3 minutes
Le téléphone est un objet de mise en scène qui offre des possibilités très nombreuses.
C’est un objet qui a évolué au fil des années, cela implique un lot de conséquences, non seulement sur le plan de la mise en scène mais aussi du récit. Aujourd’hui, une personne isolée ne l’est plus complètement grâce au téléphone, celui-ci peut ne pas capter, être volé… Les moyens pour filmer une conversation téléphonique sont aussi très différents, les réalisateurs jouent sur les mouvements, l’échelle des plans, les couleurs…
sommaire


Après le chapeau, la cigarette ou encore les lunettes, la série d'Arte "Blow Up" se penche sur un objet central dans l'histoire du cinéma : le téléphone. Qu'il soit fixe ou portable, rouge ou rose, énorme (Wall Street) ou minuscule (Zoolander), filmé par Wim Wenders, Michel Hazanavicius ou Brian De Palma, le téléphone lie les personnages entre eux, parfois dans le même split-screen. Pour le meilleur et pour le pire. Source de quiproquo (Bûcher des Vanités) ou de dispute (Punch Drunk Love), le coup de bigot peut faire mal. C'est même souvent un instrument sadique, utilisé pour élaborer des jeux de pistes machiavéliques (Une Journée en Enfer), ou, plus souvent, harceler les jolies femmes telles que Jane Fonda dans Klute, Drew Barrymore dans Scream, ou encore Grace Kelly dans Le Crime était presque parfait.D'ailleurs, on apprend souvent la mort par un plan sur un combiné. Et attention aux cadrages bizarres sur les personnages qui décrochent : c'est souvent très mauvais signe. Bon, heureusement il y a aussi quelques déclarations d'amour téléphoniques, comme dans le Grand Bleu. Quant à la cabine téléphonique, c'est un lieu privilégié au cinéma. On s'y énerve, on s'y protège de l'extérieur.Pour fêter le téléphone, Blow Up a choisi quelques extraits savoureux. Un joli Top Five dans lequel on croise David Lynch, Louis Malle, Luis Bunuel, Paul Schrader et Quentin Tarantino - un grand amateur de textos ...

Dans ce dossier, nous allons analyser les différentes utilisations du téléphone dans les mises en scène puis dans une deuxième partie plus concrète, on analysera plusieurs scènes pour véritablement dégager des possibilités précises que peuvent offrir les téléphones dans les films.

sommaire

Au cinéma, lors d’une conversation téléphonique, la voix est vocodée, malgré l’aspect peu réaliste, cette technique est une convention.
Le mot «téléphone» implique, sans même avoir un scénario, plusieurs choix basiques à faire : le téléphone fixe ou portable, la sonnerie, la couleur, montrer l’autre correspondant ou pas, ne montrer aucun correspondant… Les options sont donc multiples, sans même la présence d’une histoire. On peut donc bien imaginer la multiplicité de ces choix et l’ajout d’autres lorsqu’il y a un scénario. Grâce à une liste, non exhaustive, de films, on va analyser les différentes utilisations du téléphone.
Le téléphone peut constituer l’ouverture des films et peut causer des quiproquos dans 'Le bûcher des vanités' de Brian De Palma avec Tom Hanks ou bien peut être utilisé pour des déclarations romantiques, comme l’illustre la scène d’ouverture d’Ascenseur pour l’échafaud. Dans 'American Gigolo', il n’y a certes pas de téléphone dans l’ouverture mais on en parle à plusieurs reprises, puisque Richard Gere conduit sous la musique de Blondie, Call me.
Le téléphone peut aussi constituer un élément très important du scénario, toute l’intrigue peut s’y reposer dessus comme 'Une journée en enfer' avec Bruce Willis ou bien seulement en partie, telle la mission de James Bond dans 'Casino Royale', celui-ci utilisant les téléphones pour repérer ses ennemis.
Qui dit téléphone dit aussi conversation. Brian De Palma et Wim Wenders, par exemple, optent pour le split-screen afin de mieux représenter la conversation, système parodié dans 'OSS 117'. Les conversations impliquent également des coups de fil majeurs, décisifs, Hitchcock utilise des cadrages originaux, insolites dans 'La mort aux trousses' mais c’est encore plus explicite dans 'L’homme qui en savez trop'. Les conversations sont parfois dérangés par des baisers inopportuns, dans 'Goldfinger' ou bien 'Les enchainés' de Hitchcock avec Cary Grant et Ingrid Bergman. A l’inverse, au cinéma, la conversation téléphonique est un moyen pour les personnages de se déchainer dans des engueulades plutôt violentes, comme dans 'Punk drunk love' ou 'J’ai tué ma mère' dans lequel le téléphone permet à Anne Dorval de proposer un jeu magistral.
Les personnages appellent aussi pour des raisons plus importantes. Il s’agit d’un coup de fil d’urgence de John Travolta dans 'Pulp Fiction', heureusement décroché, mais empêché dans 'Seule dans la nuit', dans lequel Audrey Hepburn est coupée de l’extérieure à cause de la coupure des fils du téléphone. Dans beaucoup de films aussi, le policier et le criminel échangent par le téléphone, ce qui accroit les tensions. Cette méthode est certes utilisée dans 'Une journée en enfer' mais aussi dans 'Insomnia' de Christopher Nolan qui pose un duel entre Al Pacino et Robin Williams. Kevin Costner appelle aussi Demi Moore dans 'Mr Brooks' pour lui exprimer tout son respect puis jette le téléphone dans le vide. Jason Statham, lui aussi, appelle à la fin du film Ryan Phillippe pour lui révéler sa culpabilité dans 'Chaos'. Quant à Liam Neeson, il reçoit des textos de la part d’un criminel dans un avion dans le récent Non-Stop.
Le téléphone constitue aussi un leurre, pour attirer le personnage dans un piège, afin de le tuer comme dans 'L’espion qui m’aimait', de le kidnapper comme dans 'La mort aux trousses' ou Rabbi Jacob ou bien de déclencher une bombe comme dans 'The dark knight'.
Le téléphone est aussi lié à l’angoisse, la peur de l’inconnu, élément véritable de suspense tel dans 'Scream', Freddy et citons encore une nouvelle fois Alfred Hitchcock avec 'Le crime était presque parfai't. Il peut aussi être lié à la mort, un plan sur un téléphone peut suggérer la mort ou bien l’enlèvement d’un personnage.
Il y a aussi des utilisations plus insolites du téléphone dans les films. Michael Douglas en possède un très gros dans 'Wall Street' alors que Ben Stiller en possède un trop petit dans 'Zoolander'. Il peut être utilisé par un extraterrestre, tel E.T. dans le film éponyme ou bien avec David Lynch, peut servir à un échange très insolite dans 'Lost Highway' ou bien encore à «s’appeler soi-même», dans Mulholland Drive.
Il peut aussi servir en tant que mémoire pour Julianne Moore dans le tout récent 'Still Alice'. Quant à Leonardo DiCaprio, lui préfère vendre des actions dans 'Le loup de Wall street'.
Le téléphone est aussi récurrent dans les James Bond et sert de gadget, notamment avec Pierce Brosnan dans 'Demain ne meurt jamais'.
Enfin, certains personnages préfèrent plutôt envoyer des textos, lesquels apportent beaucoup de profondeur à la scène lorsqu’ils sont accompagnés par la musique mélancolique de Pino Donaggio composée pour Blow Out dans 'Boulevard de la mort' de Tarantino.
Une conversation téléphonique peut aussi impliquer la présence d’une cabine téléphonique. C’est un abris pour Tippi Hedren dans 'Les oiseaux', un piège pour Colin Farrell dans 'Phone game' ou pour la pauvre conductrice dans 'Octopussy' qui n’aperçoit pas que l’on vole sa voiture.

On a donc vu, de manière plutôt générale, les différentes possibilités d’utilisation qu’offre le téléphone.
Maintenant, dans cette deuxième partie du dossier, analysons des scènes de conversation téléphonique pour comprendre le rôle concret du téléphone ainsi que les choix de réalisation.

sommaire

Quelques références cinématographiques

'L’impossible monsieur Bébé, Howard Hawks'
La séquence débute en pleine conversation entre Cary Grant et sa fiancée. Il est assis, au centre du cadre et parle au téléphone. Ensuite survient un plan sur sa fiancée. Elle est également assise, au centre. Les deux personnages sont habillés de manière presque identique et parlent du même sujet. Ils sont donc confondus, constituant véritablement une même personne. Il y a toutefois deux différences. Elle regarde à gauche, c’est à dire vers la droite du cadre et elle est coincée dans une pièce plutôt encombrée alors qu’il n’y a rien à la droite – à gauche du cadre – de Cary Grant lorsqu’il est assis. Il se dirige ensuite vers la gauche pour ouvrir la porte et doit emmener avec lui le téléphone et ne doit pas chuter à cause du fil, ce qui ajoute un petit effet comique à la scène. Il est plutôt dynamique alors que la fiancée ne l’est pas du tout, coincée, c’est un fossile. Howard Hawks ne lui consacre d’ailleurs qu’un seul plan et donc ne lui accorde pas d’importance. La séparation aurait été triste si plusieurs plans auraient été accordés pour la fiancée. Pour l’instant, le téléphone est utilisé pour créer un véritable clivage entre ces deux personnages. Toutefois, la scène est encore plus intéressante avec la suite de l’action. Il revient à droite, s’assoit et raccroche. Le téléphone sonne pour la première fois, la sonnerie est longue, il hésite à longue, ce qui instaure un suspense. Katharine Hepburn apparaît pour la première fois dans cette séquence.
Alors que la séquence démarrait en pleine conversation, cette fois-ci, le début de la conversation n’est pas supprimée, ce qui dramatise la scène et accorde bien plus d’importance au personnage de Katharine Hepburn, qui s’oppose tout de suite à la fiancée. Elle est non seulement magnétique, la prise de pouvoir est immédiate, mais aussi surféminisée grâce à sa robe blanche et son nuage de voile. Le décor, aussi, est composé d’objets blancs – même le téléphone est blanc – qui ajoutent de la prestance et de l’importance au personnage. On peut comparer Katharine Hepburn à un bel oiseau. Howard Hawks offre un deuxième plan à Katharine Hepburn, on oublie tout de suite la fiancée.
Le changement d’échelle pour le quatrième plan de Katharine Hepburn dévoile le fameux léopard, l’effet est assez comique. Les plans sur Katharine Hepburn sont très longs, elle parle beaucoup au téléphone, bien plus que Cary Grant. A partir de la chute de Katharine Hepburn, Cary Grant se lève, inquiet, alors qu’avec la fiancée, il était assis coincé et s’était levé pour ouvrir le facteur. Le spectateur sent donc bien une véritable osmose entre les deux personnages. Le processus d’envoûtement de Katharine Hepburn fonctionne bien puisqu’il séduit totalement Cary Grant. Howard Hawks joue ensuite avec le son. Nous voyons certes l’image mais à cause du téléphone, les deux personnages n’ont que le son. Le téléphone, ici, joue sur les sons pour envoûter Cary Grant. Il se déplace et tombe à cause du téléphone, comme elle, à gauche. Le téléphone dans cette scène est donc cruciale puisqu’il permet de rendre véritablement la scène comique, de poser des clivages ainsi que des rapprochements. L’impossible monsieur Bébé, Howard Hawks
sommaire

'Very Bad Trip, Todd Phillips'
La scène d’ouverture du film est très intéressante. la couleur blanche prédominante ainsi que les fleurs, dès le premier plan, indiquent la préparation du mariage. Le travelling circulaire apporte de la douceur et la chanson romantique un certain lyrisme. Les deux premières scènes montrent donc une impression de contrôle. Le son du téléphone dérange tout de même ce cocon. On remarque que le répondeur de Doug est plutôt fade, stéréotype. Le répondeur du dentiste, lui, est bien plus original. On a donc déjà des clivages grâce au téléphone, avant même qu’il apparaisse. L’accumulation des messageries accroit le suspense, une petite panique se créée. Tracy est en peignoir blanc, placée à droite de l’écran, la famille se situe en arrière plan, la droite évoque donc le mariage et les festivités. Phil est en noir placé à droite, l’arrière plan constitué d’un désert annonce l’histoire à venir. On remarque aussi bien évidemment l’emploi d’une caméra stable pour elle alors que pour lui, Phillips choisit logiquement une caméra à l’épaule. Cette scène est assez classique et ne propose rien d’innovant mais la conversation téléphonique permet de poser clairement le clivage entre deux univers.

sommaire


'Journal intime, Nanni Moretti'
L’île aux enfants est une scène très intéressante, dans lequel le téléphone et les conversations téléphoniques permettent encore une nouvelle fois d’opposer des personnage, cette fois-ci de manière plus originale et insolite. On remarque, lors de la première conversation téléphonique, que les taches rouges dans l’arrière plan du plan avec l’adulte renvoient au vase rouge du plan avec l’enfant. Il y a donc une forme de symétrie entre les deux univers qui se ressemblent fortement, cependant c’est bien le téléphone qui diffère par rapport aux deux mondes. Alors que le téléphone de l’adulte est une grande cabine rouge, celui de l’enfant est totalement noir et aussi bien plus petit, à l’image de l’enfant. Malgré la différence de taille, ici, c’est bien l’enfant qui possède le pouvoir. L’enfant maîtrise la situation et mène la danse dans cette île. Les adultes qui appellent sont prisonniers du téléphone, isolés. Les enfants, chez eux, sont libres. L’enchainement des trois plans sur les adultes montrent que le cas est généralisé et concerne tout le monde. Le travelling final de cette scène dévoile une confusion générale.
Veuillez cliquer sur ce lien pour visionner la scène sur Vodkaster.

sommaire

'Taxi Driver, Martin Scorsese'
La dernière scène de ce groupement est celle de la conversation téléphonique de Robert De Niro dans Taxi Driver. Il est bloqué à droite du cadre, ce qui contribue à une atmosphère d’oppression, il y a peu d’espace. Martin Scorsese fait le choix crucial de cacher son visage avec le combiné et sa main, toute l’émotion dans cette scène passe par le corps et la voix. L’absence de voix vocodée contribue également à la solitude du personnage, Robert De Niro est seul, livré à lui-même en quelque sorte. La caméra stable permet de se focaliser entièrement sur lui et ce qu’il dit. Malheureusement, l’humiliation est progressive : il propose d’abord à Betsy de l’inviter au restaurant, puis de prendre un café puis enfin, de lui offrir des fleurs. La couleur de son blouson se noie dans la saleté du mur, le personnage commence à être dégradé. L’effacement de l’acteur est progressif, au profit d’un couloir, seul chemin qui annonce sa sortie. La fille largue Travis et nous aussi à cause du travelling sur ce couloir. Le plan est aussi bien entendu symbolique puisqu’il traduit toute la solitude du personnage. Dans cette scène, Martin Scorsese utilise donc le téléphone pour renforcer la solitude du personnage ainsi que sa dégradation.

sommaire

La cabine téléphonique à vent
Arami Ullón, est accompagnée dans son projet par le créateur du « téléphone à vent », Itaru Sasaki.
Il s’agit d’un téléphone qui n’est relié à rien, et pourtant, des milliers de personnes l’utilisent pour appeler leurs morts. Ces cabines téléphoniques apparues par centaines aux quatre coins du monde pendant la pandémie et les conversations imaginaires qu’elles permettent ont aidé beaucoup de gens à faire leur travail de deuil.
Le film et l’enquête qu’elle mène pour ce faire sur « le téléphone à vent », trouvent leur raison d’être dans un questionnement personnel : quels sont les outils utilisés par ceux qui, pour une raison ou une autre, n’ont pas la même manière d’aborder le deuil que la collectivité dans laquelle ils vivent ?

sommaire

'Le Crime était presque parfait'
Alfred Hitchcock, le maître absolu du suspense ne s’y est pas trompé en 1954.
Les premières images du film se focalisent sur un téléphone qui, s’il n’est pas l’arme du crime à proprement parler, en est la pierre angulaire. Tony, mari trompé et sans le sou, met en scène le meurtre de sa femme Margot. Connaissant ses habitudes, il sait qu’elle se postera dos à la fenêtre en répondant à son coup de fil, offrant au spadassin de fortune qu’il a engagé un angle d’attaque idéal.
Mettant à exécution son dessein, il est aux premières loges acoustiques de l’assassinat, à la fois témoin et instigateur qui jouit de son crime. Cet usage du téléphone n’a de sens qu’avec un filaire. L’époque ne pouvait évidemment pas offrir d’autres possibilités mais quand en 1998, Andrew Davis réalise Meurtre parfait (relecture insipide du chef d’œuvre d’Hitchcock), il garde l’idée du poste fixe.
L’immobilité que confère le téléphone à fil au personnage, crée une tension, un angle statique d’autant plus visible qu’il répond aux mouvements de l’assassin en arrière-plan. Ces plans rappellent que la dynamique d’une scène peut reposer sur une profondeur de champ construite, même si certains éléments y sont figés, et pas uniquement sur une suite de déplacements du personnage.

sommaire

'Terreur sur la ligne' (When a Stranger Calls)
En 1979, Terreur sur la ligne (When a Stranger Calls) met en scène l’archétype de la victime des horror movies: la baby-sitter. Jouant une fois encore sur l’ubiquité inhérente au téléphone, le film s’amuse à prendre le contrepied de l’idée de distance. Une jeune étudiante, en pleine séance de baby-sitting est harcelée au téléphone par un maniaque. Pensant être à l’abri en s’enfermant à double tour, elle découvre bientôt que le psychopathe n’est pas si loin... Habilement orchestrées, les vingt premières minutes du film (les seules qui vaillent le détour) déstabilisent le public. Habitués à l’adage «qui dit téléphone dit loin», les spectateurs sursautent quand la menace téléphonique prend corps à proximité. Placer l’ennemi au plus près de sa proie, alors que l’usage du téléphone implique l’impression inconsciente d’éloignement, surprend et attise grandement la tension dramatique.

sommaire

'Phone Game'

Objet dérivé du téléphone mais hybride, entre fixité et mouvement, la cabine téléphonique, malgré sa quasi disparition des trottoirs, inspire à Joël Schumacher Phone Game en 2002. Obligeant le réalisateur à se focaliser sur un lieu unique (le critère de base du huis clos), la cabine téléphonique répond par son immobilisme à l’émergence phénoménale du portable et à son itinérance. Deux mondes se font face: l’archaïque et le moderne. Bien que le dispositif exigerait un film-séquence autour de la cabine (pour capter l’emprisonnement physique du personnage pendu à son combiné), Schumacher multiplie les split-screens d’actions se déroulant ailleurs, dénaturant les enjeux de réalisation de son film. Noyée sous des mouvements incessants de caméra, Phone Game échoue à construire une narration de l’inertie, ce que parviendra à faire quelques années plus tard Rodrigo Cortes.

sommaire

Mais ne coupons pas le fil trop vite…
En 1997, Wes Craven réalise 'Scream', un abécédaire du film de genre où le téléphone tient le rôle-titre. Hommage et déconstruction sont à l’œuvre dans ce petit bijou horrifique qui a intégré les évolutions technologiques des dernières années. Sus aux postes ombilicaux, les téléphones sont désormais sans fil et les portables pointent le bout de leurs antennes. Il n’en faut pas plus à Craven pour dynamiter les règles spatiales du film d’horreur. Plus de contrainte de mouvement: les personnages peuvent vaquer à leurs occupations tout en passant des coups de fil. Plus de notion de distance et de point d’ancrage: le portable délocalise le tueur à l’envi. Et tous les cas de figure sont étudiés et utilisés par le réalisateur. La réception parasitée lorsqu’on s’éloigne trop de la borne fixe du sans fil, obligeant le personnage à demeurer dans un périmètre circonscrit. La fonction haut-parleur qui amplifie les gémissements de la victime. La géolocalisation du portable qui innocente ou accable selon le cas. Et dans les nombreuses suites, les nouvelles fonctionnalités seront ajoutées aux scénarii (la présentation du numéro dans Scream 2 ou les vidéos et SMS dans le quatrième volet).
Au-delà de l’aspect ludique qu’il y a à s’amuser avec les technologies qui nous entourent, la saga Scream prouve surtout la réactivité du cinéma à intégrer des formes de narration inédites. Tourneboulant les modèles cinématographiques établis (la distance entre émetteur et récepteur, immobilisme du fixe face à insituabilité du portable…), les avancées technologiques du téléphone permettent des constructions scénaristiques originales, des situations impossibles quelques années auparavant, une véritable révolution dramaturgique.

sommaire

Pas une conversation téléphonique ne commence aujourd’hui sans cette fameuse interrogation.
Le portable ayant brouillé les pistes du dehors et du dedans, la question de la localisation dans l’espace est devenue l’enjeu majeur de nos interactions. Aubaine absolue pour le septième art qui cherche à abolir les règles pour renouveler son langage, le portable a toutefois fait une entrée fracassante non pas au cinéma mais sur le petit écran.

En 2001, l ‘agent les plus testostéroné de Los Angeles, Jack Bauer, fait son apparition sur Fox dans la série 24. Pas une séquence sans que le bonhomme ne soit pendu à son téléphone. Mais cet usage, outre le fait d’ancrer le récit dans le quotidien du nouveau millénaire, offre surtout des possibilités infinies d’investigation. Jack peut ainsi faire avancer son enquête à la minute grâce aux informations qui lui parviennent en temps réel. Le portable se révèle donc l’outil en adéquation parfaite avec le parti-pris temporel de 24, même si la notion de réalisme est quant à elle totalement piétinée (on se demande toujours quelle batterie utilise Bauer pour tchatcher pendant des plombes). Le travail sur le terrain (portable) est privilégié, au détriment des gratte-papiers du bureau (téléphone fixe).
Symbolisant l’action, l’hyperactivité (donc implicitement l’efficacité), le portable se veut l’accessoire du mâle dominant, une sorte d’arme moderne, celle de la communication. Véritable phénomène de société, 24 a ouvert la voie aux films en temps réel, qui grâce à l’invention du téléphone portable ont trouvé un ressort dramatique inattendu.

sommaire

Réaliser un film en temps réel et en huis clos dans une boîte, avec un briquet et un portable, il fallait oser. C’est le challenge de Buried du metteur en scène espagnol Rodrigo Cortes. Alors que le protagoniste est coincé six pieds sous terre dans un cercueil, son unique espoir et son lien avec l’extérieur résident dans son téléphone portable.
Reprenant ainsi le postulat de mettre en scène l’inertie (un peu comme Phone Game mais en réussi), Buried recrée un monde par l’entremise des discussions tenues par le héros. Chaque conversation téléphonique symbolise un type de scènes que le public reconnaît (le conflit professionnel, le drame familial…) et dont il recompose l’image manquante. Le son fonctionne alors sur le modèle du déjà-vu: le déjà-entendu.

sommaire

Rarement un accessoire aura à ce point fait évoluer la grammaire cinématographique et rendu obsolète les métrages antérieurs.
Demanderait-on encore Mr Kaplan au téléphone dans La Mort aux trousses alors que de nos jours chacun a son portable ?
Les filles de Girl 6 de Spike Lee auraient-elles encore du boulot dans le téléphone rose avec l’explosion du net ?
Autant de films dont le récit et la mise en scène seraient différents aujourd’hui.
Finalement, pour inventer le cinéma de demain, peut-être suffit-il d’observer votre téléphone…

Le cinéma avait prédit l’apparition de l’appel vidéo dans Metropolis, de Fritz Lang, paru en 1927. Dans ce film, " il y avait un vidéophone, c’est-à-dire qu’au mur, on voyait la personne à qui on parlait avec un énorme téléphone .

sommaire

Allo, j'écoute ! - Liste de 79 films
S'il est banal de voir les personnages d'un film utiliser le téléphone, il arrive que les échanges téléphoniques soient au centre de l'action, voire ...

sommaire

LES COMMUNICATIONS TELEPHONIQUES AU CINEMA


EXPERIMENTATIONS AUDIOVISUELLES INTERACTIVES,

REMARQUABLE MEMOIRE DE FIN D’ETUDES-MASTER 2 Par Elton RABINEAU en 2012

Dans tous les styles de films, le téléphone est un outil qui permet aux scénaristes de créer des situations narratives spécifiques : menaces, relations amoureuses, écoutes téléphoniques par exemple. La présence de deux personnes qui se parlent et s’écoutent à distance et en simultané offre aux réalisateurs et aux monteurs de nombreuses possibilités de montage. Ils ont par exemple le choix de montrer un seul interlocuteur, de montrer les deux, de montrer seulement celui qui parle ou seulement celui qui écoute, et encore beaucoup d’autres solutions.
Michel Chion
( voir sa biographie ), a proposé une classification (ou typologie) de ces combinaisons audiovisuelles qu’il appelle téléphèmes. Nous proposons dans ce mémoire une typologie étendue basée sur le dénombrement logique des combinaisons, permettant au total d’en obtenir 83. Ensuite nous proposons un logiciel de montage interactif des sons et des images téléphoniques (Le LaBoPhone) qui explore ces 83 typologies audiovisuelles.
Nous avons imaginé une intrigue téléphonique spécialement adaptée pour le logiciel interactif.

INTRODUCTION
Le cinéma est avant tout affaire de transmissions : transmissions d’histoires, transmissions d’émotions par le biais d’un media qui transcende les époques et les distances.
La téléphonie et le cinéma ont été, bien que dans des domaines distincts, de grands facteurs de bouleversements techniques et sociologiques du XXe siècle. Leur naissance presque contemporaine n’aura fait que les entremêler.
Le cinéma, moyen d’expression tout nouveau au début du XXe siècle, cherche des contenus : il s’approprie d’abord les standards culturels de l’époque (vaudevilles, romans, imaginaire poétique, etc). Dans un second temps le cinéma s’avère être un outil efficace de dérision face aux mœurs et à la société alors en pleine mutation. C’est dans cet espace que le téléphone, un objet qui a changé notre façon de communiquer, a très vite été pris comme un objet essentiel au cinéma pour dépeindre cette nouvelle société du XXe siècle. Dès les premiers temps du cinéma muet, la mise en parallèle de deux interlocuteurs au téléphone, bien que sans paroles, met en évidence les différences et les similitudes des gestes et des caractères
des personnages.
Il faut dire qu’en plus d’être un objet de société offrant à la caméra toutes les possibilités d’immersion et de dérision, le téléphone, par son mode de représentation à distance, ressemble au cinéma. Les deux inventions ne sont pas simplement contemporaines, elle sont aussi sous certains aspects similaires. Au téléphone comme dans les films, la voix qui transite à travers un dispositif éléctro-acoustique, a le pouvoir de nous rapprocher symboliquement de ceux qui sont loin. Dans le cas du cinéma, l’abrogation des distances conduit le spectateur à s’identifier psychologiquement aux personnages et à s'éloigner virtuellement de la salle de cinéma dans laquelle il se trouve. Dans le cas du téléphone, la voix qui nous parvient nous permet d’être « à deux endroits à la fois » : être ici, et par projection, avec la personne que l’on entend à travers le combiné mais que l’on ne voit pas.
Dans le cas des séquences de conversation téléphonique filmée, il y a deux façons de traiter la voix des interlocuteurs : soit en considérant le point d’écoute à proximité physique de celui qui parle, soit en considérant le point d’écoute à proximité physique de celui qui écoute. Celui qui écoute reçoit dans son combiné téléphonique un signal sonore déformé par la télécommunication : nous utiliserons le terme de son « filtré » ; c’est un son qui vient de loin. Dans ce cas particulier, le signal sonore est à la fois une voix et un effet puisqu’il transmet la parole et y ajoute les informations propres à la communication téléphonique.
Enfin et c’est peut être là son enjeu principal, la présence du téléphone au cinéma pose la question fondamentale de la représentation d’une matière exclusivement sonore (la conversation téléphonique) par un média qui combine lui, sons et images. L’écoute seule a le pouvoir de créer des images mentales. Robert Bresson l’explique : « L’œil superficiel, l’oreille profonde et inventive. Le sifflement d’une locomotive imprime en nous la vision de toute une gare». Mais quand un film montre une personne qui écoute, et que le spectateur écoute à travers ses oreilles, les images qui nous sont montrées sont-elles en contradiction avec nos images mentales ? Nos images sont-elles entièrement faussées parce que nous voyons ? La transposition de la forme sonore à la forme audiovisuelle renvoie à la question de l’union sacrée de la bande-son et de l’image qui est à la base du cinéma et plus particulièrement depuis que celui-ci est devenu parlant.
Dans la pratique filmique, l’union du son et de l’image accouche d’une construction polymorphe. Et c’est à cause de cinq dualités fondatrices que la possibilité est donnée aux réalisateurs d’accentuer les comportements associés ou antagonistes des personnages : dualité d’individualité, dualité d’espace, dualité entre son et image, dualité entre parole et écoute, dualité entre son lointain et son proche. La combinaison de ces dualités caractéristiques de la conversation filmée fait de chaque film un cas particulier : voir un seul interlocuteur, voir les deux interlocuteurs, ne voir que celui qui parle, ne voir que celui qui écoute, voir les deux en même temps... Il y a d’autres cas encore, et en nombre.
Pour pouvoir analyser les intentions véhiculées par ces différentes formes, Michel Chion a proposé un système de classification qu’il appelle une typologie des téléphèmes.
Nous nous proposerons d’étudier cette typologie et de la développer. Dans la continuité, nous proposerons un logiciel interactif qui permettra à un spectateur de choisir via une interface le cas de figure qu’il souhaite voir s’appliquer dans une salle de cinéma pendant qu’il visionne un film. L’interaction étant le premier principe de la communication téléphonique, il était naturel de s’en servir pour donner à un spectateur l’occasion d’explorer sa représentation par la voie cinématographique.
Cette exploration, qui revient à endosser le rôle de monteur questionne le la place du spectateur dans le cinéma traditionnel, a-t-il le pouvoir d’imaginer des images et des sons autres que ceux qui lui sont proposés ? Et dans le cinéma interactif, le spectateur peut il modifier le récit filmique par d’autres moyens que la destinée des personnages ? Le choix du point de vue et du point d’écoute peut il influer sur l’histoire ?
Lors des conversations téléphoniques filmées, de quelle manière le spectateur peut il prendre le contrôle de cadres et des points d’écoute au sein d’une classification établie ?

Le but de ce mémoire n’est pas une analyse en bonne et due forme de la construction des conversations téléphoniques ni des ressorts dramatiques offerts par le téléphone ; il s’agit d’une exploration teintée de créativité et de pragmatisme au sein des modes audiovisuels utilisés dans les séquences téléphoniques. Cette exploration conduira à la conception et à la réalisation d’une expérience audiovisuelle interactive.
Dans une première partie nous verrons le trajet de la voix depuis sa production acoustique jusqu’à son émission par le haut-parleur du téléphone. Ce sera une partie à composante technique dans laquelle nous verrons tous les éléments sonores de la téléphonie enclins à nous aider à reconstruire une séquence de conversation téléphonique dans un film.
La seconde partie de ce mémoire sera l’occasion d’observer la façon dont le téléphone est utilisé comme un outil dans l’écriture des histoires des scénarios.
Dans la troisième partie, nous prendrons pour acquise la construction narrative d’un film et nous verrons de quelle manière les sons et les images peuvent s’articuler et s’imbriquer. Nous verrons en détail la typologie des téléphèmes proposée par M.Chion pour classifier des combinaisons. Par la suite, nous proposerons une typologie étendue qui a mis au jour 83 cas par dénombrement logique.
Les quatrième et cinquième parties seront consacrées à l’exploration des cas de figures énoncés dans la troisième partie à travers la description du fonctionnement d’un logiciel interactif (le LaBoPhone) et de la conception d’un film qui lui est dédié. La quatrième partie aura préalablement permis de mettre au jour les fondements et les pratiques du cinéma interactif.

sommaire

RAPPEL de la CONSTRUCTION ET de la RECONSTRUCTION DES COMMUNICATIONS TELEPHONIQUES
(largement expliquée sur ce site)

A. Construction d’une communication téléphonique
Pour commencer, nous allons décrire d’un point de vue technique comment les conversations téléphoniques sont construites aussi bien les étapes protocolaires de l’appel que par les différentes sources sonores qui constituent le champ sonore de la téléphonie : la voix, la voix filtrée, les sonneries, les tonalités, les numérotations.
1. Au départ il y a la voix
a. Le Fonctionnement du système phonatoire
En médecine, la voix est appelée le système phonatoire. Il comprend 3 parties fonctionnelles que sont la soufflerie qui produit un influx d’air, un oscillateur au niveau du larynx, et des résonateurs qui permettent l’amplification des sons et leur modification.
La réserve d’air utile à l’émission d’un son est contenue dans les poumons, ceux-ci se chargent et se déchargent en air par des contractions du diaphragme et des muscles intercostaux.
’oscillateur est lui, une partie complexe du système phonatoire, il est principalement constitué de 2 cordes vocales aussi appelées les plis vocaux. Les cordes vocales sont deux membranes muqueuses de couleur blanchâtre qui vibrent au contact de l’air venu des poumons. Les deux cordes vocales agissent comme une mâchoire pour bloquer ou relâcher le flux d’air. Les deux cordes vocales peuvent vibrer seules ou en contact. D’autres cordes vocales de moindre importance appelées « fausses cordes vocales » ont par exemple un rôle dans la voix extrêmement grave des chants tibétains ou des cris gutturaux du « death metal ».
La vibration en régime permanent du système de cordes vocales imprime une fréquence sonore dépendante, selon les individus, des dimensions des cordes vocales, de leur tension et des dimensions de la trachée apporte l’air venu des poumons. Cette fréquence est appelée fréquence fondamentale de la voix c’est une caractéristique du timbre de la voix d’un individu. La fréquence fondamentale est la plus « forte » mais elle n’est unique, elle est ccompagnée de nombreuses fréquences harmoniques qui fait du son produit par les cordes vocales, un son spectralement large.
Chez les hommes, les cordes vocales mesurent entre 15 mm et 25 mm pour une fréquence fondamentale qui est en moyenne de 125 Hz. Chez les femmes, les cordes vocales mesurent entre 8 mm et 17 mm, pour une fréquence fondamentale qui est en moyenne de 210 Hz. Chez les enfants la fréquence fondamentale est généralement supérieure aux 300 Hz.
Enfin viennent les organes qui ont le rôle de l’amplification des sons et de leur modification : les cavités buccales et nasales. Ils sont à l’origine des éléments qui constituent le langage.
b. La création des sons du langage
Les joues, la langue et la mâchoire par leurs mouvements incessants, modifient les dimensions de la cavité résonnante et privilégient donc certaines fréquences selon le modèle acoustique des ondes stationnaires. Certains sons de la voix n’utilisent pas la vibration des cordes vocales mais uniquement la modification du débit d’air par des organes qui sont en aval (cas du « s » qui est une sifflante sans timbrage vocal)
Pour chaque son vocal produit, la répartition de l’énergie sonore selon les fréquences de l’audible (environ 20 Hz - 20 kHz) constitue un formant qui est en quelque sorte sa carte d’identité.
Les consonnes et les voyelles sont des cas particuliers parmi tous les sons de la voix, ils constituent les phonèmes qui se définissent comme étant les plus petites unités de langage.
L’Alphabet Phonétique International (API) a défini les spécifications physiologiques de tous ces éléments, avec notamment les fréquences centrales de leurs formants. Les voyelles utilisent nécessairement la vibration des cordes vocales (l'étymologie ne trompe pas : «Voyelle » vient de « Voix ») .
Parmi les phonèmes, il existe aussi les consonnes ; elles sont produites par un flux d’air venu des poumons qui est retenu puis relâché, ou freiné. Ces opérations d’occlusion ou de constriction de l’air sont réalisées par différents organes du système phonatoire : par exemple les lèvres pour les consonnes labiales (« b »), les lèvres et les dents pour les consonnes labio-dentales (« f », « v »). La plupart sont dites voisées, c’est-à-dire que les cordes vocales vibrent, mais cela n’est pas systématique. L’API prévoit une nomenclature très précise des phonèmes en fonction de la façon dont ils sont produits (labiales, dentales, nasales, fricatives, occlusives, etc).
Chez les ingénieurs du son, les consonnes plosives (ou occlusives) sont bien connues puisqu’elles ont la particularité d’être très mal captées par les microphones à gradient de pression. Les consonnes plosives (« p », « b ») sont des consonnes pour lesquelles il y a un blocage total du flux d’air puis un relâchement soudain qui fait l’effet d’une bourrasque de vent pour une membrane de microphone. Pour éviter cela, on utilise des filtres anti-pop (littéralement « anti coups secs») qui jouent le rôle de « coupe-vent ». La difficulté est de ne pas trop altérer la voix à enregistrer avec ce procédé. Dans le cas des appels téléphoniques, les micros n’étant pas munis de filtres anti-pop efficaces, il arrive bien souvent que les plosives soient mal captées et qu’elles soient mal perçues par l’interlocuteur. On notera qu’il est souvent difficile de distinguer les « p » et les « b » dans les conversations téléphoniques.
Nous avons vu que la voix parlée par son fonctionnement même, réalise une opération de filtrage sur la fréquence initiale de la voix. La notion de filtrage qui apparait ici, sera un fil conducteur tout au long de ce travail. De manière générale, dès lors qu’il y a une communication, il y a une modification de la matière que ce soit par ajout de matière non désirée (bruit) ou par dégradation volontaire ou utile, dont le filtrage fait partie.
a. Tonalité d’invitation à numéroter ( dial tone )
Il existe deux notes de tonalité d’invitation à numéroter selon que le téléphone est naturellement connecté à un centre de transit grand public ou à un centre de transit privé tels qu’on peut les trouver dans les entreprises ou dans les institutions (serveur interne) :
- Une fréquence de 440 Hz (La3) pour les tonalités vers un centre public.
- Une fréquence de 330 Hz (Mi3) pour les tonalités vers un serveur interne.
Pour passer un appel vers l’extérieur (réseau public) il faudra commencer le numéro par un « 0 » qui aura pour conséquence de basculer la tonalité sur un La3, avec au passage une belle quarte téléphonique pour les mélomanes.

Cadencements et fréquences des tonalités d’invitation à numéroter selon les pays
Pays --- Fréquence --- Cadencement --- Niveau
France 440 Hz ( ou 330 Hz) continu -3.5 dBm 0
USA 350 Hz + 440 Hz continu
GB 350 Hz + 440 Hz continu -20 dBm0 / -23 dBm 0

c. Tonalité de retour d'appel (ringtone back)
Une tonalité de retour d'appel est le signal sonore entendu sur une ligne téléphonique par la personne qui appelle en attendant que son correspondant décroche. Cela confirme que le correspondant est alerté de son appel (la sonnerie de son téléphone retentit).
La cadence à laquelle la tonalité de retour d'appel est émise est généralement la même que pour la sonnerie chez l'appelé, mais la plupart du temps avec un décalage temporel.

Cadencements et fréquences des tonalités de retour d’appel selon les pays
Pays --- Fréquences --- Cadencement ---Niveau
France 440 Hz 1.5 s ON / 3.5 s OFF -8 dBm0
USA 440 Hz + 480 Hz 2 s ON / 4 s OFF N/C
GB 400 Hz + 460 Hz 0.4 s ON / 0.2 OFF/ 0.4s
ON 2 s OFF -20 dBm 0

d. Tonalité d’occupation (busy signal)
Elle indique que le correspondant est déjà en communication avec une personne. Quand le combiné du correspondant est décroché, c’est une tonalité de faux appel qui a les mêmes caractéristiques que la tonalité d’occupation bien les telecoms puissent faire la différene. On le voit souvent dans les films.
En France 440 Hz, 0.5 s ON / 0.5 s OFF, -8 dBm0

sommaire

2. Théories des télécommunications et de l’information
a. La nature des transmissions
Lorsqu’il s’agit de transmettre des informations10 à distance, plusieurs cas peuvent se présenter :
- Une liaison point à point entre un émetteur et un récepteur (téléphonie)
- Une diffusion à partir d’un émetteur vers plusieurs récepteurs (radio/télédiffusion) .
Une liaison sonore est dite « full-duplex » lorsque les deux correspondants peuvent entendre et être entendus en simultané (ou « vus » si c’est une liaison vidéo)
• Une liaison sonore est dite « half-duplex » lorsque les deux correspondants peuvent entendre et être entendus, mais pas simultanément. C’est typiquement le cas des talkies-walkies où on ne peut pas entendre quand on parle.
Par définition une diffusion est « simplex », c’est-à-dire que l’information ne va que dans un seul sens. Le media de transmission de l’information (câbles, fibres optiques, ondes Hertziennes, satellites) est appelé le canal de transmission. Le passage de l’information dans le canal de transmission nécessite une opération de conversion préalable qui s’appelle le codage de canal. Cette opération consiste soit à transmettre simultanément plusieurs signaux informatifs sur un seul canal (multiplexage) soit à adapter une information au canal de transmission (Modulations d’amplitude, de fréquence et de phase)
La téléphonie telle que nous la connaissons repose sur les technologies de téléphonie fixe développées depuis son invention à la fin du XIXe siècle. Le fonctionnement du téléphone fixe est régi en France par la norme TBR2111 de 1998, nous allons en tirer les grands principes de fonctionnement. Cela permettra d’avoir un état des lieux des éléments qui peuvent être manipulés au sein des films.
b. Les réseaux téléphoniques et Internet
Le Réseau Téléphonique Commuté12 (RTC) repose sur le principe de connexion physique entre le canal d’un appelant et le canal d’un appelé. Autrefois la commutation était réalisée à la main par des opératrices (« les demoiselles du téléphone »), maintenant cela est automatisé dans des centres de commutation, hiérarchisés par zones. En France, la communication via un standard à commutation manuelle a disparu depuis le milieu des années 70. La liaison entre deux personnes d’une même région géographique passe par un Commutateur à Autonomie d’Acheminement (CAA). Pour un appel inter-régional, un centre de transit relie deux CAA.
Pour un appel international, la commutation est réalisée dans un des trois centre de transits Internationaux français.
Le téléphone numérique et Internet utilisent de la même manière des lignes téléphoniques qui passent par des centres de transit. Les ordinateurs utilisent des modems pour adapter les données informatiques au réseau téléphonique. Il n’ y a pas de « magie de l’internet » comme certains pourraient le croire. Faire une recherche sur Google ce n’est ni plus ni moins qu’envoyer une requête codée à travers des câbles pour atteindre un serveur situé aux USA, qui renverra à son tour un code... On aurait tendance à l’oublier mais les bits traversent bien l'atlantique chaque fois que l’on va sur un site hébergé aux USA ! D’ailleurs il est intéressant de constater que Lannion en Bretagne, ville historique des radiocommunications, est aujourd’hui un grand centre stratégique mondial, et pour cause :
c’est là d’où partent la majorité des câbles de télécommunications sous-marins qui relient l'Amérique du Nord à l’Europe.

3. Le protocole d’appel
a. Opérations de mise en relation avec un correspondant
Avant que deux téléphones soient mis en relation, il y a une série d’opérations de réseau qui structure l’ensemble des communications téléphoniques. Nous les pratiquons au quotidien sans même y penser. Nous avons jugé bon de les rappeler et de les détailler. Toute la
description qui va suivre, pourra servir de référence pour situer les actions des personnages de films dans le processus d’appel téléphonique et éventuellement de respecter les normes en vigueur dans un pays ou à une époque donnée.
Etudions maintenant phase par phase les implications contextuelles et sonores de ce schéma et pour commencer ce qu’il est nécessaire de disposer avant de passer un appel : le numéro de téléphone.
b. Petite histoire des numéros de téléphone
Le numéro de téléphone est un code qui permet lors de la numérotation de s’adresser aux différents commutateurs qui nous mettrons en relation avec la personne souhaitée. Avec ce système à 10 chiffres adopté depuis 1996, il y a 300 millions de numéros possibles (sans compter les numéros en 09 dédiés aux concurrents de France Télécom). L’obligation de numéros à 8 chiffres a été en vigueur de 1985 à 1996.
En 2010, pour palier à l’insuffisance des 100 millions de numéros de portable commençant par 06, un 07 a été ajouté. La course aux chiffres ne semble pas devoir se terminer de sitôt puisque l’ARCEP, l’autorité régulatrice du plan de numérotation français qui avait d’abord estimé que les 07 suffiraient pour 10 ans, a revu leur estimation à 4 ans. Cela s’explique par l’essor récent des communications M2M15. D’ici à 2014, il est prévu que nous passions directement à 14 chiffres pour les téléphones portables.
c. Les différents types de numérotation
La Numérotation décimale par impulsions
A l’époque des téléphones à cadran rotatif, le numéro à appeler était codé par des impulsions électriques de durées différentes selon la position du nombre sur le disque. Ainsi pour coder un « 1 », il y avait 100 ms d’impulsions, un « 2 » 200ms et jusqu’à une 1s pour le « 0 ». Entre chaque il fallait attendre 200 ms soit au total une bonne vingtaine de seconde pour composer un numéro ! Ce système peut encore fonctionner sur les lignes mais il est complètement désuet.
Numérotation par fréquence vocale ou DTMF ( Dual Tone Multi Frequency )
Le DTMF est le procédé de numérotation bien connu qui joue une « mélodie » lorsqu’on tape sur les touches du combiné. C’est un codage de canal normalisé qui consiste à envoyer sur le réseau un signal électrique de fréquence compris entre 300 Hz et 3400 Hz. A chaque sur la touche, la fréquence est jouée. Le problème qui s’est posé lors de la conception de ce procédé est que le microphone de combiné étant actif lors de la numérotation, il se pouvait qu’une fréquence présente dans l’environnement extérieur vienne polluer le codage (par exemple quelqu’un siffle une note à la bonne fréquence juste à coté du téléphone). Pour remédier à cela, chaque nombre a été codé par une combinaison de 2 fréquences que l’on juge impossible à exister naturellement dans le milieu extérieur (les fréquences ne sont pas premières entre elles). De plus, lors d’un appui erroné sur 2 touches en même temps, il est impossible que la somme ou la différence des deux fréquences fabrique16 la fréquence d’une
autre touche. Sur le clavier du téléphone, en appuyant sur une touche, on émet les deux tonalités correspondant à l’intersection de l’axe horizontal et de l’axe vertical.
Exemple : lorsqu’on appuie sur la touche 5 du combiné, on entend un mélange 770 Hz et 1336 Hz et un signal électrique composé de ces fréquences est envoyé au centre de transit.

4. Caractéristiques techniques des tonalités
Dans les films on entend souvent des tonalités qui correspondent à des moments où les personnages attendent une réponse de leur correspondant. Nous allons voir comment sont fabriqués ces différentes tonalités selon les pays, puisqu’il n’y a pas de normalisation à l’échelle mondiale. Cette section pourra notamment intéresser les monteurs son désireux de reproduire avec réalisme des séquences d’appels téléphoniques.
Les caractéristiques techniques des tonalités sur le réseau France Télécom sont données selon un document : « Spécifications techniques d’interface : sonneries, tonalités et numérotation sur les ligne téléphoniques analogiques» Elle sert de cahier des charges aux constructeurs de téléphones. Les données pour les pays étrangers ont été trouvées sur Wikipédia où les tolérances n’étaient pas indiquées. Pour ce qui est de la France, voici les tolérances données par France Télécom.
- Les fréquences sont données à +/- 2 Hz
- Les cadencements sont donnés à +/- 10 %
- La distorsion globale due à chaque fréquence est inférieur à 1,5 %
- Les 2 premiers harmoniques de chaque fréquence ont une distorsion inférieure à 1 %
- Les niveaux d’émission sont donnés à +/- 0.5 dBm0

5. Caractéristiques techniques des sonneries
a. Le cadencement des sonneries
Les postes reçoivent en permanence une tension continue de 48 V depuis le centre de transit.
Pour activer la sonnerie, le centre envoie en superposition un signal sinusoïdal de fréquence 50 Hz et de tension de 50 à 80 V efficaces par cadences de 2 secondes suivies par 4 secondes de silence. En général ces boucles durent pendant 1 minute si personne ne décroche soit
environ 10 boucles au total. Pour les téléphones dont les sonneries sont personnalisables,
l’appareil récupère le front montant de la cadence et lance sa sonnerie intrinsèque, il est parfois possible de régler le nombre de boucles avant l’extinction de la sonnerie.
Sur les anciens téléphones, la tension de 80 V à 50 Hz alimentait un moteur grâce auquel un «marteau » venait percuter une cloche. Maintenant c’est un haut-parleur indépendant du haut-parleur d’écoute qui génère la sonnerie.
En France et USA, 2 s ON / 4 s OFF .
b. Le niveau des sonneries
Dans la suite nous utiliserons les niveaux sonores en décibels pondérés avec la courbe A (dB(A)) qui sont des niveaux sonores prenant en compte la courbe de réponse du système auditif humain aux faibles niveaux. Dans un environnement courant la sonnerie du téléphone est perçue aux alentours de 70 dB(A) selon l’endroit où on se trouve dans l’espace, un niveau sonore suffisamment fort pour couvrir la voix (qui est environ de 50 dB(A) pour une discussion entre deux personnes séparées d’un mètre. Ce niveau permet à la sonnerie de se répandre dans un espace domestique classique (entre 30 m2 et 200 m2) sans qu’il soit noyé dans le bruit de fond ambiant qui peut culminer dans les villes à un maximum de 45 dB(A).
c. Les différents types de sonnerie
L’arrivée des téléphones mobiles a été accompagnée de la personnalisation des sonneries, ainsi elles sont devenues non seulement des signaux d’alerte mais aussi un moyen de montrer ses goûts musicaux, son humour et par là dévoiler une part de son identité. Cette tendance s’est aussi étendue aux téléphones fixes. Le signal d’alerte téléphonique s’est agrémenté depuis quelques années du mode vibreur proposé sur les téléphones portables.
Sensé être une alerte sensorielle plus que sonore, le vibreur entrant la plupart du temps en contact avec un matériau solide (une table par exemple), a de fait pris une place importante dans le paysage sonore de la téléphonie.

6. Technologie sonore pour les conversations téléphoniques.
a. Les microphones à charbon et les haut-parleurs
Historiquement, les micros utilisés dans les téléphones sont des micros à charbon. La technologie consiste en une capsule de granules de charbon tenues entre 2 électrodes métalliques, les granules de charbon jouent le rôle d’une résistance électrique. Quand ces granules de charbon sont soumis à l’onde sonore émise par la voix, leur géométrie change et la résistance électrique aussi, ce qui permet de réaliser une transduction d’une énergie sonore à une énergie électrique. Leur réponse en fréquence est relativement médiocre puisqu’elle est comprise entre 200 Hz à 3500 Hz. Ce type de micro était beaucoup utilisé jusque dans les années 50 à la radio ou dans les films. Les voix des films des années 30 à 60 ressemblent
d’ailleurs aux voix filtrées que l’on entend dans nos téléphones. Quand il y a des séquences de téléphone dans les films anciens, la différence entre le timbre des voix filtrées et des voix normales est moins flagrant que dans les films actuels.

Les haut-parleurs embarqués sur les téléphones fixes sont calqués sur la qualité médiocre des microphones avec une bande passante guère plus large (en général 200 Hz - 5 kHz). Tout comme les microphones, ils ont un taux de distorsion important malgré leur petite puissance. Tout cela fait du téléphone, un système audio de bien mauvaise qualité. Mais le but n’est pas là...L’important est de transmettre le message porté par la voix. Avec la bande passante de 300 Hz à 3400 Hz des micros à charbon, même si certains détails fins disparaissent en chemin, la voix avec son flot de messages et d’émotions nous parvient sans problème.
Malgré l’évolution des microphones (dynamiques, piezzo) et haut-parleurs de téléphones, le passage au numérique, la médiocrité des communications téléphonique demeure : la qualité sonore des voix téléphonique n’est pas si éloignée des années 1960.
Ceci est du à la norme G 771 qui a été adoptée lors du passage à la téléphonie numérique.

c. L’avenir des communications téléphoniques
Les systèmes de téléphonie sur smartphone utilisent maintenant le réseau internet pour transiter la voix et non les réseaux cellulaires (pas d’antennes relais). C’est comme si deux ordinateurs étaient reliés entre eux par internet et qu’ils échangeait un flux sonore plutôt que des e-mails. Ils utilisent le protocole VoIP (Voice Over Internet Protocol) en associant des adresses IP aux téléphones. Cette technologie à l’avantage de permettre des débits beaucoup plus grand qu’en téléphonie cellulaire. Cela a permis la création de la norme G.722 qui propose une bande passante « haute définition » pour la voix : 50 - 7000 Hz au lieu de 300 - 3400 Hz avec la norme G.771. Si cette technologie se démocratisait, cela pourrait changer
l’idée de son téléphonique filtré qu’utilise le cinéma pour distinguer les interlocuteurs de part et d’autre de la ligne.
Une autre technologie qui est encore à l'état embryonnaire pourrait se répandre d’ici quelques années. Il s’agit de la technologie Mesh22 ou « maillage ». C’est un système complètement gratuit (pas d’opérateur téléphone ni internet) à condition de disposer d’un téléphone avec un émetteur Wifi (tous les smartphones). Des téléphones sont reliés entre eux par Wifi donc si le maillage spatial est suffisamment dense, de proche en proche il est possible de joindre quelqu’un qui est loin. Ce système pourrait particulièrement bien fonctionner dans les villes
où la densité de téléphone est forte.

Nous venons de voir comment les conversations téléphoniques étaient construites et comment le son était traité à travers la télécommunication. Il est maintenant légitime de se demander, dans l’optique de la création d’un film où l’on cherche à reconstruire des éléments de réalité, quels sont les outils et les techniques de resynthèse du son téléphonique en général, et des conversations en particulier.

sommaire

Les prises de son : Reconstruction des conversations téléphoniques

Selon les exigences des réalisateurs, il est possible de reconstruire les sons des conversations avec différents degrés de réalisme. Mais comment obtenir le son de téléphone le plus réaliste possible ?
Une volonté de réalisme ce conçoit dès le tournage, nous commencerons donc par recenser les techniques d’enregistrement du son lors des tournages de séquences téléphoniques pour voir ensuite ce qui peut être fait de la matière enregistrée durant les phases de post-production.

Comment enregistrer une conversation téléphonique en tournage ?
On serait en mesure d’espérer que le choix du dispositif de tournage dépend de ce qu’il a été décidé de montrer ou d’entendre dans le scénario. En général, au moment du tournage le but est de capter le plus de matière possible, en sachant qu’il est toujours plus simple d’en supprimer en post-production que d’en ajouter (post-synchronisation).
Les remarques qui vont suivre ne sont issues d’aucun ouvrage, elles sont basées sur des expériences et sur les entretiens avec des ingénieurs du son. On peut considérer qu’il y a deux grandes catégories de dispositif de tournage avec téléphones :
- Les 2 acteurs jouent leur dialogue ensemble
- Il y a 1 seul acteur qui joue

a. Les 2 acteurs jouent leur dialogue ensemble
Le cas où les deux acteurs jouent ensemble ne signifie pas nécessairement que les deux acteurs sont filmés, l’un des deux peut simplement donner la réplique à l’autre. Faire jouer les 2 acteurs en même temps permet de conserver l’aspect naturel et intuitif du dialogue téléphonique.
Dans la description qui va suivre, nous utiliserons par simplification le terme «perché » qui signifie « enregistré avec un microphone monté sur une perche » Au sein de cette catégorie, il y a plusieurs dispositifs possibles :
- Les deux acteurs sont filmés et perchés.
- Un acteur est filmé et perché, son interlocuteur est seulement perché.
- Un acteur est filmé et perché, son interlocuteur donne simplement la réplique.
Le premier cas est très rare, il peut être utilisé pour des séquences destinées au split-screen.
Il est compliqué à mettre en œuvre : il faut 2 caméras filmant les 2 acteurs dans 2 décors différents, le tout en parfaite synchronisation.
Soit les 2 décors sont installés sur un même plateau ce qui permet aux deux acteurs de s’entendre de vive-voix malgré qu’ils feignent de s’entendre par le combiné. Ce cas ne protège pas des risques de chevauchements qui empêchent de capter proprement les sons non vocaux de la personne qui est en train d’écouter.
Soit ils sont dans 2 locaux éloignés ce qui nécessite qu’il y ait un système audio pour qu’ils s’entendent : un téléphone fixe ou système d’oreillette sans fil. L’usage du portable en tournage est proscris à cause des interférences audibles qu’il génère.
Le deuxième cas est similaire au premier pour ce qui est du chevauchement et de la nécessité d’éloignement des interlocuteurs. Dans ce deuxième cas la voix de l’acteur qui n’est pas filmé est aussi enregistrée. Ce type de dispositif a deux buts :
- Aider le personnage qui est filmé en lui donnant la réplique.
- Dans le cas d’une conversation où l’on ne voit que celui qui est filmé, cela permet d’avoir directement la voix de son interlocuteur pour en faire un son avec effet téléphone en mixage (filtrage).
Cette voix peut être une voix témoin c’est-à-dire qu’elle sera refaite en post-production.
Souvent ce n’est pas le bon acteur qui a enregistré la voix mais un assistant réalisateur (pour donner la réplique). L’avantage de la voix témoin enregistrée est d’avoir une référence pour réenregistrer par la suite.
Le troisième cas est similaire au premier et au deuxième pour ce qui est du chevauchement et
de la nécessité d’éloignement des interlocuteurs. La personne qui donne la réplique, acteur ou
non n’est pas enregistré. Cela peut signifier que ce n’est pas prévu qu’on entende
l’interlocuteur dans le résultat fini.

b. Un seul acteur joue le dialogue
Voyons maintenant la deuxième grande catégorie de dispositifs de tournage. Là encore il y plusieurs possibilités :
- L’acteur doit imaginer les répliques d’un interlocuteur qu’il n’entend pas.
- L’acteur qui est filmé entend dans son combiné ou dans une oreillette un enregistrement préalable des répliques de son interlocuteur.
Il est difficile d’utiliser le premier dispositif pour le tournage en champ/contrechamp puisque la personne filmée ne connait pas la durée exacte des paroles de son interlocuteur.
Même s’il connait par cœur le minutage de chaque parole de son interlocuteur, il faut être un très bon acteur pour donner ses répliques naturellement en l’absence de réponses. Le montage alterné permet de corriger un éventuel mauvais rythme d’enchaînement des répliques. Si au
contraire les paroles de son interlocuteur ne sont pas vouées à être entendue, il n’y pas problème, il peut faire durer les périodes de silences et de paroles comme il le souhaite.
Le deuxième cas est fréquent pour le tournage en champ / contrechamp. La méthodologie est la suivante. La voix de celui qui n’est pas filmé est enregistrée préalablement en son seul sur le magnétophone de l’ingénieur du son ou avec l’option Dictaphone d’un smartphone. Si l’acteur filmé doit téléphoner avec un portable, il a juste a lancer la lecture de l’enregistrement sur le Dictaphone. Si l’acteur filmé doit téléphoner avec
un fixe, l’ingénieur du son peut lui envoyer en playback26 la sortie du magnétophone soit par le biais d’une oreillette sans fil, soit directement dans le combiné à travers un insert téléphonique ou un bricolage similaire. Si le plan « champ » du champ/contrechamp a déjà été filmé, il est aussi possible d’envoyer la prise de son qui a été faite en playback à l’acteur qui est filmé en contrechamp.

Nous n’avons pas encore mentionné les techniques de prise de son. Il n’y a en fait, rien de spécial. C’est la complexité du dispositif qui fait la particularité de ce type de tournage.
Sauf volonté particulière, le microphone de perche est au plus proche de la bouche de l’acteur. Il a déjà été imaginé d’utiliser directement le microphone du téléphone pour enregistrer la voix d’un personnage ou à l’époque des premiers téléphones portables2 de cacher un micro-
cravate et un émetteur HF dans le corps du téléphone. Si les ingénieurs du son sont sûrs que la voix enregistrée est destinée à être filtrée, il peuvent se permettre de réaliser un premier traitement fréquentiel dès la prise de son ce qui permettra d’avoir une idée du rendu dès la relecture et la projection des rushs. Dans tous les cas, le travail de la voix filtrée traduisant «l’effet téléphone » n’est pas la priorité des ingénieurs du son de tournage, cette tâche bien spécifique est traditionnellement un travail réalisé par les mixeurs et de plus en plus par les monteurs sons.

Comment fabriquer une voix téléphonique ?
Le premier constat est que le filtrage des voix n’est pas systématique dans les conversations téléphoniques.
En fonction de la construction qui a été choisie au montage, on voit soit un seul interlocuteur soit les deux. Quand on voit les deux, il y a de fortes chances d’entendre au moins une voix filtrée, quand on voit qu’un seul personnage il y a de fortes chances pour qu’on entende jamais son interlocuteur (donc pas du tout de filtrage). Si on entend une voix filtrée, ce n’est pas dit qu’elle le reste tout au long de la conversation et en particulier quand le sens de ce qui est dit devient trop important, il arrive que le filtrage soit supprimé à la faveur d’un point de montage.

Le deuxième constat est, comme nous le verrons dans la troisième partie, l’adoption quasiment systématique du point d’écoute subjectif de la personne que nous voyons à l’image.
En effet quand, à travers la caméra, nous avons l’impression de nous trouver à deux mètres d’une personne au téléphone, nous pouvons entendre et comprendre ce qui est dit dans le combiné, alors qu’en situation réelle c’est tout à fait impossible. Nous entendons « à travers les oreilles » de cette personne : c’est un point d’écoute subjectif.
Alors la question se pose de savoir quels sont les traitements que l’on applique pour obtenir une voix qui donne la sensation au spectateur d’être « passée par un téléphone ».Y’a t’il des traitements qui sont particulièrement adaptés à des situations narratives données ?
Quel équilibre faut il faire entre désir de réalisme et intelligibilité de la voix ?

a.La méthode des traitements audio successifs
En interrogeant certains mixeurs sur leur pratique du filtrage des voix téléphoniques, nous avons vérifié ce que nous pensions déjà : à savoir qu’il n’y a pas de règle générale si ce n’est celle d’une écoute très attentive du timbre et des modifications apportées par les outils de traitements. La règle est de toujours privilégier, si le film l’impose, la bonne compréhension des paroles sur l’effet de réalisme. Dans la suite nous ne prétendrons pas donner une solution adéquate de filtrage mais seulement évoquer les étapes nécessaires à la conception d’une voix filtrée crédible ; les mixeurs auront toujours des pratiques personnelles à proposer.
Traitement fréquentiel
Le traitement fréquentiel est le traitement qui participe le plus à la sensation d’ « effet téléphone ». En général le filtrage de la voix correspond à la bande passante de la voix telle qu’on l’entend dans un combiné : 300 Hz - 3400 Hz. Les systèmes de prise de son actuels permettent une bande passante égale à celle de l’audible de 20 Hz - 20 kHz. Cela signifie que les mixeurs doivent supprimer une bonne partie du signal dans les graves, et quasiment tout dans les aigus avec des filtres coupe-haut et coupe-bas. Contrairement au traitement habituel de la voix, l’utilisation de filtres avec une forte pente peut ici être un avantage puisqu’ils apportent des distorsions que l’on retrouvent aussi dans le son du téléphone. En plus du
traitement global qui fabrique l’effet, il est possible de relever certaines zones fréquentiellespour apporter une coloration.
Tous ces réglages dépendent bien sûr de la prise de son originale, qui peut déjà comporter une coloration (choix des micros, distance de prise de son) et du type de téléphone que le personnage utilise : on ne fera pas un son similaire pour un téléphone en Bakélite des années 50 et un smartphone nouvelle génération. La coloration de la voix peut signifier une intention narrative : pour caricaturer, une voix ronde apporterait de la chaleur et un certain confort d’écoute (séduction) alors qu’une voix aiguë, donc plus agressive traduirait une impatience ou un énervement.
Notons un détail amusant ; en mixage classique, pour procurer la sensation d’éloignement d’un son, il y a trois solutions possibles et combinables : baisser son niveau, ajouter de la réverbération pour faire jouer l’espace qui l’entoure et enfin, comme pour la voix téléphonique, le filtrer en supprimant les fréquences graves et aigus. Au final le filtrage de la voix revient à placer l’interlocuteur à sa position géographique originelle ; c’est-à-dire loin, comme si une trop grande proximité sonore était gênante puisqu’il est physiquement loin ! Et pourtant, le filtrage bien est une contrainte technique de la téléphonie (bande passante des charbons, débit limité) et non une règle de bienséance.
Traitement dynamique
Le codage numérique de la voix, en plus de la réduction de débit qu’il permet, apporte une forte compression de dynamique. Pour reproduire cet effet il faut appliquer sur la voix l’action combinée d’un expander qui va amortir les bas niveaux et d’un compresseur qui va limiter les forts niveaux. Concernant le réglage des paramètres (ratio, threshold) de ces outils nous pouvons dire qu’ils sont très forts pour accentuer l’effet, mais qu’il faut avant tout voir au cas par cas. La conséquence de l’utilisation de l’expander est d’abaisser le bruit de fond et les bas niveaux ce qui coupe l’interlocuteur de certaines actions qui se déroulent à l’autre bout du fil (par exemple quelqu’un qui parle à voix basse à l’interlocuteur ne sera pas forcément entendue). La conséquence de l’utilisation du compresseur est par exemple de « sous-évaluer » le niveau de voix d’un interlocuteur qui se mettrait à crier et qui serait d’ailleurs saturé. Bien que nous n’ayons pas d’éléments sur cette question, nous pensons qu’il pourrait être efficace de travailler avec des expanders / compresseurs multi-bandes pour accentuer le traitement dynamique des bas médiums par
rapport aux hauts médiums.
Ajout de distorsions
La mauvaise qualité des microphones et des amplificateurs utilisés dans les téléphones apporte beaucoup plus de distorsion qu’un système de prise de son moderne ; il est donc légitime d’ajouter de la distorsion harmonique pour fabriquer une voix téléphonique. Il existe de nombreux plug-in qui réalisent des opérations d’ajout de distorsion. En se référent au codage de la norme G.771, on peut terminer la chaine des traitements audionumériques en convertissant le son de la voix en 8 bits pour accentuer l’effet « basse définition »
Speakerphone : la méthode tout-en-un
La méthode qui est la plus rapide et qui s’approche grandement de la réalité acoustique des conversations téléphoniques est sans doute la technologie des réponses impulsionnelles de téléphones disponible dans le plug-in Speakerphone de chez Audioease.
Les réponses impulsionnelles
La technique d’empreinte sonore par réponse impulsionnelle consiste à obtenir la réponse d’un système sonore (une pièce, un haut-parleur ou un microphone) à un signal de référence impulsionnel (Dirac, coup de feu, etc.) Ensuite par une opération mathématique dite de produit de convolution entre la réponse obtenue et un signal quelconque, on peut simuler le comportement du signal à travers le système. Au Cinéma, cette technique est beaucoup utilisée pour capter l’empreinte sonore d’un espace (sa réverbération) et l’appliquer sur la voix des acteurs. Cela permet d’ ancrer un peu plus les personnages dans le décor. AudioEase et sa réverbération à convolution Altiverb est à l’heure actuelle le leader du domaine. L’Altiverb propose une liste de réponses impulsionnelles correspondant à des espaces standards tels que des studios de musique, des églises ou des forêts. L’Altiverb propose également à ses utilisateurs d’enregistrer eux-mêmes des réponses impulsionnelles dans des lieux de leur choix selon un protocole d’enregistrement clairement identifié (choix des haut-parleurs, disposition des micros, etc.).
Un catalogue de téléphones de toutes les époques
Speakerphone (speakerphone pouvant être traduit par haut-parleur de téléphone) repose sur le principe de réponses impulsionnelles appliquées à des téléphones et à des systèmes de télécommunications (talkies-walkies, CB, interphones). Speakerphone permet à ses utilisateurs de simuler n’importe quel son de leur choix (souvent une voix) à travers un téléphone. Il y a un catalogue de plus de 100 appareils : du téléphone à manivelle de 1910 jusqu’au plus récent téléphone portable. Les ingénieurs de chez AudioEase sont allés au musée des télécommunications de La Hague aux Pays-Bas pour procéder à des enregistrements de réponses impulsionnelles de chaque téléphone. L’empreinte d’un téléphone est en fait constituée de l’empreinte de son microphone et de l’empreinte de son haut-parleur, celle du microphone étant plus caractéristique du son total. Pour l’empreinte d’un microphone il faut diffuser un signal test avec un haut-parleur très précis et enregistrer le signal électrique en sortie du microphone ou de l’amplificateur. Pour l’empreinte du haut-parleur, il faut faire l’inverse c’est-à-dire envoyer un signal électrique test dans le haut-parleur
et enregistrer le son avec des microphones très précis.
Speakerphone intègre aussi des options de Sound Design qui permettent de simuler des problèmes de connexion pour les portables ou d’altération du signal. La pratique de speakerphone a montré que c’était un gain de temps considérable pour les mixeurs qui en ont souvent peu. Elle a aussi montré la tendance des utilisateurs à utiliser des téléphones très anciens pour traiter des conversations modernes ; il semblerait que les téléphones actuels n’ont pas une empreinte sonore suffisamment caractéristique pour jouer pleinement « l’effet téléphone » ancré dans nos imaginaires collectifs. Nous pouvons reprocher au Speakerphone d’avoir uniformisé les voix téléphoniques par simplification de réalisation, là où les mixeurs
d’avant avaient leurs secrets de fabrication.
Comment mixer les voix filtrées par rapport aux voix normales ?
Là encore il n’y a pas de situation réelle sur laquelle se référer ; comme on l’a dit plus haut le point d’écoute n’est souvent pas en accord avec le point de vue. Faire preuve de réalisme serait ne jamais entendre ce qu’une personne écoute au téléphone. Mixer la voix filtrée a un niveau légèrement inférieur aux paroles parait correcte si on convient d’adopter le point d’écoute subjectif : quand on est au téléphone, la voix que l’on entend dans le combiné est en général un peu moins forte que la nôtre. Mais il y a des cas où la voix filtrée peut être plus forte que la voix parlée. Le plus simple est sans doute de mixer selon ses sensations et les desirata des réalisateurs.

Le sound design des perturbations sonores au téléphone
La téléphonie est accompagnée d’un ensemble de sons spéciaux. Les tonalités et les sonneries peuvent être des sons seuls ajoutés lors du montage son. Les ingénieurs du son de tournage enregistrent souvent les sonneries des téléphones qui ont servi en tournage. Quant aux tonalités, on les trouve en sonothèque ou on peut les fabriquer soi-même comme c’est indiqué dans la partie « caractéristiques techniques des tonalités » de cette partie.
Au sein du thème sonore des perturbations téléphoniques, il y a classiquement les interférences provoquées par les mobiles (bip bip bip), les interruptions longues de conversation (plusieurs secondes dans un tunnel par exemple), les interruptions courtes et saccadées, les altérations de la voix qui varient dans le temps. Les interruptions sont simplement réalisées en pratiquant des coupes dans la voix, quant aux altérations, elles
peuvent être réalisées avec des outils de traitement utilisé en « live32 » ou avec Speakerphone qui propose notamment le module Telecom Liquid.
Il faut aussi considérer les cas où les perturbations ne sont pas dues au système de télécommunication mais à une pollution sonore venue de l’extérieur : c’est souvent le cas depuis l’arrivée du portable et les gênes de la voie publique (sonnerie de métro, accélération d’un bus, camion-poubelle). Remarquons qu’il est rarement choisi de mettre en scène ce genre d’actions, surement parce que les ingénieurs du son de tournage tiennent à préserver un relatif silence sur le plateau de tournage pour assurer la compréhension des dialogues (quitte à les « salir » plus tard).
Mais la réussite de ce genre de séquence dépend surtout de la façon dont le scénario prévoit d’intégrer ces interruptions et altérations. Dans son article33, Julien Morel rappelle que dès qu’il y a une perturbation sonore dans une conversation téléphonique, les interlocuteurs ont des réactions particulières et en font un sujet de conversation « c’était quoi ce bruit ?» ou même s’il téléphonent avec un portable, n’hésitent pas à se déplacer pour obtenir une meilleure connexion. Les séquences de perturbations au téléphone sont un difficile à réaliser dans la mesure où dès l’écriture et le tournage il faut anticiper les traitements qui pourront être faits en post-production.

Nous avons vu de quelle manière se composait l’univers sonore de la téléphonie et la façon dont il était possible de le reconstituer dans les films, nous allons maintenant voir par quels ressorts le téléphone s’impose comme un objet cinématographique à part entière.

sommaire

L’utilisation narrative du téléphone au cinéma

! Les grands figures dramaturgiques que nous venons de voir se retrouvent largement
dans les films, c’est simplement la mise en forme qui prend une allure différente. Ce qui
sépare le cinéma et le théâtre tient dans la relation entre l'acteur et le public. En effet, le
théâtre permet de jouer en direct et d'avoir une réaction du public instantanée et interactive.

1. Rendre proche ce qui est loin
a. Pouvoirs d’ubiquité

La fonction première du téléphone réside dans son étymologie : « télé » qui désigne «à distance » et « phonie » qui exprime le transit d’une information par le média sonore. Le téléphone c’est donc l’objet qui véhicule des informations sonores venues de loin. La distance que désigne le « télé » est a priori sans limite, il permet de glisser des mots dans le creux de l’oreille à quelqu’un qui se trouve à l’autre bout du monde comme à un voisin. Ainsi nos «proches » même s’ils sont géographiquement loin demeurent proches grâce à l’abrogation des distances permise par la téléphonie. C’est ce qui nous faire dire que le téléphone a un pouvoir d’ubiquité : une personne au téléphone se trouve à la fois chez elle et un peu chez la personne qu’elle appelle, au moins par le biais du media sonore. Le cinéma n’est-il pas pour sa part un exemple d’ubiquité ? Il l’est au moins de deux façons ; d’abord parce que regarder un film c’est à la fois être dans une salle de cinéma et par projection dans les lieux où se trouvent les acteurs. Ensuite parce que le cinéma peut rapprocher, au moins symboliquement, des endroits géographiquement très éloignés en les montrant à la suite. Ainsi quand le cinéma cite le téléphone, il cite un procédé proche de son fonctionnement intrinsèque.
b. Une proximité toute relative
Le fait d’entendre une voix sans en voir le corps déroge à la sensation naturelle qui ne sépare pas le son de la représentation visuelle, quand on entend une voix désincarnée, on cherche à imaginer le corps et la personne qui va avec, et si l’image ne nous le donne pas, il y a une sensation de déséquilibre qui crée une attente, une soif de voir. Qui n’a pas déjà été surpris en rencontrant une personne qu’il avait jusqu’alors seulement entendue ? Entendre sans voir ce n’est pas comme entendre en voyant. Les gestes et les expressions du visage qui accompagnent en temps normal la parole ne sont pas là pour nous informer de tous les détails du message. Dans une conversation en face-à-face les gestes jouent pour plus de 50 % dans la perception du message. De plus la bande passante réduite de la communication téléphonique tronque une part de la vérité sur son chemin : la voix est déformée, parfois incompréhensible.
c. A la recherche d’un corps perdu
Les films où l’intrigue repose sur la recherche d’identité d’un personnage connu seulement par sa voix au téléphone sont nombreux. C’est notamment le cas des films d’horreurs où des thrillers : When a stranger calls, Scream, Scary Movie. Dans Le regard et la voix, Pascal Bonitzer rappelle que la disjonction entre une voix qui traverse l’espace et un corps qui reste où il est, constitue une figure fondamentale du suspens. De la même manière les appels téléphoniques peuvent cultiver/entretenir l’arlésienne en mettant en scène une situation attendue de tous qui ne se produira pas ou qui sera sans cesse repoussée. Dans le film When A Stanger Calls, l’histoire repose sur la croyance que ce qui provient du téléphone
est nécessairement loin. Une jeune baby-sitter en train de garder des enfants reçoit des appels menaçants d’un inconnu. Par réflexe de protection, elle s’empresse de verrouiller toutes les issues de la maison (nombreux plans d’insert sur des verrous qui se ferment), avant qu’on apprenne que l’agresseur se trouve à l’intérieur.

2. Le téléphone : un personnage incontournable
a. La personnification du téléphone
Malgré ses imperfections, le téléphone est un objet qui est souvent utilisé dans les films comme un prolongement des interlocuteurs qu’il permet de joindre, au point de lui conférer le rôle d’un personnage à part entière. C’est parfois un personnage clairement assumé comme dans le film français Hellphone64 où un adolescent voit son téléphone se personnifier et lui confier des super-pouvoirs. Le téléphone est en fait une extension matérielle
des interlocuteurs qui sont à distance : une sorte d’avatar. Il y a plusieurs raisons qui font du téléphone un personnage, tout d’abord le fait qu’il peut sonner à n’importe quel moment et venir interrompre une situation dans laquelle les acteurs comme les spectateurs s’étaient installés, la sonnerie du téléphone a un pouvoir d’alerte quasiment religieux, comme l’appel à la prière du muezzin qui fait cesser toute activité des fidèles. Dans les films, contrairement à la réalité, il est très rare que les personnages dont on suit les péripéties décident de ne pas répondre à un téléphone qui sonne, peut être que cela représenterait un mystère trop insupportable pour le spectateur. Le téléphone a ses humeurs, il sonne au beau milieu de la
nuit, il sonne sans qu’on s’y attende, il vient déranger une action cruciale. Ce qui démarque le téléphone des objets de la panoplie d’accessoires du cinéma, c’est qu’il est visuel et sonore et qu’il constitue une source d’embûches idéale pour les scénaristes. Si on prend pour acquis que le téléphone à des comportements proches de celui des hommes, alors quels grands comportements peut-on observer à travers les films ? Y-a-t-il des fonctions symptomatiques du téléphone qui reviennent majoritairement ? Appels de menace, appels sentimentaux, appels de diversion, erreurs d’appel, appels de mensonge : autant de situations dramaturgiques présentes dans les films, là où dans la vraie vie nous nous contentons en général d’appels informatifs.
b. Le sésame du numéro de téléphone
Le seul élément qui sépare deux individus qui ne se connaissent pas et qui se trouvent à deux endroits de la terre est finalement leur numéro de téléphone. Un code qui donne accès à une identité (surtout depuis l’arrivée du téléphone mobile). Parfois l’absence de numéro de téléphone conduit les personnages dans une impasse, avoir un téléphone mais pas le bon numéro, c’est comme avoir un coffre-fort sans code pour l’ouvrir. Dans Cellular, Kim Basinger retenue en otage n’a qu’un téléphone, que les ravisseurs pensent détruit. Pour contacter quelqu’un, elle parvient à composer un numéro en trafiquant les câbles du téléphone, celui d’un inconnu qui tentera de lui venir en aide. Pour l’anecdote, dans les films
américains, une législation spécifique oblige les scénaristes et réalisateurs à utiliser le préfixe 555 avant les numéros de téléphones afin d’éviter que des personnes soient dérangées si leur numéro apparaissait fortuitement dans un film. La plupart du temps les numéros sont compris entre 555-100 et 555-199. En France, il n’y a pas de pareille règle et après la sortie du film Bellamy, un homme dont le numéro de mobile apparaissait dans le film a porté plainte contre le réalisateur, suite à de nombreux appels anonymes. Depuis, dans les séries françaises, les numéros sont factices utilisant 8 ou 12 chiffres et non 10, ou bien ce sont des numéros achetés aux opérateurs pour l’occasion. Dans certaines séries américaines, les numéros des
personnages renvoient en réalité vers le lien commercial d’un sponsor.
Pour voir quels sont les usages du téléphone dans les films, il est bon d’adopter le point de vue chronologique. Les évolutions techniques n’ont cessé de suggérer aux cinéastes de nouvelles situations dramatiques et de nouvelle formules cinématographiques.

3. L’histoire de la téléphonie au service des films
a. Le téléphone fixe
Le téléphone est devenu un objet courant de nos vies et dans la plupart des films montrer des conversations téléphoniques n’est que le reflet d’un habitus67. Mais aux débuts du téléphones, c’est un objet non familier et les premiers pas ne sont pas évidents. Dans la série TV historique Downtown Abbey, toutes les erreurs d'apprentissage sont relevées : confusion entre la sonnerie du téléphone et de la porte d’entrée, confusion entre le micro et le haut-parleur, mauvaise numérotation. A cette époque où tout appel passe par une standardiste, de nombreuses histoires se créent comme nous l’avons vu avec les pièces de théâtre du début du siècle. Fernand Reynaud dans son sketch Le 22 à Asnières relève l’absurdité de la mondialisation en marche des communications. Alors qu’il est dans un bureau des PTT et qu’il cherche à joindre le 22 à Asnières, tous les clients souhaitant appeler en Amérique sont traités en priorité dans la file d’attente. Il finit par demander à appeler un standard à New York pour qu’il le mettent en contact avec Le 22 à Asnières.
Parmi les anecdotes autour du téléphone fixe, il y a beaucoup d’histoires concernant la localisation d’un malfaiteur. En général, un agent de police doit faire parler le malfaiteur pendant au moins 30 secondes pour le localiser et le malfaiteur, qui n’ignore pas ce stratagème, raccroche au bout de 29 secondes. Avant l’ère du portable, certaines nouvelles options du téléphone fixe ont ouvert de nouvelle voies narratives, c’est le cas du téléphone fixe sans fil qui permet la mobilité aux personnages mais les cantonne dans un rayon d’action limité. La présentation du numéro pour les appels entrants permet de choisir de décrocher ou non alors qu’auparavant décrocher pouvait conduire à toutes les surprises.
b.La cabine téléphonique
Comment parler d’histoire de téléphones au cinéma sans parler des cabines téléphoniques qui ont été tant utilisées ? La cabine ou plus généralement le téléphone public représente un lieu symbolique à la croisée de la vie publique et de la vie privée. Il y a un personnage qui se trouve dans l’agitation de la rue ou d’un aéroport puis en un instant il se retrouve dans l’intimité d’une conversation amicale ou amoureuse. A cet égard il donnera un aperçu avant l’heure de l'ère du téléphone portable où environnement extérieur et vie privée se mêlent, la mobilité en moins. Dans Le meurtre était presque parfait, Tony Wendice, couvert par l’alibi d’un diner d’affaire, s’absente un instant à la cabine téléphonique du restaurant pour écouter en direct le meurtre de sa femme qu’il a lui-même commandité. Dans l’imaginaire cinématographique, la cabine est un lieu qui assure l’anonymat des interlocuteurs, les malfaiteurs s’y rendent au cours de leurs cavales. Les personnes craignant que leur ligne fixe soit écoutée par des espions appellent d’une cabine téléphonique. Dans Phone Booth, le personnage joué par Colin Farell va dans une cabine téléphonique pour appeler sa maîtresse de peur que sa femme n’épluche les factures de son téléphone portable. Dans L’Affaire Thomas Crown, un riche homme d’affaire recrute des hommes pour commettre un hold-up : il ne leur parle que par téléphone pour garder son identité masquée.
Parmi les anecdotes que l’on retrouve souvent au cinéma et dans les séries on pensera forcément à l’histoire de la cabine déjà occupée alors que le personnage doit passer un appel urgent. C’est aussi le cas dans The Phone Booth, où le héros est contraint par son corbeau téléphonique de rester dans la cabine malgré les insistances de gens de l’extérieur sous peine de recevoir une balle de fusil. Dans d’autres cas, le héros n’a plus de monnaie pour poursuivre la conversation (Sorry wrong number), la page d’annuaire recherchée a justement été arrachée ou bien une sonnerie de téléphone interpelle un personnage qui marche tranquillement dans la rue. Le fort symbole visuel de la cabine téléphonique a parfois été détourné pour en faire une machine à remonter le temps ou une cabine d’essayage. Il existe même un film entièrement dédié à une cabine téléphone, Mojave Phone Booth, qui retrace l’histoire vraie d’une cabine perdue en plein désert pour des chercheurs d’or
c.Le téléphone portable
Comme le dit Ursula Michel dans son article paru sur slate.fr, « Le portable a brouillé les pistes du dehors et du dedans, la question de la localisation est devenue l’enjeu majeur de nos conversations » Le portable rajoute à l’ignorance a priori de l’identité de l’interlocuteur, l’ignorance a priori de son lieu d’appel.
Le cinéma comme les séries TV ont su jouer de la perte de localisation qu’offraient les portables. C’est le cas des maris qui font croire à leurs femmes qu’ils sont encore au bureau alors qu’ils batifolent. Certains portables proposent même d’ajouter un fond sonore artificiel pour rendre l’imposture crédible (rue, aéroport, voiture, bureau, etc). L’arrivée de la technologie du téléphone portable ajoute toute une panoplie de nouveaux coups de théâtres pour les scénaristes : perte soudaine de réseau cellulaire, passage dans un tunnel, perte de la batterie, perte du téléphone. Dans sa thèse sur l’évolution du cinéma avec les téléphones portables, Steven J. Putsay défend l’idée que le rôle des interlocuteurs est passé de l’impuissance causé par la fixité des téléphones à la toute puissance permise par la mobilité des portables. Les personnages seraient donc, passés du statut de victime à celui d’agresseur, ce qui selon Putsay a enrayé les moyens de suspens qui ont fait du téléphone un outil très
utilisé au cinéma.
Mais cette technologie a surtout permis de communiquer plus vite et dans n’importe quelle situation. Ces avantages s'accommodent bien de la série télévisée 24 H Chrono dont le parti pris est de raconter une heure d’histoire en 1 heure de programme (en réalité 45mn si on enlève les 15 minutes de publicité aux USA). Le héros Jack Bauer peut obtenir toutes les infos qu’il souhaite par le biais de son téléphone portable. Il est sans cesse relié à son centre de commandement (CTU). Le téléphone devient une arme. Il faut remarquer que les séries TV utilisent beaucoup plus les téléphones portables que dans les films de cinéma. Les séries se sont adaptées à l’évolution technique des téléphones (possibilité de faire des photos, des
vidéo), peut-être par soucis de représentation de la société.
Le téléphone regorge de formes et de fonctionnalités diverses qui permettent d’imaginer des situations sans cesse renouvelées tout en rappelant aux spectateurs leurs pratiques du quotidien. Dans ce renouvellement, l’évolution des technologies a apporté a eu un impact conséquent et comme le remarque Amandine Prié, il suffit de regarder les téléphones de demain pour savoir à quoi ressemblera le cinéma.

sommaire

MISE EN FORME AUDIOVISUELLE DES CONVERSATIONS TELEPHONIQUES

A. Le montage ou l’art de savoir combiner des images et des sons
Après avoir vu quels étaient les principes de fonctionnement du téléphone et la manière dont ils pouvaient être exploités pour raconter des histoires, nous allons maintenant voir comment mettre en images et en sons les conversations téléphoniques.
Les conversations téléphoniques filmées exploitent au maximum le contrat du cinéma sonore : l’apport du son à l’image construit un nouveau media qui est plus que la somme de son et d’image, comme si l’équation « 1 + 1 = 3 » existait. Dans le cas des conversations, il y a une alternance répétée entre des voix dont on voit le corps et des voix acousmatiques qui sont par définition « sans corps ». La possibilité de disjoindre son et image permet des constructions filmiques protéiformes suivant plusieurs variables. Qui vois-je ? Qui entends-je ? Est-ce j’entends celui que je vois ? Et ainsi de suite....Mais avant de voir toutes les formes de construction que les conversations peuvent prendre, nous allons voir ce qu’il y a
de particulier dans le montage des images et des sons.
1. Le montage en champ / contrechamp
Le montage en champ / contrechamp est la figure de montage typique du dialogue de «vive-voix » entre deux personnes. C’est l’alternance de deux plans d’orientation opposée.
Pour chacun des 2 plans, la caméra prend le point de vue d’un acteur qui regarde son interlocuteur. Parfois dans un plan en champ / contrechamp on voit une partie du corps de l’acteur dont on adopte le point de vue (c’est l’amorce) en plus de voir son interlocuteur. Mais dans le champ / contrechamp, les personnages peuvent aussi se parler par-delà une séparation physique imposée par un élément concret du décor (porte, barrière, grille, vitre ou distance) qui une sorte « d’effet parloir». L’image que nous voyons n’est plus le point de vue d’un acteur sur son interlocuteur puisque par définition il ne le voit plus, la caméra devient omnisciente.
Paradoxalement c’est par un point de montage, donc une séparation, que l’on parvient le mieux à symboliser une union entre 2 personnes : l’alternance de plans les rapproche en jouant le rôle de « passe-muraille ». Le champ / contrechamp qui est bien antérieur au parlant s’est transformé avec son arrivée en permettant de poser la question suivante. Est-ce que je peux voir celui qui écoute ou seulement celui qui parle ? A cette question Poudovkine décrit l’idée d’un chevauchement où « la parole d’un personnage A continue de retentir sur l’image de B qui l’écoute.» On voit le personnage A parler et tout en continuant à parler on voit l’expression du visage ou du corps que cela suscite chez son interlocuteur. Il y a donc parallèlement une coupe visuelle et une voix qui parvient à franchir cette barrière. Là encore la sensation de lien malgré la séparation est garantie.
2. Le choix du point de montage
La technique de tournage du champ / contrechamp est très simple, elle consiste à tourner d’abord toute la scène sur un personnage (champ) puis toute la scène sur l’autre personnage (contrechamp) et éventuellement « un master » qui est un plan large où l’on voit les 2 personnages ensemble (mais ce n’est pas possible au téléphone !)
Une fois la scène tournée, une nouvelle écriture de la scène se fait avec le choix des images qui seront montrées et celles qui seront définitivement oubliées. Bien que le choix des points d’alternance relève souvent du bon sens pour améliorer la compréhension ou l'esthétisme de la séquence, le choix final revient au monteur de concorde avec le réalisateur. Walter Murch rappelle que sur un plan d’une minute à une cadence de 24 images par seconde, il y’a potentiellement 1439 points de montage pour le lier à une séquence précédente. En multipliant ce chiffre par autant de plans qu’il y a dans un film, nous voyons que le film terminé n’est qu’une proposition parmi un million d’autres possibilités.
3. Quel point d’écoute pour une conversation téléphonique ?
De la même manière qu’il y a un point de vue donné par l’emplacement de la caméra, qui oriente le regard du spectateur, il y a dans les séquences audiovisuelles un point d’écoute que nous allons tenter de définir maintenant. La différence majeure entre le point de vue et le point d’écoute c’est que le point de vue ne concerne qu’une zone de l’espace (un angle à partir de la caméra) alors que l’audition n’a pas de cadre. Il y a en fait deux types de points d’écoute selon que l’on décide d’en faire une question spatiale ou bien subjective.
• Le point d’écoute spatial est un point physique que l’on place de façon abstraite dans le décor (y compris hors-cadre). Souvent ce point se trouve sur la caméra, ce qui permet de respecter les plans sonores et la latéralisation (on entend le personnage à droite si on le voit à droite). Ca peut être n’importe quel point, par exemple si les personnages sont loin à l’image et qu’on les entend comme s’il étaient près, le point d’écoute spatial est proche d’eux.
• Le point d’écoute subjectif revient à faire écouter ce qui se passe dans l’espace à travers les « oreilles » d’un personnage. Par exemple dans le film Agent X2784, on voit un personnage s’éloigner d’un piano et le son s’éloigner en même temps, alors que le plan reste fixe.
! Dans les conversations téléphoniques, nous rencontrons ces deux types de point d’écoute. Quand on voit une personne parler, le point d’écoute est spatial, il se trouve très près de cette personne. En revanche quand celui-ci est en train d’écouter ce qui lui est dit au téléphone, on entend dans la plupart des cas son interlocuteur d’une voix filtrée, ce qui n’est possible qu’en ayant l’oreille collée au combiné : c’est une écoute subjective du personnage à l’image. Notons qu’en situation naturelle et standard, il n’est pas possible d’entendre ce qui est dit à travers le combiné si on se trouve à 2 m de lui, bien qu’il y ait des exceptions.
Dans la plupart des films, il y a donc une contradiction entre point de vue et point d’écoute : nous voyons comme si nous avions le recul d’une autre personne mais nous entendons avec « les oreilles » de celui que nous voyons. Parfois, il n’y a pas du tout de filtrage, on entend les 2 interlocuteurs comme s’ils étaient dans la même pièce. La contradiction est encore plus forte mais le symbole n’en est pas moins intéressant.

Nous avons vu que dans les films et en particulier quand il y a des conversations téléphoniques, de nombreuses façons existent pour mettre en forme les images et les sons qui ont été filmés. Toute mise en formes qui conduit à un résultat filmique concret est une combinaison de points de vue, de points d’écoute et d’instants de décision. Mais ces mises en formes ne sont pas seulement une construction audiovisuelle, ce sont autant de moyens de raconter une même histoire : parfois l’influence sur la narration n’est pas remarquable, d’autres fois cela modifie du tout au tout l’histoire qui est racontée. Ne montrer qu’un interlocuteur en n’entendant pas ce qui lui est dit n’aura pas le même sens que de voir et
d’entendre les 2 interlocuteurs à tour de rôle.
A ce moment donné de notre réflexion, il était logique de vouloir regarder de plus près comment les films utilisent ces combinaisons en analysant un corpus de séquences bien choisi. C’est ce que nous avons commencé à faire avant de constater que les outils d’analyses et le vocabulaire existant se heurtaient à la complexité du cas particulier audiovisuel de la conversation téléphonique. Nous avons donc préféré développer l’idée d’un outil de classification et de nomenclature des cas de figures audiovisuels et dans un second temps la création d’un outil d’exploration ludique et interactif. Ce sera l’objet de toute la suite de ce mémoire. Mais d’abord voyons ce qui existe pour analyser ces séquences téléphoniques si
particulières.

sommaire

B. Typologie du téléphème au cinéma : la classification de Michel Chion ( voir sa biographie )

Une typologie est une démarche, souvent scientifique, consistant à classer un certain nombre de données empiriques concernant un phénomène afin d’en faciliter l'étude et l'analyse des réalités complexes.
La conversation téléphonique, qu’elle que soit la façon dont elle est montrée, parle de deux personnes situées à deux endroits distants. Cette dualité s'accommode bien du principe originel du montage qui consiste a montrer avec différents angles (points de vue) une situation ou un objet. Quand la situation est composée de deux pôles indépendants comme deux correspondants téléphoniques, le montage s’exprime de sa manière la plus simple et évidente.
Michel Chion emprunte à un journaliste du XXe siècle le terme de « téléphème » qui signifie une unité de conversation téléphonique. Il propose 7 types de « téléphèmes » qui sont sensés couvrir une bonne partie des séquences audiovisuelles où il y a une conversation téléphonique. Les titres donnés à chaque type ne font pas partie de l’inventaire proposé par Michel Chion, nous les avons ajoutés dans un but de clarté selon une nomenclature qui sera développée plus tard. Voyons de plus près ce découpage, découpage que nous discuterons dans un second temps.
0. Le type 0 : Cinéma muet
Description : C’est un échange téléphonique où nous voyons, sans les entendre, les deux locuteurs. On peut les voir en montage alterné ou montage parallèle, c’est-à-dire un plan sur le personnage A puis un plan sur le personnage B puis à nouveau un plan sur le personnage A. L’alternance de ces plans est souvent rapide.
Le type 0 utilise une des grandes idées du téléphème au cinéma, en permettant au spectateur de voir et de comparer des gens qui sont en conversation mais qui ne se voient pas. Le spectateur prend conscience de son statut privilégié d’observateur omniscient. Il est témoin
des différences sociales ou contextuelles entre les personnages (types de costumes, décor intérieur / extérieur) mais aussi de leur ressemblances ou différences de comportement (à la manière d’un miroir les gestes sont symétriques, complémentaires ou en écho).
Dans La Grève d’Eisenstein, la conversation entre un homme, debout dans une cabine publique et son interlocuteur assis dans un salon cossu marque clairement leurs positions hiérarchiques respectives.
1. Type 1 : Raccord sur les paroles
Description : Le Type 1 reprend le procédé de montage alterné du Type 0. Il correspond au cas où on entend strictement que la voix de la personne qui est à l’écran. Quand l’image est sur A on entend A, quand l’image est sur B on entend B.
Remarque : Avec ce téléphème de Type 1, on ne voit jamais de personnages en train d’écouter, c’est-à-dire qu’on entend jamais l’effet de filtrage sensé reproduire le son téléphonique.
Le type 1 est celui le plus utilisé dans les films hollywoodiens classiques. Cela correspond probablement au fait que dans la plupart des appels téléphoniques, « ce qui est dit » comporte plus d’importance que la réaction que cela engendre.
2. Type 2 : Focalisation partielle
! Description : C’est un appel durant lequel on ne voit et on n’entend qu’un seul des deux interlocuteurs. La voix du correspondant peut être audible mais elle reste inintelligible.
Le personnage à l’image enchaîne les phases de parole et d’écoute. On se focalise sur le personnage (image) mais seulement partiellement puisque nous n’entendons pas comme lui.
Remarque : C’est le cas que l’on retrouve dans les pièces de théâtre comme La Voix humaine de Jean Cocteau. La conversation est hachée par des silences que le spectateur peut éventuellement interpréter en fonction de ce qui est dit par le personnage à l’image (paroles rapportées, contexte connu). Souvent ce téléphème correspond aux appels de courte durée.
Combinaisons : Dans une séquence on peut trouver une combinaison du type 1 et du type 2 comme dans Loulou de Maurice Pialat en 1979 : on voit chaque interlocuteur parler à son tour puis l’image se fixe sur un personnage qui écoute et parle. De la même manière, on peut imaginer une combinaison de 2 types 2 : une alternance de plans entre 2 personnages que l’on voit écouter et /ou parler sans entendre l’interlocuteur opposé. On pourra parler de double focalisation partielle (cas proche du Type 4).
Exemple de Type 2
Dans Docteur Folamour, le Président des USA, utilise le téléphone rouge pour annoncer à son collègue soviétique qu’un avion américain équipé d’ogives est, par erreur, en route pour bombarder la Russie. Nous n’entendons pas ce que répond le Président russe mais pouvons deviner sa colère. Le comique cinématographique de la situation, c’est qu’autour de la table ronde où siège le Président américain, il y a une douzaine de personnages, qui tous suivent la conversation par des écouteurs individuels : tout le monde entend, mais pas le spectateur.
3. Type 3 : Focalisation totale
! Description : C’est un appel durant lequel on ne voit qu’un seul personnage et dans lequel on entend à la fois ses paroles mais aussi celles de son correspondant. Le type 3 est identique eu type 2 sauf qu’on peut cette fois entendre la voix du correspondant à travers le combiné téléphonique.
Remarque : C’est le cas typique de la voix désincarnée. Le spectateur se trouve dans la même relation « auditive » à l’interlocuteur que le personnage qui est à l’image (focalisation totale).
Cette identification à l'héroïne permet toutes les figures de suspens typiques des films d’horreur (Scream, Scary Movie, Terreur sur la ligne) ou des thrillers dans lesquels l’identité des ravisseurs est masquée. Le but du film est souvent de démythifier l’énigme acousmatique (ce qui est entendu sans être vu) en associant un corps à la voix du ravisseur.
Combinaisons : Alterner plusieurs plans de type 3 manque d'intérêt dans le cas des films cités précédemment puisque se serait révéler le corps de l’agresseur. Dans d’autres films cette pratique est courante, elle correspond à un cas standard de réalisme où « tout le monde entend
tout le monde ». Cela définira le type 4.
Dans Fenêtre sur Cour, il y a un cas de passage du type 3 au type 2 qui montre bien la volonté de marquer un point de vue focalisé sur une personne. Le téléphone sonne, James Stewart décroche, on entend son interlocuteur, un agent de police qui demande à parler à son collègue déjà sur place, Stewart passe le combiné au collègue, la conversation se poursuit mais on n’entend plus le policier parler avec son collègue.
4. Le type 4 : Raccord réaliste
Description : Le type 4 combine le montage alterné et la possibilité d’entendre filtrée dans le combiné la voix du correspondant. Notons que pour chacun des 2 plans en alternance, on peut soit voir le personnage à l’image parler, soit le voir écouter et nous-mêmes entendre ce que son correspondant lui dit.
C’est un cas de figure très répandu, peut être le plus répandu de tous. Il y a en fait une infinité de façons d’utiliser ce cas selon les points d’alternance choisis par le réalisateur. Notamment dans l’équilibre qui sera donné aux phases d’écoute et de parole de chacun des personnages, il
sera possible d’insister sur la sensation d’oppression, de domination, de solitude, de rapprochement, par exemple. On peut choisir de ne pas montrer une réplique qui n’est pas à l’avantage d’un personnage, choisir de montrer les ressemblances ou les différences des personnages en appliquant un type de montage similaire ou différents pour les 2.
5. Type 5 : Split-screen
Description : L’écran de cinéma comprend au moins deux sous-fenêtres dans lesquelles se trouvent un personnage de la conversation téléphonique. La plupart du temps l’écran est divisé en deux mais il peut aussi s’agir d’une image normale associée d’une ou plusieurs fenêtres auxiliaires avec un (des) interlocuteur(s). On le trouve notamment dans Indiscret de Stanley Donen ou à nouveau dans Phone Game
Remarque : Les remarques faites pour le Type 1 quant à la similitude des gestes est aussi valable pour le Type 5. Ici c’est la simultanéité qui produit cet effet et non l’alternance : la comparaison est directe. D’ailleurs le split-screen est utilisé dès l’époque du cinéma muet.
6. Type 6 : Fourre-tout
Description : Evidemment, il existe de nombreux cas qui ne rentrent pas dans la classification qui vient d’être faite. C’est le cas des films qui n’utilisent pas un son « cohérent» avec l’image comme dans Sexes, mensonges et vidéo93, de Steven Soderbergh, ou Phone Game où l’on entend la voix de l’interlocuteur téléphonique acousmatique sans filtrage.
Parfois même des conversations naviguent parmi plusieurs types comme on l’a dit pour Fenêtre sur cour. Le réalisme n’est pas nécessaire, il est tout à fait possible de commencer une discussion avec un interlocuteur avec une voix filtrée puis qu’après plusieurs alternances le filtrage disparaisse sans raison logique. Quand le sens de ce qui est dit par les personnages est l’objet d’attention du spectateur, la « non cohérence » du son passe souvent inaperçue. Le confort d’écoute passe avant la volonté de réalisme sonore.

sommaire

C. Création d’une typologie complémentaire et alternative

1. Définitions et limites de la typologie
a. Remise en question des 7 téléphèmes
La typologie qui a été proposée ci-dessus a été créée pour classer les conversations téléphoniques filmées dans des catégories. Elle a l’avantage d’offrir un angle d’analyse facile et immédiat. Mais nous constatons que dès lors que les choix des réalisateurs se compliquent, l’utilisation de plusieurs cas de figures mélangés devient difficilement lisible. Nous constatons que certains cas de figures rencontrés dans des films n’entrent pas dans cette typologie, ce qui oblige à panacher entre plusieurs catégories ou à les ranger dans une section « fourre-tout » qui à l’évidence ne renseigne pas énormément sur leur nature.
Dans la classification qui est proposée par Michel Chion, il y a 2 types de situations qui selon nous mériteraient d’être distinguées :
• Il y a d’un côté des téléphèmes que nous appellerons continus où l’on ne voit qu’un seul des 2 personnages tout au long de la séquence. Ce sont les téléphèmes 2 et 3.
• Il y de l’autre côté les téléphèmes où l’on voit les 2 personnages, c’est donc une succession d’au moins 2 téléphèmes continus. Nous appellerons ces téléphèmes des téléphèmes de raccord puisqu’il y a au moins un point de montage image ou raccord image.
Ce sont les téléphèmes 0, 1, 4, et 6.
Nous remarquons, d’autre part, qu’il n’y a pas de téléphème qui à l’instar du type 1 prévoit les situations où l’on ne voit que des personnages en situation d’écoute (situation de parole pour le téléphème 1).
Bien que ce cas de figure soit a priori moins répandu dans les films, nous estimons qu’il n’y a pas de raison évidente de le rejeter. De la même manière, remarquons qu’il n’y a pas de téléphème pour les cas de figure où le spectateur entend les 2 interlocuteurs quand il voit le personnage A et n’entend qu’un seul personnage lorsqu’il voit le personnage B. Encore une fois ce cas de figure a peu de chance d’être visible dans un film mais il n’est pas impossible de le rencontrer. Nous pourrions bien sûr continuer en prenant autant d’exemples complexes. Le fait est qu’en jouant sur les différences de voix, les différences d’images et les alternances de personnages, il y a un grand nombre de solutions possibles, qui sont difficilement descriptibles par le texte.
Michel Chion perçoit d’ailleurs la difficulté de décrire rigoureusement tous les cas de figure, en expliquant : « Toute cette typologie ne doit pas être employée de manière rigide.
Chaque téléphème est un cas d’espèce » Il crée d’ailleurs la catégorie 6 appelée « fourre-tout » qui est, selon nous, un aveu de complexité de la typologie des conversations téléphoniques.
Nous constaterons plus loin que la catégorie « fourre-tout » concentre plus de 60 % des cas de figures possibles, aussi improbables soient ils.
Bien que tout système de rangement possède sa catégorie « inclassable », nous pensons qu’une autre typologie est possible. manière plus rigoureuse de catégoriser ces configurations audiovisuelles est possible. Nous le démontrerons grâce à un certain nombre d’hypothèses
fondatrices et en utilisant des tableaux descriptifs
b. Mises en garde et précautions
Nous sommes conscients que classifier et analyser des séquences de films avec des tableaux et des combinaisons mathématiques peut passer pour une dérive « calculatoire », là où il est bon de faire preuve de sensibilité dans la compréhension des choix artistiques. Nous ne perdons pas de vue cette idée ; la typologie alternative qui va être proposée maintenant a pour but d’offrir un outil d’analyse filmique complet et performant face à la complexité évidente des situations audiovisuelles que nous devons étudier. Elle permettra par la suite, du moins nous l’espérons, une interprétation plus facile et un retour à l’analyse plus classique.

2. Hypothèses de départ et mise en place de vocabulaire
Nous avons considéré un certain nombre de distinctions et hypothèses conduisant à la typologie alternative.
a. Hypothèses générales
- Nous ne prenons pas en compte le fait qu’un cas de figure donné ait une application dans un film ou non.
- Nous ne prenons pas en compte le fait qu’un cas de figure paraisse « réaliste » ou non.
Toutes les configurations sont étudiées sur un pied d’égalité.
Définitions des personnages :
• Une conversation téléphonique a lieu entre strictement deux personnes : un personnage A et un personnage B.
• Dans une conversation téléphonique, un personnage a seulement deux attitudes possibles : soit il écoute soit il parle. Ces attitudes se remarquent visuellement.
b. Hypothèses sur le son
• Un son est dit « filtré » lorsqu’il y a un effet audible qui laisse supposer que le son est entendu à travers un combiné téléphonique. Toute différence notable avec le son normal sera considéré comme filtré.
• Un son est dit « normal » lorsque la voix est semblable à celle entendue dans un dialogue de « vive-voix » entre deux personnages.
• Il y a trois options quant au son entendu : il n’y a pas de son, le son est filtré, le son est normal. Les options « filtré » et « normal » peuvent être simultanées.
• Si on voit personnage A parler, le son associé à A est la parole de A. Si on voit un personnage A écouter, le son associé à A est la parole de B. Remarque réciproque avec le personnage B.
• Le son entendu ou non par le spectateur est composé d’une voix et d’ambiance extérieure.
c. Hypothèses sur l’image
• Le spectateur a le choix de voir : aucune image (écran noir), le personnage A, le personnage B, le personnage A et le personnage B en simultané lors des split-screens.
• Nous faisons une simplification (la seule) : il ne peut pas y avoir d’alternance entre l’image d’un personnage et une image noire. On considère que s’il n’y a pas d’image, il n’y en aura jamais durant la conversation (pièce radiophonique).
• Nous considérons qu’il y a changement de l’image dans seulement 2 situations :
- Lorsque le même personnage change d’attitude (passage de la parole à l’écoute ou l’inverse).
- Lorsque il y a un changement de personnage à l’image.
• Lorsqu’il y a plusieurs plans (angles de caméra) sur un seul personnage et que celui-ci a la même attitude, on considère qu’il n’y a pas de changement d’image.
d. Définitions
Comme nous l’avons déjà expliqué plus haut, nous apportons une distinction fondamentale entre les téléphèmes de continuité et les téléphèmes de raccord.
Continuité : La situation de continuité est le cas où l’image reste sur le même personnage (téléphèmes 2 et 3) pendant toute la conversation mais où il y a des changements d’attitude du personnage (le passage de la parole à l’écoute) ou un changement de comportement d’écoute (entendre une voix filtrée puis ne rien entendre). Le comportement d’écoute du personnage est considéré comme étant confondu avec celui du spectateur.
Raccord : au contraire nous appelons Raccord le cas qui correspond à un changement de personnage à l’image au sein de la conversation, cela revient à la succession de 2 situations de continuité différentes avec 2 personnages différents.
Remarque : avec le tableau des raccords nous pouvons analyser le passage d’un personnage A à un personnage B. Pour un 2e point de montage, soit la typologie est réciproque soit c’est un nouveau cas qu’il faut envisager. Cette remarque prendra tout son sens au moment
d’appliquer concrètement les typologies.
Split-screen : la situation du split-screen est un cas particulier qui combine à la fois la continuité (un seul personnage dans chaque fenêtre) et l’alternance (2 personnages sur l’écran réunissant les fenêtres)

3. Dénombrement des situations audiovisuelles possibles
a. Comment construire des tableaux typologiques ?
Pour réunir tous les cas de figure possibles, nous avons construit un grand tableur dans Open Office (ANNEXE E DVD p.150). L’intérêt d’utiliser un tableur est de pouvoir organiser et classer les situations audiovisuelles selon des caractéristiques données (perso A, perso B, parler, écouter, filtrage, pas de filtrage, etc.). Le tableur a permis de générer automatiquement les lignes de résultats, là où un travail manuel aurait été fastidieux.
Pour une conversation entre A et B,
On associe à chaque personnage une IMAGE et un SON.
Dans la colonne IMAGE
A / B parle : On voit le personnage A / B parler
A / B écoute : On voit le personnage A / B écouter son interlocuteur
Dans la colonne SON
A / B normal : On entend le personnage A / B avec une voix normale
A / B filtré : On entend le personnage A / B avec une voix filtrée
A(X) / B(X) : On n’entend pas la voix de A / B .


La logique que nous avons utilisée pour le remplissage du tableau de la continuité est d’imaginer un changement de plan entre un personnage A et le même personnage A avec une attitude différente ( A passe d’une écoute filtrée à du silence dans la Fig.1)
Pour distinguer les 2 cas de CONTINUITE et RACCORD, nous avons opté pour un code-couleur :
• La Barre NOIRE qui sépare les colonnes des personnages 1 et 2 signifie qu’il y a un changement de personnage à l’image. C’est le type RACCORD défini plus haut.
• La Barre BLEUE séparant les colonnes des personnages 1 et 2 signifie qu’il y a un changement d’attitude du personnage mais que l’image reste sur la même personne. C’est le type CONTINUITE défini plus haut.
La colonne de droite TYPOLOGIE propose une description succincte du cas de figure.
Comment lire les lignes de ce tableau (Fig.1) ?
• Ligne 1 : C’est l’alternance entre un plan où l’on voit A parler avec une voix normale et un plan où on voit B parler aussi avec une voix normale.
Fig1. Exemple de remplissage de tableau typologique
• Ligne 2 : C’est l’alternance entre un plan où l’on voit le personnage B écouter A avec une voix filtrée et un plan où l’on voit A parler avec une voix normale.
• Ligne 3 : Dans le même plan, le personnage A qui entendait bien le personnage B avec une voix filtrée, ne l’entend soudain plus.
b. Le modèle probabiliste
Pour remplir le tableur, nous sommes partis d’un raisonnement fondé sur un arbre des probabilités94 dont voici le schéma ci-dessous :

• Ligne 2 : C’est l’alternance entre un plan où l’on voit le personnage B écouter A avec une voix ?ltrée et un plan où l’on voit A parler avec une voix normale.
• Ligne 3 : Dans le même plan, le personnage A qui entendait bien le personnage B avec une voix ?ltrée, ne l’entend soudain plus.
b. Le modèle probabiliste
Pour remplir le tableur, nous sommes partis d’un raisonnement fondé sur un arbre des probabilités dont voici le schéma ci-dessous :
Dans un arbre de probabilités, une manière empirique de dénombrer tous les cas possibles est de multiplier le nombre de combinaisons possibles à chaque « étage ».
En multipliant, pour chacune des 4 cases du tableau, tous les choix qui sont possibles, on obtient au final 148 cas possibles. Dans les cases 1 et 3, on peut choisir à la fois le personnage qui est à l’image (A ou B) et son action (parler / écouter), ce qui revient à 4 choix possibles.
Pour les cases 2 et 4, on choisit le son concernant la personne qui est à l’image (voix normale, voix ?ltrée, pas de voix), ce qui revient à 3 choix possibles.
c. Décimation des redondances
Pour autant, ces 148 cas ne font pas 148 téléphèmes au sens où Michel Chion les a définis. Dans ces 148 situations, la moitié des cas ne sont qu’une répétition d’un cas de figure avec le personnage réciproque.
Par exemple, du point de vue pratique ce n’est pas pareil de dire « On voit Aude qui entend Daniel filtré » et « On voit Daniel qui entend Aude filtrée ». En revanche du point de vue purement typologique, il n’y a pas une différence de catégorie pertinente entre « On voit A entendre B filtré » et « On voit B entendre A filtré ». Dans l’arbre des probabilités que nous avons au-dessus, cela revient à n’avoir le choix qu’entre 2 possibilités dans la case 1 (A parle ou A écoute). On obtient le calcul 2x3x4x3 = 72 cas. Il y a 72 cas réels.
En revanche, nous considérons que l’ordre dans lequel la suite d’actions est commise a une importance. C’est un système séquentiel.
Par exemple « On voit A parler normalement puis B l’entendre filtré » n’est pas similaire à «On voit A entendre B filtré puis B parler normalement ». Même si le personnage est le même
(CONTINUITE), cette remarque reste valable. Par exemple il y a une différence entre « On voit A qui entend bien le personnage B avec une voix filtrée, et soudain il ne l’entend plus » et « On voit A qui n’entend rien puis soudain il entend B filtré »
Parmi les 72 cas que nous avons comptabilisé, il y a 6 autres cas qui ne sont réels.
Dans l’arbre de probabilités nous voyons que par le biais des traits bleus qui correspondent à la continuité, il est par exemple possible d’obtenir la suite « A parle A normal --- A parle A normal » ce qui est en fait un cas de continuité totale ou rien ne change pour le personnage, ni attitude physique ni son. Nous comprenons par suite que ces 6 cas ne représentent aucun intérêt dans notre classification. Nous nous trouvons dès lors à 66 cas réels.
d. Ajout de cas particuliers
La pièce radiophonique
Remarquons que de la même manière que nous avons pris en compte l’absence de son pour traiter les films muets, nous aurions pu prendre en compte l’absence d’image. Cela nous aurait obligé à rajouter une catégorie A(X) et B(X) dans la colonne image. Dans le chapitre «Hypothèses de départ et mise en place de vocabulaire », nous avons fait une simplification en disant que nous ne traiterions pas tous les cas d’alternance entre une image noire et une image de personnage. Cela aurait, en effet, complexifié la typologie de manière conséquente (5x3x5x3=225 cas au lieu de 148) pour une utilisation qui est absente à toute pratique cinématographique. Néanmoins il y a un cas particulier que nous tenons à étudier : celui de
l’absence d’image pour les deux personnages. Il s’agit en fait de la configuration d’une conversation téléphonique dans une pièce radiophonique. Il est tout à fait imaginable de rencontrer ce genre de séquence au sein d’un film, si par exemple les personnages sont dans l’obscurité totale (panne d’électricité mais téléphones portables en marche) comme c’est le cas dans Buried.
Dans le tableur nous avons donc accolé ce cas particulier en supprimant tout bonnement la colonne IMAGE :
Tableau des combinaisons possibles pour la pièce radiophonique
Il y a en tout 9 possibilités pour ce cas particulier. Sans son ni image, le cas 9 ne présente aucun intérêt, nous le retirons du dénombrement des cas réels. Les cas 1 et 5 sont très fréquents ainsi que les cas 2 et 4 qui permettent à l’auditeur d’adopter un point d’écoute. Les 3 et 6 correspondent au cas où on n’entend qu’un personnage : comme au théâtre, l’imaginaire du spectateur est sollicité pour trouver ce qui peut être répondu.
Nous rajoutons donc 8 cas réels aux 66 déjà trouvés soit 74 cas réels.
Le split-screen
Comme vous avez sûrement pu le remarquer, nous n’avons pas encore traité le cas du split-screen. C’est à la fois un cas de raccord puisque nous voyons deux personnes à l’image et un cas de continuité puisqu’il n’y a par définition pas de point de montage. Nous n’avons pas pu intégrer le split-screen dans le tableau général étant donné qu’il aurait fallu fusionner les colonnes IMAGES des 2 personnages.
Nous remarquons que pour le split-screen, le comportement typologique est similaire à celui de la pièce radiophonique : en effet, puisque tout est vu avec les 2 images, les attitudes des personnages n’ont pas d’importance. Nous obtenons donc le tableau suivant :

Nous avons considéré, dans ce cas bien particulier que quand A parle d’une façon donnée, B écoute nécessairement de la même façon. Le passage de la colonne PERSO 1 à PERSO 2 signifié par une barre GRISE correspond à une alternance des répliques dans le temps et non
à un changement de plan. Notons le cas 9 qui correspond ici au film muet en split-screen, beaucoup été utilisé au début du XXe siècle96. Il nous faut rajouter ces 9 cas particuliers aux 74 déjà trouvés.
A l’issue du dénombrement du système de classification, nous obtenons 83 cas uniques et réels. Reste maintenant à savoir comment les associer pour en faire des familles de types.

4. Présentation des résultats de la typologie alternative
Nous venons de montrer les cas particuliers qui ne rentraient pas directement dans les 66 cas du système de classification général. Maintenant, nous allons présenter quelques grandes familles typologiques issues du tableur. Nous prenons le terme de famille aux mathématiques, c’est une suite finie d’éléments d’un ensemble. Ici l’ensemble est composé des 83 cas uniques et réels.
a. Le film muet
Commençons par les origines du cinéma avec les films muets. Cette famille se caractérise dans le tableur comme étant une combinaison d’absence de son pour A (noté A(X)) et d’absence de son pour B (noté B(X))

Fig5. Tableau des combinaisons possibles pour le film muet

Le type film muet est similaire à la définition donnée par Michel Chion pour le téléphème 0.
La différence est qu’ici on en décline les variations. Il y a en tout 7 combinaisons de film muet, dont 4 sont des raccords entre 2 personnages. Il y a également 2 cas où il y a continuité d’un seul personnage. La dernière ligne est un rajout du cas particulier du split-screen.
b. Toutes les familles typologiques

Fig6. Capture d’écran du tableur Open Office permettant d’explorer tous les cas

Certaines familles que nous allons voir ici englobent les téléphèmes de Michel Chion.
Il existe un très grand nombre de familles dans l’ensemble de 72 éléments, nous ne révélerons que celles qui représentent un intérêt pour l’analyse des films mais si toutes les autres font réellement partie de la classification que nous proposons. Pour des raisons d’économie d’espace nous n’allons pas donner les tableaux de toute les familles mais simplement en donner les définitions. Pour voir plus de familles, vous pouvez vous rapporter au tableur de l’annexe DVD p.150
Les familles ne sont pas indépendantes, dans le sens où un cas de figure peut appartenir à deux familles.
Il est bien sûr plus facile d’explorer le tableur pour retrouver le cas de figures. Nous allons donner ici quelques familles représentatives et les critères qui les définissent. Notez que dans le tableur se trouvent l’ensemble des 148 cas pratiques plus les cas particuliers. Pour voir
uniquement les cas uniques, il faut cocher l’onglet cas réel.

Liste des familles :
La Famille Continuité :
c’est la famille des conversations téléphoniques où l’on ne voit qu’un seul des 2 correspondants. Dans le tableur, c’est l’ensemble des colonnes séparées par une barre bleue (A I A ou B I B).
Et au sein de cette famille :
• La famille Continuité de parole : On ne voit qu’un seul personnage qui ne fait que parler.
• La famille Discontinuité d’attitude : On voit un seul personnage qui alternativement parle et écoute (idem qu’écouter et parler).
• La famille Focalisation partielle ( VOIR ANNEXE )
On voit un seul personnage qu’on entend parler. On n’entend jamais ce que son interlocuteur lui dit. La focalisation signifie que le spectateur s’identifie au personnage, mais de manière partielle puisque le spectateur n’entend pas « comme lui ».
• La famille Focalisation totale : On voit un seul personnage qu’on entend parler. On entend aussi son interlocuteur. La focalisation signifie que le spectateur s’identifie totalement au personnage, il ne voit que lui et entend « comme lui ».
La Famille Raccords :
C’est la famille des conversations téléphoniques où l’on voit au moins une fois chacun des 2 correspondants. Dans le tableur, c’est l’ensemble des colonnes séparées par une barre noire (AB ou BA).
Et au sein de cette famille :
• La Famille Raccord sur la parole : ( VOIR ANNEXE ) On voit toujours les 2 interlocuteurs en train de parler mais jamais en train d’écouter.Cela correspond à la définition du téléphème 1 de Michel Chion.
• La Famille Raccord sur l’Ecoute : ( VOIR ANNEXE ) On voit toujours les interlocuteurs en train d’écouter mais jamais en train de parler.
• La famille Raccord sonore : Lorsqu’on passe visuellement d’un personnage à un autre, le son de celui qui parle n’est pas modifié.
• La famille Raccord réaliste : Lorsqu’on voit un personnage, on l’entend parler normalement et on entend son interlocuteur en son filtré. Par voie de conséquence, si on voit un personnage on l’entend en son filtré et son correspondant en son normal. Cela correspond au téléphème 4.
• La famille Raccord inégal : Le comportement d’écoute et de parole des 2 personnages n’est pas le même. Par exemple quand on voit A parler il a une voix normale mais quand on voit B parler il n’émet pas de son.
D’autres familles ont une valeur plus anecdotique :
La famille Intrusion :
C’est quand on voit un personnage A avec une voix quelconque et qu’on entend son interlocuteur B avec une voix normale. Cela donne l’impression que l’interlocuteur est réellement présent dans la pièce avec le personnage.
La famille Ecoute téléphonique : ( VOIR ANNEXE )
C’est quand on voit 1 ou 2 personnages mais que de notre point d’écoute de spectateur on n’entend jamais sa (leurs) voix normale(s). On peut soit ne rien entendre soit l’entendre en son filtré.

c. Conclusion
Nous avons établi une liste de familles qui nous semblaient pertinentes par rapport aux cas que l’on rencontre dans les films. Il n’en reste pas moins que dans le tableur certaines cases TYPOLOGIE restent vides et bien qu’en faisant preuve d’imagination, il est difficile de voir
comment cela pourrait s’appliquer dans un film et trouver le bon terme qui définisse ces actions.
Nous souhaitons que ce travail reste ouvert et que d’autres personnes poussent ce raisonnement dans ses plus grands retranchements, en proposant des analyses et des nomenclatures, nous n’avons fait que mettre en lumière tous les cas possibles.
Il est vrai que nous aurions pu tenter d’appliquer cette méthode à l’analyse de certains films, mais le but n’était pas tant de mettre l’outil à l’épreuve de l’analyse que de permettre de définir cet outil en expliquant son mode de fonctionnement et en définissant les résultats.
Etant donné le nombre de solutions, et la difficulté d’y voir clair, l’idée a vite germé d’offrir un outil interactif qui permettrait à un spectateur-explorateur de naviguer dans tous ces cas de figure de manière simple et intuitive. C’est l’objet de la création d’une interface logicielle que
nous verrons dans la partie 5, qui permet d’avoir un résultat concret et immédiat à l’image.
Mais avant cela dans la partie 4, nous verrons sur quoi se base l’idée d’interactivité au cinéma.

sommaire

PISTES DE REFLEXION POUR UN CINEMA INTERACTIF

A. De l’interactivité dans l’Art à l’Art interactif

1. Interactivité et interfaces
a. Une définition de l’interactivité
L’interactivité est une situation de communication entre au moins deux systèmes humains ou non humains, où le processus d’échange est conditionné par une collaboration, une coopération ou une rétroaction entre les acteurs visant à produire un contenu, réaliser un objectif, ou adapter leurs comportements réciproques. La communication interactive s'oppose à une communication à sens unique, sans réaction du destinataire, sans « feed-back » ou boucle de rétroaction. Nous pensons nécessairement à la situation d’interaction la plus simple qui est le dialogue entre deux personnes : ce qui est dit par notre interlocuteur influence notre propre parole (normalement). Le deuxième type d’interaction que nous rencontrons
fréquemment est l’interaction homme-ordinateur. Par exemple, quand je tape une lettre sur mon clavier d’ordinateur, l’ordinateur affiche la lettre, cela m’influence en m’autorisant à taper le caractère suivant.
b. L’interface
Au sein du processus d’interactivité se trouve l’interface. C’est l’objet physique ou conceptuel qui permettra d’adapter les modes de communication des acteurs pour qu’un échange soit possible. En terme de télécommunication, cela correspond au codage de canal qui traduit un
message émis pour être compréhensible du récepteur. Dans les deux exemples que nous avons évoqués précédemment, les interfaces seraient le langage oral et gestuel dans le cas du dialogue et le clavier pour l’interaction homme-ordinateur. Ce n’est pas un hasard si les périphériques informatiques (souris, écran, clavier ou imprimante par exemple) s’appellent aussi des interfaces.
Nous voyons donc que le téléphone, même si cela peut paraître évident, est un objet typiquement interactif. L’interaction homme/homme dans les télécommunications se décompose en fait en plusieurs interactions. Dans les conversations classiques entre deux individus, il y a d’abord deux interactions homme-téléphone : on peut par exemple commencer à parler parce qu’on a composé le numéro et que le téléphone nous assure que la
communication va commencer. Vient ensuite l’interactivité entre les 2 téléphones : échange essentiellement électronique.

2. L’art interactif puise dans tous les arts.
a. La part d’interactivité dans les arts
Contrairement à ce que l’on pourrait croire, l’interactivité dans l’art n’est pas une notion qui est apparue avec les technologies de l’informatique. Elle s’est énormément accrue avec les évolutions techniques qui en ont même fait un art nouveau : l’art interactif. Mais dès les premières formes d’art on voit apparaitre une volonté de donner un rôle au spectateur dans l’œuvre. Voici la meilleure définition que nous pourrions donner :
« L'interactivité dans l’art repose sur son aspect social, voire politique, par l'implication active, souvent ludique du visiteur/spectateur dans l'œuvre. » . Complétons en mentionnant que l'interactivité d’une œuvre ne repose pas uniquement sur son coté participatif avec un public, il peut aussi s’agir de lier deux variables indépendantes qui ne concernent aucunement le spectateur. C’est par exemple le cas de l’installation urbaine de Zadar où des marches situées en front de mer font office d’orgue géant en transformant la brise marine et les vagues en musique aléatoire. C’est une interaction entre un élément climatique variable et un instrument de musique.
Dans les œuvres d’art dites classique, il y a déjà au sens où nous venons de le définir des traces d’interactivité. La forme d’interactivité se trouve essentiellement entre un objet : une œuvre d’art, et un spectateur. Dans les œuvres d’art classiques, la part d’interactivité peut paraître minime dans le sens où c’est surtout l’œuvre qui conditionne le spectateur par la transmission de signifiant et d’émotion, et très peu le spectateur qui a un quelconque pouvoir sur l’œuvre. Mais modifier notre vision de l’œuvre revient à modifier l’œuvre. Notons que lorsque nous nous trouvons à proximité d’une sculpture qui est un volume en trois dimensions, il est difficile d’en voir sa totalité, nous devons modifier notre position pour tout
percevoir. Notre vision de la sculpture « change » en fonction de notre position dans l’espace.
Il y a bien interactivité. Pour la peinture, c’est la taille du tableau, la richesse et la taille des détails qui va dicter la distance à laquelle nous souhaitons la regarder. Jouer avec le point de vision du spectateur a d’ailleurs été très vite expérimenté avec la toile de Hans Holbein, où un dispositif anamorphique permet de voir apparaître une tête de mort selon un angle de vue précis.
Dans le cas de la musique, il y a évidemment une propension à l’interactivité puisque dès lors que l’on joue d’un instrument, les sons sont la conséquence d’un geste et réciproquement, les gestes sont dictés en prévision du son qu’ils vont produire. Jouer de la musique à plusieurs revient à converser avec plusieurs personnes mais en utilisant une autre forme de langage.
Dans le domaine de la poésie, nous penserons aux Cent mille milliard de poèmes de Raymond Queneau qui est une œuvre de poésie combinatoire : des objets élémentaires de poésie peuvent être combinés pour former un poème parmi des milliards d’autres possibles
b. L’art interactif
Et puis petit à petit, en marge des formes d’art traditionnelles, s’est formé l’art interactif qui s’approche à plusieurs égards de l’art de l’installation. C’est en fait une discipline émergente et mouvante, aux frontières mal définies, qui selon les points de vue peut être une « discipline fourre-tout » ou bien une discipline transversale. Les arts interactifs ont pour point commun de ne pas être destinés nécessairement à une diffusion large et donc à une industrialisation comme pourrait l’être le cinéma. Ce n’est pas une culture « mainstream » mais lors de la dernière décennie elle s’est considérablement institutionnalisée. L’art interactif connait ses lettres de noblesse depuis l’arrivée de l’ère informatique dans les années 80 et la capacité des machines à interroger de grandes bases de données, à gérer en parallèle plusieurs types de media (texte, son, image, réseau), le tout dans des délais qui concurrencent largement l’intelligence humaine. Bien souvent des objets que nous manipulons au quotidien sont détournés, trafiqués, augmentés pour en faire des interfaces (horloges, téléphones, télévisions, haut-parleurs, etc.) ou bien c’est l’espace publique qui est pris comme terrain de jeu. C’est le cas dans l’œuvre interactive Video Piece for two glass office buildings où le spectateur situé entre deux bureaux d’immeuble en vis-à-vis se voit sur un moniteur avec un décalage de 8 secondes alors qu’il croit voir le bureau qui est en face.
L’étude des différentes tendances et préceptes de l’art interactif ferait sans doute l’objet d’une centaine de thèses. Ici, je voulais simplement rappeler les pratiques générales de cet art, sans m’épancher sur ces courants.

B. Et pour le cinéma : quelles formes d’interactivité ?

Au sein de l’art interactif, le travail autour de l’image n’est pas en reste, loin s’en faut. Cette pratique que l’on retrouve dans l’Art Vidéo ou le VJing s’attèle à questionner l’esthétique de l’image, et son pouvoir plastique plus que sa signification. La narration est, quant à elle, relativement moins présente dans les œuvres interactives. Et pourtant le cinéma qui est un media sonore et visuel offre des voies de détournement multiples. Voyons maintenant comment le cinéma, au cours de sa longue histoire a incorporé des éléments d’interactivité.
1. Rapport du spectateur à l’écran
Bien sûr, en s’asseyant au fond d’une salle de cinéma, nous avons une expérience perceptive différente qu’en s’asseyant au premier rang. Ce qui compte n’est pas tant la position que l’immobilité par rapport à l’écran. Les remarques du chapitre précédent concernant le rapport du spectateur à une sculpture et à une peinture ne s’appliquent pas dans le cas du cinéma.
Dans une salle de cinéma, tout est fait our que le spectateur ait une position fixe, son rapport à l’image restera le même, et il en est de même pour le son. Reste la possibilité pour lui de choisir de regarder une partie de l’écran en particulier à un moment donné. C’est d’ailleurs cette vision « partielle » de l’image qui différencie entre autre l'expérience cinématographique et télévisuelle où notre les petits écrans permettent de voir l’image dans sa totalité. Comme cela est dit par Walter Murch dans En un clin d’oeil, le travail du monteur consiste à guider le regard du spectateur sur la zone de l’image qu’il souhaite montrer, souvent sur les acteurs.
Par exemple si un plan est trop long, il y a fort à parier que le regard se détourne vers des détails insignifiants. Nous pouvons considérer que la liberté donnée au spectateur pour se placer par rapport à l’image est faible.
2. Un film pendant le film : l’histoire que se raconte le spectateur
Là où il faut chercher une dose de « participation » du public, c’est dans la façon dont l’auteur va réussir à donner au spectateur les moyens de se construire une histoire à l’avance, de s’imaginer des scénarii, de faire des suppositions. Cela est très dépendant des genres de film :
dans un film policier ou un thriller le spectateur peut quasiment mener sa propre enquête là où un film dramatique cherchera a jouer avec la sensibilité du spectateur plus qu’avec sa raison.
On peut dire comme précédemment que c’est la vision de l’œuvre qui fait l’œuvre. Il revient donc aux scénaristes et aux cinéastes de manipuler la vision le spectateur, lui donner à croire telle ou telle chose, l’induire en erreur. Les créateurs se posent aussi la question de savoir ce qui doit être donné au spectateur et que les personnages du film ne savent pas, et inversement de cacher les vérités des personnages aux spectateurs. La projection d’un film se déroule devant un groupe de personnes, l’atmosphère collective joue très peu à part dans les films d’humour ou d’horreur où la réaction de notre voisin de siège peut influencer la nôtre. Dans la plupart des cas, l'expérience d’un film au cinéma se vit seul. Et pourtant voir un film au cinéma, en plus du confort technique qu’il offre, s’oppose radicalement à la vision d’un film,
seul chez soi. Pourquoi ?
Au cinéma, dès lors que l’on sort de la salle, on confronte ses interprétations avec celles de ses amis ou de ses proches. A cette occasion nous prenons conscience de la diversité des points de vue. « Avons-nous vu le même film ? ».
Dans certains films, les différentes interprétations sont directement représentés par le choix des auteurs de proposer plusieurs alternatives narratives : le spectateur fera son choix.
3. Une forme d’interactivité : les fictions participatives
Les expériences d’interactivité en salle de cinéma se sont alignées sur l’idéologie dominante de la fiction participative : le spectateur devient acteur, voire auteur en choisissant lui-même son parcours fictionnel à l’intérieur du film. Bien entendu, il ne s’agit pas de choix libres, mais imposés par la programmation pré-établie du scénariste.
a. Le choix d’un destin
Dans Le Hasard, on suit les différentes hypothèses d’un jeune homme selon que celui-ci ait couru pour attraper un train en marche, couru mais été arrêté par le chef de gare ou simplement regardé le train s’éloigner. Ce film étonne par la façon dont il rappelle la position dans laquelle chacun d’entre nous se trouve dès lors que nous faisons face un choix important et lorsqu’on imagine les conséquences d’un choix différent : « Peut-être que si j’avais agi ainsi » Ce film propose une forme de jeu au spectateur par au moins deux aspects. Comme dans tous les films le spectateur tente de deviner ce qui arrivera aux héros, ici ses suppositions sont confortées par l’idée qu’il n’existe de toute façon aucune vérité mais 3 possibilités.
D’autre part, comme tous les films où plusieurs alternatives sont montrées, le spectateur, selon ses affinités avec l’histoire, peut choisir celle qui lui correspond le mieux. Le but du réalisateur n’est surement pas de faire choisir son histoire préférée au spectateur mais d’illustrer comment des choix ou des conditions initiales différentes ont pu conduire à des conséquences semblables, différentes ou contradictoires. C’est d’ailleurs en empruntant la théorie du chaos et son principe fondateur d’« effet papillon » qu’apparait le film éponyme :
L’effet papillon. Ici, c’est l’idée de revenir aux causes d’un accident pour en modifier, même imperceptiblement, les conditions initiales et agir pour modifier les conséquences.
Dans cette veine, nous ne manquerons pas de citer Minority Report de S.Spielberg où des agents de police sont chargés d’arrêter des individus en prédiction de leur meurtre à venir.
Bien entendu le mécanisme déterministe est rompu dès lors qu’un des policiers apprend qu’il va lui aussi passer à l’acte.
Mais dans beaucoup de films, (99 francs, Brazil) c’est la fin qui est déclinée sous plusieurs alternatives puisque c’est souvent à cet instant du film que la tension dramatique est à son plus haut point. Il faut toutefois distinguer les fins alternatives des « fausses » fins pour lesquelles il s’agit de prendre à contre-pied le spectateur qui s’attend à en rester là.
b. Le choix d’un regard
Voyons maintenant une seconde forme des fictions participatives où ce n’est pas le destin du héros qui diffère mais plutôt la façon dont l’histoire est racontée par le choix des témoignages, le choix des images, le choix du contexte par exemple. Cette forme propose au spectateur la
comparaison. Ce cas nous intéresse tout particulièrement parce qu’il se rapproche de la forme d’interactivité que nous souhaitons développer dans notre partie pratique : un contrôle du spectateur qui n’agit pas sur le destin des personnages mais sur le regard qu’on porte sur eux.
Dans cette catégorie, c’est le film de 1950, Rashômon qui sert de référence. C’est l’histoire d’un crime qui est raconté sous des versions très différentes par 4 personnes, témoins ou acteurs du crime. Quatorze ans plus tard, le scénario est repris à la mode western dans L’outrage de Martin Ritt. La même histoire racontée dans un contexte différent ou avec un genre cinématographique différent a aussi été expérimenté. Dans Melinda & Melinda, Woody Allen reprend l’idée de Raymond Queneau qui avait décliné dans ses Exercices de style , 99 fois la même histoire avec 99 styles littéraires différents (litotes, alexandrins, macaroniques). Dans Melinda & Melinda, Woody Allen s’applique à voir la vie de Melinda en utilisant les ressorts narratifs de la comédie ou de la tragédie.

4. Des exemples de montage interactif
Dans les films dont nous avons parlé précédemment, l’insertion d’une part d’alternative dans l’histoire, créatrice d’une forme de ludisme avec/pour les spectateurs, constituait une volonté écrite dès le scénario du film et immuable une fois le film tiré sur pellicule ou copié sur DCP.
Mais Catherine Guéneau déplore le statut réservé au spectateur : « Un homme nouveau tourné vers l’horizon interactive doit renaître des cendres du spectateur depuis trop longtemps esclave de l’enchaînement ininterrompu des images » et propose d’outrepasser sa passivité en le reconsidérant comme un « spectacteur »
Le spectacteur pourrait donc modifier le cours de l’histoire du film en temps réel. Ce procédé rappelle fortement celui du jeu vidéo dans lequel, même si les histoires sont déjà écrites, c’est au joueur de décider à quel rythme il avance et dans quels embranchements il se lance pour créer sa propre histoire. La particularité des jeux vidéos est que chaque partie est unique et par conséquent certains scénarii imaginés par les développeurs sont ignorés du joueur. Ces dernières années, l’évolution des technologies ont permis de rendre possible l’idée d’un cinéma interactif dans lequel le spectateur-joueur aurait sa part de responsabilité dans le résultat visible à l’écran. Cette démarche est assez proche des web-documentaires, mais ceux-ci s’adressent plus généralement à un spectateur unique se trouvant devant son ordinateur et les contenus ne sont pas fictionnels. Nous citerons le film d’horreur interactif The Outbreak, film en ligne dans lequel on doit prendre une suite de bonnes décisions pour ne pas être
dévorés par une bande de zombie.
a. Un film interactif téléphonique : modèle de Last Call
Il nous faut maintenant mentionner un film interactif qui est un modèle du genre et qui nous a conforté dans l’idée qu’un croisement entre l’aspect ludique du jeu vidéo et le cinéma était possible, ou du moins méritait réflexion. Last Call, un film d’horreur de l’allemand Jung Von Matt est le premier film interactif à être sorti en salles. Voici ce que l’on peut lire à propos du film : « Les spectateurs sont invités à donner leur numéro de téléphone portable à l’entrée du cinéma. Aux moments décisifs du film, l’héroïne appelle l’un d’eux afin de lui demander conseil : « Je monte ou je descends les escaliers ? », « Je l’aide ou je m’enfuis ? Les spectateurs peuvent ainsi influencer le cours de l’histoire. »
Grâce a un procédé de reconnaissance vocale, la voix du spectateur est transformée en commande informatique. A chaque fois, il y a plus d’une vingtaine de séquences préenregistrées pour coller le plus possible à la réponse du spectateur. L’utilisation de téléphones portables dans une salle de cinéma est à la fois un pied-de-nez à l’interdiction systématique de son usage dans cet endroit et un clin d’oeil au film des années 70, When a
stranger calls, dans lequel l’enjeu dramatique fort réside dans le fait que l’appel de menace provient de la maison même où se trouve la victime et non de l’extérieur comme supposé.
Pendant le tournage de Last Call, il a fallu filmer une réponse pour chacune des commandes des spectateurs. Cela rappelle que dans les tournages conventionnels, sans que les actions des acteurs soient réellement différentes d’une prise à l’autre, les scriptes peuvent inciter à des petites variations de mise en scène (« ne coupons pas avant la sortie de champ du comédien ») dans le but d’offrir au monteur plusieurs alternatives de montage et ne pas le bloquer dans une situation élaborée au tournage et qui s’avère ne pas fonctionner pour diverses raisons. Comme le dit le réalisateur Francis Ford Coppola, il y a en réalité trois écritures pour un film : une fois à travers le scénario, une fois pendant le tournage et une fois
pendant le montage. Dans le cas du film interactif, le spectateur s’empare, en partie et sous contrôle, de la troisième écriture.
b. Twixt : Présentation de différents montages en temps réel
Francis Ford Coppola, en expérimentateur des nouvelles formes filmiques, s’est s’intéressé aux nouvelles formes cinématographiques que pourraient permettre l’intégration d’outils interactifs dans la diffusion des films. C’est dans cet esprit que pour son nouveau film, Twixt, sorti fin 2011, il a effectué une tournée de 10 projections à travers le pays dans lesquelles il pouvait contrôler en partie le montage de son film en fonction des réactions du public. Muni d’une tablette Ipad, il pouvait contrôler la longueur des séquences en ajoutant des suites pré-établies de plans permettant de rendre le film vivant et adapté à l’ambiance de la salle. Selon lui, la révolution du numérique offre des perspectives plus grandes que le relief, qu’il utilise d’ailleurs avec parcimonie, relief qui n’a rien de novateur dans le fond si ce n’est les profits financiers qu’il permet de dégager... Avec l’expérience qu’il a mené pour Twixt,
Coppola a montré qu’une autre forme de cinéma était possible : tout en ne donnant pas entièrement les clefs du film aux spectateurs (ce qui peut se comprendre), il a permis au public d’avoir sa part dans la réalisation en temps réel du film. Le cinéma est devenu un spectacle vivant.

Si le cinéma tel que nous le connaissons à l’heure actuelle n’a rien de vivant, cela n’a pas toujours été le cas. A l’époque du cinéma muet, des musiciens jouaient en même temps que le film était diffusé, ce qui d’ailleurs semble revenir au goût du jour avec les prestations du groupe Air qui a récemment sorti une nouvelle bande-son du film muet Le voyage dans la lune , de Georges Méliès. Les films muets de la première époque étaient notamment remarquable par le fait que chaque projection était une projection unique : que ce soit à cause de la musique du film dépendante des musiciens présents, de la durée variable du film due à la projection à la manivelle, ou des imperfections de la pellicule dépendant de la copie. Nous
devons constater qu’avec le cinéma numérique d’aujourd’hui, les copies sont parfaitement identiques, et les différentes séances d’un même film ne se distinguent que par les qualités techniques des salles dans lesquelles elles sont diffusées. Il semblerait qu’un retour à une part de spectacle puisse voir le jour dans les décennies qui viennent. C’est du moins le point de vue Coppola. L’avenir lui donnera peut-être raison.

sommaire

CONCEPTION ET REALISATION D’UN FILM INTERACTIF (PPM)

Genèse de la partie pratique de mémoire
Réaliser un film dans cette partie pratique de mémoire est pour moi l’occasion d’expérimenter pour la première fois la réalisation audiovisuelle. A chaque fois que j’ai pu réaliser des fictions ou des documentaires radiophoniques, j’ai trouvé que le fait de porter un projet, d’en avoir l’idée et la responsabilité m’aidait pour les projets suivants où je n’étais que collaborateur. Se mettre dans la peau d’un réalisateur me permettra, je pense, de comprendre des enjeux jusqu’alors inconnus ou méconnus et principalement ceux qui ne concernent pas les outils de réalisation. Cependant, étant donné que c’est ma première expérience de la sorte, je n’ai pas la prétention de faire un film qui puisse être présenté à un public, ni même plaire.
C’est sa conception et les différentes étapes de sa réalisation qui m’importent plus que la volonté d’atteindre un résultat. En tout état de cause, ce film ne compte pas s’inscrire dans la conception habituelle des films, puisqu’il sera interactif. L’idée de faire un film interactif m’est venue suite à la découverte du film interactif Last Call, décrit dans la partie précédente, qui a la particularité d’intégrer des téléphones portables comme interfaces.
! Ma partie pratique, qui est un aboutissement du mémoire plus qu’une illustration, se découpe en deux réalisations majeures, distinctes et complémentaires. La création d’un film interactif, c’est en fait la combinaison d’une partie programmatique qui décide des modes d’interaction autour d’une interface, et d’un contenu filmique adapté au programme ; en découlent naturellement les deux étapes de conception qui ont conduit à la réalisation du film interactif.

Présentation du projet
J’ai choisi d’illustrer de manière expérimentale les différentes configurations de conversations téléphoniques audiovisuelles. Grâce une interface interactive développée sous le logiciel libre PureData, un utilisateur pourra monter en temps réel une séquence filmique de conversation téléphonique. Afin de convenir au format spécial qu’impose le logiciel, nous allons tourner le 2 juin 2012 un film sur la base d’un scénario original. Pour bien comprendre les enjeux de ce travail nous allons commencer par concevoir les modes de fonctionnement interactif du logiciel pour voir ensuite les contraintes de tournage que cela impose, et ensuite justifier les choix scénaristiques qui ont été faits.
A. Création d’un logiciel interactif : Le LaBoPhone
Sur certains DVD, par exemple les DVD de concert, les utilisateurs peuvent choisir l’image entre plusieurs caméras (technologie multi-angle). Dans le LaBoPhone, l’utilisateur aura le choix entre 2 « angles » correspondant aux 2 interlocuteurs d’une conversation téléphonique. En plus de cela, il aura le choix d’entendre les voix des personnages avec effet téléphone (filtrage) ou non.
1. Les 83 combinaisons audiovisuelles
Nous nous référerons ici largement à la seconde partie de ce mémoire dans laquelle nous avons détaillé ce que nous avons appelé les typologies de conversations téléphoniques filmées. Les combinaisons possibles sont à la base de l’arithmétique du logiciel interactif.
Chaque personnage filmé dans une conversation téléphonique peut être en train d’écouter ou en train de parler. Parallèlement quand on le voit écouter, on peut entendre son interlocuteur de « vive-voix » ou « filtré » à travers le combiné téléphonique ; quand on le voit parler on
l’entend de « vive-voix » ou plus rarement « filtré » Pour plus de clarté, nous reprenons un extrait du tableur.

Fig1. Extrait du tableur d’exploration typologique

Pour un point de montage, symbolisé par la barre noire du tableau, qui fait basculer l’image du personnage A au personnage B, la combinaison de 2 sortes d’attitude (écouter / parler) et de 2 sortes de sons (son normal, son filtré, pas de son) conduit à de nombreux cas de figures.
Au total, selon un raisonnement qui est développé dans la partie 3.B, nous décomptons 83 cas de figures uniques.
Evidemment, la remarque qui vient immédiatement à l’esprit est que tous ces cas de figure ne sont pas utiles et même jamais rencontrés dans les films. Nous avons décidé dans notre démarche de ne rejeter aucun cas, y compris ceux qui peuvent paraître absurdes. Qui sait si l’on ne pourrait pas rencontrer une situation narrative dans laquelle cette combinaison audiovisuelle aurait un sens ? Le but du logiciel est de permettre à l’utilisateur d’explorer chacune des 83 possibilités de montage son/image des conversations téléphoniques filmées.
Parmi les cas les plus singuliers on peut citer :
- La pièce radiophonique : du son uniquement.
- Le split-screen : Le film muet : des images uniquement.
- La focalisation partielle : on entend et on voit un seul personnage.
- Le raccord sur paroles : on voit les personnages quand ils parlent uniquement.
- Le raccord sur l’écoute : on voit les personnages quand ils écoutent uniquement.
En voulant traiter un récit, une multitude de possibilités de mises en images et en sons s’offrent à nous. L’idée du logiciel est, à la manière d’un laboratoire, d’explorer les façons que l’on a de montrer un même récit par des outils sonores et visuels différents. Plus largement, l’idée est de permettre à plusieurs personnes de réaliser une construction personnelle du film à partir d’un scénario établi et d’images déjà enregistrées.
A cela nous voulons associer deux aspects qui entrent en résonance avec les différents points abordés tout le long de ce mémoire, à savoir :
• L’affichage de la désignation des situations audiovisuelles que l’opérateur expérimente.
Cela correspond aux familles de situations audiovisuelles développées dans le tableur «Tableau d’exploration typologique »
• La possibilité de régler les paramètres de filtrage de voix comme cela a été vu dans la première partie. Cela permettra à l’opérateur de choisir une esthétique de voix filtrée qui lui convient et de l’adapter en fonction des situations narratives.

2. Choix des outils de programmation et d’interface
a. Puredata
PureData est un logiciel libre de programmation, initié dans les années 90 par Miller Puckette à des fins de création musicale et multimédia. Il permet de gérer des signaux de tout genre en entrée/sortie et en temps réel (capteurs de mouvements, réseau internet, audio, video, texte), ce qui permet notamment de faire interagir des valeurs physiques a priori sans liens.
PureData est conçu de façon modulaire. Chaque utilisateur peut ainsi adapter le logiciel selon ses besoins. Il exploite un langage de programmation non procédural avancé qui permet à l’utilisateur d’effectuer des modifications de code sans qu’il y ait besoin de recompiler.
L’interface du logiciel n’est pas une suite de lignes de code mais une représentation visuelle de la logique qui sous-tend la programmation. Les éléments fondamentaux de code sont des objets ou « boîtes » dont les entrées et les sorties sont reliées par des fils, permettant leurs interactions.
Fig2. Les objets fondamentaux dans PureData
Des bibliothèques s’ajoutent à PureData, permettant d’autres fonctionnalités comme la video avec GEM (Graphic Environment for Multimedia) ou MrPeach pour le protocole OSC dont nous parlerons plus bas. Pd-extended, la version que nous avons utilisée pour réaliser le LaBoPhone, intègre toutes les bibliothèques.
Si PureData a l’avantage d’une manipulation facile pour le programmeur, en revanche l’interface est relativement austère pour un utilisateur novice, c’est pourquoi beaucoup lui préfèrent son grand frère payant MAX/MSP. Pour le LaBoPhone, nous avons choisi de déporter les commandes sur un smartphone ou une tablette iPad via l’application TouchOSC.
b. TouchOSC
TouchOSC120 est une application payante pour smartphones et tablettes (iOS et Android) qui permet d’envoyer des instructions via le protocole OSC (Open Sound Control) : ce dernier peut être filaire ou passer par un réseau sans-fil Wifi. L’avantage de cette application est de permettre de télécommander PureData puisque celui-ci accepte aussi le protocole OSC. En ayant définis des adresses IP et des numéros de ports pour la tablette (ou le smartphone) et l’ordinateur sur lequel se trouve le programme, il est possible d’en prendre totalement le contrôle à distance. L’autre avantage de TouchOSC est qu’il est accompagné d’un éditeur d’interfaces « TouchOSC Editor » qui m’a permis d’embellir le programme par
rapport à la version PureData. Il permet de créer différents boutons tactiles, des faders de volume, de gérer plusieurs pages. Cela m’a permis de penser sereinement l’ergonomie de l’interface-utilisateur, ce qui est plus difficile avec PureData.
Fig3. Page principale de l’interface portative du LaBoPhone

3. Cahier des charges du LaBoPhone
Ce cahier des charges, qui a été conduit en même temps que la réalisation du programme, permet de justifier les choix qui ont été faits. Il peut aussi largement servir de documentation pour toute personne souhaitant utiliser ce logiciel. Le LaBoPhone est composé d’une partie interface utilisateur qui sera la base des expérimentations et d’une fenêtre de projection qui permet de montrer le résultat visuel. La partie interface sera réservée à l’utilisateur et la fenêtre de projection à l’utilisateur, ainsi qu’à un éventuel public s’il s’agit d’une performance en Live.
a. L’Interface utilisateur
!Nous travaillons actuellement à la possibilité de déporter cette interface sur un iPad. A l’heure actuelle, toutes les sections qui sont décrites plus bas fonctionnent sur un iPhone. Il suffit d’appuyer sur les onglets 1, 2, 3, 4 visibles en haut du schéma ci-dessus, pour passer d’une section à une autre. La grande taille de l’écran d’Ipad permettrait d’afficher tous les éléments fondamentaux de l’interface sur une seule page afin d’avoir une vue globale des réglages effectués. Faute d’avoir une tablette iPad pour tester les affichages, les captures d’images que nous verrons ici seront celles d’un Iphone. Les blocs fonctionnels resteront peu ou proue les mêmes, seuls leurs agencements seront susceptibles de modifications. Nous nous réservons aussi le droit d’apporter des améliorations ergonomiques par rapport aux photos présentées ici.
Les principaux blocs fonctionnels
• Section TRANSPORT. Elle permettra de charger et de lire les 2 vidéos et les 2 bande-son correspondants aux 2 personnages. Elle comprendra les éléments de lecture standards (PLAY, PAUSE, STOP) ainsi qu’une barre montrant l’avancement de la vidéo. A terme, on pourrait ajouter 2 fonctionnalités :
- Avancer / reculer dans le temps avec la barre de curseur.
- Enregistrer en temps réel le montage en cours pour une éventuelle rediffusion.
Fig4. Page de transport dans l’interface du LaBoPhone

• Section FILTRAGE. C’est là que l’utilisateur pourra régler les différentes courbes de filtrage en fonction des situations téléphoniques. Il s’agira pour les personnages A et B d’un equalizer tactile d’une quinzaine de bandes fréquentielles comprises entre 200 Hz et 10 kHz. Les utilisateurs pourront choisir le volume de la voix filtrée avec un fader accolé à la courbe. A terme, nous souhaiterions associer une section de compression et de distorsion de la voix.
• Section AFFICHAGE. Cette section permettra principalement de gérer l’affichage sur l’écran de projection. C’est ici que l’utilisateur pourra choisir d’activer ou de désactiver l’option « split-screen» qui permet de réunir les fenêtres des 2 personnages. Dans le cas du split-screen la voix des personnages sera automatiquement latéralisée à droite ou à gauche selon leurs positions. L’utilisateur pourra choisir d’afficher ou non sur l’écran de projection la désignation des cas de figure qu’il est en train d’utiliser (mode muet, mode fiction radio, mode alternance sur écoute, mode split-screen, etc.)
• Section REGLAGES. Dans cette section seront réunis tous les pré-réglages possibles du logiciel. Ce sera le cas des filtrages sonores et de certaines des 20 combinaisons audiovisuelles décrites plus haut. Pour les filtrages, nous enregistrerons par exemple trois réglages standards selon le type de filtrage (Filtrage léger, Filtrage fort, Voix rendue inintelligible), mais cela n’empêchera pas l’utilisateur d’affiner les réglages dans la section FILTRAGE. D’autre part, il sera possible que les sons et les images correspondent aux situations classiques définies dans le tableau de la page 11 (A1-B1, A1-B4, etc.). Une fois le film tourné nous pensons relever les TimeCodes correspondants aux moments de parole et d’écoute des 2 personnages, ces données pourraient être intégrées au logiciel ce qui permettrait d’automatiser certaines fonctions si l’utilisateur le souhaite. On pourrait par exemple imaginer que le logiciel change automatiquement de plan de personnage dès qu’il y a changement de locuteur. Etant donné la relative complexité que représente l’implémentation de cette fonction dans le logiciel, nous n’en faisons pas l’une de nos priorités. Dans cette section, des réglages par défaut seront prévus lors du démarrage du logiciel.
Mais le but premier de ce logiciel interactif est de laisser à son utilisateur l’initiative de choisir en temps réel les points de montage qui correspondront au passage d’un interlocuteur à l’autre. Pour réaliser cette fonction, nous allons maintenant décrire la partie principale du LaBoPhone : La section MATRICE.
La section MATRICE
La section MATRICE est le cœur du programme. C’est là que l’utilisateur va pouvoir choisir d’alterner entre les images des 2 personnages mais aussi tester l’influence du son filtré ou non filtré sur l’image.
Tout d’abord, nous avons choisi un code-couleur qui permettra de distinguer les 2 personnages. Ceci est valable pour l’ensemble du programme.
• L’ORANGE est réservé au personnage A qui sera par défaut celui qui parlera en premier dans le film. Dans le cas du split-screen, le personnage A se trouvera dans la fenêtre de gauche.
• Le VERT est réservé au personnage B. Le personnage B se trouvera à droite dans les split-screens.

Fig6. Page principale de l’interface portative du LaBoPhone (MATRICE)

Sur la page MATRICE, il y a un gros bouton rouge « CUT » qui permet de basculer de l’image du personnage A au personnage B. De part et d’autre de ce bouton se trouvent deux colonnes concernant le réglage du son :
• La colonne de gauche est affectée au réglage du son quand le personnage A est visible à l’image. Pour signifier qu’elle est active, un petit feu ORANGE est allumé en haut de la colonne. Quand le feu est éteint la colonne est inactive.
• La colonne de droite est affectée au réglage du son quand le personnage B est visible à l’image. Pour signifier qu’elle est active, un petit feu VERT est allumé en haut de la colonne. Quand le feu est éteint la colonne est inactive.
Appuyer à plusieurs reprises sur le bouton CUT alterne les images des 2 interlocuteurs et active les colonnes gauche et droite à tour de rôle. Maintenant, il nous faut décrire le fonctionnement de ces colonnes.
Dans chaque colonne, les 2 premiers boutons en partant du haut, dénommés « Normal» et « Filtré » sont de la couleur de la personne qui est à l’image, ils agissent sur le son du personnage à l’image quand celui-ci parlera. Les 2 autres boutons « Normal » et « Filtré », de la couleur de la personne qui n’est pas à l’image, agissent sur le son de l’interlocuteur qui n’est pas à l’image (phases d’écoute).
Il est possible d’effectuer des réglages dans une colonne inactive (feu éteint), les réglages enclenchés seront effectifs au prochain appui sur le bouton CUT. Cela permet de préparer des réglages en prévision du prochain plan.
Remarques :
• Il n’est pas possible d’enclencher à la fois les boutons « Normal » et « Filtré » d’une même couleur dans une même colonne. Dans chaque colonne de 4 boutons, il peut y avoir 0, 1 ou 2 boutons enclenchés.
• Quand le mode split-screen est enclenché, une seule colonne suffit à régler le son des 2 interlocuteurs, ce sera par défaut celle de gauche (ORANGE). On sort du mode split-screen en appuyant sur le bouton CUT qui nous fera basculer sur l’image du personnage B, les
réglages de la colonne de droite (VERTE) seront appliqués.
• A tout instant, il y a une forcément une colonne active. Pour que le personnage à l’image soit muet, il faut décocher toutes les cases de sa colonne.
b. La fenêtre de projection
La majeure partie de la fenêtre de projection sera dédiée à montrer le résultat du montage réalisé par l’opérateur : split-screen ou alternance entre les 2 personnages dans le temps. Un texte en marge de l’écran viendra préciser aux spectateurs la situation audiovisuelle que l’utilisateur est en train d’expérimenter. Cette fenêtre de projection apparaitra selon les utilisations sur un écran externe ou projeté dans une salle de cinéma.

Fig7. Capture d’écran de la fenêtre de projection en mode split-screen et en écoute téléphonique (Les 2 voix sont filtrées)

4. A qui s’adresse ce logiciel ?

Le LaBoPhone a d’abord été concu dans le but d’explorer de manière ludique les 83 combinaisons typologiques et d’en faire la démonstration en temps réel au jury de ce mémoire. Il permet a une seule personne de prendre le controle des images et des sons avec une interface mobile. Si cette expérimentation se faisait dans une salle de cinéma remplie de spectateur, ceux là assisteraient à un « spectacle vivant » proposé par une personne comme dans Twixt.

sommaire

B. Réalisation d’un contenu audiovisuel adapté au LaBoPhone, Du logiciel au film

En même temps que le programme était élaboré, de nombreux essais préliminaires ont été faits pour valider certaines hypothèses et préparer le vrai tournage qui n’a malheureusement pas pu avoir lieu avant le rendu de la partie écrite de ce mémoire. Le tournage aura lieu le samedi 2 Juin 2012 à l’école Louis Lumière. Parmi les tests qui ont été faits, vous pourrez trouver avec ce mémoire un DVD avec une version bêta du logiciel et un film-test dont l’image ci-dessus est extraite. Ces essais ont montré que l’exploration de ces formes cinématographiques pouvait apporter une touche ludique et avait un vrai intérêt pédagogique. J’ai par ailleurs fait essayer le LaBoPhone à des personnes de mon entourage grâce auxquels j’ai pu améliorer l’ergonomie de l’interface et constater certains problèmes fonctionnels. En mars, les séquences filmées que vous pouvez trouver sur le DVD qui sont des remakes du film A single man, de Tom Ford m’ont permis de pointer du doigt les difficultés inhérentes à la nécessité de synchronisation et la problématique du tournage en temps réel.

1. Mise en place d’un dispositif de tournage
a. La nécessité d’un double plan-séquence
La difficulté du tournage de ce film particulier réside dans le fait de devoir tourner avec 2 caméras dans 2 locaux différents, 2 plan-séquences en parfait synchronisme. Voyons ce qui oblige à cela.
Le point de départ est que ces plans ne seront pas montés avant le traitement par le logiciel :
pendant la conversation, il n’y aucun passage inutile, tout est voué à être potentiellement vu et monté par l’utilisateur. Cela à deux implications importantes :
• Nous ne pouvons pas tourner de manière classique (avec une caméra) les paroles de l’un puis, plus tard, sur une autre prise, les paroles de l’autre puisque rien n’assure que leurs rythmes de jeu et de parole seront parfaitement identiques. C’est une chose que l’on peut gommer aisément dans le cas d’un montage en champ / contre-champ classique mais pas dans notre cas où le montage n’est pas possible.
• Implication caractéristique du plan séquence : nous ne pourrons garder qu’une seule version du double plan-séquence parmi tous ceux qui auront été tournés.
Remarquons qu’il s’agira d’un tournage où il n’y aura aucun découpage de plans. A priori cela pourrait ressembler à du « non-cinéma » s’il n’y avait pas une dose de montage apportée à la diffusion par le LaBoPhone. Il sera souhaitable de tourner les plan-séquences avec des mouvements de caméra à l’épaule pour rompre avec la monotonie de l’alternance des personnages et éviter l’effet «ping-pong». Ce sont les mouvements de caméra et le jeu des acteurs qui vont donner une résonance cinématographique à ce film, forme brute qui pourra ensuite être torturée par l'utilisateur du logiciel.
b. Le choix du mode de télécommunication
Il y aura une caméra pour chaque interlocuteur, les 2 personnages devront être éloignés physiquement lors du tournage pour éviter que les répliques de l’un vienne « polluer » les temps de silence et d’écoute de l’autre. La conséquence de cet éloignement est que les 2 acteurs ne pourront pas s’entendre « de vive voix », aussi il faudra qu’ils puissent s’entendre à travers un système audio quelconque. Nous détaillons ici les solutions que nous avons successivement envisagées :
• Une conversation avec deux téléphones fixes à supposer que le combiné ne fasse pas trop entendre l’interlocuteur opposé. Le problème est d’avoir deux lignes téléphoniques indépendantes dans 2 locaux proches. Cela suppose de devoir rallonger des lignes téléphoniques de manière importante.
• Une conversation avec des téléphones portables à supposer que ceux-ci ne fassent pas d’interférences avec l’enregistrement du son. L’avantage est que le niveau sonore du combiné est réglable, le désavantage est que cela oblige la scène à être située dans un contexte récent. La possibilité de passer des appels via le protocole VoIP a été étudiée mais cela nécessiterait que les 2 appareils soient connectés sur un même réseau Wifi et que nous puissions paramétrer facilement les réglages d’adresse IP, ce qui n’est pas chose facile avec le réseau de l’école (dispositifs pare-feu). Cette solution était relativement peu fiable.
• La solution qui a finalement été retenue est d’envoyer dans des oreillettes sans fil les voix des interlocuteurs opposés, captées par les 2 micros de perche. Ce dispositif a l’avantage de nous permettre d’utiliser n’importe quelle sorte de téléphones qui auront seulement le rôle d’accessoires de mise en scène et non de transmission du son. Ce sont les oreillettes sans fil qui sont utilisés dans les journaux télévisés pour communiquer des informations au présentateur.
c. Protocole pour la synchronisation des sons et des images
Il y a plusieurs synchronismes à préserver lors de ce tournage :
- La synchro entre les 2 pistes son (un micro perche sur chaque acteur)
- La synchro entre les 2 caméras
- La synchro entre le son et l’image
1) Les deux pistes son sont enregistrées sur un même magnétophone numérique, ce qui garantit leur synchronisme.
2) Les deux caméras se réfèrent à un même TimeCode, elles enregistrent en mode FreeRun.
La caméra 1 est maître en TimeCode, l’autre esclave, on relie les 2 par un câble BNC. La caméra maître imprime ou « jam » son TimeCode à la deuxième qui le garde pendant plusieurs heures avec une dérive négligeable. Les 2 caméras sont synchrones sans être reliées en permanence.
3) Par suite, si les 2 caméras sont synchronisés entre elles, si les 2 pistes son sont synchrones entre elles, alors il suffit de synchroniser une piste son à une caméra pour garantir le synchronisme de l’ensemble. On optera pour un clap entre la caméra 1 (Maitre) et le micro proche de celle-ci.


Schéma synoptique de tournage qui a été retenu.

sommaire

2. L’écriture du scénario : « Une source en forêt »

a. Les contraintes d’écritures dues au dispositif
Bien entendu, ce n’est jamais évident de commencer à écrire une histoire en ayant trop de contraintes, en général il est plus simple d’écrire sans se poser trop de questions et de rendre le projet réalisable en écartant les idées trop compliquées à mettre en place ou trop chères à tourner. Dans mon cas, je disposais d’un cahier des charges du dispositif de tournage qui réduisait mes possibilités. D’autres part, j’ai dès le début de l’écriture tenté d’intégrer des figures typiques des conversations téléphoniques. Je voulais de la même manière laisser une part importante aux sons de téléphones hors communications dont je parle dans la première partie du mémoire (sonneries, tonalités, etc). Le LaBoPhone comporte un intérêt particulier pour les séquences de conversations téléphoniques. Néanmoins pour que le film ait une cohérence, j’ai décidé d’y ajouter quelques instants de mise en scène non verbale, au début avec le comportement parallèle des 2 personnages, et à la fin avec l’apparition d’un troisième
personnage qui annonce la chute.

Voici un résumé des contraintes et des nécessités qui ont guidé l’écriture du scénario et le choix des comédiens.
• Les personnages :
- Au moins 2 personnages. Ils doivent se téléphoner.
- Pour couvrir les différents types de voix, il y a un homme et une femme.
- Choisir des voix relativement graves pour sentir nettement l’effet du filtrage.
• Les décors :
- Les 2 lieux de tournage sont éloignés physiquement (acoustique).
- Les 2 lieux de tournage doivent être assez proches pour tirer des rallonges audio.
- Les 2 décors doivent être nettement différenciés.
- Si possible choisir un décor intérieur et un décor extérieur.
- Chaque décor peut avoir une ambiance sonore qui lui est facilement associable (par exemple : ambiance de forêt / fond de radio dans un bureau). Le son filtré n’est pas uniquement de la voix mais aussi une empreinte du décor
• La temporalité :
- L’histoire s’écoule sur une seule période temporelle (pas d’ellipse). Temps réel imposé par la nécessité de tourner un plan-séquence.
- Le film dans son ensemble ne dure pas plus de 4 minutes. Une durée courte permettra à l’utilisateur d’essayer plusieurs montages.
• L’usage du téléphone :
- Utiliser des vieux téléphones pour la richesse des sons et le design de l’objet.
- Profiter du double plan-séquence pour autoriser les « chevauchements » des acteurs.
Pas de problèmes de raccords...
• Les possibilités apportées par le LaBoPhone :
- Encourager les paroles à double interprétation. Selon l’utilisation du LaBoPhone cela peut créer des contresens et des interprétations diverses.
- Les personnages peuvent répéter quelques mots clefs de ce que leur interlocuteur leur dit pour les confirmer. « 17h », « au bar », « très bien ». Cela permettra de deviner ce qui est dit en face si l’utilisateur du LaBoPhone a fait le choix de n’entendre qu’un personnage.

b. Synopsis et résumé
C’est en gardant constamment ces idées en tête que j’ai écris le scénario du film dont vous trouverez ci-dessous le synopsis. Vous pouvez aussi lire le résumé du film, mais celui révèle la fin du film. Le scénario complet est donné dans les pages annexes
Synopsis « Une source en forêt »
Nous sommes dans les années 70, à Paris. Un journaliste d’investigation rédige un dossier polémique sur une bavure des services secrets français en Syrie. Cette affaire sous haute tension oblige à certaines précautions...Le journaliste a contacté indirectement une jeune femme pouvant lui apporter des preuves de la culpabilité de certains dirigeants politiques. Pour garantir l’anonymat de cette source, le journaliste lui donne un rendez-vous téléphonique sur un vieux téléphone à cadran accroché à un arbre dans une forêt.
Résumé
Le journaliste utilise un code pour s’assurer que c’est la bonne personne qui est à l’autre bout de la ligne. Ce code est un poème et l’interlocuteur doit en réciter la fin pour prouver qu’il est la bonne personne. Mais l’interlocuteur s’avère être une promeneuse qui attirée par la sonnerie du téléphone a décidé de décrocher. Comble du hasard, elle connait le poème... Commence alors un quiproquo volontairement entretenu par une jeune femme amusée de parler avec ce personnage tout droit sorti d’un roman à complots. Il souhaite qu’elle lui remette des documents secrets qui mettraient en évidence la culpabilité de dirigeants politiques. Elle pousse le faux-semblant jusqu’à parvenir à lui donner un rendez-vous dans un endroit tenu secret. On apprend à la fin que la discussion était sur écoute : les services secrets pensent enfin pouvoir mettre la main sur la jeune femme qui détient les documents compromettants...

3. Les différentes étapes de la post-production
a. Post-production de l’image
Bien que les plans tournés soient deux plan-séquences, il y aura un point de montage réalisé à la fin pour introduire la séquence 3 du scénario qui annonce la chute de l’histoire.
Cette séquence sera montée de la même manière pour la vidéo du personnage A et pour la vidéo du personnage B. Par conséquence, pour la fin du film et le générique, l’appui sur le bouton CUT, jusque là utilisé pour basculer d’un personnage à l’autre, n’aura plus d’effet sur l’image.
Le gros du travail de post-production de l’image sera d’une part d’élaguer les extrémités du double plan-séquence et de trouver le point de montage entre celui-ci et la séquence 3. Nous devrons intégrer le générique de fin en synchronisme avec le son puisque les acteurs vont lire
le générique.
Enfin il faudra aussi compresser les vidéos puisque d’après les essais préliminaires que nous avons pu réaliser, PureData installé sur mon ordinateur n’est pas capable de lire deux flux vidéos en qualité HD avec fiabilité. Il est probable que nous les compressions en format 720p.
b. Post-production du son
La post-production du son consistera à :
- Nettoyer les éventuels défauts de tournage (bruits de perche, bruits parasites).
- Rajouter éventuellement des ambiances sonores stéréo dans le plan-séquence.
- Monter les sons de téléphone au début du film ( sonneries, tonalités, etc.).
- Travailler le raccord son entre le plan-séquence et la séquence .

C. Caractéristiques de la diffusion du film interactif
1.Les choix techniques
La diffusion aura lieu dans la salle de projection de l’école Louis Lumière le jour de la soutenance (semaine du 11 juin 2012). Nous prévoyons une journée d’essais le mercredi 6 juin.
La lecture des fichiers video et audio sera réalisée par un ordinateur portable relié à un vidéo-projecteur idéalement placé au sein de la salle de cinéma (si possible utiliser une sortie DVI).
Le son sera diffusé sur les enceintes de la salle de cinéma. Les canaux d’écran suffiront (canaux LCR) puisque la plupart des contenus seront des voix (canal C) accompagnées d’ambiances stéréo (canaux LR). Par simplification, nous n’utiliserons pas les canaux Surround. Nous utiliserons une carte son pour véhiculer les 3 canaux jusqu’aux amplis de la cabine de projection. Un Smartphone iPhone ou Tablette Ipad fera office d’interface logicielle. Il commandera le logiciel installé sur l’ordinateur via une liaison Wifi. Nous n’envisageons pas d’utiliser le réseau Wifi de l’école pour lequel il faudrait avoir des autorisations spéciales (afin d’enlever les pare-feux). Nous utiliserons un téléphone en guise de modem, il transformera le réseau cellulaire 3G en réseau Wifi. Vous trouverez en annexe C un schéma synoptique de l’installation sous réserve des modifications que les essais préliminaires pourront révéler.

sommaire

CONCLUSION

Au moment où j’ai commencé à écrire ce mémoire, j’entendais dire autour de moi que les téléphones dans les films n’étaient que des outils au service de la narration. Mais j’avais la conviction qu’en plus de cela, le téléphone portait en lui la synthèse d’un cinéma sonore accompli. Un cinéma qui ne serait pas seulement une juxtaposition ou une superposition de sons et d’images mais qui ferait interagir ces deux médias en bonne intelligence.
Là où on entend souvent regretter que le son soit « le parent pauvre » du cinéma, le téléphone impose sa part de sonore. Peut être parce que le son se remarque essentiellement par comparaisons et que le téléphone offre une comparaison directe entre la voix et la voix filtrée.

Nous avons vu que le téléphone au cinéma posait la question de la représentation d’un objet d’échange sonore par un media à la fois visuel et sonore. Vouloir représenter le téléphone s’accompagne des figures qui ont marqué son histoire : entre évolutions technologiques et leurs conséquences sur la société. Vouloir représenter le téléphone s’accompagne d’un bagage de référents culturels, autant sonores que visuels.
Mais la cohésion accomplie de l’image et du son implique aussi des mises en formes combinées (montage image et montage son), particulières et complexes, dont une bonne lecture nécessitait de se détacher un instant des cas filmiques concrets. Par un raisonnement de bon sens, nous avons pris la mesure de ce que la combinaison du son et de l’image permettait de faire. Au final ce sont 83 cas audiovisuels qui ont été recensés.
A ce stade il aurait été possible de voir ce que chacun des 83 cas pouvait signifier à travers des exemples de films. Mais nous avons préféré laisser ce champ comme futur terrain d’investigation et proposer un outil interactif qui permet d’explorer les 83 cas en permettant à un « spect-acteur » de prendre le contrôle d’éléments simples comme le point de montage ou le point d’écoute. Notre plus grand regret aura été de ne pas avoir pu pousser l’expérimentation audiovisuelle jusqu’à son paroxysme en analysant les comportements des utilisateurs. Nous espérons que la définition précise d’un protocole de fonctionnement et la conception du LaBoPhone permettront à d’autres de poursuivre l’expérimentation, y compris en dehors des conversations téléphoniques.

De quoi le cinéma de demain sera-t-il fait ?
Les films n’étant que des réecritures et réinterprétation de sujets universels, il y a fort a parier que les nouvelles technologies, notamment par les objets connectés, n’offrent pas de reconsidérations des thématiques cinématographiques, mais créent plutôt des nouvelles voies de dialogues et d’interactions entre les spectateurs et la forme audiovisuelle des films. Par dessus tout c’est l’idée d’un cinéma à la croisée de tous les autres médias qui pourrait voir le jour : un cinéma transmedia. Espérons que les domaines du son, aussi riches que méconnus, puissent y prendre une part intégrante.

sommaire