kotoko1Kotoko di Tsukamoto Shin’Ya si caratterizza certamente per la particolare attenzione che il regista ha dedicato alle questioni relative alla forma, che qui viene investita di una portata significazionale di livello primario, talvolta addirittura superiore a quella riconosciuta ai codici attoriali e verbali.
Soprattutto durante i climax emozionali, le scelte stilistiche di Tsukamoto escludono l’opzione mimetica in favore di una poetica della manipolazione espressiva del reale il cui esito di maggior rilievo è certamente quello di creare una forma particolare di soggettiva, che chiameremo soggettiva mentale-percettiva, nella quale lo spettatore, attraverso una serie di alterazioni dei dati audio-visuali, viene indotto a sperimentare condizioni psicologiche affini a quelle esperite dai personaggi.


In stretta relazione con il grado di intensità emozionale delle varie scene si acuisce la ritmicità del montaggio, che procede per bruschi stacchi di unità di ripresa dalla durata ridotta mentre la scala dei piani si assesta sulla corta misura dei primi e primissimi piani, gettandoci a ridosso di corpi e volti. In questa generale temperie di esasperazione formale, il sonoro abbandona la propria funzione di resa mimetica dei suoni del mondo per sdilinquirsi in composizioni rumoristiche e astratte, dall’eminente valore espressionistico e i movimenti della macchina, interamente realizzati con la camera a mano, si fanno particolarmente instabili e convulsivi.
Tsukamoto realizza una vera trasduzione1 stilistica degli stati emozionali fondata sull’istituzione di una diretta proporzionalità tra il grado di manipolazione espressionistica dei materiali audio-visivi che utilizza  e il grado di concitazione degli stati emozionali esperiti dai personaggi.
Alla base di questo modus operandi ritroviamo un principio di tipo analogico, che permette a Tsukamoto di restituire al suo spettatore le sensazioni legate al disturbo mentale della protagonista attraverso la messa in opera di un altro disturbo, quello della visione e del dato uditivo (analogia di principio), la cui entità sarà per l’appunto analoga per misura a quella del disturbo psicologico (analogia di misura).

Questo tipo di atteggiamento si manifesta particolarmente nelle scene in cui si rappresentano gli effetti allucinatori delle crisi psicotiche di Kotoko, prive di commento musicale extradiegetico e  consacrate ad un rumorismo cristallino nella sua qualità espressionistica, tale da non concedere allo spettatore neppure quel grado minimo di pacificazione psicologica che si sarebbe potuto sperimentare in presenza di un principio di strutturazione musicale, e dunque dotato di un fine estetico, dei materiali sonori.
La resa espressiva delle manifestazioni di instabilità psichica, quindi, non cerca la mediazione di quelle grammatiche emozionali implicite nella sintassi musicale, e si appoggia a una espressività che emerge solo e unicamente in ragione delle qualità timbriche, di registro e di andamento nel tempo (inviluppo) dei vari oggetti sonori.
Ai contenuti visuali di maggiore violenza fanno da contraltare, nel dominio dell’uditivo, tonfi improvvisi e deflagrazioni, clangori metallici, stridori e masse informi di frequenze, che sfruttano la violenza timbrica e volumetrica come termini sinonimici di quella comportamentale e psicologica.  
Imponenti masse di frequenze basse e medio basse, colpiscono lo spettatore dritto allo stomaco (che infatti “vibra”), mentre alti e medio alti si fanno di una qualità talmente disturbante da sfiorare la soglia del dolore.

Per questa via Tsukamoto sottrae il proprio cinema a un atteggiamento rappresentativo “puro” e semplice, per dirottarlo, almeno in quanto a tendenza di fondo, verso una variante maggiormente sinestetica e performativa della rappresentabilità cinematografica.
La matrice di fondo, la tendenza a riconsiderare il corpo come luogo di mediazione e produzione di significati, sembra avere una qualche relazione con le esperienze di tipo teatrale che si collocano agli albori della carriera di questo artista, le quali, per sua stessa ammissione, hanno risentito fortemente della ricerca e della pratica del teatro sperimentale di Kara Juro2, regista e performer Giapponese che utilizzò la corporeità in maniera estremamente violenta, caricandola di valenze espressive ed eversive marcate, spesso perturbanti.
Il film allora non viene più pensato, semplicemente, come un complesso audio-visuale atto a “rappresentare al meglio” sentimenti e situazioni, ma come dispositivo (rappresentazionale, ma soprattutto percettivo) in grado di attivare direttamente nel corpo (e solo successivamente nella psiche) di chi guarda e ascolta, gli stessi stati emozionali e psicologici che si trovano ad esperire i personaggi, o condizioni ad essi equiparabili per contenuto semantico.

Quest’ordine di considerazioni, per altro, trova conforto anche nelle speculazioni di Enrico Carocci,  il quale proprio disquisendo del tipo e delle modalità del coinvolgimento con cui Tsukamoto “trascina” il suo pubblico all’interno dei propri dispositivi filmici ebbe a scrivere: «Il suo spettatore si trova risucchiato all’interno di un universo mentale facendone esperienza diretta, cioè sperimentando senza mediazioni il rapporto distorto tra il soggetto e il mondo che il film racconta» (Carocci in Boscarol 2013, p. 52).
Abolendo la distanza narrativa che normalmente separa spettatore e personaggio Tsukamoto realizza una tipologia ampliata per estensione e più profonda per grado di condivisione-immedesimazione della normale soggettiva, che correttamente Carocci rubrica come soggettiva mentale nella quale il pubblico non condivide più con il personaggio il solo campo scopico, ma l’intero flusso di pensieri e stati psichici, punti di vista (non solo in senso visuale) ed emozioni.
Volendo tener conto del fatto che questo genere di con-partecipazione si produce nel cinema di Tsukamoto a partire da una alterazione dal valore espressionistico dei dati percettivi offerti allo spettatore, mi sento di poter parlare di soggettiva mentale-percettiva o di soggettiva mentale a base percettiva, senza con questo tradire l’intenzione significazionale primaria di Carocci.
La soggettiva mentale a base percettiva qualifica una modalità soggettivante ben precisa del cinema di Tsukamoto da tenersi distinta da altre forme di soggettiva mentale, le quali fondano il proprio valore di condivisione tra personaggio e spettatore sulla sola mostrazione, sebbene mentalizzata (per esempio il flashback interno di Kotoko con i ricordi della giornata trascorsa con il figlio) e dalle soggettive ordinarie, che pure sono presenti nel film.


La patologizzazione del gesto quotidiano per via audio-visuale: Kotoko e una padella

kotoko3Per fornire un esempio di come le dinamiche relazionali tra piano del visivo e del sonoro esplichino il proprio ruolo nel meccanismo di messa in rappresentazione degli stati emozionali, svolgeremo alcune semplici considerazioni sulla scena che prende il via a 12 minuti e 15 secondi e in cui Kotoko tenta di cucinarsi un semplice pasto dovendo reggere in braccio il proprio piccolo che è in preda a una disperante crisi di pianto.
L’ansia da prestazione materna dovuta alle pur semplici operazioni quotidiane emerge in tutta la sua disfunzionalità attraverso differenti strategie di diversione del dato percettivo, che avvicinano le modalità espositive di questa sequenza a quelle che hanno per oggetto le allucinazioni di Kotoko.

Come nella messa in immagine degli eccessi psicotici, infatti, anche qui l’obiettivo di Tsukamoto sbanda e sobbalza continuamente in maniera estremamente accentuata, e sembra non riuscire a tenere in campo i primi piani della madre e del piccolo.
Décadrage marcati, quindi, sfocature, jump cuts e divergenze direzionali che creano, durante questa scena ai fornelli, una visione estremamente agitata, caotica, senza respiro e che non trova giustificazioni “esterne” alla psiche di Kotoko.
Questa serie di quadri così destrutturati associati sul piano del sonoro al pianto forsennato del bimbo che ha un registro acuto e una persistenza snervanti, riescono a dare vita a un complesso dal limpido valore ansiogeno che ben rappresenta a livello schermico la crescente esasperazione di una madre che si scopre ogni giorno più inadeguata al ruolo che la vita la chiama a ricoprire.

La giovane è tutta intenta a cercare di contenere l’inarrestabile pianto del figlio che ha in braccio, ma contemporaneamente deve riuscire a cucinare una banale padellata dei tipici spaghetti giapponesi con verdure saltate. Il suo livello di esasperazione ha raggiunto l’apice (dopo quest’ultima crisi il bambino le verrà tolto e affidato alla sorella) e Tsukamoto, ce lo comunica inasprendo il quoziente di manipolazione espressionistica della combinazione audiovisiva, sopratutto dei materiali sonori.  
Con uno stacco nettissimo e un imponente aumento “del volume” (pressione sonora) irrompe nello spazio del nostro ascolto lo sfrigolio ingigantito di una padella sul fuoco (sul piano del visivo giganteggia sullo schermo il dettaglio della medesima padella poggiata sulla fiamma). Ora questo semplice rumore si presenta alterato nella regione delle frequenze medio alte e alte e risulta dunque tagliente, fastidioso per l’orecchio e tale da formare un tappeto di fondo disturbante e ansiogeno.
Da questa sorta di sfondo continuo si staccano i rumori metallici, i clangori e gli urti cupi che produce la padella maldestramente maneggiata dalla giovane tutta intenta a reggere in braccio il figlio urlante e a placarne il pianto.
Anche questi rumori sono resi enormi da manipolazioni delle componenti spettrali e d’ambiente e risultano, nella loro irregolarità ritmica, molesti, eccessivamente aggressivi e saturi di frequenze.
Questo aumento delle proporzioni dei suoni, sul piano dell’interpretazione complessiva della scena, finisce con l’epicizzare il microevento che si svolge davanti ai nostri occhi, conferisce ai gesti quella caratura altamente drammatica che, ovviamente, hanno solo nella rilettura psicologicamente distorta che ne ha Kotoko.
L’aumento di rilevanza significativa che ne sortisce per lo spettatore si produce in ragione di quell’elementare principio della corrispondenza dimensionale fonte-effetto sonoro, che al cinema, di norma, fa sempre corrispondere a un suono grande un “grande evento” per portata effettiva o per rilevanza narrativa.
Dall’importanza sonora con cui vengono trattati, capiamo che i gesti che si stanno compiendo hanno per Kotoko una significatività innaturalmente sovradimensionata, di prova che, essendo estrema, produrrà manifestazioni sonore altrettanto estreme.

Tra questi rumori di pentolame e i bruschi scarti che agitano l’immagine, tra l’altro, si vengono a creare una serie di punti di sincronizzazione3 (che non si direbbero del tutto intenzionali), per cui sembra quasi che il campo di visione sia letteralmente scosso dalla loro esuberanza volumetrico-frequenziale.  
Vediamo al lavoro, dunque, quel generalissimo criterio di rafforzamento del sonoro ad opera del visivo per cui nei film l’immagine “trema”, come se tremasse la terra, in corrispondenza di esplosioni, urti e collisioni di cui si intenda sottolineare la violenza.

Su questa sorta di base rumorista e asimmetrica si innesta, quasi fosse l’assolo di una chitarra distorta e urticante, il pianto esasperante di Daijiro, che si impenna in acuti isterici e fomenta la tensione.
La chiusa di sequenza arriva poco dopo, in forte crescendo, dapprima con i frastuoni del piatto che cade e si frantuma, poi con il definitivo tracollo di Kotoko segnalato dal pianto lacerante in cui si scioglie e che, sommandosi a quello del bambino, acuisce il senso di diffuso disturbo.
L’apice della crisi giunge con il lancio rabbioso della padella che segna la resa senza condizioni della protagonista.
Il rumore che produce la pentola atterrando chissà dove in fuori campo è assolutamente sopra misura rispetto al tipo di oggetto e di gesto che sonorizza: due giganteschi schianti metallici che potrebbero venire prodotti solo da un grave incidente stradale in cui fossero implicati mezzi pesanti, e che qui si presentano oltremodo spazializzati e riverberati sino a saturare il campo dell’ascolto in maniera omnidirezionale, in una sorta di clamoroso effetto quinta4 dal valore altamente drammatico. È in questo rumore artefatto e “proveniente da ogni dove” che si concreta la totale capitolazione di Kotoko, nel suo essere accompagnato dall’ultimo e più intenso scuotimento del campo visivo, in una finale aggressione audio-visuale dal carattere definitivo in cui il deragliamento psicologico del personaggio trascina con sé lo statuto estetico delle componenti filmiche, in una zona di non ritorno. «Non posso farcela. Non posso. Non ce la posso fare» ripete a mo’ di litania Kotoko mentre si accascia scivolando con la schiena contro il muro.
La crisi si chiude definitivamente con un vero e proprio ritorno alla realtà mediato dai rumori di un’auto fuoricampo che si ferma di fronte alla casa a cui segue il suonare del campanello della porta di ingresso: qualcuno deve aver chiamato le forze dell’ordine udendo le grida e i pianti di madre e figlio...ma questo Tsukamoto ce lo lascia solo immaginare, omettendo di mostrarci cosa avvenga dopo lo scampanellio all’ingresso.
Quello che mi pare rilevante è che attraverso questi suoni non manipolati, credibili ai fini della riproduzione naturalistica, si operi la definitiva fuoriuscita dalla dimensione dell’interiorità di Kotoko e si riporta lo spettatore alla “realtà” concreta della diegesi (mi si passi il paradosso).
A questo livello del reale diegetico, infatti, le identità spettromorfiche degli oggetti sonori sono determinate esclusivamente dalla funzione mimetica che essi svolgono nei confronti dei corrispondenti rumori reali, e non dalla caratura espressiva che Tsukamoto attribuisce loro ai fini della resa del quadro psicologico del personaggio, il recupero di queste identità sonore “normali”, dunque, segnala allo spettatore il ritorno al mondo “normale”, quello cioè non deformato dai deliri psicotici di Kotoko.


Le scene di canto

kotoko4Michel Chion, nel 2007, attribuiva al cinema sonoro «[…] l’uso di una meravigliosa macchina che arresta, dilata o contrae il tempo: la musica» (Chion 2007, pp. 192-93) volendo sottolineare come questa agisca in maniera diretta sulla nostra percezione del tempo trascorso in una scena.
Il cosiddetto tempo percepito, certo, risulterà dilatato dall’utilizzo di elementi musicali di tipo statico, poco o per niente ritmici e privi di variazioni interne, mentre sembrerà scorrere in maniera più rapida e meno annoiante, più “movimentata”, direi, quando sostenuto da interne mutazioni (del ritmo o del suono) che “facciano lavorare” la nostra attenzione e da appoggi ritmici che ci consentano di “misurare” lo scorrere del tempo.
Le scene di canto che Tsukamoto inserisce nel film presentano un gradiente di varietà timbrica pressoché nullo, dato che la sola presenza sonora in esse contenuta è data dalla voce di Cocco, e sono volutamente “monche” di qualsivoglia struttura ritmica che le animi dall’interno, ad eccezione del ritmo irregolare fornito dalla scansione delle sillabe e delle parole.
Per non risultare del tutto immobili, queste scene contano solo sul grado basilare di variazione interna fornito dal differente svilupparsi della melodia nel tempo (che pure è soggetto a reiterazioni nel ripetersi di strofe e ritornello).

Queste esecuzioni “a cappella” sembrano mirare apertamente sia a una sorta di sospensione del proprio tempo interno che a una dilatazione dell’esperienza di durata dello spettatore, il che ben si accorda con quella funzione di sospensione del quotidiano diegetico che esplicano nei confronti della visione patologica che Kotoko ha del mondo.
«Non vedo doppio quando canto» ci rammenta infatti la voce fuoricampo della protagonista (4 minuti e 24 secondi circa) per spiegarci come nei momenti di abbandono canoro cessi in lei il timore per la violenza proveniente dall’esterno che causa la sua doppia vista.
Nell’espansione dell’esperienza di durata del tempo si potrebbe vedere una sorta di coerentizzazione del percepito spettatoriale con ciò che è esperito dal personaggio: così come questa si rifugia nell’intimo della sua dimensione protetta, e si perde nell’astratta temporalità della canzone, che sospende quella ordinaria (rispetto alla diegesi), tanto più lo spettatore si trova a vivere un tempo alterato, gonfiato e lento.

D’altro canto, nel suo prosieguo, l’intervento di Chion ci illumina su quelle che possono essere le relazioni e le interazioni tra il piano temporale “della storia” (tempo della diegesi) propriamente detto e quella temporalità autonoma e astratta inscritta nella musica, senza tralasciare di sottolineare le implicazioni che tale interazione genera sul piano del flusso narrativo:

Spesso combinata con la scomparsa temporanea del suono sincrono (del quale essa serve nello stesso tempo a riempire il vuoto), la musica dà al cinema sonoro dei momenti di tregua, dove esso può sfuggire alla legge infernale della successione dei momenti, evolversi in una temporalità flessibile, elastica, contrarre un anno, dilatare un secondo, prima di rimettere piede sulla terra ferma del tempo reale. (ibidem)

Questo tipo di soluzioni “a temporalità alterata” non sono certo infrequenti nel cinema di Tsukamoto che ha spesso sfruttato il potere evocativo-astrattivo della musica (soprattutto quella di Ishikawa Chū) per creare degli “a parte” dalla temporalità indefinita (o indefinibile?) in cui collocare i propri deliri visuali e i contenuti più onirici.
Nella scena dell’investimento di Yatsu, il feticista del metallo interpretato dal regista stesso in Tetsuo: The Iron Man, tra il momento in cui l’auto inizia una brusca frenata e “ci” colpisce (siamo in regime di soggettiva interna al personaggio vittima dell’investimento) e quello in cui udiamo la fine della frenata e il tonfo prodotto dall’impatto, infatti, trascorrono una cinquantina di secondi.
Durante questo non breve lasso di tempo Tsukamoto ci lascia sospesi, galleggianti tra le volute vellutate di un amoroso tema di sassofono che sonorizza una sorta di balletto visuale in cui i dettagli del muso della macchina tout court (paraurti cromati, frecce ammiccanti che lampeggiano, fanali ecc.) giocano a sedurre l’uomo macchina.
Il microevento dell’investimento, che nella linea temporale “normale” della diegesi non dovrebbe occupare che pochi secondi, acquista per questa via una durata artificiale ed espansa che “viaggia”, per così dire, a una velocità differente.
Si produce un aumento della durata complessiva dell’evento, ma non una contestuale espansione del tempo delle diegesi, o della storia, che dir si voglia, in quanto questo surplus di tempo viene interpretato dal nostro encefalo in maniera separata, come una sorta di corpo estraneo infilato a forza nel tempo diegetico, ma ad esso non sommabile in quanto dotato di leggi interne di organizzazione e sviluppo autonome e differenziate. La durata della scena, in questo caso, non corrisponde più alla durata effettiva dell’evento rappresentato, ma alla sua durata emotiva, al tempo che esso occupa nell’economia emozionale del personaggio che lo sta vivendo. A segnalare allo spettatore questo mutamento nel tipo di temporalità interviene l’abbandono dell’ordinario suono diegetico (ambienti sonori, rumori puntuali prodotti da azioni specifiche, voci ecc.) e la sua sostituzione con la musica extradiegetica. L’emissione sonora corrispondente a un’azione, infatti, ha una sua durata nel tempo, che solitamente corrisponde alla durata dell’azione, poiché si suppone che l’azione perduri almeno sino a quando dura il rumore corrispondente. Il presentare delle immagini scisse da quelli che sarebbero i loro suoni “naturali”, che ne sono anche la misura cronologica, e associarle a un elemento dalla temporalità astratta, tutta interiore ed emozionale, come la musica, produce l’effetto di sottrarle a una temporalità concreta, misurabile in termini di tempo trascorso e ne apre, per così dire, la durata alla indefinibile temporalità dell’ascolto estetico.
Tutto questo non avviene, o avviene solo in parte, durante le scene cantate di Kotoko.
Queste, come dicevo poc’anzi, realizzano una espansione della temporalità che riguarda più la percezione della durata che non la durata effettiva.
Tali performance canore si collocano sul medesimo piano temporale di tutte le altre scene del film sia sotto il profilo della continuità narrativa con le altre azioni, sia sotto quello delle modalità di ripresa, che non contribuiscono a differenziarle dal resto.
A garantire questa uniformità saranno, sul piano delle relazioni audivisiogene5, la persistenza del legame di sincronicità suono-immagine e la continuità del sound-scape, che forniscono allo spettatore l’informazione relativa al fatto che l’azione visualizzata avviene in tempo reale e in continutà spaziale, cioè nello stesso ambiente, rispetto alle altre azioni presenti nel film, quelle non cantate.

D’altro canto la percezione complessiva che si ha di queste scene è in qualche modo “separata” dal resto dell’opera, come se fossero delle piccole parentesi di irrealtà inserite in un contesto generale estremamente concreto e reale, per quanto magari parossistico e iperbolico, come sovente sono i mondi messi in rappresentazione da questo regista.
Se si adotta un punto d’osservazione strettamente diegetico, infatti, questi attimi espansi di abbandono melismatico altro non sono che piccole interruzioni del quotidiano, momenti di fuga da quella condizione sofferenziale che costituisce l’oggetto primo della narrazione, quindi, nuovamente, degli “a parte” nel corpus narrativo complessivo dell’opera.
E visto che ho chiamato in causa la narrazione sarà bene notare che, analogamente a quanto avveniva nelle scene con musica extradiegetica come quella di Tetsuo che abbiamo citato, anche in questo caso si producono sia una parziale interruzione del flusso narrativo che una interruzione dell’azione, del fluire degli eventi.
Il secondo punto è di evidenza immediata: quando Kotoko canta tutto il resto smette di accadere, cioè il film, nella sua accezione di racconto preordinato di una serie di accadimenti e azioni, si interrompe per soffermarsi, spesso per un tempo ostentatamente lungo, su un evento singolo, una unica informazione dalla durata espansa: Kotoko canta.
Per quanto riguarda l’interruzione del flusso narrativo durante le scene a contenuto musicale, ovviamente, è più facile notarla in quelle con musica extradiegetica, poiché in questi casi l’interruzione del flusso “di realtà” è più marcato.
Sono casi particolari, questi, in cui il film cessa temporaneamente di funzionare come dispositivo narrativo che si esprime per via audio-visiva, e diviene uno strumento ottico-uditivo elementare: funzione mostrativo-narrativa contro funzione mostrativa pura.

In via meno manifesta, però, le stesse considerazioni possono valere anche per le scene di canto di Kotoko, durante le quali sembra che la macchina da presa di Tsukamoto si acquieti, per così dire, assuma un atteggiamento tendenzialmente neutrale, che non prende posizione, non interpreta e non racconta, semplicemente mostra, e lascia che a raccontarsi sia la performatività di Cocco-Kotoko autonomamente, la canzone con le sue valenze emozionali.

Tutte queste caratteristiche emergono con particolare evidenza, e per differenza, se le si confronta con la scena del flashback mentale che ha luogo durante la parte cantata ambientata sulla spiaggia a circa 26 minuti e 30 secondi.
Qui, non nuoce ricordarlo, avviene che mentre la giovane canta l’immagine si scolli dal suono e, dopo poche strofe, anziché continuare a mostrarci il suo volto intento nell’esecuzione, ci offra una lunga carrellata di ricordi che consentono allo spettatore di ricostruire vari momenti dell’incontro madre-figlio che non ci erano stati mostrati precedentemente.
Attraverso questa acusmatizzazione6 della voce di Kotoko Tsukamoto realizza una vera e propria riqualificazione funzionale del suono, che viene a perdere le proprie caratteristiche mimetiche, di resa del suono reale di un data azione, per acquisire, almeno in parte, le funzioni tipiche delle musiche extradiegetiche, quelle funzioni, cioè, che riguardano il commento musicale delle immagini e l’induzione di stati emozionali perseguita attraverso le qualità evocative della melodia, dell’armonia e del verso.
Il mutamento investe il solo livello funzionale, però, perché dal punto di vista identitario-causale continuiamo a legare questo canto alla vocalità di un personaggio diegetico, e a pensarlo come una sua azione sonora svoltasi internamente al mondo posto in rappresentazione.
Ora, in una combinazione audiovisuale, il nesso di contemporaneità-sincronicità suono immagine  incide profondamente sulla ricostruzione del tempo rappresentato da parte dello spettatore.
Udendo in un dato istante una certa manifestazione acustica lo spettatore saprà che l’azione che ne è la causa sia stata compiuta proprio in quel dato istante e poiché suoni e rumori hanno una propria durata nel tempo saprà anche quantificare la durata dell’azione, poiché, come già abbiamo avuto modo di notare, si suppone che essa perduri almeno quanto la sua manifestazione sonora.
Una volta spezzato questo legame di contemporaneità-sincronicità si apre il campo a «una temporalità flessibile, elastica», per dirla con Chion, e tale da permettere «di contrarre un anno, dilatare un secondo, prima di rimettere piede sulla terra ferma del tempo reale» (ibidem).
A differenza di quanto avveniva nella altre scene di canto presenti nel film, nelle quali proprio a causa della presenza della sincronicità suono-immagine era possibile stabilire che la quantità di tempo diegetico trascorso durante la scena coincidesse con la durata effettiva dell’esecuzione canora, qui è praticamente impossibile stabilire quanto tempo diegetico abbiano occupato le azioni che ci vengono esibite nel lasso di tempo ellittico (il flashback) che l’esecuzione del brano richiede.

A rendere ancora più incerta la misurazione cronologica di questa scena interviene anche la presenza di numerose ellissi, segnalate da dissolvenze incrociate, che non permettono di quantificare quanto tempo sia stato omesso dalla messa in immagine e di quanto sia stato “compresso” quello che invece ci viene mostrato.
E se i contenuti allucinatori presentati durante le crisi psicotiche di Kotoko facevano irruzione nel film senza che il dispositivo linguistico provvedesse in alcun modo a differenziarli da ciò che invece era da ritenersi reale rispetto alla diegesi, qui la consistenza onirica e immateriale delle immagini è scientemente sottolineata dalla continua presenza di dissolvenze incrociate che legano le varie inquadrature sovrapponendole l’una all’altra per periodi abbastanza lunghi, quasi a voler assecondare quella modalità rappresentativa di tipo “classico” che nella resa del sogno, del ricordo o dei contenuti allucinatori adotta ab antiquo espedienti quali l’effetto flou o le sfocature, le alterazioni cromatiche o, come nel caso nostro, le dissolvenze incrociate o tenute.
In concomitanza con questa pratica del visivo de-realizzante, l’audio viene sottoposto a una vera e propria ri-semantizzazione, tale da orientare l’interpretazione spettatoriale verso un’attribuzione di immaterialità-mentalismo alla situazione nel suo complesso.
Il canto di Kotoko, già lo abbiamo detto, inizia come suono diegetico on-screen e sincrono, tale dunque da definire una situazione “di realtà” attraverso la propria im-mediata corrispondenza con una fonte sonora visualizzata (la bocca di Kotoko).
Tale statuizione di realtà cessa quando l’immagine della bocca della protagonista viene sostituita da quelle dei suoi ricordi, nelle quali è evidentemente impossibile stabilire una qualche forma di corrispondenza sincronica o causale tra l’udito e il mostrato.

A potenziare questo effetto di de-realizzazione della sequenza contribuisce anche il fatto che ad essere acusmatizzato, insieme alla voce della protagonista, sia anche il rumore delle onde del mare, che forniva uno sfondo sonoro plausibile, sebbene acusmatico (perché le onde non erano in campo in quel momento), fintanto che noi spettatori “ci trovavamo fisicamente” sulla spiaggia, accanto a Kotoko, ma che finisce per produrre un vero e proprio effetto di dissonanza audiovisiva7, quando associato agli interni domestici nei quali vediamo interagire la madre e il bambino.
La consistenza puramente mentale del mostrato emerge da un duplice conflitto che il sonoro instaura con il visivo: conflitto con l’azione, poiché i suoni che sentiamo (canto di Kotoko e rumore del mare) non sono i suoni “naturali” che le azioni inscenate dovrebbero produrre, e conflitto con il luogo, poiché il suono ambientale di origine marina che fa da sottofondo a tutta la scena risulta chiaramente decontestualizzato rispetto ai luoghi (interno domestico) in cui le azioni si svolgono.

Il ritorno della narrazione al tempo presente e al regime di oggettività avviene attraverso una progressiva riacquisizione del legame sincronico suono immagine e della relazione visiva con la fonte sonora.
Dapprima rientra in campo il profilo di Kotoko in primissimo piano che canta l’ultimo ritornello del brano, con movimenti labiali sincroni rispetto alle parole che udiamo.
Si realizza con questa inquadratura un primo passaggio, quello che ci fa uscire dal regime di soggettiva mentale e ci riporta all’oggettiva.
Lo spettatore, a questo punto, ritrova tutte quelle corrispondenze suono-immagine che qualificano la situazione di realtà della diegesi, e che gli permettono di intendere che la narrazione avviene di nuovo “in presa diretta”, qui e ora.
Una nuova dissolvenza introduce alcune brevi inquadrature di Kotoko che, ripresa oggettivamente,  tiene in braccio il bimbo camminando o correndo nel giardino antistante la casa mentre la sua “voce mentale” (suono interiore soggettivo) ci fa udire i suoi pensieri di quel momento: «Mi sento bene», «Ma il tempo vola quando mi diverto».
A questo stadio del percorso che ci riporterà verso l’oggettiva Tsukamoto recupera il legame di simultaneità suono-immagine, dandoci a intendere che i pensieri che ci lascia udire vengano pensati da Kotoko contemporaneamente ai gesti che stiamo visualizzando.
Si configura nuovamente un complesso audiovisuale difficile da inquadrare nelle categorie previste dalle  grammatiche cinematografiche tradizionali; se da un lato infatti è chiaro che ci troviamo ancora in regime di soggettività, poiché siamo “dentro” la testa della protagonista, e che questa soggettiva sia di tipo squisitamente mentale, poiché ciò che condividiamo con lei sono solo i pensieri, e non anche il suo campo visivo, dall’altro è pur vero che il piano della visione è configurato in maniera oggettivante, con un occhio esterno e “neutrale” che osserva il soggetto.
Lo spettatore viene così a trovarsi nella privilegiata condizione di essere collocato ubiquamente dentro il personaggio in quanto a condivisione dei saperi, poiché condivide con questo quelle informazioni puramente mentali che non saranno rivelate agli altri personaggi della storia, e contemporaneamente fuori di esso, poiché è in grado di osservarlo oggettivamente, da un punto di vista ad esterno.
Tale ubiquità viene meno quando, con uno stacco netto, Tsukamoto ci trasporta all’interno di un negozio in cui Kotoko stà comprando dei dolciumi a Daijiro e ci fa sentire le sue parole in maniera diretta, sincrona e visualizzata.
Con il rientro del suono sincrono, diegetico e esteriore siamo tornati al regime di oggettività e alle modalità di ripresa che lo caratterizzano, concludendo quel percorso per gradi verso l’oggettività che era iniziato con la soggettiva mentale di Kotoko. Lo spettatore ritrova il suo posizionamento canonico all’esterno del personaggio, e l’estensione del suo sapere si riallinea a quella degli altri personaggi, che non partecipano di quelle informazioni “segrete” che sono i pensieri della protagonista.
Per scrupolo critico mi pare opportuno segnalare al lettore che sarà comunque possibile attribuire al tempo rappresentato in questo flashback una durata che non supera l’arco di una giornata sulla base di elementi di tipo logico-deduttivo, quindi non filmico, poiché in chiusura contiene una breve scenetta di ambientazione palesemente serale in cui, fatto indossare il pigiama al piccolo Daijiro, lo si sta per mettere a letto, mentre il percorso a ritroso nei ricordi di Kotoko era iniziato in pieno giorno, dunque in un qualche momento della giornata seguente.
Anche sul piano della narrazione questa scena si distingue dalle altre a contenuto canoro.
In quelle, come si è detto, il flusso narrativo si concede una pausa, non prosegue nell’esposizione degli accadimenti che forniscono l’oggetto alla trama.
Qui, invece, il dispositivo filmico continua a narrare, continua a fornire informazioni su ciò che è accaduto nella vita di Kotoko, ma lo fa, per così dire, procedendo a ritroso, tornando sui suoi passi, adottando quella logica implicita nel cosiddetto flashback che in narratologia prende il nome di analessi e che serve ad aggiornare le informazioni a disposizione dello spettatore rispetto alle conoscenze dei personaggi che si collocano nel passato rispetto al tempo della storia.


Note

1 In fonica si definisce infatti trasduttore un «[...] dispositivo atto a ricevere segnali di determinata natura da un mezzo di trasmissione trasformandoli in altri segnali generalmente di diversa natura, che possono essere trasmessi attraverso un altro mezzo di trasmissione; [...]», in: treccani.it

2 Proveniente dall’esperienza del teatro shingheki di cui intese polemicamente superare i limiti, fondò a partire dal 1963 una sua compagnia autonoma sotto il nome di Shichueischion no kai (Gruppo Situazione) e che raggiunse la notorietà dopo alcuni anni di attività con il nome di Jokyo Jekijo (Teatro di Situazione). L’impianto socialista di fondo che animava le sue rappresentazioni si traduceva in scena in azioni violentemente contestatarie dei programmi governativi in ambito sociale, politico e culturale, azioni per lo più fondate sul rifiuto delle convenzioni sceniche tanto del cosiddetto “teatro tradizionale” quanto del pur già eversivo teatro shingheki.

3 «Chiamo punto di sincronizzazione, in una catena audiovisiva, un momento saliente di incontro sincrono tra un momento sonoro e un momento visivo concomitanti, ovvero un momento in cui l’effetto di sincresi è più marcato e accentuato, creando un effetto di sottolineatura e di scansione. [...]» (Chion 2007, p. 195).

4 «Effetto creato nel caso del cinema a suono multipista (dolby) da un suono “in fuori campo assoluto”, posizionato realmente nello spazio concreto della sala fuori dello schermo» (ivi p. 352).

5 «Effetti creati da associazioni di suoni e di immagini, e spesso, per effetto del “valore aggiunto”, proiettati sull’immagine e attribuiti a essa» (ivi p. 341).

6 Adottiamo qui la definizione di derivazione Schaefferiana del termine “acusmatico” elaborata da Michel Chion che recita: «che si sente senza senza vedere la causa originaria del suono – o – che fa sentire dei suoni senza la visione delle loro cause» (Chion 2001, p. 74).

7 «Effetto di contraddizione diegetica tra un suon puntuale e un’immagine puntuale, o tra un’ambientazione sonora realistica e il quadro nel quale la si sente» (Chion 2007, p. 34).


Bibliografia

Carocci E. (2013): Tsukamoto e il mind game film in Boscarol M. (a cura di): Tetsuo: The Iron Man. La filosofia di Tsukamoto Shin’Ya, Mimesis, Milano-Udine.

Chion M. (2009): L’audiovisione. Suono e immagine nel cinema, Lindau, Torino.

Chion M. (2007): Un’Arte Sonora, il Cinema. Storia, estetica, poetica, Edizioni Kaplan, Torino.


Filmografia

Kotoko (Tsukamoto Shin’Ya 2011)

Tetsuo: The Iron Man (Tsukamoto Shin’Ya 1989)