L’identità vocale e la filastrocca dell’orecchio allenato

Corte di cassazione, DALLE CORTI, Giurisprudenza di legittimità

L’identità vocale e la filastrocca dell’orecchio allenato

Katia La Regina
11 Ottobre 2021

Cass., Sez.II, 2 luglio 2021 n. 33115

Cass., Sez.II, 2 luglio 2021 n. 33115

La sentenza in commento sintetizza, nelle poche righe dedicate al tema dell’identificazione vocale, un trend assolutamente consolidato nell’approccio giurisprudenziale a questa materia.

Il caso – classico – è quello di un riconoscimento eseguito su materiale intercettato nel corso delle indagini preliminari dall’interprete e dagli operatori di polizia giudiziaria che – con certezza, sottolinea la Corte – asseriscono che la voce captata appartiene all’indagato. Da qui – senza null’altro aggiungere – discende l’utilizzabilità degli esiti di quella che – sempre a detta della Corte – è una ricognizione vocale[1].

Non servono ulteriori spiegazioni in un settore in cui vige un regime di anarchia acquisitiva. Sulla scena processuale, del resto, i risultati del riconoscimento vocale riescono ad insinuarsi attraverso qualunque feritoia, comprese quelle del buon senso. Così, la pronuncia ripropone la consolidata prassi con cui, a partire dall’alterazione dello schema disegnato in merito ai rapporti tra individuazione (art. 361 c.p.p.) e ricognizione (art. 216 c.p.p.), si procede ad una omologazione dei due istituti ed alla progressiva trasformazione del riconoscimento eseguito nel corso delle indagini preliminari in un atto a valenza probatoria, come tale utilizzabile a fini cautelari^[2] e decisori, sia in dibattimento che nel giudizio abbreviato^[3].

Nulla quaestio, poi, che il riconoscimento non sia stato eseguito da un perito fonico ma dall’interprete e dagli operanti perché, in materia di identificazione auditiva, basta un qualunque orecchio allenato all’ascolto per marginalizzare il ruolo dell’esperto. L’identificazione, del resto, si ritiene eseguibile anche attraverso l’attribuzione, agli ufficiali o agli agenti addetti all’ascolto, del compito di procedere all’abbinamento dei nominativi agli interlocutori delle conversazioni intercettate; una attestazione dei brogliacci utilizzabile – come pare nel caso di specie – persino laddove difetti l’indicazione dell’operante riconoscente, reputandosi «essenziale la valutazione contenuta nell’atto di polizia giudiziaria posto alla base dell’accertamento di responsabilità»^[4].

L’approccio, dunque, è autenticamente fideistico, tanto che – nel silenzio della Corte – la questione relativa alla necessità di disporre perizia fonica non si pone neppure.

Cosa conta, quindi, per ritenere raggiunto l’obiettivo dell’identificazione di una voce? Esattamente come accade quando a venire in rilievo sia un riconoscimento auditivo c.d. informale, cioè effettuato nel corso della testimonianza, senza il rispetto delle formalità previste per la ricognizione dall’art. 216 c.p.p., basta che sussista una duplice condizione: l’affidabilità del ricognitore e la sicurezza espressa nel riconoscimento.

Errore metodologico prevedibile quando la conoscenza della materia è scarsa.

Innanzitutto, a dispetto delle molte ricerche condotte sul tema^[5] – è tutt’altro che dimostrata l’esistenza di una correlazione tra sicurezza nel riconoscimento e correttezza del medesimo; persino la correlazione tra familiarità con la voce da riconoscere e sicura attendibilità del riconoscimento è smentita dagli studi in cui si evidenzia che, anche a fronte di una abitudine all’ascolto, l’identificazione auditiva debba essere vagliata con «particolare prudenza» perché essa risente, ancor più del riconoscimento personale, «di numerose variabili contestuali»^[6], tra cui si pongono – specificamente segnalati nei casi in cui il riconoscimento venga effettuato dagli operatori di polizia giudiziaria – i rischi di polarizzazione nella direzione della aspettativa^[7].

In secondo luogo, sembra ignorarsi che l’approccio sensoriale restituisce un risultato gravido di insidie suscettibili di manifestarsi già nella fase percettiva della voce, la quale, per sua natura, non è caratterizzata dalla stessa precisione e dalla stessa determinatezza che connota l’omologo visivo. Del resto, sono basi magmatiche quelle su cui si fonda il fenomeno ricognitivo, le quali, inevitabilmente, determinano un elevato tasso di soggettivismo del riconoscimento, oltre che un consistente grado di fallibilità.

Persino l’indagine tecnica, del resto, sconta il fatto di incentrarsi su un «bioindicatore dotato di una capacità “caratterizzante” imperfetta»^[8]. La voce, a differenza di una impronta digitale o genetica, non è immutabile e non possiede caratteristiche sufficientemente univoche da consentire sempre e comunque la distinzione di una persona da un’altra o l’emersione di una identità dalla moltitudine indifferenziata. Il problema principale è connesso al fatto che la variabilità non si presenta solo a livello interindividuale – cioè da persona a persona – ma anche a livello intraindividuale; la voce di un medesimo individuo, infatti, subisce variazioni sia legate al trascorrere del tempo (variabilità di lungo termine) che connesse a situazioni contingenti (variabilità di breve termine), come lo stato d’animo, lo stato di salute, il fumo di una sigaretta, l’assunzione di un determinato tipo di bevanda. Anche il canale di trasmissione deve considerarsi come fattore fortemente incidente perché la voce di un medesimo individuo è soggetta a modifica ove, ad esempio, registrata o veicolata da un microfono o da un telefono cellulare^[9].

Il «dramma di giudicare in condizioni di incertezza probatoria»[10], tuttavia, non può costituire un alibi per coltivare prospettive che, a ben vedere, sono in ultima analisi di disimpegno motivazionale: se le risorse per procedere al controllo sono collocate in un campo ancora minato dalla assenza di consolidate conferme da parte della comunità scientifica, l’orecchio allenato dell’interprete o dell’operatore non può – per ciò solo – divenire l’approdo sicuro, e più comodo, per ancorare l’attendibilità della base cognitiva.

Che al fondo si tratti di una variazione sul tema di quella tendenza rinunciataria molto spesso denunciata dalla dottrina che ha analizzato i rapporti tra scienza e processo[11], emerge anche nei casi in cui si faccia spazio all’ingresso del sapere specialistico nel processo penale.

Emblematica a tal proposito è la decisione con cui si è preso in considerazione il caso di una perizia attraverso cui, per la prima volta, si è proceduto all’impiego di un metodo completamente automatico di identificazione vocale, denominato speaker recognition sistem. Qui, a dispetto del larvato accenno ai criteri enucleati dalla sentenza Daubert[12], l’attendibilità dei risultati dell’indagine fonica è stata desunta esclusivamente dal fatto che «il sistema aveva effettuato una oggettiva comparazione dei dati interamente affidata al software» e che, dunque, l’identificazione non era stata basata solo su «interpretazioni meramente soggettive»[13].

C’è un filo rosso che lega questi due modi di concepire l’identificazione vocale, all’apparenza così tanto eterogenei. A ricomporre la marcata antinomia c’è, infatti, una «deresponsabilizzazione cognitiva del giudice»[14] il quale si accontenta di proiettare sul risultato le garanzie di attendibilità che sembrano poter essere attribuite alla fonte, non importa se perito, interprete operatore addetto all’ascolto delle intercettazioni. È però – e in entrambi i casi – l’assenteismo giudiziale che garantisce l’ingresso sulla scena processuale di risultati che non offrono sufficienti garanzie di attendibilità.

La sentenza in commento, dunque, è solo l’ultimo pezzo di un puzzle inquietante. È, infatti, evidente che sullo sfondo ci sia un problema di vischiosità culturale che, tuttavia, solo in parte è legato ai fantasmi di un passato che si fa fatica a mettere via. A fare da zavorra è anche la staticità di un sapere giudiziale che, stentando a rinnovarsi, finisce per sfuggire al confronto con quelle risorse verso cui costantemente si muove il mondo fuori dall’aula di udienza. Solo la conoscenza, del resto, garantisce l’acquisizione di una consapevolezza essenziale in questa materia e cioè che, almeno allo stato attuale, identità di voci non significa necessariamente identità di parlatori[15], e ciò in quanto, nonostante sia possibile caratterizzare pienamente una voce, non è invece possibile caratterizzare pienamente un parlatore, perché una stessa voce può corrispondere a più parlatori[16].

È su questo aspetto, non a caso, che si proietta uno dei principali fraintendimenti che si registrano nell’esperienza giudiziaria e che emerge, con dirompente chiarezza, dal tenore dei quesiti che generalmente vengono sottoposti agli esperti, ai quali si finisce per domandare non se vi è compatibilità, ma piuttosto, se vi è identità tra la voce del parlatore anonimo e quella dell’imputato[17].

Con tutta evidenza, si tratta di prospettive viziate da un grossolano errore di metodo. Il problema dei rischi sottesi all’identificazione vocale – o forse sarebbe meglio dire, il problema dell’identificazione del parlatore – è, e resta, un problema del giudice, che va affrontato secondo le regole e le garanzie che presiedono all’attività di ricostruzione del fatto. E questo anche laddove l’identificazione vocale sia un approdo raggiunto senza l’intervento di un esperto. Quale che sia, infatti, il mezzo di prova utilizzato ai fini dell’identificazione ed il livello di attendibilità che sia stato a questo riconosciuto, il risultato va ulteriormente verificato in relazione all’intero quadro probatorio perché è un esito, quello dell’identificazione della voce, da filtrare, sempre e comunque, attraverso le maglie del ragionevole dubbio.

[1] Nello stesso senso, in precedenza, Cass., sez. II, 27-10-2020, Cera, CED, 280064, ha ritenuto che l’interprete nominato per la traduzione e trascrizione delle conversazioni registrate può identificare gli interlocutori e compiere un’attività di carattere comparativo e ricognitivo.

[2] Cass., sez. VI, 8-1-2008, Gionta, CED, 239725; Cass., sez. II, 23-11-2004, p.m. in proc. Teri, ivi, 229909; in precedenza, Cass., sez. VI, 19-2-1992, Papale, ivi, 191250.

[3] Cass., sez. III, 27-10-1995, Megna, CED, 203906.

[4] Così, Cass., sez. II, 11-5-2017, Evangelista, inedita.

[5] Solo per limitarci a pochi esempi, v. Deffenbacher, Eyewitness accuracy and confidence: can we infer anything about their relationship?, Law and Human Behavior, 1980, n. 4, 243; Devenport – Studebaker – Penrod, Perspectives on jury decision- making, in Aa. Vv., Handbook of applied cognition, Chichester, 1999, 819; Yarmey, The psychology of speaker identification and earwitness memory, in AA.VV., Handbook of eyewitness psychology, II, New York, 2014, 110.

[6] Su punto, v. le Linee guida psicoforensi per un processo sempre più giusto, consultabili su www.fondazionegullotta.org.

[7] Su questo fenomeno, v. Sherrin, Earwitness evidence: the reliability of voice identification, in Osgoode Hall Law Journal, vol. 52 (3), 2015, 14.

[8] Così Biral, L’identificazione della voce nel processo penale: modelli, forme di accertamento, tutela dei diritti individuali, RIDPP, 2015, 1842 ss.

[9] Sulla molteplicità dei fattori che influiscono sulle variazioni della voce di un medesimo individuo, v. Albano Leoni – Maturi, Fonetica sperimentale e fonetica giudiziaria, GP, 1991, I, 316.

[10] Questa condizione è evocata da Canzio, Prova scientifica, ricerca della “verità” e decisione giudiziaria nel processo penale, in Riv. trim. dir. e proc. civ., 2005, 55.

[11] Cfr., per tutti, Dominioni, La prova penale scientifica, Milano, 2005, 236.

[12] Il riferimento corre alla nota sentenza Daubert v. Merrel-Dow Pharmaceutical, Inc., 509 U.S. 579 (1993).

[13] Cass., sez. II, 11-7-2012, Arzu, CED, 254344.

[14] L’espressione è di Lorusso, Il contributo degli esperti alla formazione del convincimento giudiziale, in Arch. pen. on line, 2011, n. 3, 2.

[15] Si tratta di un approccio assolutamente consolidato tra gli esperti della materia: cfr., per tutti, Paoloni, Le indagini foniche, consultabile su www.ording.roma.it , 1 e ss.

[16] Cfr., sul punto, Trib. Torino, 23-12-1991, Leonardis, in Cass. pen., 1992, 2217.

[17] Calibrando il quesito su quello che gli esperti definiscono come “rapporto 1 a 1”, resta in ombra non solo il margine di errore statistico, sempre connesso all’operazione, ma anche l’idea di relativismo sottesa al rapporto di verosimiglianza.

Katia La Regina

Professore Associato di Diritto Processuale Penale presso l'Università Giustino Fortunato di Benevento

Condividi su:

Conflitto tra mandato d’arresto europeo ed estradizione: può decidere un organo esecutivo

Alessio Gaudieri 31 Marzo 2025

Le Sezioni unite risolvono due questioni in materia di indebita percezione di erogazioni in danno dello Stato: depositata la motivazione

a cura di Guido Colaiacovo 31 Marzo 2025

Le Sezioni unite riducono gli spazi del difensore del terzo nel procedimento di prevenzione: informazione provvisoria

Leonardo Filippi 31 Marzo 2025

IL PROBLEMA DELLA CONFIGURABILITA’ DEL DELITTO DI EPIDEMIA COLPOSA IN FORMA OMISSIVA: NOTE A MARGINE DI UNA RECENTE ORDINANZA DI RIMESSIONEALLE SEZIONI UNITE

Carolina Serafina Errico 28 Marzo 2025

Articoli più recenti