“La senti questa voce, chi canta è il mio cuore”, l’incipit di una canzone di Nicola di Bari, fa venire in mente a chi è più “grandicello” che quel brano venne presentato al Festival di Sanremo nel 1970 in accoppiata con i Ricchi e Poveri.
Il nome di quest’ultimo gruppo è azzeccatissimo per quel che sto per dire a proposito di tecnologie per l’accesso ai conti bancari.
Il ricorso alla voce come “parola chiave” per la clientela di servizi finanziari rischia, infatti, di trasformare i ricchi in poveri, tramutando una soluzione innovativa in un potenziale incubo per chi se ne serve.
Il titolo del brano in questione, non a caso “La prima cosa bella”, sembra scritto dai pirati informatici per esprimere la propria soddisfazione nel trovarsi la strada spianata per portare a termine le proprie malefatte.
L’idea che la voce possa autenticare un utente e abilitarne l’operato sul proprio conto corrente è sembrata una figata spaziale, Molti si sono cimentati a sviluppare applicazioni di questo tipo, altri hanno pure investito un mucchio di soldi per mostrarsi moderni e all’avanguardia, pochi ne hanno considerato le potenziali controindicazioni.
Dove non arriva la capacità visionaria di chi crede di cavalcare l’innovazione senza sapere di essere sul dorso di un cavallo da rodeo, giunge la realtà dei fatti che amaramente induce a rivedere i propositi futuribili che tanto avevano entusiasmato il management e la clientela.
La frase “La tua voce è la tua password” sembra strappata pari pari dal film “I signori della truffa”, pellicola del 1992 con un travolgente Robert Redford a capo di una banda capace di ogni bricconata. Una specifica sequenza di quell’opera cinematografica mostrava proprio la fragilità di un sistema analogo, ma in questi oltre trent’anni qualcuno quel capolavoro non lo ha visto nonostante sia stato ripetutamente proposto anche sul piccolo schermo.
L’arco di tempo tra oggi e quel “cult movie” è stato segnato da numerosi mutamenti hi-tech e in particolare ha visto lo sbarco dell’intelligenza artificiale a disposizione di chiunque.
La clonazione di tono e timbro della voce sono diventati una sorta di gioco e chi aveva pensato a magici metodi di identificazione per autenticare la propria clientela forse è il caso che perda dieci minuti per fare qualche riflessione.
Senza andare a cercare chissà quale alchimia, basterebbe prendere in considerazione le parole di OpenAI (l’azienda di ChatGPT per intenderci) che venti giorni fa ha annunciato un’anteprima di “Voice Engine”, una tecnologia che con un campione audio di 15 secondi può generare un parlato dal suono naturale che secondo il comunicato stampa “ricorda molto da vicino l’oratore originale”.
Un team della software house OmniSpeech sta sviluppando un algoritmo per identificare le sottili discrepanze che distinguono le voci autentiche dalle loro imitazioni artificiali, ma è forte la consapevolezza che una voce umana possa essere clonata in soli tre secondi e a breve il processo di elaborazione per arrivare a tale risultato potrebbe essere istantaneo…
OpenAI nel frattempo suggerisce alle banche di premere il “tasto pausa” e rivedere i rispettivi progetti. Forse vale pena riservare il “tasto play” per rivedere “I signori della truffa” e magari capire che era già tutto previsto o comunque prevedibile…