Rassegna stampa

La startup che insegna alle voci dell’intelligenza artificiale a flirtare con te

Sonantic dice di aver trovato una soluzione affinché le voci registrate possano diventare più credibili: inserire suoni non vocali per inframezzarle

Come se l’intelligenza artificiale che disciplina le risposte del nostro assistente vocale volesse riproporre il canto delle sirene di Ulisse. Dare un tocco in più di umanità, l’aspetto suadente di una voce, l’emozione che quest’ultima può veicolare. È l’obiettivo – e a quanto pare anche il tentativo verso cui si sta muovendo in questi ultimi mesi – di Sonantic, una startup che punta a rendere più umane le voci metalliche degli assistenti vocali. Al momento, la sua ricerca si sta concentrando sul concetto di flirt: dare un tono ammiccante alla voce dell’intelligenza artificiale.

Sonantic e la sua strategia rispetto all’intelligenza artificiale

Sonantic crede di aver trovato una sorta di Photoshop della voce. La ricetta per rendere l’idea del flirt o della battuta spiritosa in una voce registrata è quella – secondo l’azienda – di inframezzare alla voce umana anche dei suoni non vocali: respiri, risatine, suoni che emettiamo quasi automaticamente, senza pensarci su. Si tratta di soluzioni che puntano a rivoluzionare il settore del vocale e dell’intelligenza artificiale.

Certo, è difficile riprodurre proprio tutte le emozioni umane. Non a caso sono stati scelti i flirt e le battute di spirito: si tratta di due piani emotivi replicabili più facilmente rispetto, ad esempio, alla drammatizzazione, al tono serioso con cui si comunica un lutto o un evento non propriamente piacevole. Ancor più difficile la riproduzione dei toni attoriali, di quelli che si sentirebbero nei teatri o al cinema (gli attori possono stare tranquilli: non verranno sostituiti così facilmente da un’intelligenza artificiale).

Sonantic ha una piattaforma che permette ai suoi utenti di selezionare il messaggio che si vuole inviare, di scegliere il suo tono tra un vasto campionario, di regolare l’intonazione della voce attraverso la modalità “regia”. Ingredienti – non propriamente automatici, ma che ricordano un po’ il lavoro di un fonico in uno studio di registrazione – che contribuiscono a rendere più umane le esperienze vocali. Non è ancora la perfezione, ma poco ci manca. E lo spettro di una relazione che ricordi quella del film Her si fa sempre più presente.