Per il CEO di ElevenLabs la voce sarà la prossima grande interfaccia per l'AI

05/02/2026

Per il CEO di ElevenLabs la voce sarà la prossima grande interfaccia per l'AI

Mati Staniszewski racconta come la sintesi vocale stia diventando il ponte naturale tra umani e agenti AI, grazie a modelli che capiscono contesto ed emozioni.

Sul palco del Web Summit di Doha il CEO di ElevenLabs, Mati Staniszewski, ha spiegato perché la voce diventerà l'interfaccia principale per l'intelligenza artificiale.

L'azienda, nota per i modelli di sintesi vocale realistici, sta lavorando a sistemi capaci non solo di leggere un testo, ma di interpretare pause, enfasi e intenzioni dell'utente.

Secondo Staniszewski, gli assistenti vocali di nuova generazione avranno una componente "ricettiva": comprenderanno il tono dell'interlocutore, lo stato emotivo e gli obiettivi della conversazione, regolando la risposta di conseguenza.

ElevenLabs sta combinando modelli linguistici di grandi dimensioni con reti neurali audio specializzate; il risultato è una pipeline che converte testo in voce e voce in prompt, creando cicli di dialogo quasi naturali.

Il CEO immagina call center, videogiochi, esperienze educative e customer care gestiti da agenti vocali AI sempre attivi, con la possibilità di passare la conversazione a un umano senza soluzione di continuità.

Per evitare abusi, l'azienda sta investendo in watermark, filtri anti deepfake e strumenti per riconoscere le voci generate artificialmente, offrendo contemporaneamente un sistema di licenze per attori e doppiatori.

Staniszewski ha anche sottolineato l'importanza di collaborare con i regolatori: ElevenLabs ha proposto linee guida per il consenso vocale e per l'utilizzo delle identità audio nei media.

Nel 2026 arriveranno API che permetteranno a sviluppatori e brand di creare agenti vocali personalizzati, con voci su misura e comportamenti programmabili per diversi mercati.

Fonte: https://techcrunch.com/2026/02/05/elevenlabs-ceo-voice-is-the-next-interface-for-ai/