Scritto da Interactive Media
Ottobre 7, 2021

I chatbot dialogano con le persone tramite linguaggio naturale e hanno avuto una straordinaria crescita negli ultimi anni. Hanno iniziato ad apparire come piccole finestre di ricerca sui siti Web, consentendo agli utenti di scrivere ciò che stavano cercando e fornendo così le informazioni in modo diretto, senza la necessità di navigare all’interno del sito.
Questo è sicuramente un servizio utile, tuttavia i chatbot si sono evoluti, svolgono ricerche all’interno di database, fornendo all’utente risultati personalizzati, ed eseguono anche alcune attività mission-critical, come la prenotazione e la conferma degli appuntamenti.
Negli ultimi anni si è vista anche l’esplosione dei servizi di messaggistica mobile, che sono ormai parte integrante della vita di (quasi) tutti. Questo vale per i semplici messaggi di testo (SMS), servizi di messaggistica multimediale con più destinatari, e diverse piattaforme che si posizionano a metà tra servizi di messaggistica e social network, come WhatsApp, Viber, Telegram e Facebook Messenger. I vantaggi offerti da questi servizi sono evidenti: vengono distribuiti come software e possono essere installati dagli utenti su qualunque dispositivo portino con loro, sono gratuiti o quasi, offrono funzionalità multimediali e, non da ultimo, risulta molto spesso più rapido e pratico scrivere un messaggio piuttosto che chiamare il destinatario. WhatsApp, proprietà di Facebook, è attualmente l’app di messaggistica mobile più diffusa al mondo (anche se ha una diffusione più limitata negli Stati Uniti) e vanta circa 2 miliardi di utenti e 100 miliardi di messaggi inviati al giorno.
Altri articoli
Interazioni multimodali: un bisogno impellente?
La settimana scorsa ho seguito un webinar con demo fatto da una ditta che produce strumenti...
Il futuro della voce intelligente
Ora che il mercato degli smart speaker vacilla, cosa faranno i tre protagonisti (Amazon, Apple,...
E così il numero di messaggi inviati dagli utenti cresce sempre di più. Naturalmente anche i chatbot giocano un loro ruolo in questo contesto, assistendo i loro utenti sui diversi canali utilizzati. In questo modo gli utenti possono comunicare con i chatbot attraverso l’app di messaggistica che preferiscono, proprio come se stessero messaggiando con degli amici.
I chatbot sono capaci ad elaborare testo, e le applicazioni di messaggistica inviano, di base, messaggi di testo. Queste supportano naturalmente anche l’invio di immagini e video, che vengono però trasferiti come collegamenti testuali, tramite cui l’app può recuperare il contenuto o gli allegati. I chatbot possono connettersi così facilmente a qualsiasi piattaforma di messaggistica dispondendo di un’API che lo consenta, simulando un utente del sistema o implementando un contatto di tipo aziendale.
Tutto bene allora? Non del tutto. Alcune piattaforme di messaggistica consentono di registrare un messaggio in voce in alternativa (o in aggiunta a) un messaggio di testo. Questa modalità sta diventando sempre più comune e le persone in movimento spesso preferiscono registrare un breve messaggio vocale, piuttosto che fermarsi a digitare del testo, visto che ciò risulta molto più facile e veloce. Inoltre il messaggio vocale è più personale: puoi comunicare molto di più con il tuo tono di voce che non tramite l’invio di testo ed emoji. Gli esseri umani, inoltre, amano sentire la voce dei loro amici più che leggere semplicemente ciò che loro hanno scritto.
Ma questo non vale per i chatbot. Per loro un messaggio vocale registrato in uno scambio di testo significa normalmente la fine della conversazione: non sono predisposti a ricevere un file vocale e trascriverlo in formato testuale, il che consentirebbe di dare seguito alla conversazione sfruttando il loro sistema di intelligenza artificiale conversazionale. Una soluzione, che può essere applicata a conversazioni di alto valore (come quelle di vendita o di assistenza clienti), è quella di trasferire l’interazione a un agente umano, che potrà rispondere dopo avere ascoltato il messaggio vocale, assumendo di fatto il controllo della conversazione. Tuttavia questa soluzione è molto costosa, in quanto richiede l’impiego di personale che, in aggiunta alle altre attività, deve prendere in carico le conversazioni interrotte dai chatbot. Sarebbe del resto ancora peggio se gli agenti umani fossero impiegati solo per ascoltare e trascrivere i messaggi da rinviare poi ai chatbot: sarebbe un lavoro incredibilmente noioso e svilente, e porterebbe probabilmente ad un massiccio turnover.
Quello che serve è un servizio in grado di trascrivere le registrazioni vocali e restituirle ai chatbot in modo veloce e accurato.
PhoneMyBot di Interactive Media fornisce tale servizio. PhoneMyBot è realizzato per espandere le potenzialità dei chatbot, abilitandoli alla comunicazione in voce, sulla rete telefonica o su qualsiasi altro canale. Nel caso del canale telefonico PhoneMyBot trasforma la voce di un utente in testo e il testo del chatbot in voce. Tutto questo viene svolto supportando più lingue e attraverso la selezione del servizio di speech-to-text più indicato al compito assegnato.
Per supportare i canali di messaggistica è necessario che i chatbot possano anche inviare a PhoneMyBot la registrazione di un messaggio vocale e ottenerne la trascrizione in modo facile e accurato. PhoneMyBot espone per questo un’API RESTful che supporta file vocali in molteplici codifiche e formati. Considerando che la maggior parte degli utenti usa WhatsApp, e quindi anche i chatbot utilizzano questo canale, PhoneMyBot fornisce anche un numero abilitato all’accesso tramite WhatsApp. I chatbot possono inviare un messaggio a PhoneMyBot con il file vocale e ricevere la trascrizione come risposta.
Con questa soluzione, noi di PhoneMyBot crediamo di aver dato una risposta definitiva al dilemma dei messaggi vocali registrati.
Altri articoli
Interazioni multimodali: un bisogno impellente?
La settimana scorsa ho seguito un webinar con demo fatto da una ditta che produce strumenti software e soluzioni conversazionali per l’assistenza al cliente. Interactive Media, dove lavoro, è nello stesso settore e volevo dare un’occhiata a quello che fa la...
Il futuro della voce intelligente
Ora che il mercato degli smart speaker vacilla, cosa faranno i tre protagonisti (Amazon, Apple, Google)? Alexa, devo prendere un ombrello domani? Questa è una domanda che i possessori di smart speaker pongono dal 2013, l'anno in cui Amazon ha rilasciato il suo primo...
Io e il Text-to-Speech: la mia esperienza storica
L'autore fa parte del team che ha fondato Interactive Media nel 1996 ed è l'amministratore delegato dell’azienda. Interactive Media è uno sviluppatore e fornitore globale di applicazioni vocali. Interactive Media ha una lunga storia nello sviluppo di applicazioni...

Interactive Media S.p.A. • Sede Legale Viale Città d’Europa, 679 - 00144 Roma (Italy) • P.IVA 05057871005 • Cap. Sociale € 366.300,00 I.V. • Registro REA RM 834515 • PEC interactivemedia@pec.it