Chatbot e voce registrata – un dilemma nell’era della messaggistica

Ottobre 7, 2021

I chatbot dialogano con le persone tramite linguaggio naturale e hanno avuto una straordinaria crescita negli ultimi anni. Hanno iniziato ad apparire come piccole finestre di ricerca sui siti Web, consentendo agli utenti di scrivere ciò che stavano cercando e fornendo così le informazioni in modo diretto,  senza la necessità di navigare all’interno del sito.

Questo è sicuramente un servizio utile, tuttavia i chatbot si sono evoluti, svolgono ricerche all’interno di database,  fornendo all’utente risultati personalizzati, ed eseguono anche alcune attività mission-critical, come la prenotazione e la conferma degli appuntamenti.

Negli ultimi anni si è vista anche l’esplosione dei servizi di messaggistica mobile, che sono ormai parte integrante della vita di (quasi) tutti. Questo vale per i semplici messaggi di testo (SMS), servizi di messaggistica multimediale con più destinatari, e diverse piattaforme che si posizionano a metà tra servizi di messaggistica e social network, come WhatsApp, Viber, Telegram e Facebook Messenger. I vantaggi offerti da questi servizi sono evidenti: vengono distribuiti come software e possono essere installati dagli utenti su qualunque dispositivo portino con loro, sono gratuiti o quasi, offrono funzionalità multimediali e, non da ultimo, risulta molto spesso più rapido e pratico scrivere un messaggio piuttosto che chiamare il destinatario. WhatsApp, proprietà di Facebook, è attualmente l’app di messaggistica mobile più diffusa al mondo (anche se ha una diffusione più limitata negli Stati Uniti) e vanta circa 2 miliardi di utenti e 100 miliardi di messaggi inviati al giorno.

Altri articoli

E così il numero di messaggi inviati dagli utenti cresce sempre di più. Naturalmente anche i chatbot giocano un loro ruolo in questo contesto, assistendo i loro utenti sui diversi canali utilizzati. In questo modo gli utenti possono comunicare  con i chatbot attraverso l’app di messaggistica che preferiscono, proprio come se stessero messaggiando con degli amici.

I chatbot sono capaci ad elaborare testo, e le applicazioni di messaggistica inviano, di base, messaggi di testo. Queste supportano naturalmente anche  l’invio di immagini e video, che vengono però trasferiti come collegamenti testuali, tramite cui l’app può recuperare il contenuto o gli allegati. I chatbot possono connettersi così facilmente a qualsiasi piattaforma di messaggistica dispondendo di  un’API che lo consenta, simulando un utente del sistema o implementando un contatto di tipo aziendale.

Tutto bene allora? Non del tutto. Alcune piattaforme di messaggistica consentono di registrare un messaggio in voce in alternativa (o in aggiunta a)  un messaggio di testo. Questa modalità sta diventando sempre più comune e le persone in movimento spesso preferiscono registrare un breve messaggio vocale, piuttosto che fermarsi a digitare del testo, visto che ciò risulta molto più facile e veloce. Inoltre il messaggio vocale è più personale: puoi comunicare molto di più con il tuo tono di voce che non tramite l’invio di testo ed emoji. Gli esseri umani, inoltre, amano sentire la voce dei loro amici più che leggere semplicemente ciò che loro hanno scritto.

Ma questo non vale per i chatbot. Per loro un messaggio vocale registrato in uno scambio di testo significa normalmente la fine della conversazione: non sono predisposti a ricevere un file vocale e trascriverlo in formato testuale, il che consentirebbe di dare seguito alla conversazione sfruttando il loro sistema di intelligenza artificiale conversazionale. Una soluzione, che può essere applicata a conversazioni di alto valore (come quelle di vendita o di assistenza clienti), è quella di trasferire l’interazione a un agente umano, che potrà rispondere dopo avere ascoltato il messaggio vocale, assumendo di fatto il controllo della conversazione. Tuttavia questa soluzione è molto costosa, in quanto richiede l’impiego di personale che, in aggiunta alle altre attività, deve prendere in carico le conversazioni interrotte dai chatbot. Sarebbe del resto ancora peggio se gli agenti umani fossero impiegati solo per ascoltare e trascrivere i messaggi da rinviare poi ai chatbot: sarebbe un lavoro incredibilmente noioso e svilente, e  porterebbe  probabilmente ad un massiccio turnover.

Quello che serve è un servizio in grado di trascrivere le registrazioni vocali e restituirle ai chatbot in modo veloce e accurato.

PhoneMyBot di Interactive Media fornisce tale servizio. PhoneMyBot è realizzato per espandere le potenzialità dei chatbot, abilitandoli alla comunicazione in voce, sulla rete telefonica o su qualsiasi altro canale. Nel caso del canale telefonico PhoneMyBot trasforma la voce di un utente in testo e il testo del chatbot in voce. Tutto questo viene svolto supportando più lingue e attraverso la  selezione del  servizio di speech-to-text più indicato al compito assegnato.

Per supportare i canali di messaggistica è necessario che i chatbot possano anche inviare a PhoneMyBot la registrazione di un messaggio vocale e ottenerne la trascrizione in modo facile e accurato. PhoneMyBot espone per questo un’API RESTful che supporta file vocali in molteplici codifiche e formati. Considerando che la maggior parte degli utenti usa WhatsApp, e quindi anche i chatbot utilizzano questo canale, PhoneMyBot fornisce anche un numero abilitato all’accesso tramite WhatsApp. I chatbot possono inviare un messaggio a PhoneMyBot con il file vocale e ricevere la trascrizione come risposta.

Con questa soluzione, noi di PhoneMyBot crediamo di aver dato una risposta definitiva al dilemma dei messaggi vocali registrati.

Altri articoli

Come PhoneMyBot aggiunge valore al tuo chatbot

Come PhoneMyBot aggiunge valore al tuo chatbot

L'utilizzo dei robot per semplificare i processi aziendali non è più fantascienza. Oggi più che mai i sistemi basati su RPA (Robotic Process Automation) sono parte integrante del flusso dei servizi e i bot gestiscono ogni giorno un maggior numero di servizi.  Anche i...

leggi tutto

Interagisci con noi