Mar. Dic 5th, 2023

Rimani informato con aggiornamenti gratuiti

Durante la sua ultima richiesta di guadagni come amministratore delegato della società di sequenziamento genetico Illumina, Francis deSouza ha fatto del suo meglio per rimanere positivo.

Una controversa acquisizione da 8 miliardi di dollari della società di screening del cancro Grail aveva provocato una campagna da parte dell’investitore attivista Carl Icahn, scontri con le autorità garanti della concorrenza su entrambe le sponde dell’Atlantico e critiche da parte dei direttori fondatori di Grail.

DeSouza ha detto agli analisti che il dramma sta colpendo solo “una parte molto piccola dell’azienda”.

Ma ogni volta che gli è stato chiesto del Graal, si sono verificati cambiamenti nella velocità, nel tono e nel volume del suo parlato, secondo Speech Craft Analytics, che utilizza l’intelligenza artificiale per analizzare le registrazioni audio. C’è stato anche un aumento delle parole di riempimento come “um” e “ah” e persino un sorso udibile.

La combinazione “tradisce segni di ansia e tensione proprio quando si affronta questa delicata questione”, secondo David Pope, chief data scientist di Speech Craft Analytics.

DeSouza si dimise meno di due mesi dopo.

L’idea che le registrazioni audio possano fornire indicazioni sulle vere emozioni dei dirigenti ha attirato l’attenzione di alcuni dei maggiori investitori mondiali.

Molti fondi utilizzano già algoritmi per analizzare le trascrizioni delle chiamate sugli utili e delle presentazioni aziendali per raccogliere segnali dalla scelta delle parole da parte dei dirigenti, un campo noto come “Natural Language Processing” o PNL. Ora stanno cercando di trovare ulteriori messaggi nel modo in cui vengono pronunciate quelle parole.

“L’idea è che l’audio catturi qualcosa di più del semplice contenuto del testo”, ha affermato Mike Chen, responsabile della ricerca alternativa alfa presso Robeco, l’asset manager. “Anche se hai una macchina semantica sofisticata, cattura solo la semantica.”

Le parole di esitazione e di riempimento tendono a essere omesse dalle trascrizioni e l’intelligenza artificiale può anche captare alcuni “microtremori” impercettibili all’orecchio umano.

Robeco, che gestisce oltre 80 miliardi di dollari in fondi guidati da algoritmi, rendendolo uno dei maggiori quant, ha iniziato ad aggiungere segnali audio raccolti tramite l’intelligenza artificiale nelle sue strategie all’inizio di quest’anno. Chen ha affermato che ciò ha aumentato i rendimenti e che si aspetta che più investitori seguano l’esempio.

L’uso dell’audio rappresenta un nuovo livello nel gioco del gatto e del topo tra gestori di fondi e dirigenti.

“Abbiamo trovato un enorme valore nelle trascrizioni”, ha affermato Yin Luo, capo della ricerca quantitativa presso Wolfe Research. “Il problema che si è creato per noi e per molti altri è che il sentiment generale sta diventando sempre più positivo. . .[because]la direzione aziendale sa che i loro messaggi vengono analizzati.”

Numerosi documenti di ricerca hanno scoperto che le presentazioni sono diventate sempre più positive dall’emergere della PNL, poiché le aziende adattano il loro linguaggio per ingannare gli algoritmi.

Un articolo scritto da Luo all’inizio di quest’anno ha scoperto che combinare la tradizionale PNL con l’analisi audio era un modo efficace per distinguere tra le aziende poiché i loro archivi diventano sempre più “standardizzati”.

Sebbene i costi siano diminuiti, l’approccio può ancora essere relativamente costoso. Robeco ha investito tre anni in una nuova infrastruttura tecnologica prima ancora di iniziare a lavorare sull’integrazione dell’analisi audio.

Chen ha provato per anni a utilizzare l’audio prima di unirsi a Robeco, ma ha scoperto che la tecnologia non era abbastanza avanzata. E anche se gli insight disponibili sono migliorati, esistono ancora dei limiti.

Per evitare di trarre conclusioni affrettate sulla base di personalità diverse (alcuni dirigenti potrebbero semplicemente essere più naturalmente espansivi di altri) l’analisi più affidabile deriva dal confronto di diversi discorsi dello stesso individuo nel corso del tempo. Ma ciò può rendere più difficile giudicare la performance di un nuovo leader, probabilmente in un momento in cui l’intuizione sarebbe particolarmente utile.

“Un limite anche nella PNL è che il cambio del CEO compromette il sentiment generale [analysis]”, ha affermato un dirigente di un’azienda che fornisce analisi PNL. “Questo effetto di disturbo deve essere più forte con la voce.”

Gli sviluppatori devono anche evitare di aggiungere i propri pregiudizi negli algoritmi basati sull’audio, dove differenze come genere, classe o razza possono essere più evidenti che nel testo.

“Siamo molto attenti a garantire che i pregiudizi consci di cui siamo consapevoli non si facciano strada, ma potrebbero esserci ancora pregiudizi subconsci”, ha detto Chen. “Avere un team di ricerca ampio e diversificato in Robeco aiuta.”

Gli algoritmi possono dare risultati fuorvianti se tentano di analizzare qualcuno che parla in una lingua non nativa e un’interpretazione che funziona in una lingua potrebbe non funzionare in un’altra.

Proprio come le aziende hanno cercato di adattarsi all’analisi del testo, Pope ha previsto che i team di relazioni con gli investitori avrebbero iniziato a istruire i dirigenti per monitorare il tono della voce e altri comportamenti che non vengono rilevati dalle trascrizioni. L’analisi della voce ha difficoltà con attori addestrati che riescono a rimanere in modo convincente nel personaggio, ma replicarlo potrebbe essere più facile a dirsi che a farsi per i dirigenti.

“Pochissimi di noi sono bravi a modulare la nostra voce”, ha detto. “È molto più facile per noi scegliere attentamente le nostre parole. Abbiamo imparato a farlo fin da piccoli per evitare di finire nei guai”.