Così Instagram capisce e ci raccomanda cosa ci piace guardare

Un recente articolo pubblicato sul blog di Facebook dedicato all’intelligenza artificiale svela a grandi linee cosa si nasconde dietro il meccanismo di recommendation, per usare un termine tecnico, che suggerisce all’utente quali nuovi profili seguire in base alle proprie preferenze. Algoritmi di questo tipo non sono nuovi nel mondo del Machine Learning, ma negli ultimi tempi la ricerca si sta concentrando moltissimo sulle suddette tematiche in quanto chi primo arriva al cuore del cliente ci resta più a lungo; in altri termini sebbene da un lato l’utente medio sia sempre più consapevole dello spionaggio commerciale perpetrato dagli algoritmi, un suggerimento azzeccato su cosa guardare al di là dell’attuale stream di foto, e quindi il piacere della novità che davvero può interessarlo, contribuisce all’aumento dell’utilizzo del social che offre questo tipo di servizio.

Nel suddetto post, i data scientist di Instagram spiegano il funzionamento dietro le quinte della scheda Esplora “Questa è la prima volta che entriamo nel dettaglio dei blocchi fondamentali che ci aiutano a fornire contenuti personalizzati”, ha detto Ivan Medvedev, ingegnere software Instagram. L’intervento sottolinea che Instagram è enorme, e il contenuto estremamente vario, “con argomenti che variano dalla calligrafia araba, ai modelli di treni, alla melma”. Questo rappresenta una sfida per raccomandare i contenuti, che Instagram supera concentrandosi non su quali messaggi potrebbero piacere agli utenti, ma su quali account potrebbero essere di loro interesse, inoltre il sistema può essere progettato per dare più peso ad alcune azioni previste rispetto ad altre.

Instagram identifica gli account che sono simili l’uno all’altro adattando un metodo comune di apprendimento automatico noto come word embedding. I sistemi di word embedding studiano l’ordine in cui le parole appaiono nel testo per misurare la loro correlazione. Così, per esempio, un sistema di questo tipo noterebbe che la parola “acqua” appare spesso accanto alle parole “mare” e “ghiaccio”, ma meno frequentemente accanto alle parole “lampada” o “mouse”.

Per fare le sue raccomandazioni, il sistema che guida la scheda Esplora inizia guardando gli “account seed”, che sono account con i quali gli utenti hanno interagito in passato, apprezzando o salvando il loro contenuto. Identifica gli account simili a questi e, da questi, seleziona 500 brani di contenuto testuale. Questi candidati sono quindi successivamente filtrati per rimuovere lo spam, la disinformazione e i “probabili contenuti che violano le policy”, mentre i restanti messaggi sono classificati in base alla probabilità che un utente interagisca con ciascuno di essi. Infine, i primi 25 messaggi vengono inviati alla prima pagina della scheda Esplora dell’utente. L’algoritmo sfrutta anche tecniche di apprendimento continuo, annotando i contenuti rifiutati dall’utente e migliorando quindi la futura proposizione di account di probabile interesse.

Instagram non è comunque completamente trasparente sul suo processo, da un lato questo è comprensibile, dall’altro bisogna notare che per gli addetti ai lavori questi sistemi non necessitano di chissà quali sofisticazioni aggiuntive, funzionando già bene di per sé con i metodi base. Non ci sono dettagli su quali segnali vengono utilizzati per identificare spam o informazioni errate, e questo non è troppo sorprendente considerando che spiegare questo aiuterebbe le persone che vogliono diffondere questo tipo di contenuti. L’azienda non è nemmeno chiara sui metodi e sull’efficacia dell’apprendimento automatico utilizzato per filtrare i contenuti inappropriati, un dettaglio chiave dato che Facebook presenta spesso l’IA come una soluzione efficace per la moderazione dei contenuti, suscitando non poco scetticismo da parte degli esperti del settore.

A tutti gli utenti del social resta quindi da testare con mano l’efficacia di tali metodi, verificare se davvero gli account suggeriti soddisfano i propri interessi o se non siano annegati all’interno di account portati alla nostra attenzione da meri meccanismi pubblicitari in cui, tramite le classiche aste, vince chi introduce più denaro piuttosto che maggiori contenuti o contenuti di vero interesse, specialmente in ambito fotografico, ormai sempre più separato dalle reali proposizioni di Instagram e dei suoi fondatori.

Silvio Villa