Twitter, arriva dal Sud “Crowd Pulse”: il software che scova l’odio in rete

32

Gli hanno dato un nome inglese che significa “il battito cardiaco della folla”. E’ stato utilizzato all’Aquila per tastare il polso dei cittadini abruzzesi che hanno vissuto il post terremoto. Viene sperimentato in fase embrionale con il comune di Bari per analizzare le percezioni di sicurezza nei quartieri del capoluogo pugliese. E’ “Crowd Pulse” il nome con cui è stato battezzato il software elaborato nel Dipartimento di Informatica dell’Università “Aldo Moro” di Bari. E’ una piattaforma di social network analytics & sentiment anaysis che permette di analizzare e geolocalizzare i “cinguettii” su Twitter sulla base dei significati e dei contenuti. Se “i dati sono il nuovo petrolio” allora Crowd Pulse funziona proprio come una trivella: buca dove c’è il giacimento ed estrae. Non il greggio ma i tweet. E’ con questo esempio che lo definisce Cataldo Musto, ricercatore barese dell’Aldo Moro, che il 25 giugno ha parlato del “cuore tecnologico” alla base de “Le mappe dell’intolleranza” in Italia: terza edizione del progetto di Vox – Osservatorio italiano sui diritti per monitorare l’odio su twitter verso donne, omosessuali, musulmani, ebrei, immigrati e disabili. Come funzionano gli algoritmi elaborati nell’ateneo pugliese? “Il concetto basilare non è diverso da una ricerca effettuata a mano nel motore di ricerca interno a twitter – spiega Musto -. Il software automatizza questa operazione estraendo a intervalli regolari, ogni 24 ore, tutti i tweet che contenevano per esempio espressioni come ‘muso giallo’, ‘negro’ o ‘rabbino’ nel caso di contenuti razzisti o antisemiti”. C’e’ un problema: l’espressione “rabbino” si presta a sfumature semantiche. Puo’ essere usata in maniera dispregiativa ma anche indicare gli studiosi della Torah. “Serve il contesto – spiega Musto anticipando l’obiezione -. Non analizziamo la singola parola estrapolata ma sulla base di quelle che la circondano”. Un esempio banale? “Se attorno alla parola ‘nano” compaiono i nomi di Messi o Brunetta e non iPod, allora “c’e’ un’alta probabilità statistica che il termine sia usato come insulto o nella sua accezione d’intolleranza”.
Se la lista di 76 termini offensivi, che gli informatici definiscono “semi” e con cui il software ha tracciato i tweet dell’intolleranza, e’ stata messa in campo dal Dipartimento di psicologia dinamica e clinica della Sapienza, l’attuale direzione di ricerca e’ quella “evolvere la piattaforma per unire i dati che provengono dal web con quelli del mondo reale” come “centraline, posizioni gps, correlazioni fra mondi online e offline”. Nel progetto dell’Osservaotrio italiani sui diritti, questo continuo dialogo fra i due mondi e’ messo in luce dall’analisi dei picchi di tweet legati ai fatti di cronaca. “Nessuno si sveglia al mattino e twitta un messaggio razzista” afferma Musto, ma al contrario c’è sempre un detonatore: casi di cronaca, titoli dei giornali, reality show. “Nelle prime edizioni del progetto l’analisi dei picchi non c’era ma due anni fa ci siamo accorti di una salita vertiginosa dopo la lite fra gli allenatori Roberto Mancini e Maurizio Sarri durante un Napoli-Inter di Coppa Italia”. Il caso è quello dell’allenatore del Napoli che apostrofa con parole omofobe il suo omologo nerazzurro. E’ proprio il calci a essere uno dei detonatori piu’ frequenti. Per Musto e’ “durante le partite che si assiste a un aumento dei ‘zingaro’ o ‘negro”. “Crowd Pulse” è utilizzato ora in pianta stabile da Vox e le quattro universita’ – Statale e Cattolica di Milano, Aldo Modo di Bari e la Sapienza di Roma, che lavorano alle mappe dell’intolleranza.