L’importanza (e i limiti) dei dati: come si analizza la realtà attraverso i numeri. Intervista a Donata Columbro
di Federico Scianna
Se ne parla sempre di più. E si usano per comunicare notizie, teorie, idee. La centralità dei dati, oggi è sempre più evidente non soltanto nel mondo della ricerca scientifica, ma anche nella comprensione e nel funzionamento della società. Di riflesso, l’educazione al metodo scientifico e alla scienza dei dati è diventata sempre più cruciale per ragionare in maniera consapevole sull’oggi. Abbiamo posto qualche domanda in merito a Donata Columbro. Giornalista e divulgatrice scientifica, si è occupata dell’argomento anche all’ultimo CICAP Fest, in una conferenza con la giornalista Silvia Bencivelli, Alessandra Brescianini, Medical Director di Amgen Italia, e Lorenzo Montali, docente di psicologia sociale e presidente del CICAP.
Columbro, cominciamo ragionando sulle parole. Qual è la sua definizione della parola “dato”?
Personalmente, ritengo utile partire dal presupposto che stiamo parlando di un costrutto sociale. Si parte dalla decisione di osservare un fenomeno, misurarlo in qualche modo e metterlo in categorie. Come fare tutto questo è una scelta umana, a sua volta risultato di altre decisioni, per esempio quelle relative agli aspetti economici. Parliamo, alla fine, di un prodotto. A me non piace per esempio l’espressione “raccolta dati”. Preferisco parlare di “produzione dati”, per sottolineare che si tratta, appunto, di qualcosa che arriva alla fine di un processo. Ogni volta che consultiamo dei dati su una tabella, un grafico o una qualunque visualizzazione, è fondamentale che ricordiamo tutto quello che è successo prima che questi arrivassero a noi in quella forma. Un altro aspetto molto importante al giorno d’oggi è il cosiddetto dato digitale, ovvero il dato che viene prodotto dalla nostra interazione con tutte le strumentazioni tecnologiche. Anche in questo caso non dobbiamo dimenticare che c’è sempre un processo umano dietro, nel decidere che cosa ci interessa o meno contare delle azioni delle persone, anche nel caso di azioni digitali.
Veniamo all’importanza che i dati stanno acquisendo oggi non solo in relazione alle tecnologie più avanzate, ma anche allo studio di fenomeni sociali. Cos’è cambiato negli ultimi anni?
Siamo in un momento storico in cui non si parla più tantissimo di dati in sé, ma ormai di intelligenza artificiale. Guardiamo a che cosa è successo negli ultimi dieci, quindici anni. Nel periodo 2012-2013 l’espressione che si sentiva più spesso in giro era big data. Ci si domandava che cosa si riuscisse a fare con l’informazione contenuta in grandi quantità di dati, dallo studio alla prevenzione di diversi fenomeni. C’era l’ingresso di questa nuova scienza dei dati in qualsiasi settore. Nel corso della conferenza abbiamo parlato del settore umanitario, per esempio. A un certo punto però ci si è resi conto che i big data non erano la soluzione a tutto: avere grandi quantità di dati per spiegare i fenomeni non bastava. Un esempio molto istruttivo a questo proposito è stato il web service Flu Trends di Google per la previsione di epidemie. Non ha previsto non solo la pandemia di Covid-19 del 2020, ma nemmeno altre. Questo perché si basava sul fatto di poter usare i dati degli utenti, monitorando le loro ricerche online di medicinali collegati all’influenza, per prevedere i picchi di contagio. Il problema è che i picchi che vennero osservati erano semplicemente stagionali, quindi privi di una correlazione diretta. Negli ultimi anni ha preso piede l’idea che per comprendere i fenomeni è utile, insieme ai dati, dare la giusta importanza al contesto: tutto va calato all’interno di adatte cornici interpretative. Non sempre questo accade, però nella maggior parte dei casi intervengono diverse professionalità che collaborano per comprendere i fenomeni. Personalmente, ritengo che siamo in un momento in cui stiamo vedendo i risultati dell’utilizzo di queste grandi moli di dati con l’intelligenza artificiale. Dobbiamo però ricordarci che prima vanno costruiti i dataset, poi si sviluppano i software.
Esiste quindi un elemento di non oggettività sia nella produzione che nell’interpretazione dei dati? Penso ai femminicidi, caso in cui le cornici interpretative giocano un ruolo cruciale nella comprensione del fenomeno.
Sì, soprattutto perché in questo caso stiamo parlando di un fenomeno che in teoria è anche molto semplice da misurare, non di per sé complesso. Ma anche in questo caso è fondamentale capire che, prima di contare gli elementi che ricadono in una certa definizione, bisogna mettersi d’accordo su che cosa vogliamo inserire all’interno della stessa. E questo fa parte di tutto quel lavoro di alfabetizzazione ai dati che ci fa comprendere che il modo in cui un fenomeno viene contato e misurato è frutto di scelte umane. Una raccolta dati, pur essendo rigorosa, può essere politica: le decisioni che vengono prese in proposito dipendono dall’interesse di osservare e di misurare un fenomeno e dai fondi a disposizione. L’aspetto particolare del fenomeno dei femminicidi è che è molto visibile, è impossibile negare che esista perché le notizie arrivano sui giornali, ma studiarlo ci potrebbe aiutare a vedere tutta quella violenza sommersa che è più difficile da misurare.
Rimanendo su aspetti di non oggettivi, la narrazione che viene utilizzata nel presentare i dati ha spesso un ruolo cruciale, soprattutto nel caso di temi delicati. Qual è il modo corretto di raccontare i dati sui femminicidi?
Se prendiamo in considerazione i dati relativi al numero di delitti in Italia, risulta chiaro che il nostro paese è tra gli ultimi in Europa per gli omicidi in generale. Abbiamo una criminalità molto più bassa rispetto ad altri paesi, e tra l’altro questo è in forte contrasto con una certa narrazione circa la sicurezza. La conseguenza è che, anche per quanto concerne i femminicidi, abbiamo un’incidenza sulla popolazione che è tra le più basse d’Europa. Questo però è un dato che secondo me bisogna raccontare: senza parlare di emergenza, è necessario capire perché, pur abbassandosi in generale il tasso di criminalità, il dato riguardante i femminicidi rimanga pressoché costante. Si tratta di andare a studiare in maniera più approfondita il fenomeno, di soppesare cosa stiamo facendo bene – l’Italia ha tra le migliori leggi di prevenzione sulla violenza di genere – e cosa male: sembra ancora che alcuni casi siano inevitabili. Bisogna saper guardare oltre il numero assoluto, prendere in esame ogni singolo caso e chiedersi quali siano le dinamiche che coinvolgono la cultura del paese e le istituzioni.
Nel corso dell’incontro al CICAP Fest è stato proposto il concetto di diritto alla “cittadinanza scientifica”, a sottolineare l’importanza che la popolazione sia in possesso degli strumenti del metodo scientifico e dell’alfabetizzazione ai dati.
È fondamentale. Le istanze di cambiamento devono venire della popolazione, e la consapevolezza della cittadinanza è essenziale, come diceva Lorenzo Montali nel corso della conferenza. Io, per esempio, faccio parte di onData, un’associazione che lavora con dati aperti. Constatiamo con frequenza quanto sia difficile coinvolgere le persone in campagne per chiedere i dati alle istituzioni: non è come chiedere che vengano aperti più ospedali. Invece il fatto di chiedere che le decisioni vengano prese basandosi sui numeri, su degli studi di fattibilità, per esempio, sul fatto che sono investimenti che servono al benessere della popolazione, è cruciale. E se una persona non comprende come funzionano i dati non può appoggiare questo tipo di richieste.
Foto di Enrico Zabeo
