Quanto sono neutrali i dati? Intervista a Donata Columbro
di Gaia Dibiase
Quando ci si trova in un contesto d’incertezza, i dati sembrano essere una delle poche cose su cui poter contare. Ci affidiamo ad essi per prendere decisioni politiche, per rafforzare tesi in cui crediamo, per analizzare la realtà e costruire il progresso scientifico-tecnologico. Ma possiamo davvero riporre fiducia nei dati al punto da considerarli entità neutrali e “oggettive”? A questa domanda ha cercato di rispondere Donata Columbro, giornalista, divulgatrice e scrittrice, in occasione dell’evento intitolato “Bianco, occidentale, uomo. Quando la scienza discrimina”, nel corso di un evento del CICAP Fest 2024. La relatrice ha sottolineato come i dati non possano prescindere dal contesto in cui sono stati prodotti (e non debbano essere, quindi, semplicemente raccolti e presi per buoni asetticamente), influenzando inevitabilmente la narrazione attorno al fenomeno preso in esame.
Professoressa Columbro, in che modo il pregiudizio può essere trasmesso attraverso la produzione di dati?
La diffusione di un pregiudizio avviene spesso proprio attraverso la trasmissione di notizie o di informazioni non veritiere o solo parzialmente vere. Ciò accade soprattutto con le tematiche che, in un determinato periodo storico e sociale, sono effettivamente “calde” da un punto di vista politico. È il caso, per esempio, dei fenomeni migratori, della violenza di genere o di eventi climatici estremi. Il modo in cui il dato viene prodotto ha un’influenza su come verrà percepito un fenomeno fin dalla scelta di includere oppure escludere una certa categoria di individui. Per esempio, se interroghiamo le persone su quanti stranieri ci sono attualmente in Italia, le risposte più diffuse si collocano tra il 20 e il 30% (contro un più realistico 8%). Questa percezione dipende dal modo in cui vengono presentati al pubblico numeri e statistiche, spesso per motivi di propaganda politica. Non si tratta di diffusione di informazioni necessariamente false, ma della costruzione di uno storytelling in grado di modellare il modo in cui un determinato fenomeno viene osservato e compreso.
Potrebbe fare alcuni esempi di manipolazione di numeri e statistiche allo scopo di condizionare l’opinione delle persone?
L’uso strategico dell’asse delle Y che non parte da zero è un esempio classico di manipolazione visiva con i grafici. Quando l’asse delle Y non parte da zero, anche differenze minime tra i dati possono sembrare più significative di quanto non siano in realtà e questo può alterare la percezione del trend o dell’entità delle variazioni. Facciamo un esempio prendendo i risultati di un sondaggio elettorale fittizio. Il partito A viene dato al 51% e il partito B al 49%. Se l’asse delle Y parte da 45% invece che da 0%, il grafico a barre mostrerà una differenza visiva enorme tra i due. Questo potrebbe portare il lettore a pensare che il partito A sia nettamente in vantaggio, anche se la differenza reale è di soli 2 punti percentuali. Un’altra modalità per ingannare il prossimo è quella di fare “cherry picking”, che è uno dei modi in cui esprimiamo bias cognitivi quando vogliamo raccontare la realtà attraverso i dati. Letteralmente significa “scegliere le ciliegie migliori”. Chi lavora con i dati può decidere di escludere quelli che potrebbero contraddire la propria tesi, o di includere solo quelli che la rafforzano, ad esempio rappresentando solo quelli che succede da un certo anno in poi o solo in alcuni paesi, o fasce di popolazione.
Immaginando di parlare direttamente con chi si occupa di ricerca, quali potrebbero essere delle precauzioni concrete per arginare i casi di discriminazione?
Preciso che fare ricerca non è il mio mestiere, ma mi sento di dire che un modo potrebbe essere riconoscere e dichiarare i limiti della propria ricerca nell’includere determinate categorie di persone. Un altro aspetto da considerare è la provenienza dei dati analizzati, specialmente quando questi provengono da aziende private che effettuano un proprio filtraggio prima di fornire le informazioni. In generale, un aspetto fondamentale è porre attenzione a tutti quegli aspetti che possono rendere la scienza “bianca e coloniale”, ciò accade quando le ricerche vengono effettuate esclusivamente su determinate popolazioni, tipicamente quelle occidentali.
Da dove nasce l’interesse per questo argomento?
L’interesse è nato quando, attorno al 2012, il giornalismo dei dati comincia ad avere popolarità in Italia e si intravedono le potenzialità dei dati come strumento utile per indagare fenomeni complessi, come l’immigrazione. Essendo laureata in Scienze Politiche, all’epoca mi occupavo principalmente di tematiche legate ai diritti umani e mi sono resa conto della necessità di approfondire la rilevanza della narrazione giornalistica dei big data. Con il tempo, abbiamo collettivamente preso coscienza anche dei limiti del linguaggio dei dati, come nel caso della pandemia da SARS-CoV-2. Durante la pandemia, infatti, Regioni diverse presentavano dati diversi a causa di differenze di nomenclatura, nonostante si stesse cercando di descrivere un fenomeno scientifico. Questo ebbe importanti conseguenze sulla pianificazione della risposta sanitaria all’epidemia in corso.
Nel discorso sull’oggettività dei dati entra anche la questione di genere.
L’idea che il dato non sia uno strumento oggettivo ma soggettivo ha a che fare anche con le dinamiche di potere. Tra i testi che mi hanno aiutato a capirlo c’è “Data Feminism” (libro del 2020 di Catherine D’Ignazio e Lauren F. Klein che esplora l’intersezione tra i dati e il femminismo, nda). Ammetto che, prima, non consideravo che il femminismo potesse essere parte integrante delle mie battaglie sui diritti umani. Invece, osservare il punto di vista dei corpi, quindi comprendere che ciò viene costruito da una ricerca è strutturato anche in base al corpo della persona che la produce o che ne è soggetta, è un cambiamento enorme. Questa variazione di prospettiva rende visibile l’oppressione di genere che si cela a livello strutturale in un determinato contesto e dà la possibilità di abbattere quelle barriere. In altre parole, avere consapevolezza di queste dinamiche permette di capire come la percezione di un fenomeno che viene analizzato possa essere influenzata dell’inclusione o dell’esclusione di alcune categorie di persone (ad esempio, appunto, le donne) nel processo di osservazione e raccolta dati.