Capire i test di screening usando le capre e i cavoli

Antonio Crisafulli è medico, professore associato di Fisiologia umana

La pandemia in corso ha portato con sé la necessità di eseguire test medici diagnostici su un vasto numero di persone. Tutti ormai hanno sentito parlare di test sierologici, tamponi, PCR, dosaggi anticorpali e altre astrusità tecniche di questo tipo per la ricerca del virus SARS-CoV-2. In questo articolo non entreremo nei dettagli tecnici di questi test, né di quando e perché eseguirli. Ci sono sul Web, ma soprattutto nelle riviste mediche specializzate, ottime rassegne che affrontano il problema [1,2,3], che non è così semplice come potrebbe apparire a prima vista. Analizzeremo invece il problema dei test di screening in generale, cercando di capire quali sono i limiti del loro utilizzo. Su questa base, vedremo più nello specifico quali possono essere le insidie nascoste dietro l’interpretazione dei test di screening per la ricerca del SARS-CoV-2. Nel farlo, ci avvarremo dell’inaspettato aiuto di un ortaggio, il cavolo, e delle capre, quei simpatici e utilissimi mammiferi che vengono, a torto, additati come esempio di ignoranza.

I cavoli…

Iniziamo a parlare di cavoli. Supponiamo di essere degli agricoltori che coltivano un grande terreno con molti tipi di cavoli: cavolfiore, cappuccio rosso, cappuccio verde, broccolo, cavolini di Bruxelles e così via. Ma siamo anche un po’ disordinati e abbiamo seminato i cavoli alla rinfusa. Un grossista vuole comprare la nostra produzione, ma non vuole assolutamente che ci siano cavolfiori perché una recente infestazione parassitaria che colpisce solo loro li ha resi immangiabili. Bisognerà quindi raccogliere tutti i cavoli e poi separare i cavolfiori dal resto dei cavoli. Per farlo abbiamo a disposizione una macchina che riconosce i cavolfiori sulla base del loro colore e forma. Tuttavia, la macchina non è precisa al 100% e ogni tanto non riconosce il cavolfiore e lo mette insieme agli altri cavoli; oppure riconosce come cavolfiore anche qualche altro tipo di cavolo. Diciamo che la macchina sbaglia cinque volte ogni cento quando deve riconoscere e separare il cavolfiore dagli altri cavoli, e tre volte ogni cento quando deve identificare gli altri cavoli e separarli dai cavolfiori.

Facciamo due esempi pratici di errori di raccolta. Il primo esempio ci è utile per capire la sensibilità di un test in ambito medico, ovvero la capacità di un test di screening di individuare correttamente, in una popolazione generale, i soggetti malati, che in questo caso sono rappresentati dai cavolfiori. Nel nostro caso supponiamo di aver raccolto 1.000 cavoli in totale e che 100 di essi siano cavolfiori (cioè il 10% dei 1.000 totali). La macchina non identificherà tutti e 100 i cavolfiori, ma solo 95; per cui 5 cavolfiori andranno a finire in vendita. La sensibilità della nostra macchina separatrice sarà del 95%.

Il calcolo per arrivarci è abbastanza banale: Sens = Ver+/Tot,

laddove Sens indica la sensibilità, Ver+ indica la quantità di cavolfiori riconosciuti (in termini tecnici significa “veri positivi”, in questo caso 95) e Tot la quantità totale di cavolfiori del nostro raccolto, che saranno 95 più i 5 che sono sfuggiti al test. Se adesso sostituiamo ai cavolfiori una qualsiasi malattia, ecco che il test si potrà applicare in campo medico-diagnostico. In pratica, la sensibilità indica la percentuale di soggetti malati che hanno una risposta positiva al test. Nel nostro esempio la sensibilità del test è stata quindi del 95%, che in ambito medio-diagnostico è un buon risultato.

Il secondo esempio è invece utile per comprendere la specificità di un test, ovvero la capacità di un test di screening di escludere una malattia quando essa non è presente. Nel nostro esempio, l’agricoltore deve avere a disposizione una macchina che identifichi il più correttamente possibile i cavoli che non sono cavolfiori. Dei 1.000 cavoli totali raccolti, 900 non sono cavolfiori (cioè il 90% dei 1.000 totali). Di questi 900 la macchina ne riconosce 873, mentre 27 (il 3%) vengono identificati come cavolfiori. La specificità del test sarà del 97% ed anche in questo caso il calcolo è abbastanza banale: Spec = Ver-/Tot,

laddove Spec indica la specificità, Ver- indica la quantità di cavoli-non cavolfiori riconosciuti (in termini tecnici significa “veri negativi”, in questo caso 873) e Tot la quantità reale di cavoli non-cavolfiori realmente presenti nel raccolto, cioè 900. Sostituendo adesso ai cavoli le persone sane, ecco che il metodo si potrà applicare anche per la diagnostica medica. In pratica, la specificità di un test esprime la percentuale di soggetti sani che hanno una risposta negativa al test. Nel nostro esempio, la specificità del test è del 97%, che, similmente a quanto visto prima per la sensibilità, è un buon risultato.

…e le capre

Ma adesso parliamo di un problema un po’ più ostico e meno intuitivo, e per farlo usiamo le capre. Si tratta del “Paradosso di Monty Hall”, di cui potete trovare una trattazione dettagliata anche su Wikipedia [4].

Questo paradosso prende il nome dal conduttore di un gioco a premi televisivo statunitense ed in sintesi è così composto:

1)            Vengono mostrate al concorrente del gioco tre porte chiuse. Dietro una di esse si trova un’automobile; le altre due invece nascondono una capra ciascuno. Se il concorrente indovina dove si cela l’automobile la vince, in caso contrario vince una capra.

2)            Il giocatore sceglie una delle tre porte.

3)            Prima di aprire la porta scelta, il conduttore – che sa cosa si nasconde dietro ciascuna porta – apre una delle due porte che il giocatore non ha scelto. La porta che apre nasconde sempre una capra.

4)            Per cui il giocatore sa che le due porte rimanenti (tra cui c’è quella che ha scelto lui) nascondono un’automobile ed una capra.

5)            A questo punto il conduttore chiede al giocatore se vuole cambiare porta.

Voi cosa fareste: cambiereste porta o no?

Per essere più chiari: secondo voi, se cambiamo la porta che abbiamo precedentemente scelto, le chances di vincere un’automobile aumentano o rimangono le stesse?

Intuitivamente verrebbe da pensare che la probabilità di vittoria sia ½, ma non è così. Vi potrà sembrare strano, ma se si cambia porta le chances di vincere cambiano drasticamente e passano da 1/2 a 2/3. In pratica, se si cambia porta si vince due volte su tre invece che una su due.

Il risultato è abbastanza controintuitivo, tanto che alcuni accademici non accettarono la soluzione, che fu proposta dalla signora Marilyn vos Savant. Questa signora è saggista e editorialista sulla rivista Parade ed è, secondo il Guinness dei primati, una delle persone più intelligenti di sempre sulla base del suo Q.I. (228!).

Ma perché le possibilità di vincere aumentano in modo così drastico se si cambia porta?

Una trattazione matematica estesa esula dalle finalità divulgative di questo articolo, ma può essere adeguatamente spiegata con il teorema di Bayes, che tratta del calcolo delle probabilità. Per i più curiosi si consiglia di consultare la trattazione che si trova su Wikipedia [4]. È qui sufficiente sapere che il teorema di Bayes prevede la possibilità che si verifichi un evento sfruttando la probabilità a priori che quell’evento si verifichi. A sua volta, la probabilità a priori dipende dalle informazioni che noi abbiamo su quel determinato evento. In pratica, il teorema di Bayes postula che più informazioni si hanno su un evento, e più si saprà con precisione qual è la probabilità che quel determinato evento accada. Nel paradosso di Monty Hall, l’apertura da parte del conduttore di una delle porte con una capra dietro aggiunge un’informazione in più al gioco (il giocatore, dopo che il presentatore apre una delle tre porte, sa dove si trova una delle due capre) e sposta a favore del giocatore l’esito del gioco. L’esclusione da parte del conduttore di una scelta certamente sbagliata rende la porta rimanente più “interessante” della porta scelta quando non si aveva nessuna informazione.

Ma cosa c’entra il paradosso di Monty Hall e le sue capre con gli esami diagnostici in medicina?

In realtà c’entra eccome; infatti, questo fenomeno è alla base del concetto di probabilità a priori ampiamente sfruttato per calcolare la capacità predittiva dei test medici usando il teorema di Bayes. È noto come il valore predittivo dei test dipende non soltanto dalla loro sensibilità e specificità, di cui abbiamo già parlato usando come esempio i cavoli, ma dipende anche in maniera considerevole dalla probabilità a priori della presenza di una malattia sospetta; a sua volta la probabilità a priori dipende dalle informazioni di cui noi siamo in possesso. A questo riguardo, l’informazione più importante è quella che viene definita “prevalenza” di una malattia in una popolazione, che è rappresentata dal numero di persone malate rispetto al totale degli individui della popolazione stessa. In pratica, conoscere la prevalenza equivale grossolanamente all’apertura di una delle porte del paradosso di Monty Hall.

Per andare sul pratico, il valore predittivo di un risultato negativo di un test di screening con sensibilità e specificità alte (come il 95% e 97% dell’esempio dei cavoli) è eccellente quando la prevalenza della malattia è bassa; viceversa, un risultato positivo ha affidabilità più modesta e deve essere integrato da altre indagini che confermino la reale presenza della malattia. Di contro, quando la prevalenza di una patologia è molto alta, il valore predittivo di un test che ha fornito un risultato negativo è assai poco affidabile, mentre lo è molto di più un risultato positivo.

Per cui abbiamo capito che: 1) i test sono affidabili se hanno una elevata sensibilità e specificità, e 2) più informazioni si hanno sulla frequenza con cui dobbiamo aspettarci una patologia, meglio siamo in grado di interpretare i risultati di un test. In termini più semplici, la possibilità di trovare una patologia dipende dalla probabilità a priori che quella patologia sia effettivamente presente in una persona.

Il lettore più attento a questo punto avrà probabilmente capito che quanto sopra esposto è perfettamente applicabile ai test diagnostici per il SARS-CoV-2. La negatività o la positività di un test (il famoso “tampone”) dipenderà da diversi fattori, tra cui la sensibilità e la specificità dei test, che a sua volta sono funzione della qualità del prodotto e anche dell’abilità tecnica di chi esegue il test; ma l’interpretazione dell’esito dipenderà anche della probabilità a priori che il SARS-CoV-2 sia presente in quel paziente, che a sua volta sarà funzione di quanto il virus è presente in un determinato momento nella popolazione studiata, cioè, dalla sua prevalenza.

Per intenderci, un risultato negativo di un tampone è abbastanza affidabile se siamo in un luogo dove il virus circola poco e se non siamo entrati in contatto con nessun malato confermato; viceversa, dovrà essere guardato con sospetto se siamo in presenza di una circolazione virale sostenuta (come quella di questi giorni) o se siamo stati in contatto prolungato con persone che si sono ammalate, oppure se abbiamo sviluppato i sintomi della malattia. Discorso inverso si applica nell’ipotesi di un tampone positivo.

L’argomento è talmente importante che se ne è occupata anche la prestigiosa rivista Nature in una pubblicazione apparsa lo scorso anno [5]. Prendiamo ad esempio i calcoli eseguiti in questa pubblicazione e supponiamo di disporre di tamponi a buona sensibilità e specificità (il 95% per entrambe) e di sottoporre ad esame due popolazioni di ugual numerosità (400 persone). L’unica differenza tra le due popolazioni è che una ha una bassa prevalenza del virus (il 5%), mentre l’altra ha una prevalenza decisamente maggiore (il 25%).

Supponiamo di trovare nella popolazione a bassa prevalenza un test negativo. Quale è la probabilità che sia un falso negativo? I calcoli dicono: lo 0.3%. Per cui la possibilità di un falso negativo in questo caso è bassa.

Supponiamo invece che il test sia positivo. Quale è la probabilità che sia un falso positivo? I calcoli dicono questo: il 50%. Si tratta più o meno del lancio di una moneta, per cui la possibilità di un falso positivo in una popolazione a bassa prevalenza è alto anche usando tamponi ad elevata sensibilità.

Le cose cambiano radicalmente se faccio il test nella popolazione ad alta prevalenza (quella con il 25%). In questo caso, la probabilità di un falso negativo è dell’1.7%, sempre abbastanza bassa.

Ma adesso vediamo cosa dicono i calcoli se il test è positivo: in questo caso la probabilità che il test sia un vero positivo è abbastanza elevata, l’86%. Da quanto esposto si capisce come vale la pena testare soprattutto in caso di alta prevalenza del virus.

Tuttavia, c’è da considerare che le cose diventano molto più incerte se si usano tamponi a sensibilità più bassa, per esempio del 70%. In questo caso l’interpretazione dell’esito del test può essere molto problematica, soprattutto nel caso di esiti negativi in una popolazione ad alta prevalenza virale: alcuni studi dimostrano che la sensibilità dei tamponi in soggetti asintomatici è abbastanza bassa. Per esempio, in uno studio portato avanti a Liverpool su un ampio campione di individui asintomatici (5869), la sensibilità dei tamponi antigenici rapidi è stata in media del 67%, un valore troppo basso per poter essere considerato affidabile. Inoltre, è stato visto che la sensibilità varia in maniera sostanziale quando i test sono eseguiti in laboratorio (79%) rispetto a quando sono eseguiti “sul campo” o anche autosomministrati a casa (58%) [6].

Per chi volesse divertirsi con questi calcoli, il British Journal of Medicine ha reso disponibile online un ottimo calcolatore automatico che rende immediatamente disponibili i calcoli di probabilità partendo dai dati di sensibilità, specificità e probabilità a priori [7].

Riassumendo, nell’interpretazione dei test medici in generale e dei tamponi per il SARS-CoV-2 in particolare, ogniqualvolta si usino test di screening, sia il paziente che il medico dovrebbero considerare i seguenti elementi:

  • Le capacità del test di discernere correttamente i malati dai non malati (sensibilità e specificità del test).
  • La probabilità a priori che il test sia positivo; questo aspetto è spesso trascurato, seppure di vitale importanza.
  • La storia epidemiologica del paziente, cioè avere informazioni sui contatti, su eventuali viaggi, sul lavoro che svolge e sulla presenza di sintomi e sul quant’altro sia utile a determinare la probabilità a priori.
  • Conoscere dove e da chi il test è stato eseguito per avere informazioni riguardo la bontà della tecnica utilizzata.

Da quanto abbiamo esposto dovrebbe risultare chiaro quanto anche un semplice esame come un tampone possa essere fonte di errori grossolani nella diagnostica medica. Si tratta dunque di un problema complesso che dovrebbe essere gestito da tecnici esperti del settore.

Immagine in evidenza: photo credit: dronepicr/Flickr, CC BY-SA 2.0

Note

[1] Sethuraman N, Jeremiah SS, Ryo A. Interpreting Diagnostic Tests for SARS-CoV-2. JAMA. 2020;323(22):2249–2251. doi:10.1001/jama.2020.8259

[2] Vogl T, Leviatan S, Segal1 E. SARS-CoV-2 antibody testing for estimating COVID-19 prevalence in the population. Cell Rep Med. 2021 Feb 16; 2(2): 100191.

[3] Peeling RW, Heymann DL, Teo YY, Garcia PJ. Diagnostics for COVID-19: moving from pandemic response to control. Lancet. 2021 Dec 20: S0140-6736(21)02346-1.

[4] https://it.wikipedia.org/wiki/Problema_di_Monty_Hall

[5] https://www.nature.com/articles/s41576-021-00360-w

[6] Mytton OT, et al. Interpreting a lateral flow SARS-CoV-2 antigen test. BMJ. 2021. PMID: 34158286

[7] https://www.bmj.com/content/373/bmj.n1411/infographic

One thought on “Capire i test di screening usando le capre e i cavoli

  • 17 Gennaio 2022 in 22:34
    Permalink

    Egr. Prof. Crisafulli, La ringrazio per l’ esposizione, che per la didattica oserei definire geniale. Ma il problema pratico col quale ci confrontiamo un po’ tutti in questa pandemia è che il Virus responsabile e le sue “varie varianti” si diffondono ad una velocità talmente elevata che i falsi negativi sono sempre trascurabili, e pure quelli positivi, anche se per ragioni diverse, che Lei ha ben esposto. La platea di contagiati è semplicemente troppo ampia perché si possa sperare di tracciarla e contenere il diffondersi del contagio.

    Rispondi

Rispondi a Aldo Grano Annulla risposta

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *