Skip to content

L’imprevedibilità di Donald Trump

Quando nel giugno del 2015 Donald Trump ha annunciato la sua candidatura alla presidenza degli Stati Uniti nessun commentatore politico, in patria e all’estero, gli ha dato credito come possibile nuovo volto del Partito Repubblicano. L’opinione più diffusa era che le sue posizioni atipiche non avrebbero raccolto il favore dei tradizionali elettori repubblicani e che quindi non avrebbe ottenuto il numero necessario di delegati per vincere le primarie. Alcuni commentatori non hanno nemmeno preso sul serio la sua candidatura, vedendo nella mossa l’ennesima trovata pubblicitaria per rilanciare la nuova stagione del suo reality show, Celebrity Apprentice. Anche dopo i primi sondaggi estremamente favorevoli, i commentatori hanno continuato a essere scettici sulle sue possibilità, pensando che l’attenzione e il consenso fossero dovuti all’effetto novità e sarebbero quindi svaniti in fretta.

In particolare Nate Silver, uno statistico esperto in previsioni politiche, molto famoso negli Stati Uniti per essere riuscito, tra le altre cose, a prevedere con incredibile precisione e dettaglio i risultati delle ultime due elezioni politiche statunitensi,  aveva inizialmente bollato Donald Trump come “troll” , e affermato che il suo iniziale consenso era destinato a scemare.

Il clamoroso errore di previsione di Silver ha causato grande stupore tra i giornalisti politici statunitensi, e in generale in molti hanno approfittato di questo errore per mettere in dubbio l’intera scienza previsionale statistica.

Silver, dimostrando grande onestà e spirito critico, non solo ha ammesso il suo errore, ha fatto di più: ha scritto un interessantissimo articolo in cui analizza nel dettaglio i motivi del suo errore dal punto di vista scientifico, articolando i motivi in cinque punti:

1) Le prime previsioni espresse non erano basate su un modello statistico

I modelli statistici funzionano bene quando si hanno a disposizione molti dati pregressi su cui basare un algoritmo di previsione. Ma le elezioni primarie repubblicane sono un caso estremamente complesso: i primi dati disponibili sono molto recenti, risalgono al 1972, quindi considerando che le primarie si tengono ogni quattro anni, ci sono solo undici pool di dati a disposizione. In aggiunta per i primi anni i dati sono difficili da reperire e le regole di candidatura e votazione cambiano a ogni nuova votazione. I candidati che si presentano alle primarie sono in numero variabile di anno in anno e mai in numero di due (le scelte binarie sono ovviamente più semplici da analizzare). Per finire c’è il problema dell’influenza contingente: siccome le elezioni si svolgono in successione in vari stati, il risultato di ogni elezione precedente influenza quelle successive. E per questo motivo un evento estemporaneo imprevedibile che dà vantaggio a un candidato in una votazione potrebbe aumentare il consenso per quel candidato anche nelle votazioni successive.

Per questi motivi Silver ha preferito non elaborare un modello, che sarebbe stato per forza di cose molto impreciso. Il suo staff, però, ha fatto l’errore di esprimere comunque delle previsioni basate sui semplici dati a disposizione da sondaggi, comportandosi come quei commentatori politici che Silver aveva tanto criticato in passato per le opinioni espresse senza basarsi su solidi dati scientifici. Silver si è dichiarato pentito di questa scelta, affermando che un modello studiato sui dati pregressi, anche se impreciso e poco calibrato, avrebbe comunque potuto dare previsioni più precise di quelle “di pancia” espresse senza modello.

2) La nomination di Trump è un singolo evento ed è difficile giudicare l’accuratezza di una previsione senza altri eventi simili a cui paragonarlo

In altre parole, anche se Silver avesse sviluppato un modello per prevedere l’esito delle primarie, non sarebbe stato possibile aggiustarlo tramite calibrazione, perché non ci sarebbero stati altri risultati a cui paragonarlo.

3) Le evidenze storiche suggerivano che Trump fosse sfavorito, ma non con le probabilità bassissime espresse inizialmente da Silver

Silver ammette di aver sottostimato Trump e di averlo paragonato in maniera statisticamente non corretta ad altri candidati alle primarie simili a lui.

Esaminando le precedenti elezioni Silver è riuscito a trovare sei casi netti (più due borderline) in cui il candidato rispondeva alle seguenti caratteristiche, che sono le stesse di Trump: essere al primo posto nei sondaggi elettorali precoci e contemporaneamente non avere l’appoggio dei capi di partito. In tutti e sei casi (o otto, considerando anche i due borderline) il consenso per i candidati è scemato dopo le primarie in Iowa e alla fine non sono riusciti a ottenere la candidatura. Per questo motivo Silver ha ritenuto che Trump non ce l’avrebbe fatta. Silver ammette comunque di aver fatto un grave errore di sottostima, attribuendo a Trump una probabilità di vittoria del 2%. Questa probabilità non era supportata dai dati a disposizione.

Infatti, applicando dei semplici modelli statistici bayesiani a questi precedenti è possibile calcolare le probabilità che aveva Trump di riuscire a vincere, secondo la regola delle distribuzioni a priori non informative, applicando questa semplice formula:

(x+1)/(n+2)

in cui x è il numero di volte che un evento è successo e n il numero di osservazioni.

In questo caso l’evento (la vittoria del candidato simile a Trump alle primarie) era successo 0 volte in 6 osservazioni, oppure 0 volte in 8 osservazioni se consideriamo anche i due casi borderline. La probabilità che Trump vincesse le primarie applicando questo semplice modello era quindi del 12,5% nel primo caso [(0+1)/(6+2)] e 10% nel secondo [(0+1)/(8+2)], in entrambi i casi decisamente più alta della probabilità espressa da Silver.

4) I modelli previsionali tipicamente usati nella previsione politica, quelli misti, nel singolo caso di Trump hanno performato peggio dei modelli più semplici basati sui soli sondaggi.

Considerando questo fatto Silver propone addirittura una rivalutazione del metodo “antico” del sondaggio, affermando che negli ultimi vent’anni si è evoluto e ha dimostrato di sapere prevedere con buona precisione molte elezioni politiche di diversa natura, mentre per i modelli più complessi, che sono cambiati poco da quando sono comparsi, la loro precisione si dimostra di anno in anno sempre più traballante.

5) L’autore si è fatto sviare dai pregiudizi personali

Non è la prima volta che Silver sbaglia una previsione. Del resto la statistica previsionale non è una scienza esatta, e la validità di un modello non è sminuita da un singolo errore, se in tutti gli altri casi il modello funziona, perché c’è sempre un certo grado di tolleranza.

Nel 2011 Silver diede una stima positiva delle possibilità di Herman Cain nella corsa alle primarie repubblicane. Cain era un uomo d’affari che aveva raccolto molti consensi nei primi sondaggi tra gli elettori repubblicani, insomma un candidato per certi versi simile a Donald Trump. Il suo consenso nei sondaggi era stato sminuito dalla maggior parte dei commentatori politici, che prevedevano uno sgonfiamento della bolla di entusiasmo iniziale (esattamente come hanno fatto per Trump). Silver si schierò dalla parte opposta, e scrisse un articolo in cui ammoniva a non sottovalutare il candidato, perché un caso come il suo non si era mai visto nelle primarie repubblicane, quindi non era possibile fare previsioni certe sulla sua débâcle.

Pochi giorni dopo aver espresso questo parere Cain fu coinvolto in uno scandalo sessuale che lo costrinse a ritirare la sua candidatura. Si trattava di un evento imprevedibile e non modellabile, ma Silver ammette di essere rimasto scottato da questa “figuraccia” e come conseguenza si è comportato in modo opposto nel caso di Trump, sottovalutando le sue possibilità di vittoria.

Silver conclude l’articolo riflettendo sulla futura utilità statistica del caso Trump: sarà utile inserire dati da queste primarie per prevedere future primarie del Partito Repubblicano? O Trump, con la sua fama, le sue idee estremiste e i suoi modi di fare bizzarri, è un caso talmente eccezionale da non poter essere paragonato a nessun altro? Silver dimostra di aver appreso la lezione e non dà una risposta certa alla domanda. La frase con cui conclude l’articolo è una massima che dovrebbe guidare qualsiasi ricercatore statistico (e non solo):

«…è utile avere un caso come quello di Trump nella nostra memoria collettiva. È un promemoria del fatto che viviamo in un mondo incerto e che occorrono rigore e umiltà per cercare di dargli un senso.»