Referendati.org analizza e visualizza i dati sul Referendum Costituzionale 2016


Referendati.org è una incursione nel mondo dei dati della politica Italiana di un gruppo di ricercatori che si occupano dell’analisi e modellizzazione di sistemi tecno-sociali. Le analisi riportate vanno considerate come preliminari e vanno quindi lette non come analisi statistiche rigorose ma come un primo approccio nel cercare nuove informazioni e stimoli per un ragionamento politico informato dalla Scienza dei dati.


Affluenza e Risultati

In questa cartogramma, mostriamo dove sono stati espressi i voti del Referendum a livello dei singoli comuni. L’area di ciascun comune e’ distorta in modo proporzionale al numero di votanti mentre il colore identifica il risultato della consultazione referendaria. In rosso (dal rosso chiaro al rosso scuro in modo proporzionale al margine della vittoria) sono indicate le province in cui il “” ha raccolto piu’ del 50% dei voti, mentre in blu (dal blu chiaro al blu scuro) vengono identificate le regioni in cui ha prevalso il “No“.

Torna su

Il Voto

In questi due cartogrammi, e’ mostrato come sono distribuiti a livello dei singoli comuni il numero di voti raccolti (rispettivamente) dal fronte del sì e dal fronte del no. Anche in questo caso l’area di ciascun comune e’ distorta in modo proporzionale al numero di voti raccolti dallo schieramento. I comuni in cui  ha prevalso il “” sono colorati di rosso mentre quelle in cui il “No” ha ricevuto la maggioranza dei voti sono colorati di blu.

Torna su

In questo grafico riportiamo il livello di correlazione tra l’affluenza registrata ai seggi (calcolata a livello comunale) con la percentuale di voti ottenuti dal ““. In particolare, si osserva che i comuni in cui si e’ registrata una maggiore partecipazione popolare hanno anche visto crescere – in proporzione – il numero di voti a favore del ““.

Torna su

Il Fronte del Sì e del No secondo Twitter

Durante i tre mesi precedenti la competizione elettorale abbiamo analizzato piu’ di un milione di tweet. Attraverso tecniche di stratificazione e geolocalizzazione e’ stato possibile possibile selezionare un campione degli utenti (circa 5’000) come possibili elettori a favore o contro la riforma costituzionale. Da questo campione e’ stato possibile inferire (secondo la popolazione italiana attiva su Twitter) le intenzioni di voto a livello nazionale. Nella figura riportiamo non solo l’andamento temporale delle intenzioni di voto ma anche il margine di errore con cui tale andamento viene stimato. In totale, il campione raccolto seleziona piu’ di cinque mila utenti (unici). Pubblichiamo questi risultati a posteriori. Alla domanda del perche’ non siano stati pubblicati precedentemente rispondiamo con i seguenti motivi principali:

  • Le analisi sono state ottenuti nelle due settimane considerate di black out da sondaggi e rilevazioni.
  • Nonostante il risultato appaia altamente predittivo, ci sono molti dettagli ed analisi che devono essere ancora compiute prima che si possa definitivamente considerare questo approccio ripetibile ed attendibile. Da questo l’esitazione nel divulgare precedentemente i risultati ed invitare tutti ad avere molta cautela nell’usare dati di social networks nella predizione di eventi elettorali.
  • Confessiamo anche che la differenza rilevante con i sondaggi demoscopici disponibili fino alla data del voto ci faceva dubitare del risultato ottenuto.

Torna su


Questo cartogramma dell’Italia mostra dove sono gli elettori che ancora non hanno deciso il loro voto. Il cartogramma deforma le aree delle province in modo che le dimensioni siano proporzionali al numero di elettori indecisi. Questo identifica in maniera diretta le province che possono essere determinanti per l’esito del voto. La stima sugli indecisi e’ basata sull’analisi statistica aggregata dei sondaggi disponibili tra Ottobre e Novembre. In ogni provincia viene anche considerata la differenza media rispetto al valore di affluenza nazionale nelle ultime 11 competizioni referendarie. La scala di colori va dal blu scuro (affluenza inferiore al -10% in media rispetto al valore nazionale) al rosso scuro (affluenza superiore al +10% in media rispetto al valore nazionale). Clicca sulla mappa per leggere il numero stimato di indecisi in ogni provincia.

Torna su

L’atlante politico e’ ottenuto analizzando la distribuzione storica dei voti raccolti dai singoli partiti nelle diverse province italiane. I cartogrammi permettono di identificare la componente del corpo elettorale di ogni forza politica e individuare il peso relativo di ogni provincia. Ogni forza politica ha un numero diverso di votanti totali. I cartogrammi di ogni partito danno informazioni relative all’interno di ciascuna base elettorale indipendentemente dalla percentuale nazionale di ciascuna forza politica. Le forze politiche minori non sono rappresentate.

Torna su

Gli Schieramenti Online

Analizzando circa un milione di tweet durante un arco temporale di tre mesi e’ possibile costruire la rete di interazione di circa 117’456 utenti. Ogni collegamento tra i nodi rappresenta una menzione, mentre la dimensione di ogni nodo e’ proporzionale al numero di menzioni ricevute. Attraverso l’uso di alcune tecniche avanzate di analisi delle reti e’ possibile identificare le comunita’ che rappresentano gruppi omogenei e interconnessi di discussione. Nel grafo ognuna di queste comunita’ e’ individuata utilizzando un diverso colore. Ad esempio in verde scuro si identifica la comunita’ di alcuni dei maggiori media (quotidiani, trasmissione di informazione) che sono in una posizione intermedia tra gli schieramenti del “si'” e del “no”. Le altre comunita’ sono di facile individuazione e lettura.

Torna su

wordcloud-si-greynew

wordcloud-no-greynew

Utilizzando delle tecniche di elaborazione del linguaggio naturale (o “natural language processing”, NLP) e’ possibile classificare gli utenti in tre diverse categorie: utenti a favore del referendum, utenti contrari al referendum e utenti neutrali. In questo approccio, ogni utente viene trattato come un “documento” che deve essere classificato a seconda dell’argomento di cui tratta. Nel nostro caso, l’argomento (o topic) concerne la sua propensione di voto al referendum che si terra’ il 4 dicembre. L’unione dei testi di tutti i tweet creati da ciascun utente va invece a creare “il testo/le parole” del “documento” stesso. L’analisi e’ quindi calibrata usando 3 diversi topic (ossia il fronte del si’, il fronte del no e gli utenti neutrali). Sul totale dei 117’456 utenti, il 20% e’ chiaramente identificabile come un “attivista/tifoso” di uno dei due schieramenti. Le due “tag clouds” qui considerate sono state ottenute considerando solalmente gli hashtag del gruppo di utenti schierati a favore o contro il referendum. Il numero totale di hashtags identificati e’ 21.539 .

Torna su

Sondaggi

In questi due grafi riportiamo le stime ottenute dai sondaggi pubblicati fino alla settimana del 14-20 Novembre. In particolare, il grafico in alto riporta il valore “medio” della percentuale di “si'” senza considerare gli astenuti e gli indecisi tenendo pero’ conto dei diversi margini di errore riportarti dai vari sondaggisti. Il grafico in basso, invece, riporta il valore “medio” dell’affluenza nazionale, mentre in entrambi i grafici i pallini rappresentano i valori stimati dai singoli sondaggi.

Torna su