Report Research: Affair Bossi e l’Antipolitica · Web viewNelle Word Cloud relative alla presenza...

11
Report Research: Affair Bossi e l’Antipolitica Nuovi Media e Future Communication: Aversa Maria Germana – 778586 Carbone Davide – 740891 Ferrari Gaia – 778526 Università degli Studi

Transcript of Report Research: Affair Bossi e l’Antipolitica · Web viewNelle Word Cloud relative alla presenza...

Report Research: Affair Bossi e l’Antipolitica

Nuovi Media e Comunicazione

Future Communication: Aversa Maria Germana – 778586 Carbone Davide – 740891 Ferrari Gaia – 778526 Morini Simone – 778577 Rescalli Andrea – 777937

Università degli Studi di Milano

L’Oggetto della RicercaL’obiettivo della ricerca era di analizzare la blogosfera in relazione allo scandalo scaturito intorno al partito della Lega Nord e in generale nei confronti delle discussioni inerenti l’antipolitica.Per Affair Bossi intendiamo l’utilizzo e la gestione impropria dei fondi del partito, molti dei quali ricavati in seguito ai finanziamenti pubblici ottenuti per il rimborso delle varie campagne elettorali. Lo scandalo della Lega ha riguardato in particolare alcuni personaggi di spicco del partito, tra cui l’oramai ex leader Umberto Bossi, suo figlio Renzo “Trota” Bossi (consigliere regionale in Lombardia), il tesoriere Francesco Belsito e il Vicepresidente del Senato Rosy Mauro.La questione dell’antipolita riguarda il malessere e la sfiducia sempre maggiore che i cittadini nutrono nei confronti della politica, del sistema e dei suoi privilegi.In breve questo è l’oggetto delle nostre indagini che qui di seguito illustreremo nelle sue varie fasi operative.

Le Fasi della Ricerca1. Abbiamo cercato un elenco di blog (trenta url) che trattassero il nostro

argomento, individuando il loro ranking nella Rete attraverso dei siti che tengono traccia del traffico (Ebuzzing, Alexa e Liquida) e verificando la loro presenza sui due principali social network (Facebook e Twitter).

2. Abbiamo cercato un elenco di parole chiave riguardanti lo scandalo della Lega e l’antipolitica, che servivano per realizzare le Word Cloud (vedi punto 3).

3. Abbiamo creato delle Word Cloud significative per la nostra ricerca, tre utilizzando le parole chiave e altre tre utilizzando come input i Facebook likes, i tweets e il numero di followers.

4. Abbiamo costruito con Issue Crawler una mappa di indirizzi web ottenuti da almeno due link presenti nei trenta blog del nostro elenco;

5. Abbiamo reso più comprensibile la mappa della rete di siti web utilizzando gli strumenti messaci a disposizione dal programma Gephi.

6. Conclusioni finali.

Procedimento1. Url e Ranking

Per trovare i blog da utilizzare nella nostra ricerca ci siamo innanzitutto informati sull’argomento “navigando” nel web, leggendo vari articoli e post che riportavano i fatti accaduti e una loro breve interpretazione. Abbiamo dato la precedenza ai blog che riportavano una classificazione alta nell’argomento politica e all’affair Bossi in particolare; come si può notare i primi quindici/venti blog dell’elenco sono ben visibili all’interno della blogosfera politica, come ad esempio beppegrillo.it, violapost.it, ciwati.it, gadlerner.it, ecc., mentre altri sono blog che trattano vari argomenti in generale, tra i quali anche la politica, come ad esempio attualissimo.it. Gli ultimi dieci url dell’elenco li abbiamo cercati manualmente attraverso i motori di ricerca utilizzando le parole chiave come input (es. fanpage.it). Infine alcuni blog (es. intoccabili.wordpress.com e normatarozzi.com) sono degli outliers, ovvero non sono classificati in nessun ranking ma risultano molto importanti per l’argomento di indagine. Assieme all’elenco dei blog abbiamo riportato in una tabella il ranking dei siti utilizzando le classifiche forniteci da Ebuzzing e Alexa; avremmo dovuto trovare anche il ranking di Liquida però sul sito relativo abbiamo incontrato delle difficoltà senza trovare una classifica che si riferisse direttamente ai nostri blog.A questo punto abbiamo cercato manualmente se i nostri blog, o eventualmente i relativi blogger, fossero presenti sui due social network principali: Facebook e Twitter; esaminando al loro interno il numero di likes (Facebook) e il numero di tweets e di followers (Twitter). Abbiamo notato, confrontando i dati relativi ai due social network, che i “mi piace” di Facebook alle pagine ufficiali sono nettamente in numero maggiore dei followers di Twitter, questo anche perché quest’ultimo in Italia come ben sappiamo ha un utilizzo minore rispetto al predominante Facebook; di contro però Twitter permette maggiore interazione e feedback, come si può notare dal numero di tweets.Nel corso della nostra ricerca ci siamo imbattuti in alcuni blog che, anche se avevano un ranking alto, non sono gestiti unicamente da un blogger che scrivere le proprie idee ma vengono gestiti da una redazione di esperti privati che non fanno altro che raccogliere le notizie pubblicate da altri (es. cadoinpiedi.it)

2. Parole chiave

Questa fase si è risolta nella individuazione dei termini più inerenti legati all’oggetto; essa è stata semplice perché, essendoci precedentemente informati sulla vicenda, avevamo un bagaglio di conoscenze abbastanza ampio da poter costruire questo elenco di parole chiave.

Abbiamo dovuto formare delle parole chiave complesse, ovvero formate da più parole unite tra loro (es. Bossi + laurea), perché altrimenti quando esse ci sarebbero servite per formare le Word Cloud, il programma avrebbe cercato articoli e post troppo generici (es. cercando solo Bossi non avevamo risultati solo riferiti allo scandalo, ma anche alle varie notizie riferite alla Lega Nord, comizi e riunioni).Per la realizzazione delle tre Word Cloud abbiamo utilizzato le seguenti parole chiave:

Francesco + Belsito + scandalo; Lega + Nord + scandalo; Bossi + laurea.

3. Google Blog Search Scraper e Word Cloud

Lo Scraper ci ha permesso di avere un riscontro concreto di quante volte le tre parole chiave, di qui sopra, sono presenti nei 30 url.Nelle impostazioni dello Scraper, abbiamo deciso di cercare solamente le pagine in italiano e comprese nel range temporale, che va dall’1 Marzo 2012 al momento dell’avvio della nostra ricerca (18 Maggio 2012).Lo Scraper ci ha restituito, alla fine della sua elaborazione, una visualizzazione che noi abbiamo reso maggiormente comprensibile, anche esteticamente, utilizzando il tool Wordle.Grazie a Wordle abbiamo potuto dare ai blog all’interno delle Word Cloud una dimensione che fosse direttamente proporzionale ai risultati dello Scraper, cioè le scritte più grandi corrispondono ai siti web che contengono più volte la parola chiave (es. giornalettismo.com); i diversi colori invece li abbiamo stabiliti utilizzando una combinazione presente nelle impostazioni del programma in modo da permettere una visuale chiara:

Nelle Word Cloud relative alla presenza dei blog sui social network abbiamo voluto escludere quelli che falsavano una rappresentazione leggibile, in quanto presentavano un numero di followers o di tweets troppo sproporzionato nei confronti dei restanti, beppegrillo.it su tutti.

4. Issue Crawler

Dopo esserci registrati abbiamo lanciato una nuova sessione di crawling, inserendo nell’apposita finestra i trenta url e selezionando tra le tre logiche di crawling disponibili quella denominata co-link, che permette di creare una rete i cui nodi sono stati reindirizzati da almeno due dei nostri blog.

co-link:

Nei setting (cliccando su “Harvest”) abbiamo scelto di fare un sola iterazione (opzione di default), ovvero con il Crawler che si ferma dopo la prima elaborazione sviluppata, e come profondità del crawling abbiamo optato invece per il livello due, cioè una dimensione media che non si fermi solamente alle homepage (superficie) ma che controlli anche le singole pagine. Infine nella finestra dedicata abbiamo inserito i siti web che avevamo intenzione di escludere dal risultato finale, oltre a quelli presenti di default (google.com, yahoo.com, ecc.) abbiamo aggiunto facebook.com e twitter.com perché altrimenti questi due avrebbero avuto il dominio della rete con il maggior numero di collegamenti.L’attesa per avere la prima bozza di rete è durata circa una giornata; dopo di che abbiamo selezionato come modalità di visualizzazione quella a cluster, la quale permette di costruire una rete in modo gerarchico, ovvero avendo a monte dei nodi principali dai quali si diramano nodi secondari. Cosi facendo abbiamo deciso di escludere le due modalità non utili ai nostri fini: circle, che permette di creare una rete i cui nodi cruciali sono al centro, e geo, che invece tiene traccia del luogo fisico dove si trovano i server relativi a siti web reindirizzati.

A questo punto abbiamo ottenuto la seguente rete, visualizzabili dalla sezione “Network Manager”:

Il differente colore dei nodi, visibile nel grafo qui sopra, dipende dal tipo di dominio (es. .com è visualizzato in azzurro e .it in verde). Questo risultato lo abbiamo esportato nel formato .gexf leggibile col programma Gephi.

5. Gephi

Dopo aver importato i dati da Issue Crawler, abbiamo calcolato prima di tutto nella finestra “Statistics” il grado medio pesato di ogni singolo nodo (visualizzabile anche nella scheda “Data Laboratory” dove c’è l’elenco degli url con i loro attributi).Poi abbiamo associato ai nodi, nella finestra “Ranking”, l’attributo appena calcolato, cosi da permetterci di modificare il colore, la dimensione e le etichette in relazione ad esso. A questo punto abbiamo scelto come layout della rete Open Ord, che permette di mettere in evidenza la struttura a cluster della rete; successivamente abbiamo

scelto anche il layout Label Adjust, che permette di avere le etichette dei vari nodi non sovrapposte e quindi ben leggibili.Infine siamo passati dalla fase di overview a quella di preview, in cui è visualizzabile la rappresentazione finale completa della nostra rete; anche qui è possibile modificare delle impostazioni: noi abbiamo deciso di deselezionare il “Rescale Weight”, in quanto il peso dei nostri nodi è linearmente distribuito, e il “Proportional Size”, perché avevamo già in fase di overview settato nella finestra “Ranking” i nodi in associazione col loro grado medio pesato. Per ultimo abbiamo scelto di visualizzare gli archi che collegano tra loro due nodi in forma dritta e non curva, in quanto la rete risultava esteticamente migliore.

Nel file allegato (Preview.png) si può vedere il risultato finale dopo l’elaborazione grafica in Gephi, non l’abbiamo inserito qui perché di dimensioni troppo grandi e per non sgranare l’immagine che permette un buono zoom.

Conclusioni e InterpretazioniIn conclusione, dopo aver analizzato la blogosfera politica, abbiamo riscontrato che l’argomento Affair Bossi e l’Antipolitica in quel lasso di tempo è stato molto discusso, sia su giornali, sia sui blog e anche nei commenti degli utenti; inoltre abbiamo potuto notare la presenza di due filoni di discussione, che la ricerca ha confermato, ovvero una parte dei blog si occupa di riportare gli accadimenti del puro scandalo, mentre un’altra tratta in maniera più generale la questione della disaffezione alla politica.L’interpretazione principale che ci sentiamo di dare ai nostri risultati, in sostanza la rete finale di Gephi, tocca due punti:

possiamo individuare dei nodi cruciali all’interno della rete intorno ai quali si concentra la maggior parte del traffico, per esempio si notano facilmente, sia per le dimensioni dell’etichette che per la grandezza stessa del nodo, il blog wittgenstein.it, gilioli.blogautore.espresso.repubblica.it e ciwati.it;

possiamo differenziare i nodi in due categorie: una rappresentata dai nodi in azzurro chiaro (cioè quelli più visibili) che ricevono il maggior numero di link da altri blog e che quindi possiamo chiamare input, mentre l’altra, rappresentata dai nodi in blu, indica dei blog che linkano frequentemente e fungono da output.

Riportiamo qui di seguito due esempi di queste categorie:

1. Input

2. Output