Data journalism

62

Transcript of Data journalism

Page 1: Data journalism
Page 2: Data journalism

Il presente materiale è pubblicato con licenza Creative Commons

‘’ Attribuzione – Non commerciale – Condividi allo stesso modo – 3.0 ‘’

(https://creativecommons.org/licenses/by-sa/4.0/)

La licenza non si estende alle immagini provenienti da altre fonti e agli screenshot, i cui diritti restano in capo ai rispettivi proprietari, che, ove possibile, sono stati indicati. L’autore si scusa per eventuali omissioni, e

resta a disposizione per correggerle.

Page 3: Data journalism

CONTENUTI

1. DATA JOURNALISM

- Definizione

- Confronto con giornalismo tradizionale

- I ruoli del data team

- Breve storia

- Raccolta dati: strumenti e fonti

2. INFOGRAFICHE

- Definizione

- Componenti principali

- Ambiti di utilizzo

- Storia

- Tecniche e software

- Edward Tufte

3. DATA JOURNALISM IN ITALIA

- Dati.gov.it

- <ahref

- DataBlog

- Wired.it e la mappa Dove ti curi

- InfoData del Sole24Ore

- Dataninja.it

- Un caso esemplare: MigrantsFiles

Page 4: Data journalism

Il data journalism rappresenta l’arte di scovare delle storie da un particolare tipo di fonte, i dati, l’abilità di interpretare il tutto e di raccontarlo sotto forma di inchieste realizzate con gli strumenti della matematica, della statistica e delle scienze sociali e comportamentali, applicate alla pratica del giornalismo.

PROGRAMMAZIONE

INFORMATICA

STATISTICA

FIUTO PER LA NOTIZIA

DEFINIZIONE

Page 5: Data journalism

GIORNALISMO TRADIZIONALE

MEZZI: giornali, radio, tv.

• I media sono le prime e uniche fonti di notizie.

• La televisione mostra notizie relativamente in diretta.

PRODOTTO FINALE: articoli, video.

RUOLO CHIAVE: giornalista.

DATA JOURNALISM

MEZZI: statistica, informatica, grafica.

• Raccogliere, filtrare e visualizzare quello che succede dietro ciò che si vede. I dati diventano significativi quando visti nella giusta prospettiva.

PRODOTTO FINALE: database aggiornabili. Infografiche che spiegano in modo chiaro e intuitivo.

RUOLO CHIAVE: data team.

ERA DIGITALE

MEZZI: internet, YouTube, social media, blog, smartphone.

• Le notizie si trasmettono in tempo reale e da fonti molteplici in tutto il mondo.

• Il fenomeno del CITIZEN JOURNALIST mette in discussione i media come unica fonte.

PRODOTTO FINALE: articoli, video, post.

RUOLO CHIAVE: pubblico.

Page 6: Data journalism

DATA TEAM

Dirige il processo.

Individua la storia e pone le domande.

Raccoglie, pulisce e analizza i dati.

Fact checking.

DESIGNER

Specialista nella visualizzazione dei dati.

Rende la storia interessante, accessibile, accattivante.

Crea anche grafiche web interattive.

SVILUPPATOREGIORNALISTA

Individua il modo migliore per presentare i dati.

Crea programmi con cui l’utente interagisce direttamente.

Supporta tutto il processo di raccolta e analisi dei dati.

Page 7: Data journalism
Page 8: Data journalism
Page 9: Data journalism

THE COLOR OF MONEY (1989)

L’inchiesta di Bill Dedmansulla discriminazione razziale da parte di banche e istituti di credito di Atlanta, cattura l'attenzione del pubblico con l'ampio uso di tavole, disegni e carte geografiche.

Page 10: Data journalism

WHAT WENT WRONG (1992)

L’inchiesta di Stephen Doigsui danni causati dall'uragano Andrew che ha colpito Miami. Confrontando dati sull’agibilità delle case, l’anno di costruzione e la forza dei venti, dimostra che a distruggere i tetti della città era stata, soprattutto, la corruzione nell'edilizia.

Page 11: Data journalism
Page 12: Data journalism

WORKFLOW

Mirko Lorenz definisce il processo del data journalismcome un workflow, un flusso di lavoro in cui i dati rappresentano la base per la ricerca, la visualizzazione e la narrazione della storia. Attraverso queste fasi, la storia non rappresenta più il prodotto del giornalismo, ma il processo stesso. In questo processo di rifinitura i dati vengono raccolti, filtrati e visualizzati trasformandosi nella storia finale. Man mano che il processo va avanti aumenta il suo valore agli occhi del pubblico.

Page 13: Data journalism

REALIZZARE UN ARTICOLO

Nel 2011 il giornalista Paul Bradshaw realizza un modello che illustra il processo di realizzazione di un articolo attraverso un diagramma a piramide rovesciata.

Le fasi del processo sono: raccogliere, pulire, contestualizzare e incrociare.

RACCOGLIERE

PULIRE

CONTESTUALIZZARE

INCROCIARE

Page 14: Data journalism

# 1 RACCOGLIERE

ISTAT, Eurostat, The World Bank, UN, WHO. data.gov, data.gov.uk, dati.senato.it.

The Data Hubdella Open Knowledge Foundation.

Storyful.

OPEN DATAWAREHOUSE

RICHIESTA SCRAPING

La fonte non rilascia i dati, ma questi possono essere ottenuti attraverso una richiesta scritta: il diritto di accesso all’informazione è un concetto fondamentale nel data journalism.

Raccogliere qualunque informazione sia stata digitalizzata, in qualunque formato.

Mercury Web Parser. DownThemAll. Scraper Extension. Tesseract. Scraperwiki.

Page 15: Data journalism

RACCOGLIERE

THE DATA HUB

Permette di trovare, condividere e riutilizzare risorse disponibili di dati. Fondata dalla Open Knowledge Foundation, un network non-profit internazionale che si batte per il libero accesso ai dati.

STORYFUL

Permette di cercare dati contemporaneamente in tutti i social network, monitorare gli argomenti di interesse, individuare le fonti e i trend ed estrarre i contenuti più interessanti.

OPEN DATAWAREHOUSE

Page 16: Data journalism

RACCOGLIERE

LIMITI

Codice HTML con poche informazioni strutturali.

Sistemi che richiedono l’autenticazione per l’accesso.

Sistemi che usano cookies per memorizzare le azioni dell’utente.

Blocchi all’accesso da parte dei server amministratori.

Barriere legali del diritto d’autore sui database.

MERCURY WEB PARSER

FIREFOX DOWN THEM ALL

CHROME SCRAPER EXTENSION

GOOGLE TESSERACTSCRAPERWIKI

STRUMENTI

SCRAPING

Page 17: Data journalism

RACCOGLIERE

SCRAPERWIKI - QUICKCODE

Piattaforma per la costruzione collaborativa di programmi per estrarre e analizzare i dati pubblici. Questi possono essere creati utilizzando una varietà di linguaggi di programmazione, tra cui Python e JavaScript.

MERCURY WEB PARSER

Con una richiesta API permette di estrarre ilcontenuto rilevante di qualsiasi pagina web-titolo, autore, testo e immagini.

SCRAPING

Page 18: Data journalism

#2 PULIRE

I dati possono essere incompleti, duplicati e contenere errori. È quindi necessario pulirli per renderli affidabili.

STRUMENTI UTILI

Page 19: Data journalism

#3 CONTESTUALIZZARECome ogni fonte, i dati non sono sempre affidabili. Bisogna pertanto chiedersi sempre chi li ha raccolti, quando, a quale scopo e con quale metodologia. La storia assume un maggiore impatto giornalistico e una maggiore rilevanza civica solo se contestualizzato.

#4 INCROCIARESpesso è necessario incrociare diversi dataset per ottenere una storia soddisfacente. La combinazione più classica è il mash up con mappe che consentono di visualizzare nello spazio i contenuti, personalizzabili dall’utente.

Page 20: Data journalism
Page 21: Data journalism

• Prodotto digitale o analogico su carta o su web.• Racconta una storia visualizzando immagini.

INFORMAZIONI GRAFICA

Page 22: Data journalism

DINAMICAvideo e

animazioni

INTERATTIVAl’utente può

scegliere

CI SONO TRE TIPI DI INFOGRAFICHE

#1GRAFICAlayout,

immagini e set di icone

#2DATI

Informazioniche riguardano un fenomeno

#3STORIA

messaggio veicolato

STATICAimmagini

Sono formate da 3 elementi

DINAMICAvideo e

animazioni

INTERATTIVAL’utente può

scegliere

Page 23: Data journalism

COOLSono di moda

Attentioneconomy

Viralità

INFOGRAFICHE NELLA COMUNICAZIONE 2.0

Nuggets of Information

Veloci e facili

Squirrellbehaviour

Page 24: Data journalism

LE INFOGRAFICHE VENGONO UTILIZZATE

AMBITO GIORNALISTICOFin dal 1982USA TODAY le utilizza nei suoi snapshots.

AMBITO SCOLASTICOCome supporto alla didattica tradizionale o come strumento per gli studenti.

AMBITO MARKETINGPer illustrare strategie di comunicazione e campagne pubblicitarie: statistiche, grafici e business model.

Page 25: Data journalism
Page 26: Data journalism

INFOGRAPHIC TIMELINE

40.000 a.C. 7.000-4.000 a.C. 1790 William Playfair

1857 Florence Nightingale 1861 Charles Joseph Minard

1972-73 Pioneer 1 e 2 1982 Edward Tufte

Page 27: Data journalism

EDWARD TUFTE (Kansas City, 14 marzo 1942)

• Statistico e scultore statunitense

• Membro della American Statistical Association

• Pioniere dell’Information Design

• The Visual Display of Quantitative Information, 1983.

«Leonardo da Vinci dei dati» NEW YORK TIMES

«Galileo della grafica» BUSINESSWEEK

Page 28: Data journalism

Total ink used to print the graphic

DATA INK RATIO

“Above all else show the data.

A large share of ink on a graphic should present data-information,

the ink changing as the data change. Data-ink is the non-

erasable core of a graphic, the non-redundant ink arranged in

response to variation in the numbers represented.”

Tufte, 1983

Data-ink

DATA-INK RATIO

Proportion of a graphic’s inkdevoted to the non-refundantdisplay of data-information

1.0 – proportion of a graphic that can be erased

=

=

=

Page 29: Data journalism
Page 30: Data journalism
Page 31: Data journalism

COME PER OGNI FORMA DI COMUNICAZIONE CHE MIRA ALL’EFFICACIA, ANCHE PER LA CREAZIONE DI UN’INFOGRAFICA È

NECESSARIO UN LAVORO PREPARATORIO:

#1Obiettivi da raggiungere

#2Individuazione dei destinatari e delle

loro necessità

#3Medium su cui verrà pubblicato il lavoro

Page 32: Data journalism

PRIMA TECNICA: GESTALTPsicologia secondo cui =

1. Il tutto è più della somma delle singole parti che lo compongono

2. il cervello umano riconduce ad unità gli elementi del campo visivo sulla base della loro stretta relazione

SICCOME gli elementi del campo visivo non vengono percepiti singolarmente ma come parte di un tutto, nel quale interagiscono tra loro…

ALLORA per progettare infografiche efficaci queste regole vanno sfruttate.

Page 33: Data journalism
Page 34: Data journalism

SECONDA TECNICA: LE METAFORE VISIVE

HAMBURGERUsato per indicare gli ingredienti del

contenuto dell’infografica.

ICEBERGUsato per indicare un fenomeno la cui

parte preponderante non

è visibile.

Page 35: Data journalism

ICONEUniversalmente comprensibili,

rappresentano ciò a cui somigliano.

Sono immediate e condivisibili.

TERZA TECNICA: LE ICONE

Page 36: Data journalism
Page 37: Data journalism

LA RICERCA DI IMMAGINI E ICONE

Sito online che offre icone e foto utilizzabili gratuitamente.

Motore di ricerca che filtra icone per tipo di licenza in funzione dell’utilizzo che se ne vuole fare.

Sito online che contiene 60 milioni di immagini, video e tracce audioutilizzabili previo acquisto dell’assicurazione e della licenza d’uso.

Page 38: Data journalism

SOFTWARE PER CREARE INFOGRAFICHE

Page 39: Data journalism
Page 40: Data journalism

2006 2010 2011 2016

«Giornalismo e metodo

scientifico: ovvero il

giornalismo di precisione»

Primo panel sul giornalismo di precisione al

Festival Internazionale

del Giornalismo di Perugia

Freedom of Information

Act =from need to right to know

Portale di open

data

della P.A.

inchieste effettuate da gruppi di attivisti e associazioni no-profit che hanno difeso fermamente il rilascio di dati aperti

=

Page 41: Data journalism

http://www.dati.gov.it/

Page 42: Data journalism

<ahref

• Fondazione di ricerca non-profit, nata nel 2010 su iniziativa della Provincia Autonoma di Trento.

• Tra i soci fondatori la Fondazione Bruno Kessler e Informatica Trentina.

• OBIETTIVI PRIMARI

http://www.ahref.eu/

condivisione valutazione incentivazione

DEGLI STRUMENTI DI INFORMAZIONE

Di fronte a politiche di segretezza…

Page 43: Data journalism

iDataProgetto di ricerca per lo sviluppo di una piattaforma opensourcededicata al data journalism.

Data Blog: primo passo pubblico.

Page 44: Data journalism

Nasce nel 2011 da una idea di Luca Tremolada e Andrea Gianotticome strumento per analizzare i fatti attraverso i numeri.Ricalca soprattutto gli argomenti economici trattati dalla testata giornalistica cartacea. BLOCCA la vera innovazione del data journalism: l’aggiornamentodei dataset da parte degli utenti.

http://www.infodata.ilsole24ore.com/

Info Data

Page 45: Data journalism

http://www.wired.it/

• Versione italiana della rivista mensile statunitense con sede a San Francisco in California dal marzo 1993, e di proprietà di CondéNast Publications.

• Nata a marzo del 2009 tratta tematiche di carattere tecnologico e di come queste influenzino la cultura, l'economia, la politica e la vita quotidiana.

Wired.it

Page 46: Data journalism

• Resoconto dettagliato della qualità delle cure in tutti i 1.200 ospedali italiani, pubblici e privati.

• Dati raccolti dall’Agenzia nazionale per i servizi sanitari regionali (Agenas) e ricavati dalle schede di dimissione ospedaliera.

• Solo nel 2012 resi accessibili ai medici e ai giornalisti accreditati.

• 2013: Wired li pubblica integralmente in un formato ricercabile.

indice di rischio

% dei pazienti deceduti

Tot. dei ricoveri effettuati

=

Per ogni indicatore patologico

Page 47: Data journalism

Dataninja.it

• Network di data journalism attivo in Italia e in Europa.

• Fondato nel 2012 da Alessio Cimarelli (data scientist-journalist) e Andrea Nelson Mauro (data journalist).

• Nato come laboratorio di sperimentazione nel giornalismo.

• Cresciuto collaborando con i più grandi gruppi editoriali del continente E partecipando ai principali eventi di networking del giornalismo globale.

• Oggi un hub di una rete di competenze

http://www.dataninja.it/

Page 48: Data journalism
Page 49: Data journalism

http://stories.dataninja.it/themigrantsfiles/

DA UNA RACCOLTA ITALIANA AD UN PROGETTO DI RESPIRO EUROPEO

Page 50: Data journalism

2012

Nasce l’idea di un’inchiesta sulla storia dei naufragi dei migranti nel Mediterraneo.

Punto di partenza = dati raccolti da Gabriele del Grande sul suo blog/osservatorio Fortress Europe.

Dal 1988 al 2013 sono morte lungo le frontiere dell'Europa almeno 27.382 persone, di cui 4.273 soltanto nel 2015 e 3.507 nel 2014.

http://fortresseurope.blogspot.it/p/la-strage.html

Page 51: Data journalism

1. Scraping della tabella originale con DataMiner.2. Pulizia dei dati con OpenRefine.3. Geolocalizzazione dei naufragi con API di Google Maps e CoordFinder. più di 1600 eventi luttuosi avvenuti negli ultimi 25 anni.

Page 52: Data journalism

http://www.datajournalism.it/mar-mediterraneo-tomba-di-migranti/

Il sito datajournalism.it pubblica la mappa “Mar Mediterraneo, tomba di migranti”. Una vera e propria applicazione web interattiva che permette di esplorare il dataset geolocalizzato fino a quel momento (circa 250 eventi dal 2009).

Aprile 2013

Page 53: Data journalism

http://daily.wired.it/news/politica/2013/10/04/lampedusa-naufragio-migranti-immigrazione-mappa-564632.html

Ottobre 2013Pubblicazione su Wired dopo l’incidente presso l’isola dei Conigli, con l’articolo “Lampedusa, la mappa dei naufragi”.

Page 54: Data journalism

• Inchiesta europea “The MigrantsFiles”, finanziata con 7 mila euro e che vede coinvolti 12 giornalisti di 5 testate da 6 paesi diversi.

• Progetto ambizioso: riunire e conciliare i maggiori database esistenti sulle vittime delle migrazioni in Europa.

2013

1° RISULTATO = dal 2000 al 2013 sono morti e dispersi più di 23 mila migranti, circa il 50% in più rispetto a quanto stimato dai due database originari presi separatamente.

Page 55: Data journalism

Confronto fra eventi luttuosi per ogni rotta di immigrazione e numero di avvistamenti riportato da Frontex nell’ambito del suo mandato di controllo dei confini europei.

2° RISULTATO = Stima della mortalità delle rotte storiche dell’immigrazione.

Page 56: Data journalism

https://docs.google.com/spreadsheets/d/1YNqIzyQfEn4i_be2GGWESnG2Q80E_fLASffsXdCOftI/edit#gid=1085726718

Marzo 2014Database finale dell’inchiesta dal 2000 al 2013 sulla base di due dataset, osservatorio Fortress Europe di Gabriele del Grande + NGO United for Intercultural Action.

Page 57: Data journalism

• 2014: vince il Data JournalismAwards.

• 2015: a Copenhagen vince l’European Press Prize.

• 2016: interruzione del progetto per adempimento degli scopi ed esaurimento dei finanziamenti.

Page 58: Data journalism
Page 59: Data journalism

1. È una realtà già affermata in paesi come Stati Uniti e Regno Unito.

2. È un terreno fertile in Italia: nei primi nove mesi del 2016 le richieste di specialisti sono aumentate del 137%, come riportato dall’Italian labour market digital monitor, per lo più concentrate in Lombardia (58%) e poi nel Lazio (17%).

3. Prima di essere una professione, quella del data scientist è una forma mentis e come tale è trasversale, si applica a qualsiasi ambito lavorativo, pubblico o privato che sia, e la conoscenza dei tool necessari diventa secondaria, ma non meno importante.

Page 60: Data journalism

BIBLIOGRAFIAFrancesco Tissoni

Social network. Comunicazione e marketing

Editore: Apogeo EducationCollana: PerCorsi di studioAnno edizione: 2014

Jonathan Gray, Lucy Chambers, Liliana Bounegru

The Data Journalism Handbook: How Journalists Can Use Data to Improve the New

Editore: O'Reilly Media

Anno Edizione: 2012

Martina Cavanna

Un giornalismo di precisione? Storia edevoluzione del data journalism internazionale

Tesi di Laurea Università degli Studi di Catania

Anno: 2013

SITOGRAFIACasi studio

• https://docs.google.com/spreadsheets/d/1YNqIzyQfEn4i_be2GGWESnG2Q80E_fLASffsXdCOftI/edit#gid=1085726718

• http://daily.wired.it/news/politica/2013/10/04/lampedusa-naufragio-migranti-immigrazione-mappa-564632.html

• http://www.datajournalism.it/mar-mediterraneo-tomba-di-migranti/

• http://fortresseurope.blogspot.it/p/la-strage.html

Page 61: Data journalism

SITOGRAFIA

• http://stories.dataninja.it/themigrantsfiles/

• http://www.dataninja.it/

• http://www.infodata.ilsole24ore.com/

• http://daily.wired.it/mappa_migliori_ospedali

• http://www.ahref.eu/

• http://www.dati.gov.it/

Data journalism

• https://mercury.postlight.com/web-parser/

• https://chrome.google.com/webstore/detail/scraper/mbigbapnjcgaffohmbkdlecaccepngjd?hl=en

• https://addons.mozilla.org/en-US/firefox/addon/downthemall/

• https://quickcode.io/

• https://storyful.com/

• https://imdigitaljournalism.wordpress.com/journalism-then-and-now/

• https://www.theguardian.com/news/datablog/2011/jul/28/data-journalism

• http://datajournalism.stanford.edu/ • http://gijn.org/resources/data-

journalism/• http://www.wired.it/economia/lavor

o/2016/12/01/esplode-la-domanda-data-scientist-italia/

Page 62: Data journalism