Data driven journalism - I primi passi

Post on 29-Nov-2014

651 views 2 download

description

Introduzione alle esperienze internazionali e nazionali di data j per gli studenti del Master in giornalismo dello IULM, summer school IULM-Ahref agosto 2012, Transacqua

Transcript of Data driven journalism - I primi passi

data driven journalism

i primi passi

Elisabetta Tola

iData - fondazione ahref

formicablu srl

Guido Romeo

iData - fondazione ahref

Wired IT

II ed. Summer School ahref-IULM, 27.08.12

1. cosa succede in giro per il mondo2. cosa succede in Italia3. perché fare ddj4. un processo a step5. primi tools del data journalist6. le fonti7. get your hands on those data – think in xls

http://datajournalism.stanford.edu/

cosa succede in giro per il mondo

http://www.nytimes.com/interactive/2012/05/13/business/student-debt-at-colleges-and-universities.html?ref=multimedia

L’inchiesta Dollars for docshttp://projects.propublica.org/docdollars/

http://www.heraldtribune.com/article/20110418/BREAKING/110419506

2011: i dati vincono il Pulitzer

Paige St. John

cosa succede in Italia

http://openspending.org/

http://www.transcrime.unitn.it/tc/1.phphttp://www.corriere.it/cronache/speciali/2011/mafiopoli/

Audizione del Presidente dell’Istat Enrico Giovannini alla Commissione Territorio, Ambiente e Beni ambientali del Senato

http://www.focus.it/scienza/salute/la-guida-ai-migliori-ospedali-ditalia_52321_C12.aspx

http://www.toxiceurope.eu/index.html

http://www.ahref.eu/it

http://datablog.ahref.eu/i-numeri-della-scuola-1-2013-lavorare-con-i-dati-della-scuola

http://datablog.ahref.eu/

perché fare ddj

È uno strumento per raccontare storie complesse da tanti punti di vistaÉ uno strumento collaborativoRende trasparente il processo di costruzione della storiaTrasforma un racconto astratto in un quadro comprensibile e spesso direttamente correlato al lettore

É un giornalismo di precisione, che applica un metodo scientificoGenera storie nuove e correlate a livello globale e localeSviluppa nuove competenze e dà nuove opportunitàValorizza la reteÈ un equalizer: non dipende dalla lingua

un processo a step

ma si parte comunque dalle domande

EJC - Mirko Lorenz

Il bugiardino

I dati raramente arrivano puliti e pronti all'uso

Spesso sono in formato non prontamente utilizzabile (.pdf, flash!)e vanno estratti

I dati raccolti per fini burocratici sono organizzati

diversamente da quelli utili per fini giornalistici

(meno precisione, molti codici incomprensibili)

leggere sempre le note metodologiche!!!

attenti ai confronti(es. dati sui crimini in diversi paesi)

Nel data j contano più la reputazione e l'affidabilità che

non la velocità di pubblicazione!

Un buon lavoro di data j genera molto traffico su un sito e non

muore a breve termine (più storie nel tempo)

i primi tools del data journalist

raccogliere i numeri organizzare i dati

excelgoogle spreadsheet

libre calcaccess, SQL

RSPSS o Stata

pulire i dati - Google Refineprime analisi e viz – Google Fusion Tables – Google charts

mappe – BatchGeo, QGisaltri strumenti semplici di data

viz: ManyEyes, Tableau

le fonti di dati

incrociare più fonti e verificare i dati

SEMPRE (la preziosa lista degli

esperti-amici!)

Comuni, Province, Regioni: servizi statistici, osservatori

Siti dei Ministeri

Istat: dati.istat.it

dati.gov.it e vari portali opendata

Grandi aziende:ENEL,INPShttp://data.enel.com/

Camere di commercio: a pagamento

OKFN,SOD e Linked Open Data,GlobalLeaks,Scraper wiki

ONG: legambiente, associazioni consumatori, cittadinanzattiva,

etc

Altri siti di news e alcuni blog (dati grezzi resi

disponibili per riuso – eg. EU structural funds – eg.

http://fortresseurope.blogspot.it/)

Sindacati e associazioni di categoria: vari report

Università e istituti di ricerca

Organizzazioni internazionali: OECD, UNICEF, FAO, World Bank,

etc (eg. OECD e FAO sulla produzione di grano)

Saper cercare

1. cercare con più parole chiave (beware: termini burocratici e

tecnici)2. specificare il formato: filetype:xls, filetype:csv

3. limitare la ricerca a un sito: site:dati.emilia-romagna.it4. usare search site o plugin

simile

Le info al contorno

1. whois.domaintools.com – chi ha registrato un sito, varie info2. the wayback machine – le

vecchie pagine3. TinEye – ritrovare l'origine

di una immagine

E con i dati che faccio?

1. salvare sempre il file originale, lavorare su una copia2. fare screenshot delle pagine

3. tenere diario di bordo4. non usare i dati per

confermare visioni preconcette5. accettare dati non completi

Quando i dati non sono online?

1. richiedere i dati (no tel)2. parlare con la persona responsabile dei dati3. informare sulla pubblicazione: può facilitare rilascio altri dati4. lanciare raccolta dati in crowdsourcing5. conoscere bene il FOIA e le sue applicazioni

The investigation is a story: la storia della costruzione del

puzzle è un buon pezzo di giornalismo (soprattutto se

qualcuno mette i bastoni tra le ruote)

Le domande valide sono sempre le stesse: i dati sono una

sorte di fonte 'viva'

http://datajournalismhandbook.org/

Altre ref Hacks/Hackers Ahref Datablog datajournalism.it

grazie!

eli@formicablu.it

@elisabetta_tola

data driven journalism

i primi passi

Elisabetta Tola

iData - fondazione ahref

formicablu srl

Guido Romeo

iData - fondazione ahref

Wired IT

II ed. Summer School ahref-IULM, 27.08.12

1. cosa succede in giro per il mondo2. cosa succede in Italia3. perché fare ddj4. un processo a step5. primi tools del data journalist6. le fonti7. get your hands on those data – think in xls

cosa succede in giro per il mondo

http://www.guardian.co.uk/news/datablog

http://www.guardian.co.uk/news/datablog

http://www.nytimes.com/interactive/2012/01/15/business/one-percent-map.html

http://www.nytimes.com/2012/01/15/business/the-1-percent-paint-a-more-nuanced-portrait-of-the-rich.html?_r=1&ref=business

http://www.baycitizen.org/data/bike-accidents/

L’inchiesta Dollars for docshttp://projects.propublica.org/docdollars/

http://www.heraldtribune.com/article/20110418/BREAKING/110419506

2011: i dati vincono il Pulitzer

Paige St. John

http://cf.htcreative.com/insurance2/insuranceriskhome.html

cosa succede in Italia

http://openspending.org/

http://www.transcrime.unitn.it/tc/1.phphttp://www.corriere.it/cronache/speciali/2011/mafiopoli/

http://danielebelleri.altervista.org/mappamilano2012.html

Audizione del Presidente dell’Istat Enrico Giovannini alla Commissione Territorio, Ambiente e Beni ambientali del Senato

http://www.ahref.eu/it

http://datablog.ahref.eu/i-numeri-della-scuola-1-2013-lavorare-con-i-dati-della-scuola

http://datablog.ahref.eu/

un processo a step

ma si parte comunque dalle domande

EJC - Mirko Lorenz

Il bugiardino

I dati raramente arrivano puliti e pronti all'uso

Spesso sono in formato non prontamente utilizzabile (.pdf, flash!)e vanno estratti

I dati raccolti per fini burocratici sono organizzati

diversamente da quelli utili per fini giornalistici

(meno precisione, molti codici incomprensibili)

leggere sempre le note metodologiche!!!

attenti ai confronti(es. dati sui crimini in diversi paesi)

Nel data j contano più la reputazione e l'affidabilità che

non la velocità di pubblicazione!

Un buon lavoro di data j genera molto traffico su un sito e non

muore a breve termine (più storie nel tempo)

raccogliere i numeri organizzare i dati

excelgoogle spreadsheet

libre calcaccess, SQL

RSPSS o Stata

pulire i dati - Google Refineprime analisi e viz – Google Fusion Tables – Google charts

mappe – BatchGeo, QGisaltri strumenti semplici di data

viz: ManyEyes, Tableau

grazie!

eli@formicablu.it

@elisabetta_tola