Datenjournalismus Workshop am fjum

45
Mit Daten Geschichten erzählen Wien 18.10.2011 Ulrike Langer (medialdigital.de) und Sascha Venohr (Zeit Online)

description

Am 18.11.2011 habe ich gemeinsam mit Zeit Online Entwicklungsredakteur Sascha Venohr ein Übersichtsseminar zum Thema Datenjournalismus mit praktischen Übungen gegeben. (Veranstalter: fjum Wien und Schweizer MAZ). Dies sind die Folien dazu.

Transcript of Datenjournalismus Workshop am fjum

Page 1: Datenjournalismus Workshop am fjum

Mit Daten Geschichten erzählen

Wien 18.10.2011

Ulrike Langer (medialdigital.de) und Sascha Venohr (Zeit Online)

Page 2: Datenjournalismus Workshop am fjum

Worum geht es?

Page 4: Datenjournalismus Workshop am fjum

Die Pioniere

Page 5: Datenjournalismus Workshop am fjum

Der Prototyp des Datenjournalismus: Everyblock

eine vielseitig recherchierbare, immer neu gefütterte Datenbank

Projekt des Progammierer-Journalisten Adrian Holovaty,hervorgegangen aus der Seite chicagocrime.org

alt

neu

mit Community-Funktionen

Page 6: Datenjournalismus Workshop am fjum

The Guardian

Investigate your MP‘s Expenses

Frühjahr 2009

Page 7: Datenjournalismus Workshop am fjum

Der Guardian bereitete im Frühjahr 2009 die gesamten verfügbaren Daten zum Spesenskandal der britischen Unterhaus-Abgeordneten (Wer hat welche Steuernachlässe in Anspruch genommen? Wer hat sie zurückgezahlt? Wer nicht?)

- interaktive Darstellungsform

- kollaborativer Charakter des Projekts (Crowdsourcing)

- ständige Fortschrittsberichte

-Abschlusspräsentation

„Can you do something with this data? Please post us your visualisations and mash-ups below or mail us at

[email protected]

MP‘s expenses: All the revelations as a spreadsheet (Guardian)

Page 9: Datenjournalismus Workshop am fjum

Beispiel für eine Anwendung, die auf Daten aus dem data store beruht:

London traffic cam viewer for the iPad

Page 10: Datenjournalismus Workshop am fjum
Page 14: Datenjournalismus Workshop am fjum

Es muss nicht immer eine

Visualisierung sein.

Die NYT veranschaulicht die minimalen Ergebnis-

unterschiede im Spitzensport

mit akustischen Effekten

Olympic Musical

Page 16: Datenjournalismus Workshop am fjum

Der Westen: Verbindung von Datenjournalismus und Crowdsourcing über ein anonymes Informantenportal (Upload-Portal)

Page 17: Datenjournalismus Workshop am fjum

Der Fall Envio - datenjournalistisch aufbereitet

Page 18: Datenjournalismus Workshop am fjum

taz Fluglärmkarte

Page 19: Datenjournalismus Workshop am fjum

nahraum.de

ein regionales + lokales flickr

Start: 11.11.2009

Stand nach 6 Monaten: 1.700 Nutzerkonten, rund 50.000 hochgeladene Bilderin 4/10: 2,7 Mio PIs. Tendenz steigend

Dienstleister: wissenmedia (Bertelsmann)

- „das lokale Foto-Gedächtnis einer Region“

Projekt der „Ruhrnachrichten, Medienhaus Lensing,Ost-Ruhrgebiet, West-Münsterland

Zugänge zum Fotoportal über Startseite, lokale Suche, Verschlagwortung von möglichst vielen Texten der Lokalausgaben

Page 20: Datenjournalismus Workshop am fjum

Wenn Medien Datenschätze nicht heben, dann tun es eben andere

Page 21: Datenjournalismus Workshop am fjum

Der transparente Bundeshaushalt - lässt sich auf kommunale Haushalte übertragen

http://bund.offenerhaushalt.de/ von Tactical Tools

Page 22: Datenjournalismus Workshop am fjum

• Jeder Klick auf einen Haushaltsposten bringt eine weitere Aufschlüsselung der Gelder.

• 1200 Seiten Papierinformationen mit rund 7000 Posten, die sich in weitere anklickbare Unterposten gliedern.

• Die Zahlen werden zu jedem Posten auch auf einer Zeitleiste von 2003 bis 2011 dargestellt – einige Zahlen erst ab 2005.

• Jeder Haushaltsposten hat eine eigene Internetadresse und kann mit Artikeln oder einer Online-Diskussion verlinkt werden.

• weitere Haushalte für Länder und und Kommunen unter Subdomains sollen folgen.

mehr dazu bei: kooptech

Page 23: Datenjournalismus Workshop am fjum

OWNI.fr

Page 24: Datenjournalismus Workshop am fjum

OWNI - Où je vote?

- Projekt zu den französischen Regionalwahlen im Frühjahr 2010- Applikation, die Nutzern zeigt, in welchem Wahllokal sie am Wahltag wählen können.- erstes Crowdsourcing-Experiment von OWNI: Nutzer tippten eingescannte Dokumente ab, damit sie computerlesbar wurden- zum Wahltag war die Facebook App fertig, funktionierte aber mangels genügend valider Daten nicht perfekt

Page 25: Datenjournalismus Workshop am fjum

Frankfurt Gestalten

Basis Open Street Map

lokalisiert lokalpolitische Entscheidungen, Anträge, Bürgerbegehren etc. auf

einer Karte

deckt alle 42 Stadtteile von Frankfurt ab

sechsköpfiges Designer- und Entwicklerteam

Projekt der Open Knowledge

Foundation

Christian Kreutz (Politologe, Initiator): "Inspiriert von Projekten in anderen Ländern kam mir die Idee eines Tages als ich im Ortsbeirat saß. Wie wäre es wenn sich Bürger direkt über das Internet vernetzen und Ideen zur Stadtgestaltung austauschen."

Page 26: Datenjournalismus Workshop am fjum

Frankfurt gestalten: Nutzer können eigene Initiativen starten

Page 28: Datenjournalismus Workshop am fjum

Bürger kreieren über eine offene Schnittstelle

Anwendungen aus den Datensätzen und stellen sie der

Allgemeinheit zur Verfügung

Page 29: Datenjournalismus Workshop am fjum

ortsbasierte Informationen über soziale Netzwerke anbieten (Twitter, Facebook, Foursquare etc.)

Foursquare-Nutzer können Restaurant- und Freizeittipps der „National Post“ (Toronto) in

ihre To-Do-Liste übernehmen

Page 30: Datenjournalismus Workshop am fjum

Hands-On-Crashkurs von Sascha Venohr:

Datenvisualisierung mit Google Fusion Tables

Page 31: Datenjournalismus Workshop am fjum

Visualisierung der internationalen Waffenausgaben

(im Verhältnis zum jeweiligen Bruttosozialprodukt) 

• Werkzeuge:

• Google Spreadsheet (Datenaufbereitung alternativ auch mit anderen Tabellenkalkulationen, z.B. MS Excel)

• Google Fusion Table

• Datensatz:

• SIPRI Military Expenditure Database

(kompletter Datensatz im Excel-Format zu Semi- n narzwecken bereits als öffentliches Google-Doc)

Page 32: Datenjournalismus Workshop am fjum

Schrittweises Vorgehen: 

1. Über diesen Link wird der Komplett-Datensatz als Google-Spreadsheet geöffnet.

2. Da dieses Dokument schreibgeschützt ist, erstellen wir eine Arbeitskopie. (Menüpunkt Datei > Kopie erstellen)

3. Wir wählen das  Tabellenblatt „Share of GDB“ aus. In diesem Datensatz wird dargestellt, wieviel Prozent des jährlichen Bruttosozialprodukts auf den Wehretat entfallen sind. Diese Prozentwerte ermöglichen eine Vergleichbarkeit der Länder im Hinblick auf die Intensität der Rüstungsbestrebungen.

4. Damit wir mit Säubern der Daten beginnen können, müssen wir zunächst die Fixierung der Kopfzeilen entfernen. Hierzu greifen wir ganz links auf Höhe der Tabellenüberschriften das kleine blaue Element und ziehen es ganz nach oben aus dem Dokument heraus [s. Abb.].

Page 33: Datenjournalismus Workshop am fjum

5. Nun können die Zeilen 1-5, die nur textliche Informationen über den Datensatz enthalten, gelöscht werden (Zeilen markieren und über Menüpunkt Bearbeit „Zeilen1-5 löschen“).

6. Gleiches wird nun zeilenweise bei Zwischenüberschriften oder dort angewendet, wo in den Ländern keine Daten vorhanden sind (bspw. German DR).

7. Da wir aus Aktualitätsgründen auf die Werte ab Jahr 2000 aufwärts beschränken wollen, werden nun die Spalten mit den älteren Jahreszahlen gelöscht. Dazu werden diese ebenfalls markiert und über den Menüpunkt Bearbeiten > „Spalten F-M löschen“ entfernt.

8. Da Waffenausgaben ihre Wirkung über einen längeren Zeitraum entfalten, wollen wir nun für die zu betrachtenden Jahre einen Durchschnittswert berechnen. Hierzu benötigen wir ganz rechts eine zusätzliche Spalte. Hierzu gehen wir in Spalte 2009 gehen über das Menü über Einfügen > Spalte rechts. Diese neue Spalte nennen wir „Formel-Durchschnitt“.

Page 34: Datenjournalismus Workshop am fjum

9. Wir gehen in die Zeile des ersten Landes und fügen in die neue Spalte unsere Formel ein, mit der wir aus den Jahren 2000 bis 2009 den durch-schnittlichen Anteil am Bruttosozial-produkt der Wehrausgaben berechnen wollen. Hier bedienen wir uns der Funktion „Average“. Und wählen den Zellraum aus, in unserem Fall die Zellen B1:K7. Unsere konkrete Formel =AVERAGE(B2:K2) [s. Abb.]. Wir fassen die Zelle mit der Formel mit gedrückter Maustaste im rechten Eck und ziehen diese komplett in der Spalte nach unten. Dadurch wird die Formel für alle weiteren Zeilen automatisch transponiert.

10. Um die damit berechneten Durchschnittswerte von der Formel zu entkoppeln, fügen wir eine zusätzliche Spalte ganz rechts ein (Menü Einfügen > Spalte rechts).

11. Nachdem wir die komplette Spalte „Formel Durchschnitt“ markiert und in die Zwischenablage kopiert haben, springen wir in die neue rechte Spalte in die erste Zelle und gehen über Menü Bearbeiten > Inhalte einfügen > Nur Werte einfügen. Die neue Spalte nennen wir der Einfachheit halber „Durchschnitt“.

Page 35: Datenjournalismus Workshop am fjum

12. Nun können wir abschließend die Jahresspalten und die nur zur Berechnung notwendige Spalte „Formel Durchschnitt“ löschen (Spalten markieren und über Bearbeiten > Spalten B-L löschen).

13. Wir haben nun eine aufgeräumte und einfache Datengrundlage, mit einer Spalte für den Ländernamen und einer Spalte mit dem durchschnittlichen prozen-tualen Anteil am Bruttosozial-produkt, den diese in den Jahren 2000-2009 aufgewendet haben. Diese Daten expor-tieren wir zunächst als CSV-Datei. Hierzu gehen wir auf Datei > Herunterladen als > CSV (aktuelles Tabellenblatt) und speichern die Datei lokal. [s. Abb.]

Page 36: Datenjournalismus Workshop am fjum

14. Nun wollen wir unseren verschlankten Datensatz auf einer Weltkarte visualisieren. Hierzu wollen wir das kostenlose Tool Google Fusion Tables verwenden. Wir springen in die Übersicht „Text & Tabellen“ bei GoogleDocs. Im Menü „Erstellen“ wählen wir den Eintrag „Tabellen (Beta)“ aus. Im ersten Dialogpunkt besteht die Möglichkeit, unsere lokal gespeicherte CSV-Datei über „Durchsuchen“ auszuwählen. Vor dem Hochladen akzeptieren wir die vorgeschlagenen Einstellungen auf „Comma“ und „UTF-8“. Durch zweimaliges Klicken auf „Next“ importieren wir diese neue Tabelle in Fusion Tables. Bevor der Vorgang abgeschlossen wird, können wir der Tabelle einen neuen aussagekräftigen Titel im oberen Feld vergeben.

15. Fusion Tables bietet nun eine einfache Möglichkeit, auf Basis von Ländernamen eine Geocodierung vorzu-nehmen. Diese Funktion finden wir unter File > Geocode. [s. Abb.] Im folgen-den Dialog bestätigen wir das vorausgewählte Feld „Country“ und stoßen dasautomatische Matching an. Nach dem 100% erreicht sind, schließen wir den Dialog durch Klicken auf das X rechts oben.

Page 37: Datenjournalismus Workshop am fjum

16. Nun sind wir kurz vorm Ziel. Über das Menü Visualize > Intensity Map überträgt Fusion Tables die Werte auf eine Weltkarte und färbt die Länder in Abstufungen automatisch ein. Voilà:

Page 38: Datenjournalismus Workshop am fjum

Überblick Werkzeuge:

scrapen veredeln visualisieren

Page 39: Datenjournalismus Workshop am fjum

Google Spreadsheets

Grundlagentool. Cloudbasiertes Pendant zu Microsofts Tabellenkalkulationsprogramm Excel. Links zu drei Tutorials (engl.).

Google Fusion Tables

Grafiken, Diagramme und Karten erstellen. Schritt-für-Schritt-Anleitung von Lorenz Matzat anhand des Beispiels "Postfilialen in Berlin auf Karte eintragen" aus der taz-Webseite.

Google Refine

Eine freie Software, die Datensätze in Tabellen säubert,

OpenCalais

OpenCalais (Thomson Reuters) erkennt semantische Textbausteine und reichert sie mit Metadaten an. So lassen sich in riesigen blitzschnell zum Beispiel, Namen, Orts- oder Datumsangeben, Telefonnummer, Email-Adressen oder auch auffällige Worthäufungen heraussuchen und abgleichen. Funktioniert derzeit nur auf engl.

Page 42: Datenjournalismus Workshop am fjum

Weiterbildung, Initiativen und Ressourcen

Codeacademy Schritt-für-Schritt-Anleitungen (engl.) um JavaScript Basics zu lernen.

Data Driven Journalism Übersichtsportal des European Journalism Centre (EJC) mit einer Fülle von Ressourcen, weiterführenden Beiträgen und Beispielen.

Design Meets Data lose Gruppe von Journalisten, Programmierern, Webdesignern, etc., die sich alle 14 Tage in Berlin trifft.

Datenjournalismus Berlin Berliner Gruppe, die ca. alle 6 Wochen Treffen zum Thema Datenjournalismus mit wechselnden Schwerpunktthemen organisieren.

Hacks/Hackers Hacks/Hackers (Journalisten und Programmierer) treffen sich regelmäßig in 20 US-Städten, u.a. auch in London und Brüssel). "Survival" Glossar (engl.) zu datenjourn. Begriffen.

Open Data Network Netzwerk, das die Themen Open Government, Open Data, Transparenz und Partizipation auf die politische Agenda bringen will. Das Netzwerk veranstaltet Workshops und Barcamps und vermittelt Spezialisten für datenspezifische Projekte zu vermitteln. Open Government Data Austria Private Initiative, die mit Verwaltungen und Organisationen kooperiert.

Open Data Initiative Schweiz Unabhängige Initiative für offene DatenOpen Knowledge Foundation Bildungsveranstaltungen und Projekte zum Thema offenes Wissen, Veröffentlichungen http://okfn.org / http://okfn.de

forum journalismus und medien - neues Journalisten-Weiterbildungszentrum in Wien mit u.a. Schwerpunkt Datenjournalismus

Page 44: Datenjournalismus Workshop am fjum

Vielen Dank!