Am 18.11.2011 habe ich gemeinsam mit Zeit Online Entwicklungsredakteur Sascha Venohr ein Übersichtsseminar zum Thema Datenjournalismus mit praktischen Übungen gegeben. (Veranstalter: fjum Wien und Schweizer MAZ). Dies sind die Folien dazu.
5. Der Prototyp des Datenjournalismus: Everyblock
eine vielseitig recherchierbare, immer neu gefütterte Datenbank
alt
mit Community-Funktionen
neu
Projekt des Progammierer-Journalisten Adrian Holovaty,
hervorgegangen aus der Seite chicagocrime.org
7. „Can you do something with this data? Please post us your
visualisations and mash-ups below or mail us at
datastore@guardian.co.uk“
Der Guardian bereitete im
Frühjahr 2009 die gesamten
verfügbaren Daten zum
Spesenskandal der britischen
Unterhaus-Abgeordneten
(Wer hat welche
Steuernachlässe in Anspruch
genommen? Wer hat sie
zurückgezahlt? Wer nicht?)
- interaktive Darstellungsform
- kollaborativer Charakter des
Projekts (Crowdsourcing)
- ständige Fortschrittsberichte
-Abschlusspräsentation
MP‘s expenses: All the revelations as a spreadsheet (Guardian)
14. Olympic Musical
Es muss nicht
immer eine
Visualisierung
sein.
Die NYT
veranschaulicht die
minimalen Ergebnis-
unterschiede im
Spitzensport
mit akustischen
Effekten
15. “Data Porn” - überfrachtete, unverständliche Grafik
Quelle:
Washington Post
16. Der Westen: Verbindung von Datenjournalismus und
Crowdsourcing über ein anonymes
Informantenportal (Upload-Portal)
19. nahraum.de - „das lokale Foto-Gedächtnis einer Region“
Projekt der „Ruhrnachrichten,
Medienhaus Lensing,
Ost-Ruhrgebiet, West-
Münsterland
Zugänge zum Fotoportal über
Startseite, lokale Suche,
Verschlagwortung von möglichst
vielen Texten der Lokalausgaben
ein regionales + lokales flickr
Start: 11.11.2009
Stand nach 6 Monaten: 1.700
Nutzerkonten, rund 50.000
hochgeladene Bilder
in 4/10: 2,7 Mio PIs.
Tendenz steigend
Dienstleister:
wissenmedia (Bertelsmann)
21. Der transparente Bundeshaushalt - lässt sich auf
kommunale Haushalte übertragen
http://bund.offenerhaushalt.de/ von Tactical Tools
22. • Jeder Klick auf einen Haushaltsposten bringt eine weitere
Aufschlüsselung der Gelder.
• 1200 Seiten Papierinformationen mit rund 7000 Posten,
die sich in weitere anklickbare Unterposten gliedern.
• Die Zahlen werden zu jedem Posten auch auf einer
Zeitleiste von 2003 bis 2011 dargestellt – einige Zahlen
erst ab 2005.
• Jeder Haushaltsposten hat eine eigene Internetadresse
und kann mit Artikeln oder einer Online-Diskussion
verlinkt werden.
• weitere Haushalte für Länder
und Kommunen unter
und
Subdomains sollen folgen.
mehr dazu bei: kooptech
24. OWNI - Où je vote?
- Projekt zu den französischen Regionalwahlen im Frühjahr 2010
- Applikation, die Nutzern zeigt, in welchem Wahllokal sie am Wahltag wählen können.
- erstes Crowdsourcing-Experiment von OWNI: Nutzer tippten eingescannte Dokumente ab, damit
sie computerlesbar wurden
- zum Wahltag war die Facebook App fertig, funktionierte aber mangels genügend valider Daten nicht
perfekt
25. Frankfurt Gestalten
Basis Open Street Map
lokalisiert lokalpolitische
Entscheidungen, Anträge,
Bürgerbegehren etc. auf
einer Karte
deckt alle 42 Stadtteile
von Frankfurt ab
sechsköpfiges Designer-
und Entwicklerteam
Projekt der
Open Knowledge
Foundation
Christian Kreutz (Politologe, Initiator): "Inspiriert von Projekten in anderen Ländern kam mir die Idee eines Tages als ich im
Ortsbeirat saß. Wie wäre es wenn sich Bürger direkt über das Internet vernetzen und Ideen zur Stadtgestaltung austauschen."
28. Bürger kreieren über eine
offene Schnittstelle
Anwendungen aus den
Datensätzen und stellen sie der
Allgemeinheit zur Verfügung
29. ortsbasierte Informationen über soziale Netzwerke
anbieten (Twitter, Facebook, Foursquare etc.)
Foursquare-Nutzer können Restaurant- und
Freizeittipps der „National Post“ (Toronto) in
ihre To-Do-Liste übernehmen
31. Visualisierung der
internationalen Waffenausgaben
(im Verhältnis zum jeweiligen Bruttosozialprodukt)
• Werkzeuge:
• Google Spreadsheet (Datenaufbereitung alternativ
auch mit anderen Tabellenkalkulationen, z.B. MS
Excel)
• Google Fusion Table
• Datensatz:
• SIPRI Military Expenditure Database
(kompletter Datensatz im Excel-Format zu Semi-
n narzwecken bereits als öffentliches Google-Doc)
32. Schrittweises Vorgehen:
1. Über diesen Link wird der Komplett-Datensatz als Google-Spreadsheet geöffnet.
2. Da dieses Dokument schreibgeschützt ist, erstellen wir eine Arbeitskopie.
(Menüpunkt Datei > Kopie erstellen)
3. Wir wählen das Tabellenblatt „Share of
GDB“ aus. In diesem Datensatz wird
dargestellt, wieviel Prozent des jährlichen
Bruttosozialprodukts auf den Wehretat
entfallen sind. Diese Prozentwerte
ermöglichen eine Vergleichbarkeit der
Länder im Hinblick auf die Intensität der
Rüstungsbestrebungen.
4. Damit wir mit Säubern der Daten
beginnen können, müssen wir zunächst
die Fixierung der Kopfzeilen entfernen.
Hierzu greifen wir ganz links auf Höhe
der Tabellenüberschriften das kleine
blaue Element und ziehen es ganz nach
oben aus dem Dokument heraus [s. Abb.].
33. 5. Nun können die Zeilen 1-5, die nur textliche Informationen über den Datensatz
enthalten, gelöscht werden (Zeilen markieren und über Menüpunkt Bearbeit „Zeilen1-5
löschen“).
6. Gleiches wird nun zeilenweise bei Zwischenüberschriften oder dort angewendet, wo
in den Ländern keine Daten vorhanden sind (bspw. German DR).
7. Da wir aus Aktualitätsgründen auf die Werte ab Jahr 2000 aufwärts beschränken
wollen, werden nun die Spalten mit den älteren Jahreszahlen gelöscht. Dazu werden
diese ebenfalls markiert und über den Menüpunkt Bearbeiten > „Spalten F-M löschen“
entfernt.
8. Da Waffenausgaben ihre Wirkung über einen längeren Zeitraum entfalten, wollen wir
nun für die zu betrachtenden Jahre einen Durchschnittswert berechnen. Hierzu
benötigen wir ganz rechts eine zusätzliche Spalte. Hierzu gehen wir in Spalte 2009 gehen
über das Menü über Einfügen > Spalte rechts. Diese neue Spalte nennen wir „Formel-
Durchschnitt“.
34. 9. Wir gehen in die Zeile des ersten
Landes und fügen in die neue Spalte
unsere Formel ein, mit der wir aus
den Jahren 2000 bis 2009 den durch-
schnittlichen Anteil am Bruttosozial-
produkt der Wehrausgaben berechnen
wollen. Hier bedienen wir uns der
Funktion „Average“. Und wählen den
Zellraum aus, in unserem Fall die Zellen
B1:K7. Unsere konkrete Formel
=AVERAGE(B2:K2) [s. Abb.].
Wir fassen die Zelle mit der Formel mit gedrückter Maustaste im rechten Eck
und ziehen diese komplett in der Spalte nach unten. Dadurch wird die Formel
für alle weiteren Zeilen automatisch transponiert.
10. Um die damit berechneten Durchschnittswerte von der Formel zu
entkoppeln, fügen wir eine zusätzliche Spalte ganz rechts ein (Menü Einfügen >
Spalte rechts).
11. Nachdem wir die komplette Spalte „Formel Durchschnitt“ markiert und in
die Zwischenablage kopiert haben, springen wir in die neue rechte Spalte in
die erste Zelle und gehen über Menü Bearbeiten > Inhalte einfügen > Nur
Werte einfügen. Die neue Spalte nennen wir der Einfachheit halber
„Durchschnitt“.
35. 12. Nun können wir abschließend die Jahresspalten und die nur zur Berechnung notwendige
Spalte „Formel Durchschnitt“ löschen (Spalten markieren und über Bearbeiten > Spalten B-L
löschen).
13. Wir haben nun eine
aufgeräumte und einfache
Datengrundlage, mit einer
Spalte für den Ländernamen
und einer Spalte mit dem
durchschnittlichen prozen-
tualen Anteil am Bruttosozial-
produkt, den diese in den
Jahren 2000-2009 aufgewendet
haben. Diese Daten expor-
tieren wir zunächst als CSV-
Datei. Hierzu gehen wir auf
Datei > Herunterladen als
> CSV (aktuelles Tabellenblatt)
und speichern die Datei lokal.
[s. Abb.]
36. 14. Nun wollen wir unseren verschlankten Datensatz auf einer Weltkarte visualisieren.
Hierzu wollen wir das kostenlose Tool Google Fusion Tables verwenden. Wir springen in die
Übersicht „Text & Tabellen“ bei GoogleDocs. Im Menü „Erstellen“ wählen wir den Eintrag
„Tabellen (Beta)“ aus. Im ersten Dialogpunkt besteht die Möglichkeit, unsere lokal
gespeicherte CSV-Datei über „Durchsuchen“ auszuwählen.Vor dem Hochladen akzeptieren
wir die vorgeschlagenen Einstellungen auf „Comma“ und „UTF-8“. Durch zweimaliges
Klicken auf „Next“ importieren wir diese neue Tabelle in Fusion Tables. Bevor der Vorgang
abgeschlossen wird, können wir der Tabelle einen neuen aussagekräftigen Titel im oberen
Feld vergeben.
15. Fusion Tables bietet nun
eine einfache Möglichkeit,
auf Basis von Ländernamen
eine Geocodierung vorzu-
nehmen. Diese Funktion
finden wir unter File >
Geocode. [s. Abb.] Im folgen-
den Dialog bestätigen wir das
vorausgewählte Feld
„Country“ und stoßen das
automatische Matching an.
Nach dem 100% erreicht
sind, schließen wir den
Dialog durch Klicken auf
das X rechts oben.
37. 16. Nun sind wir kurz vorm Ziel. Über das Menü Visualize > Intensity Map überträgt Fusion
Tables die Werte auf eine Weltkarte und färbt die Länder in Abstufungen automatisch ein.Voilà:
39. Google Spreadsheets
Grundlagentool. Cloudbasiertes Pendant zu Microsofts
Tabellenkalkulationsprogramm Excel. Links zu drei Tutorials (engl.).
Google Fusion Tables
Grafiken, Diagramme und Karten erstellen. Schritt-für-Schritt-
Anleitung von Lorenz Matzat anhand des Beispiels "Postfilialen in
Berlin auf Karte eintragen" aus der taz-Webseite.
Google Refine
Eine freie Software, die Datensätze in Tabellen säubert,
OpenCalais
OpenCalais (Thomson Reuters) erkennt semantische Textbausteine
und reichert sie mit Metadaten an. So lassen sich in riesigen
blitzschnell zum Beispiel, Namen, Orts- oder Datumsangeben,
Telefonnummer, Email-Adressen oder auch auffällige Worthäufungen
heraussuchen und abgleichen. Funktioniert derzeit nur auf engl.
40. Document Cloud
Ein Werkzeug zum gemeinsamen Bearbeiten,
Analysieren,Verfeinern und Veröffentlichen von
Datensätzen in der Datenwolke (nur engl.).
Many Eyes
Ein von IBM Research entwickeltes freies Tool zum
Visualisieren von Daten in interaktiven Grafiken
oder Kartensätzen. Schritt-für-Schritt-Anleitung
von Datenjournalist Lorenz Matzat.
Open Tableau
Datenvisualisierungs-Software
41. Yahoo Pipes
Mit Yahoo Pipes kann man Blogs, Twitterfeeds, etc. filtern und
automatisiert einlaufen lassen. Tutorial von Lorenz Matzat
Scraper Wiki
Scraper Wiki vernetzt Programmierer mit Auftraggebern.
Wordle
Einfach zu nutzendes Werkzeug zum Visualisieren von
Worthäufigkeiten in Texten. Selbst erstellte Wordles dürfen auch
kommerziell genutzt werden.
Weitere Werkzeuge:
10 tools that can help data journalists do better work, be more efficient (Poynter)
42. Weiterbildung, Initiativen und Ressourcen
Codeacademy Schritt-für-Schritt-Anleitungen (engl.) um JavaScript Basics zu lernen.
Data Driven Journalism Übersichtsportal des European Journalism Centre (EJC) mit einer
Fülle von Ressourcen, weiterführenden Beiträgen und Beispielen.
Design Meets Data lose Gruppe von Journalisten, Programmierern, Webdesignern, etc., die
sich alle 14 Tage in Berlin trifft.
Datenjournalismus Berlin Berliner Gruppe, die ca. alle 6 Wochen Treffen zum Thema
Datenjournalismus mit wechselnden Schwerpunktthemen organisieren.
Hacks/Hackers Hacks/Hackers (Journalisten und Programmierer) treffen sich regelmäßig in 20
US-Städten, u.a. auch in London und Brüssel). "Survival" Glossar (engl.) zu datenjourn. Begriffen.
Open Data Network Netzwerk, das die Themen Open Government, Open Data, Transparenz
und Partizipation auf die politische Agenda bringen will. Das Netzwerk veranstaltet Workshops
und Barcamps und vermittelt Spezialisten für datenspezifische Projekte zu vermitteln.
Open Government Data Austria Private Initiative, die mit Verwaltungen und
Organisationen kooperiert.
Open Data Initiative Schweiz Unabhängige Initiative für offene Daten
Open Knowledge Foundation Bildungsveranstaltungen und Projekte zum Thema offenes
Wissen,Veröffentlichungen http://okfn.org / http://okfn.de
forum journalismus und medien - neues Journalisten-Weiterbildungszentrum in Wien mit
u.a. Schwerpunkt Datenjournalismus
43. kollaboratives
Projekt, das im
Nov. 2011 auf
dem Mozilla
Festival in
London gestartet
wurde.
Das Buch
entsteht auf der
Google Docs
Platform unter
einer cc-Lizenz.
Link