Lezione per giornalisti nell'ambito della formazione professionale continua presso L’Ordine dei Giornalisti e la Fondazione Giornalisti dell’Emilia-Romagna Bologna - Lunedì 9 giugno 2014
Data Journalism: strumenti operativi | Bologna, 9 giugno 2014
1. Mappature, infografiche e fact-checking
Andrea Nelson Mauro
@nelsonmau
www.dataninja.it
L’Ordine dei Giornalisti
e la Fondazione Giornalisti dell’Emilia-Romagna
, Lunedì 9 giugno 2014
2. Il sito di Dataninja con i nostri progetti principali
9. Una storia che viene da lontano
Il primo uso del computer a fini giornalistici risale al 1952 negli USA: nasce
il C.A.R. ( Computer Assisted Reporting
).
Nel 1967 Philip Meyer consacra questa pratica con un’inchiesta di
successo ( 1968: A Newspaper's Role Between the Riots
).
Nel 1973 Meyer stesso fonda il , coniugando
tecnologia e metodo scientifico ( Giornalismo e metodo scientifico
).
10. Il vecchio e caro giornalismo, ma con numeri e tabelle
Quest'anno hanno partecipato 520 progetti, ridotti a 75 dopo la prima
selezione (tre italiani): i vincitori finali saranno solo 8.
11. Ingredienti:
disponibilità di dati quantitativi (numeri o roba misurabile)
possibilità di processarli e analizzarli (viva i calcolatori)
metodo scientifico (mica per altro, è che funziona)
onestà intellettuale (anche nota come deontologia professionale)
fiuto per la notizia
competenze narrative (non solo l'italiano, ma anche forme e colori)
Da giornalisti, dobbiamo sempre raccontare storie...
... ormai sempre più basate su dati digitali!
12. Richiede competenze multi-disciplinari e quindi team di professionisti:
giornalista
data scientist / statistico
sviluppatore
designer / grafico
Porta facilmente a prodotti giornalistici di lunga vita o a temi su cui
tornare a più riprese.
Ci sono ampie libertà di riutilizzo e riciclo.
Il rilascio dei dati permette di attorno ad essi: non
solo giornalismo informativo, quindi, ma anche di servizio.
13. Richiede molta accortezza nell'uso degli strumenti statistici.
Si rischiano prodotti giornalistici “belli”, ma fini a se stessi.
Spesso è necessario imparare a usare software con curve di
apprendimento abbastanza ripide.
Gli strumenti e le piattaforme cambiano molto velocemente e bisogna
rimanere aggiornati.
Spesso si usano servizi di terze parti di cui non si ha il controllo.
14. Non c'è limite ai temi che si possono affrontare: sociale, politico,
scientifico, economico, sportivo, persino gossip...
La ricerca con metodo è un approccio tipico del giornalismo d'inchiesta,
ma si sposa bene anche con quello di cronaca, il reportage, persino
l'intervista...
Il racconto e la visualizzazione dei dati si esprimono al meglio su web, ma
possono essere molto efficaci anche sulla carta, nel foto e video
giornalismo, in tv e alla radio...
15. La teoria delle quattro fasi
Mi imbatto in un insieme di dati e sento il profumo di una possibile
notizia: li raccolgo, li analizzo, faccio delle ipotesi, le verifico...
.
Trovare > Pulire > Analizzare > Raccontare
16. Dove cercare e come capire di aver trovato
Tipo di dati:
non strutturati;
strutturati (con metadati).
Titolarità e diritti di riutilizzo:
open data ( opendefinition.org
);
copyright;
privacy, diritto all'oblio, segreto statistico, ...
Accesso ai dati:
Codice dell'Amministrazione Digitale, principio dell'Open Data by
Default (2013):
http://goo.gl/zmjbY7
FOIA? Non ancora...
http://goo.gl/T8LHXK
17. Dove cercare e come capire di aver trovato
Formato dei dati digitali:
Già utilizzabili, solo da pulire e controllare
Si possono usare Microsoft Excel e Libre Office Calc
Da estrarre con lo scraping
Per essere utili devono essere : non dobbiamo
leggerli noi, ma farli leggere ai computer!
L'arte dello scraping: DataMiner
, XPATH, applicazioni sviluppate ad hoc
con Python& Co.
18. E' il principale motore di ricerca italiano che raccoglie gli Open Data di
tutte le pubbliche amministrazioni del Paese (ottimo per ricercare singole
istituzioni e/o territori)
19. L'Istituto nazionale di statistica ha ampliato enormemente la frequenza di
pubblicazione dei dati. E' la principale fonte di informazione generalista
(ottima per ricerche tematiche).
20. Anche questo è un motore di ricerca, come dati.gov.it, ma contiene il
catalogo di open data non solo pubblici (efficace per chi cerca
informazioni non soltanto da istituzioni).
21. Ogni amministrazione pubblica ha il dovere per legge di pubblicare una
sezione "Amministrazione trasparente", all'interno della quale rilasciare i
propri dati delle attività dell'ente. Se cerchi i dati di un ente, vai sul suo sito
e cerca la sezione.
22.
23. Verificare, individuare errori, correggere
Premesse sbagliate portano (quasi) sempre a conclusioni sbagliate, anche
se il ragionamento è corretto.
Pure se affidabile, anche la fonte può sbagliare. Così come può barare,
truccare, mentire, nascondere, omettere, ecc.
Da controllare sempre prima di tutto:
coerenza interna,
completezza,
verosimiglianza.
Non buttar via mai niente e tenere traccia di quello che si fa...
24. Verificare, individuare errori, correggere
Strumenti dei fogli di calcolo (come Microsoft Excel, Libre Office Calc):
filtri e funzioni di ordinamento;
formattazione condizionale;
definizione esplicita dei tipi (stringa, numero, data, ...);
semplici grafici.
Si può fare con Microsoft Office o Libre Office Calc
Oppure con uno strumento ad hoc: Open Refine ( openrefine.org).
25. Alcuni spunti e tracce di lavoro
Dati sulla disoccupazione o sui costi dei servizi: quelli della
tua città/regione sono più alti o più bassi rispetto ad altri territori?
- Le fonti ufficiali tendono a concentrarsi su dati del quarto
trimestre. Il contesto e la prospettiva cambiano osservando dati che
mostrano lo sviluppo di un fenomeno negli ultimi 5 o 10 anni.
- Un'istituzione annuncia milioni di euro di investimenti per le
scuole. Ma hai fatto qualche conto? Quanti studenti potranno
beneficiarne, su quale periodo di tempo? Ricalcolare il valore pro capite di
programmi di investimento spesso può chiarire il reale significato.
- Prova ad eseguire semplici controlli di
somme e totali. Verifica le modalità con le quali i dati sono stati raccolti e
con quali ipotesi o modelli. Qual è il tasso di disoccupazione nel tuo
paese? Controllalo e confrontalo con altri paesi o modelli alternativi.
26. Principali strumenti visualizzazione:
grafici base (linee, barre, torte):
http://datawrapper.it
mappe geografiche:
http://cartodb.com
grafici gerarchici:
http://raw.densitydesign.org/
grafi (detti anche reti):
http://gephi.org
timeline:
http://timeline.knightlab.com/
Ma on line ci sono tantissimi altri strumenti: l'importante è avere chiaro il
proprio obiettivo e non avere paura di sperimentare!
27. Con Datawrapper è possibile realizzare grafici interattivi in pochi minuti
(grafici a barre, torte, istogrammi, grafici a linee, e qualche mappa)
28. CartoDB permette di creare mappe interattive in pochi istanti.
L'importante è che la tua tabella abbia dei dati geografici.
29. RAW permette di gestire bene le relazioni tra i dati e la loro gerarchia. E'
facile da usare provando gli esempi già presenti (esempio di quali
ingredienti sono fatti i cocktail?).
30. Costruire una cronistoria degli eventi può essere molto utile. Si può fare
con Timeline.JS, ad esempio inserendo in una tabella vari articoli in
successione temporale (guarda la timeline del terremoto in Emilia).
31. Quali sono le relazioni tra i dati? E' possibile visualizzarle con GEPHI, un
software di Networl Analysis (basato sui grafi). E' spesso usato per vedere
le connessioni tra gli utenti su Twitter o le amicizie su Facebook.
32. Spesso visualizzare i dati può aiutarci a "scoprire" delle notizie
Quanto è grande la differenza del tasso di disoccupazione tra due o più
territori? Com'è cambiato un fenomeno nel tempo?
Visualizzare questi dati può aiutarci a comprendere in maniera più
immediata un fenomeno e fare prendere al nostro lavoro giornalistico
un'altra direzione: torniamo indietro, cerchiamo altri dati, li mettiamo a
confronto.
33. Verificare le informazioni in maniera approfondita (comunicati stampa,
dichiarazioni dei politici). Si sta diffondendo enormemente in relazione
all'aumento della quantità di informazioni disponibili sul web.
34. Le best practices del Data Journalism prevedono che insieme alle
inchieste vengano pubblicati i dati relativi, per permettere di verificare le
visualizzazioni e i risultati. Noi abbiamo costruito dati.dataninja.it
35. Ma anche no...
La distinzione tra e non ha
senso di esistere... ma è servita a delineare un e a
definire una comunità di professionisti, ora riconosciuta.
Gli strumenti, le tecniche e le metodologie del giornalismo sono ormai
in ogni redazione che si ponga l'obiettivo di affrontare il
racconto della nostra realtà usando tutti i dati e le informazioni oggi
disponibili.
Sicuramente l'analisi dati e la di notizie richiedono un'approccio
metodologico lontano dal giornalismo d'opinione (non a caso il data
journalism è un termine anglosassone).