SlideShare a Scribd company logo
1 of 106
Download to read offline
data driven journalism

      i primi passi
               Elisabetta Tola
          iData - fondazione ahref
               formicablu srl


                 Guido Romeo
          iData - fondazione ahref
                  Wired IT


  II ed. Summer School ahref-IULM, 27.08.12
1. cosa succede in giro per il
mondo
2. cosa succede in Italia
3. perché fare ddj
4. un processo a step
5. primi tools del data
journalist
6. le fonti
7. get your hands on those data
– think in xls
http://datajournalism.stanford.edu/
cosa succede in giro per
        il mondo
http://www.guardian.co.uk/news/datablog
http://www.guardian.co.uk/news/datablog
http://www.nytimes.com/2012/01/15/business/the-1-percent-paint-a-more-nuanced-portrait-of-the-rich.html?_r=1&ref=business

http://www.nytimes.com/interactive/2012/01/15/business/one-percent-map.html
http://www.nytimes.com/interactive/2012/05/13/business/student-debt-at-colleges-and-universities.html?ref=multimedia
http://www.baycitizen.org/data/bike-accidents/
L’inchiesta Dollars for docs
http://projects.propublica.org/docdollars/
2011: i dati vincono il
       Pulitzer



                                                Paige St. John




http://www.heraldtribune.com/article/20110418/BREAKING/110419506
http://cf.htcreative.com/insurance2/insuranceriskhome.html
cosa succede in Italia
http://openspending.org/
http://www.transcrime.unitn.it/tc/1.php
http://www.corriere.it/cronache/speciali/2011/mafiopoli/
http://danielebelleri.altervista.org/mappamilano2012.html
Audizione del Presidente dell’Istat Enrico
Giovannini alla Commissione Territorio, Ambiente e Beni
ambientali del Senato
http://www.focus.it/scienza/salute/la-guida-ai-migliori-ospedali-ditalia_52321_C12.aspx
http://www.toxiceurope.eu/index.html
http://www.ahref.eu/it
http://datablog.ahref.eu/i-numeri-della-scuola-1-2013-lavorare-con-i-dati-della-scuola
http://datablog.ahref.eu/
perché fare ddj

 È uno strumento per raccontare
storie complesse da tanti punti di
vista

 É uno strumento collaborativo

 Rende trasparente il processo di
costruzione della storia

 Trasforma un racconto astratto in
un quadro comprensibile e spesso
direttamente correlato al lettore

 É un giornalismo di precisione,
che applica un metodo scientifico

 Genera storie nuove e correlate a
livello globale e locale

 Sviluppa nuove competenze e dà
nuove opportunità

 Valorizza la rete

 È un equalizer: non dipende dalla
lingua
un processo a step

ma si parte comunque dalle
          domande
EJC - Mirko Lorenz
Il bugiardino
I dati raramente arrivano
puliti e pronti all'uso

Spesso sono in formato non
prontamente utilizzabile (.pdf,
flash!)e vanno estratti
I dati raccolti per fini
  burocratici sono organizzati
diversamente da quelli utili per
       fini giornalistici
 (meno precisione, molti codici
         incomprensibili)

     leggere sempre le note
        metodologiche!!!

attenti ai confronti(es. dati sui
    crimini in diversi paesi)
Nel data j contano più la
reputazione e l'affidabilità che
       non la velocità di
         pubblicazione!

Un buon lavoro di data j genera
molto traffico su un sito e non
   muore a breve termine (più
        storie nel tempo)
i primi tools
del data journalist
raccogliere i numeri
  organizzare i dati

       excel
google spreadsheet
     libre calc
    access, SQL
         R
   SPSS o Stata
pulire i dati - Google Refine
   prime analisi e viz – Google
  Fusion Tables – Google charts
      mappe – BatchGeo, QGis
altri strumenti semplici di data
      viz: ManyEyes, Tableau
le fonti di dati

  incrociare più fonti
   e verificare i dati
         SEMPRE
(la preziosa lista degli
     esperti-amici!)
Comuni, Province, Regioni:
servizi statistici, osservatori

      Siti dei Ministeri

     Istat: dati.istat.it

  dati.gov.it e vari portali
           opendata
Grandi aziende:ENEL,INPS
     http://data.enel.com/

    Camere di commercio: a
           pagamento

     OKFN,SOD e Linked Open
Data,GlobalLeaks,Scraper wiki

ONG: legambiente, associazioni
consumatori, cittadinanzattiva,
              etc
Altri siti di news e alcuni
     blog (dati grezzi resi
disponibili per riuso – eg. EU
     structural funds – eg.
    http://fortresseurope.blogspot.it/)


 Sindacati e associazioni di
    categoria: vari report
Università e istituti di
           ricerca

Organizzazioni internazionali:
OECD, UNICEF, FAO, World Bank,
   etc (eg. OECD e FAO sulla
      produzione di grano)
Saper cercare

 1. cercare con più parole chiave
  (beware: termini burocratici e
              tecnici)
     2. specificare il formato:
     filetype:xls, filetype:csv
3. limitare la ricerca a un sito:
    site:dati.emilia-romagna.it
   4. usare search site o plugin
               simile
Le info al contorno

1. whois.domaintools.com – chi ha
  registrato un sito, varie info
    2. the wayback machine – le
           vecchie pagine
 3. TinEye – ritrovare l'origine
          di una immagine
E con i dati che faccio?

    1. salvare sempre il file
originale, lavorare su una copia
2. fare screenshot delle pagine
    3. tenere diario di bordo
     4. non usare i dati per
 confermare visioni preconcette
 5. accettare dati non completi
Quando i dati non sono online?

1. richiedere i dati (no tel)
2. parlare con la persona
responsabile dei dati
3. informare sulla
pubblicazione: può facilitare
rilascio altri dati
4. lanciare raccolta dati in
crowdsourcing
5. conoscere bene il FOIA e le
sue applicazioni
The investigation is a story:
la storia della costruzione del
   puzzle è un buon pezzo di
  giornalismo (soprattutto se
qualcuno mette i bastoni tra le
             ruote)

 Le domande valide sono sempre
  le stesse: i dati sono una
     sorte di fonte 'viva'
http://datajournalismhandbook.org/
Altre ref


    Hacks/Hackers

    Ahref Datablog

    datajournalism.it
grazie!

eli@formicablu.it

@elisabetta_tola
data driven journalism

      i primi passi
               Elisabetta Tola
          iData - fondazione ahref
               formicablu srl


                 Guido Romeo
          iData - fondazione ahref
                  Wired IT


  II ed. Summer School ahref-IULM, 27.08.12
1. cosa succede in giro per il
mondo
2. cosa succede in Italia
3. perché fare ddj
4. un processo a step
5. primi tools del data
journalist
6. le fonti
7. get your hands on those data
– think in xls
cosa succede in giro per
        il mondo
http://www.guardian.co.uk/news/datablog
http://www.guardian.co.uk/news/datablog
http://www.nytimes.com/2012/01/15/business/the-1-percent-paint-a-more-nuanced-portrait-of-the-rich.html?_r=1&ref=business

http://www.nytimes.com/interactive/2012/01/15/business/one-percent-map.html
http://www.baycitizen.org/data/bike-accidents/
L’inchiesta Dollars for docs
http://projects.propublica.org/docdollars/
2011: i dati vincono il
        Pulitzer



                                                Paige St. John




http://www.heraldtribune.com/article/20110418/BREAKING/110419506
http://cf.htcreative.com/insurance2/insuranceriskhome.html
cosa succede in Italia
http://openspending.org/
http://www.transcrime.unitn.it/tc/1.php
http://www.corriere.it/cronache/speciali/2011/mafiopoli/
http://danielebelleri.altervista.org/mappamilano2012.html
Audizione del Presidente dell’Istat Enrico
Giovannini alla Commissione Territorio, Ambiente e Beni
ambientali del Senato
http://www.ahref.eu/it
http://datablog.ahref.eu/i-numeri-della-scuola-1-2013-lavorare-con-i-dati-della-scuola
http://datablog.ahref.eu/
un processo a step

ma si parte comunque dalle
          domande
EJC - Mirko Lorenz
Il bugiardino
I dati raramente arrivano
puliti e pronti all'uso

Spesso sono in formato non
prontamente utilizzabile (.pdf,
flash!)e vanno estratti
I dati raccolti per fini
  burocratici sono organizzati
diversamente da quelli utili per
       fini giornalistici
 (meno precisione, molti codici
        incomprensibili)

     leggere sempre le note
        metodologiche!!!

attenti ai confronti(es. dati sui
    crimini in diversi paesi)
Nel data j contano più la
reputazione e l'affidabilità che
       non la velocità di
         pubblicazione!

Un buon lavoro di data j genera
molto traffico su un sito e non
   muore a breve termine (più
       storie nel tempo)
raccogliere i numeri
 organizzare i dati

       excel
google spreadsheet
    libre calc
   access, SQL
         R
   SPSS o Stata
pulire i dati - Google Refine
   prime analisi e viz – Google
  Fusion Tables – Google charts
      mappe – BatchGeo, QGis
altri strumenti semplici di data
      viz: ManyEyes, Tableau
grazie!

eli@formicablu.it

@elisabetta_tola

More Related Content

Similar to Data driven journalism - I primi passi

Dandelion API e Atoka: due strumenti utili al Data Journalism
Dandelion API e Atoka: due strumenti utili al Data JournalismDandelion API e Atoka: due strumenti utili al Data Journalism
Dandelion API e Atoka: due strumenti utili al Data JournalismSpazioDati
 
La visualizzazione dei Big Data: opportunità e sfide - di Stefano De Francisci
La visualizzazione dei Big Data: opportunità e sfide - di Stefano De FrancisciLa visualizzazione dei Big Data: opportunità e sfide - di Stefano De Francisci
La visualizzazione dei Big Data: opportunità e sfide - di Stefano De FrancisciIstituto nazionale di statistica
 
02_dietro le quinte delle inchieste data j
02_dietro le quinte delle inchieste data j02_dietro le quinte delle inchieste data j
02_dietro le quinte delle inchieste data jElisabetta Tola
 
Economia dei Dati Liberati - Open Data e Semantic Web nella PA
Economia dei Dati Liberati - Open Data e Semantic Web nella PAEconomia dei Dati Liberati - Open Data e Semantic Web nella PA
Economia dei Dati Liberati - Open Data e Semantic Web nella PAMatteo Brunati
 
Open data e Data journalism
Open data e Data journalismOpen data e Data journalism
Open data e Data journalismElisabetta Tola
 
2019 11 13 Secondo raduno RTD - Open Data sul serio
2019 11 13 Secondo raduno RTD - Open Data  sul serio2019 11 13 Secondo raduno RTD - Open Data  sul serio
2019 11 13 Secondo raduno RTD - Open Data sul serioDaniele Crespi
 
Open Data: cosa sono, come funzionano e quali già a disposizione in Italia
Open Data: cosa sono, come funzionano e quali già a disposizione in ItaliaOpen Data: cosa sono, come funzionano e quali già a disposizione in Italia
Open Data: cosa sono, come funzionano e quali già a disposizione in ItaliaVincenzo Patruno
 
Data journalism e Coesione Sociale
Data journalism e Coesione SocialeData journalism e Coesione Sociale
Data journalism e Coesione SocialeDaniele Frongia
 
School of data Trento: basic spreadsheet
School of data Trento: basic spreadsheetSchool of data Trento: basic spreadsheet
School of data Trento: basic spreadsheetCristian Consonni
 
15.09.08 ODTCorsoTN+BZ+Regione
15.09.08 ODTCorsoTN+BZ+Regione15.09.08 ODTCorsoTN+BZ+Regione
15.09.08 ODTCorsoTN+BZ+RegioneFrancesca Gleria
 
Smau Roma 2013 Morena Ragone
Smau Roma 2013 Morena RagoneSmau Roma 2013 Morena Ragone
Smau Roma 2013 Morena RagoneSMAU
 
I dati geografici come punto di partenza per una strategia open data
I dati geografici come punto di partenza per una strategia open data I dati geografici come punto di partenza per una strategia open data
I dati geografici come punto di partenza per una strategia open data Maurizio Napolitano
 
I dati geografici come punto di partenza per una strategia open data - Mauriz...
I dati geografici come punto di partenza per una strategia open data - Mauriz...I dati geografici come punto di partenza per una strategia open data - Mauriz...
I dati geografici come punto di partenza per una strategia open data - Mauriz...OpenGeoDataItalia
 
Apps4Italy, il contest italiano sugli Open Data
Apps4Italy, il contest italiano sugli Open DataApps4Italy, il contest italiano sugli Open Data
Apps4Italy, il contest italiano sugli Open DataVincenzo Patruno
 
Focus Group Open Source 25.1.2012 Federico Morando
Focus Group Open Source 25.1.2012 Federico MorandoFocus Group Open Source 25.1.2012 Federico Morando
Focus Group Open Source 25.1.2012 Federico MorandoRoberto Galoppini
 
Verso una Spatial Data Science Seminario 29-11-2017
Verso una Spatial Data Science Seminario 29-11-2017Verso una Spatial Data Science Seminario 29-11-2017
Verso una Spatial Data Science Seminario 29-11-2017Giuliana Bonello
 

Similar to Data driven journalism - I primi passi (20)

Dandelion API e Atoka: due strumenti utili al Data Journalism
Dandelion API e Atoka: due strumenti utili al Data JournalismDandelion API e Atoka: due strumenti utili al Data Journalism
Dandelion API e Atoka: due strumenti utili al Data Journalism
 
La visualizzazione dei Big Data: opportunità e sfide - di Stefano De Francisci
La visualizzazione dei Big Data: opportunità e sfide - di Stefano De FrancisciLa visualizzazione dei Big Data: opportunità e sfide - di Stefano De Francisci
La visualizzazione dei Big Data: opportunità e sfide - di Stefano De Francisci
 
02_dietro le quinte delle inchieste data j
02_dietro le quinte delle inchieste data j02_dietro le quinte delle inchieste data j
02_dietro le quinte delle inchieste data j
 
Economia dei Dati Liberati - Open Data e Semantic Web nella PA
Economia dei Dati Liberati - Open Data e Semantic Web nella PAEconomia dei Dati Liberati - Open Data e Semantic Web nella PA
Economia dei Dati Liberati - Open Data e Semantic Web nella PA
 
Open data e Data journalism
Open data e Data journalismOpen data e Data journalism
Open data e Data journalism
 
sisvsp2012_sessione5 tola_romeo
sisvsp2012_sessione5 tola_romeosisvsp2012_sessione5 tola_romeo
sisvsp2012_sessione5 tola_romeo
 
2019 11 13 Secondo raduno RTD - Open Data sul serio
2019 11 13 Secondo raduno RTD - Open Data  sul serio2019 11 13 Secondo raduno RTD - Open Data  sul serio
2019 11 13 Secondo raduno RTD - Open Data sul serio
 
Open Data: cosa sono, come funzionano e quali già a disposizione in Italia
Open Data: cosa sono, come funzionano e quali già a disposizione in ItaliaOpen Data: cosa sono, come funzionano e quali già a disposizione in Italia
Open Data: cosa sono, come funzionano e quali già a disposizione in Italia
 
Data journalism e Coesione Sociale
Data journalism e Coesione SocialeData journalism e Coesione Sociale
Data journalism e Coesione Sociale
 
School of data Trento: basic spreadsheet
School of data Trento: basic spreadsheetSchool of data Trento: basic spreadsheet
School of data Trento: basic spreadsheet
 
15.09.08 ODTCorsoTN+BZ+Regione
15.09.08 ODTCorsoTN+BZ+Regione15.09.08 ODTCorsoTN+BZ+Regione
15.09.08 ODTCorsoTN+BZ+Regione
 
FANTIN BIG DATA (1)
FANTIN BIG DATA (1)FANTIN BIG DATA (1)
FANTIN BIG DATA (1)
 
Smau Roma 2013 Morena Ragone
Smau Roma 2013 Morena RagoneSmau Roma 2013 Morena Ragone
Smau Roma 2013 Morena Ragone
 
I luoghi degli "open data"
I luoghi degli "open data"I luoghi degli "open data"
I luoghi degli "open data"
 
I dati geografici come punto di partenza per una strategia open data
I dati geografici come punto di partenza per una strategia open data I dati geografici come punto di partenza per una strategia open data
I dati geografici come punto di partenza per una strategia open data
 
I dati geografici come punto di partenza per una strategia open data - Mauriz...
I dati geografici come punto di partenza per una strategia open data - Mauriz...I dati geografici come punto di partenza per una strategia open data - Mauriz...
I dati geografici come punto di partenza per una strategia open data - Mauriz...
 
Italia open data
Italia open dataItalia open data
Italia open data
 
Apps4Italy, il contest italiano sugli Open Data
Apps4Italy, il contest italiano sugli Open DataApps4Italy, il contest italiano sugli Open Data
Apps4Italy, il contest italiano sugli Open Data
 
Focus Group Open Source 25.1.2012 Federico Morando
Focus Group Open Source 25.1.2012 Federico MorandoFocus Group Open Source 25.1.2012 Federico Morando
Focus Group Open Source 25.1.2012 Federico Morando
 
Verso una Spatial Data Science Seminario 29-11-2017
Verso una Spatial Data Science Seminario 29-11-2017Verso una Spatial Data Science Seminario 29-11-2017
Verso una Spatial Data Science Seminario 29-11-2017
 

More from Elisabetta Tola

Taller tola jornadas (1)
Taller tola jornadas (1)Taller tola jornadas (1)
Taller tola jornadas (1)Elisabetta Tola
 
III Jornadas periodismo de datos - ponencia Elisabetta Tola
III Jornadas periodismo de datos - ponencia Elisabetta TolaIII Jornadas periodismo de datos - ponencia Elisabetta Tola
III Jornadas periodismo de datos - ponencia Elisabetta TolaElisabetta Tola
 
Dataschool_SISSA - dati, licenze, risorse, tools
Dataschool_SISSA - dati, licenze, risorse, toolsDataschool_SISSA - dati, licenze, risorse, tools
Dataschool_SISSA - dati, licenze, risorse, toolsElisabetta Tola
 
#safeschools, open data and right to access info - an italian case
#safeschools, open data and right to access info - an italian case#safeschools, open data and right to access info - an italian case
#safeschools, open data and right to access info - an italian caseElisabetta Tola
 
03_opendata e diritto di accesso
03_opendata e diritto di accesso03_opendata e diritto di accesso
03_opendata e diritto di accessoElisabetta Tola
 
01_introduzione_summerschool_dataj
01_introduzione_summerschool_dataj01_introduzione_summerschool_dataj
01_introduzione_summerschool_datajElisabetta Tola
 
Opendata and journalism - parte II
Opendata and journalism - parte IIOpendata and journalism - parte II
Opendata and journalism - parte IIElisabetta Tola
 
Opendata&journalism - parte I
Opendata&journalism - parte IOpendata&journalism - parte I
Opendata&journalism - parte IElisabetta Tola
 
OddIT Bologna, Urban center
OddIT Bologna, Urban centerOddIT Bologna, Urban center
OddIT Bologna, Urban centerElisabetta Tola
 
opendata&dataj @spaghetti_folks
opendata&dataj @spaghetti_folksopendata&dataj @spaghetti_folks
opendata&dataj @spaghetti_folksElisabetta Tola
 
quando il dataset non c'è: #scuolesicure, backstage dell'inchiesta
quando il dataset non c'è: #scuolesicure, backstage dell'inchiestaquando il dataset non c'è: #scuolesicure, backstage dell'inchiesta
quando il dataset non c'è: #scuolesicure, backstage dell'inchiestaElisabetta Tola
 
On air - radio e podcast - Barcelona
On air - radio e podcast - BarcelonaOn air - radio e podcast - Barcelona
On air - radio e podcast - BarcelonaElisabetta Tola
 
Comunicazione e apprendimento digitale
Comunicazione e apprendimento digitaleComunicazione e apprendimento digitale
Comunicazione e apprendimento digitaleElisabetta Tola
 
Dataj and science: a good deal
Dataj and science: a good dealDataj and science: a good deal
Dataj and science: a good dealElisabetta Tola
 
Datajournalism - Dollars for docs: un caso studio
Datajournalism - Dollars for docs: un caso studioDatajournalism - Dollars for docs: un caso studio
Datajournalism - Dollars for docs: un caso studioElisabetta Tola
 

More from Elisabetta Tola (20)

Taller tola jornadas (1)
Taller tola jornadas (1)Taller tola jornadas (1)
Taller tola jornadas (1)
 
III Jornadas periodismo de datos - ponencia Elisabetta Tola
III Jornadas periodismo de datos - ponencia Elisabetta TolaIII Jornadas periodismo de datos - ponencia Elisabetta Tola
III Jornadas periodismo de datos - ponencia Elisabetta Tola
 
Dataschool_SISSA - dati, licenze, risorse, tools
Dataschool_SISSA - dati, licenze, risorse, toolsDataschool_SISSA - dati, licenze, risorse, tools
Dataschool_SISSA - dati, licenze, risorse, tools
 
#safeschools, open data and right to access info - an italian case
#safeschools, open data and right to access info - an italian case#safeschools, open data and right to access info - an italian case
#safeschools, open data and right to access info - an italian case
 
03_opendata e diritto di accesso
03_opendata e diritto di accesso03_opendata e diritto di accesso
03_opendata e diritto di accesso
 
01_introduzione_summerschool_dataj
01_introduzione_summerschool_dataj01_introduzione_summerschool_dataj
01_introduzione_summerschool_dataj
 
Opendata and journalism - parte II
Opendata and journalism - parte IIOpendata and journalism - parte II
Opendata and journalism - parte II
 
Opendata&journalism - parte I
Opendata&journalism - parte IOpendata&journalism - parte I
Opendata&journalism - parte I
 
OddIT Bologna, Urban center
OddIT Bologna, Urban centerOddIT Bologna, Urban center
OddIT Bologna, Urban center
 
opendata&dataj @spaghetti_folks
opendata&dataj @spaghetti_folksopendata&dataj @spaghetti_folks
opendata&dataj @spaghetti_folks
 
quando il dataset non c'è: #scuolesicure, backstage dell'inchiesta
quando il dataset non c'è: #scuolesicure, backstage dell'inchiestaquando il dataset non c'è: #scuolesicure, backstage dell'inchiesta
quando il dataset non c'è: #scuolesicure, backstage dell'inchiesta
 
On air - radio e podcast - Barcelona
On air - radio e podcast - BarcelonaOn air - radio e podcast - Barcelona
On air - radio e podcast - Barcelona
 
Raccontare il terremoto
Raccontare il terremotoRaccontare il terremoto
Raccontare il terremoto
 
Listos, no chocados!
Listos, no chocados!Listos, no chocados!
Listos, no chocados!
 
Comunicazione e apprendimento digitale
Comunicazione e apprendimento digitaleComunicazione e apprendimento digitale
Comunicazione e apprendimento digitale
 
Dataj and science: a good deal
Dataj and science: a good dealDataj and science: a good deal
Dataj and science: a good deal
 
Education in Italy
Education in ItalyEducation in Italy
Education in Italy
 
On air - 2011
On air - 2011On air - 2011
On air - 2011
 
Datajournalism - Dollars for docs: un caso studio
Datajournalism - Dollars for docs: un caso studioDatajournalism - Dollars for docs: un caso studio
Datajournalism - Dollars for docs: un caso studio
 
Di onda in onda
Di onda in ondaDi onda in onda
Di onda in onda
 

Data driven journalism - I primi passi