AI nel mondo delle scuole. Formazione docente per creare un ponte con gli stu...
ASOC2021 Webinar Lezione 1 - Conoscere e preparare un'indagine di statistica ufficiale - Istat
1. Conoscere e preparare un'indagine di statistica ufficiale
Rita Lima
Direzione Centrale per la Metodologia e il Disegno dei Processi Statistici
19 Novembre 2020
2. CONOSCERE E PREPARARE UN'INDAGINE DI STATISTICA UFFICIALE
✔ Introduzione alla statistica ufficiale e il suo campo di applicazione con
particolare riferimento ad ISTAT, SISTAN ed EUROSTAT
✔ Le principali fonti di statistiche ufficiali
✔ Le fasi di una indagine statistica
▪ La progettazione dell’indagine
▪ L’elaborazione dei dati raccolti
▪ La qualità dei dati
▪ La diffusione dei risultati
✔ Esempi di indagine statistica
3. COSA È LA STATISTICA NEL LINGUAGGIO COMUNE?
LA STATISTICA COME DATO
▪ RACCOGLIERE dati per interpretare determinati fenomeni
▪ SINTETIZZARE dati attraverso grafici o i numeri derivati dai dati (medie, percentuali, ecc.)
, in quanto costruire l’informazione è un
Compito di particolare rilievo e difficoltà: i numeri
(ossia i dati) forniscono informazioni su un problema
o su una certa realtà in studio, ma non rappresentano
di per sé un’informazione statistica.
4. La conoscenza necessita di alcuni passaggi:
▪ RACCOGLIERE informazioni sul comportamento del singolo (UNITÀ
STATISTICA) non in quanto tale, ma come componente dell’insieme
che si considera (POPOLAZIONE O FENOMENO COLLETTIVO ).
▪ ELABORARE i risultati dell’ OSSERVAZIONE di uno o più CARATTERI
del FENOMENO COLLETTIVO
▪ EVIDENZIARE (da un punto di vista QUANTITATIVO e QUALITATIVO)
alcuni aspetti che interessa indagare
▪ COMUNICARE i risultati ottenuti
“La statistica (…) ha come scopo la conoscenza quantitativa dei fenomeni collettivi”
LA STATISTICA COME MISURAZIONE DI COLLETTIVI
ESEMPIO: Numero di incidenti avvenuti in un determinato periodo in una data città
LE FASI DELLA RICERCA
5. LA STATISTICA UFFICIALE COME INFORMAZIONE RILEVANTE E BENE PUBBLICO
La statistica ufficiale italiana ha un fondamento costituzionale (art. 117):
“Lo Stato ha legislazione esclusiva nelle seguenti materie:...
r) …; coordinamento informativo statistico e informatico dei dati dell'amministrazione
statale, regionale e locale;...”
ESEMPIO: LA SPESA SANITARIA
La spesa sanitaria si compone di due macro-categorie: spesa pubblica e spesa privata.
La spesa pubblica è quella relativa a beni e servizi sanitari sostenuta dalla popolazione residente nel
Paese. La spesa privata è quella intermediata da fondi sanitari e da polizze assicurative insieme a
spesa out-of pocket direttamente sostenuta dai cittadini.
Le statistiche ufficiali di utilità generale debbono essere elaborate e rese disponibili, in modo
imparziale, dalle istituzioni della statistica ufficiale affinché sia soddisfatto il diritto dei cittadini
all'informazione pubblica.
6. Spesso come FONTE viene indicata oltre la RILEVAZIONE (STATISTICA o AMMNISTRATIVA ) usata
per raccogliere i dati anche l’ENTE PRODUTTORE .
I DATI possono derivare da ogni TIPO DI FONTE.
UN MONDO DI DATI E DI PRODUTTORI DI STATISTICHE NON TUTTE UGUALI PER ESIGENZE
CONOSCITIVE SEMPRE PIU’ DIFERENZIATE
❑ AUTOREVOLEZZA DELLA FONTE (imparzialità, indipendenza scientifica,
impianto organizzativo pubblico)
❑ QUALITA’ DELLA STATISTICA UFFICIALE (affidabilità, pertinenza, trasparenza,
riservatezza, tempestività etc.)
LE FONTI DEI DATI
7. I PRODUTTORI DI STATISTICHE UFFICIALI E IL SISTAN
ALTRI ORGANISMI E ENTI NAZIONALI E
INTERNAZIONALI
Eurostat, OCSE, FMI, Bankitalia, ect.
ALTRI PRODUTTORI DI INFORMAZIONI
STATISTICHE
Censis, Università, Centri Studi, Fondazioni,
Istituti privati di ricerca e di ricerche di
mercato
LE PRINCIPALI FONTI STATISTICHE PUBBLICHE
8. LA STATISTICA BENE IMMATERIALE
LA PRODUZIONE DI STATISTICA PUBBLICA
▪ sviluppata secondo il Programma Statistico Nazionale (PSN)
e i programmi regionali dagli Enti ed Uffici del Sistema
Statistico Nazionale (SISTAN) e fornita al Paese e agli
organismi internazionali attraverso il SISTAN
(https://www.sistan.it)
▪ corredata di principi e standard per lo sviluppo, la
produzione e la diffusione in linea con il Codice Italiano
delle statistiche e con le prescrizioni internazionali del
Codice delle statistiche europee (EUROSTAT,
https://ec.europa.eu/eurostat)
DATO INFORMAZIONE CONOSCENZA
LE FONTI STATISTICHE UFFICIALI
9. Provvede a:
❑ INDIRIZZARE e COORDINARE le attività statistiche degli altri
soggetti del SISTAN
❑ ASSISTERE sugli aspetti tecnici enti e uffici del SISTAN
LA STATISTICA UFFICIALE E L’ISTAT
10. LE FASI DI UNA INDAGINE STATISTICA
ESISTONO DATI GIA’ DISPONIBILI?
DATI SECONDARI DATI PRIMARI
OBIETTIVO CONOSCITIVO
Qual è l’età media degli occupati maschi nel Nord Italia nell’agricoltura?
11. LE STATISTICHE UTILIZZANDO DATI GIA’ RACCOLTI DA ALTRI
SVANTAGGI
▪ Archiviazione di dati con finalità diverse da quelle
per cui vengono riutilizzati
▪ Occorre verificare e valutare la loro qualità
▪ Dati non sono sempre "adeguati all’uso" rispetto ai
propri obiettivi
▪ Problemi di comparabilità dati di diversa fonte
▪ E’ necessario conoscere il processo della loro
produzione
I DATI SECONDARI
VANTAGGI
▪ Riduzione di costi e tempi di produzione
▪ Disponibilità di un ricco insieme di risorse
informative Informazioni raccolte da più
fonti
12. ESEMPIO: LA SPESA SANITARIA PRIVATA. Pluralità di soggetti, eterogeneità di fonti e metodi di calcolo
Legenda: SHA: System of Health Accounts - ICHA: International Classification for
Health Accounts -COICOP: Classification of Individual Consumption by Purpose
FONTI:
ISTAT. Sistema dei conti della sanità. Edizione giugno 2018. Disponibile a:
http://dati.istat.it/Index.aspx?DataSetCode=DCCN_SHA .
OECD Health Statistics 2018. Last update 8 November 2018.
ISTAT. Spesa per consumi finali delle famiglie per voce di spesa (COICOP 3 cifre) e durata. Sanità. Disponibile a:
http://dati.istat.it/index.aspx?queryid=12005.
Del Vecchio M, Fenech L, Rappini V. I consumi privati in sanità. In: Cergas-SDA Bocconi. Rapporto OASI 2018. EGEA,
novembre 2018.
Corte dei Conti. Rapporto 2018 sul coordinamento della finanza pubblica.
Agenzia Italiana del Farmaco. L’uso dei farmaci in Italia. Rapporto nazionale 2017.
Ministero dell’Economia e delle Finanze. Dipartimento della Ragioneria Generale dello Stato. Il monitoraggio della spesa
sanitaria. Rapporto n° 5. Roma, novembre 2018
4° Rapporto GIMBE sulla sostenibilità del Servizio Sanitario Nazionale, 2019
13. QUALE DATO STAI CERCANDO?
Banche dati generali, tematiche o settoriali
Serie Storiche
Datawarehouse
Pubblicazioni
Siti web e link
Uffici di supporto (Contact Centre Istat)
Biblioteca centrale ISTAT
ISTAT: NON SOLO CENSIMENTO
Principale fonte d’informazione statistica «open», cioè fruibile e riutilizzabile gratuitamente.
14. Definire lo scopo della ricerca, gli obiettivi conoscitivi che si vogliono
raggiungere e le unità statistiche oggetto di indagine calibrandoli in modo da
garantire la qualità dei dati rilevati.
❑ COSA = Fissare gli obiettivi e individuare il fenomeno collettivo di interesse dell’indagine
(nota che più ampio l’arco degli argomenti trattati, maggiori le complessità da affrontare sul
piano concettuale, statistico ed operativo);
❑ CHI = Scegliere/definire la popolazione (campo di osservazione) le unità statistiche e i caratteri
o variabili statistiche da indagare (es. qualitative ordinali o sconnesse, quantitative discrete o
continue);
❑ COME = Definire se interessa descrivere un fenomeno nella sua componente statica o dinamica
e se si vuole confrontare i risultati con informazioni relative ad altre realtà territoriali;
❑ QUANDO e DOVE = Delimitare il periodo di tempo e l’area geografica a cui ci si riferisce.
I DATI PRIMARI
PROGETTAZIONE (1)
15. PROGETTAZIONE (2)
Sia le rilevazioni complete che quelle parziali possono fornire informazioni distorte del
fenomeno che si sta studiando.
❑ Nella rilevazione totale (censimento) si ha la conoscenza esatta del fenomeno
studiato: viene rilevata tutta la popolazione di interesse.
❑ Nella rilevazione parziale (campionaria) si perviene a una stima (più o meno
precisa) del fenomeno studiato: viene osservata una parte o campione della
popolazione di interesse.
Definizione del disegno di indagine ossia specificazione del tipo di indagine più confacente alla
raccolta delle informazioni e alla produzione delle relative statistiche. Come si vuole indagare?
Indagine totale o campionaria? Con quale tecniche e strumenti di rilevazione?
16. VANTAGGI
• Fornisce una misura reale (non affetta da errore
campionario) della popolazione
• Le informazioni rilevate possono essere utilizzate come
base di riferimento per studi successivi
• Elevato dettaglio di analisi
SVANTAGGI
• Il rilascio delle informazioni richiede tempi molto lunghi
• Costi elevati sia in termini di risorse che economici
INDAGINE TOTALE INDAGINE CAMPIONARIA
TIPI DI INDAGINE A CONFRONTO
17. PROGETTAZIONE (3)
❑ Scelta della tecnica di contatto più idonea a raccogliere le informazioni
Intervista mediante supporto di PC (CAPI)
Interviste faccia a faccia (PAPI)
Intervista telefonica (CATI)
Questionario cartaceo o digitale inviato per e-mail, posta, on-line (CAWI)
❑ Formulazione del questionario (strumento di osservazione)
Identificazione del contenuto delle domande da porre
Definizione del tipo di domande
Modalità di formulazione delle domande
Definizione della sequenza delle domande
Verifica degli aspetti formali del questionario
❑ Rilevazione su campo
Formazione dei rilevatori
Predisposizione di meccanismi di controllo per correggere eventuali distorsioni (mancate
risposte, errori di misura)
18. Intervistatore
Tecnologia
Intervistatore
SI
Intervistatore
NO
Con computer CATI, CAPI CASI, CAWI
Senza computer PAPI Postali
Spesso sono usati due o più modi di raccolta dei dati per:
▪ risparmiare
▪ aumentare il tasso di risposta
▪ ridurre gli errori di misura
Scelta modalità compromesso tra diversi obiettivi contrastanti: partecipazione, qualità dei dati,
costi, etc.
TECNICHE DI RILEVAZIONE
19. RILEVAZIONE DEI DATI
❑ Raccogliere le informazioni necessarie ad analizzare il fenomeno (dati e metadati), utilizzando diverse
modalità (comprese estrazioni da registri e database statistici e amministrativi)
❑ Individuare le unità di rilevazione (famiglia, impresa,…) e promuovere la partecipazione
alla rilevazione
❑ Registrare i dati riportando le risposte dei questionari cartacei su
supporto informatico:
▪ in alcuni casi l’operazione può essere sostituita dalla lettura ottica dei
questionari;
▪ i quesiti aperti vanno codificati attraverso la trascrizione delle risposte
pervenute sotto forma di linguaggio libero in codici standard (es.
ATECO);
▪ può essere fonte di errore (slineamenti, scambi di tasti, errori di lettura
ottica);
▪ non è necessaria quando la rilevazione è effettuata in modalità assistita
dal computer (CATI, CAPI, CAWI).
20. ANALISI DEI DATI: ELABORAZIONI E INTERPRETAZIONE
Nella fase di elaborazione si applicano strumenti propri dell’analisi statistica al fine di
ottenere una sintesi e una descrizione dei dati.
Ad esempio, nel caso di indagini campionarie si applicano metodi inferenziali – induttivi
per poter trarre conclusioni che riguardano l’intera popolazione a partire da
informazioni che si ottengono dal campione.
Verificare le possibili incongruenze dei dati:
▪ individuando le possibili fonti di errore;
▪ analizzando i dati alla ricerca di errori;
▪ correggendo gli errori.✔
21. ELABORAZIONE DEI RISULTATI
Lo statistico deve porre particolare cura nella elaborazione dei
risultati sotto forma di:
▪ tabelle
▪ grafici
▪ calcolo di indici e rapporti sintetici
Si possono effettuare anche analisi esplorative.
Se l’indagine è di tipo campionario si dovrà procedere alla
stima dei parametri per la popolazione di riferimento tenendo
conto del disegno di campionamento utilizzato.
Se l’indagine è volta a verificare dei modelli definiti a priori si
possono effettuare anche analisi di tipo confermativo o
verifica di ipotesi statistiche.
22. QUALITÀ E FONTI DI ERRORE NELLA RILEVAZIONE DEL DATO
L’ACCURATEZZA
23. La validazione consiste nel valutare:
▪ la congruità delle informazioni raccolte con le finalità dell’indagine;
▪ identificare le fonti di errore più rilevanti e predisporre modifiche al processo di
produzione in modo da ridurre gli effetti degli errori in successive occasioni di
indagine;
▪ la qualità dei dati se è buona ai fini della diffusione dell'informazione agli utenti.
VALIDAZIONE
Predisporre un sistema di controllo:
azioni di prevenzione, controllo in corso d’opera, valutazione a posteriori (es.
selezione e formazione dei rilevatori, monitoraggio mancate risposte, indagini ad
hoc su non rispondenti)
24. LA QUALITÀ DELLE STATISTICHE
Il dato di scarsa qualità è come un prodotto di scarsa qualità: non lo vuole nessuno!
OBIETTIVI PROGRAMMATI E RISULTATI RAGGIUNTI
Una statistica può essere perfettamente accurate e affidabile ma se non è diffusa in tempi utili
(SCARSA TEMPESTIVITÀ) è difficile da trovare e capire sul sito (SCARSA ACCESSIBILITÀ E
CHIAREZZA) e non misura esattamente ciò che aveva come obiettivo di stima (SCARSA
PERTINENZA) è del tutto INUTILE.
❑ valutare la congruità delle informazioni raccolte con le finalità
dell’indagine
❑ valutare se la qualità dei dati è adatta alla diffusione
❑ valutare la necessità di modificare il processo di produzione
25. DIFFUSIONE
È la fase conclusiva di una rilevazione, grazie alla quale si
rendono disponibili i dati raccolti.
I dati sono utilizzabili se vi sono:
▪ adeguata offerta di informazioni
▪ efficienti forme di diffusione
I dati sono accessibili a chi li usa se vengono diffusi in
modo:
▪ chiaro
▪ tempestivo
▪ coerente
Si deve tenere conto di:
▪ caratteristiche degli utenti
▪ canali utilizzati
27. ESEMPIO: Rilevazione Istat: «Aspetti della vita quotidiana» - Progettazione e disegno di indagine
▪ popolazione:
i giovani italiani tra i 14 e i 19 anni
▪ campione:
i giovani tra i 14 e i 19 anni appartenenti alle circa
25.000 famiglie campione
▪ tecnica di rilevazione:
tecnica mista, che si avvale di un questionario
online auto compilato (CAWI) o di una
intervista diretta con questionario sia elettronico
che cartaceo, somministrato da un intervistatore
(CAPI-PAPI)
▪ questionario:
articolato in più parti: una scheda generale con
informazioni socio-demografiche (età, sesso, stato
civile, titolo di studio, ecc.) per tutti i componenti la
famiglia; un questionario familiare con informazioni
generali sulla famiglia; un questionario individuale
dati anagrafici
Per realizzare l’indagine è necessario scegliere:
consumo di tabacco
28. ESEMPIO: Rilevazione Istat: «Aspetti della vita quotidiana» - Progettazione e disegno di indagine
▪ OSSERVAZIONE delle singole unità che compongono il collettivo
▪ SINTESI delle osservazioni effettuate
In Italia nel 2018 fuma:
✔ il 6,3% dei ragazzi tra 14 e 17 anni
✔ il 19,0% dei ragazzi tra 18 e 19 anni
Unità
(singolo
individuo)
Collettivo
(giovani di 14-19 anni)
Fonte: Istat, Indagine multiscopo “Aspetti della vita quotidiana“
29. ESEMPIO: Rilevazione Istat: «Aspetti della vita quotidiana» - Diffusione
Estrazione dati: http://dati.istat.it/
Informazioni sulla rilevazione: https://www.istat.it/it/archivio/91926
30. ESEMPIO: Rilevazione Istat Indagine Viaggi e vacanze
Che cosa è Rilevazione annuale sui movimenti turistici dei residenti in Italia. L’indagine è di
tipo campionario e coinvolge ogni anno circa 32 mila famiglie residenti in circa 540 comuni
italiani.
Come vengono raccolte le informazioni I dati sono raccolti mediante 2 questionari CAPI
somministrati da un rilevatore, e un diario cartaceo autocompilato dalla famiglia.
Come consultare i risultati dell'indagine Le stime definitive sono disponibili sul data
warehouse I.Stat (tema: Cultura, Comunicazione, viaggi). Ogni anno i dati raccolti vengono
analizzati e pubblicati anche su volumi a carattere generale (Annuario statistico italiano, Noi
Italia, Italia in cifre).