Innovazione di processo e infrastrutturale per la gestione degli indicatori delle statistiche economiche e degli aggregati di Contabilità nazionale
http://www.istat.it/it/archivio/193422
Viviana De Giorgi, Luigi Virgili - SIGIS: Indicatori Strutturali e applicazione delle regole di riservatezza
1. SIGIS:
Indicatori Strutturali e
applicazione delle regole di riservatezza
Viviana De Giorgi
(degiorgi@istat.it, +390646736144)
Direzione centrale per le statistiche economiche
Servizio statistiche strutturali sulle imprese, istituzioni pubbliche e non-profit
Luigi Virgili
(virgili@istat.it, +390646732042)
Direzione centrale per la metodologia e il disegno dei processi statistici
Servizio metodi, qualità e metadati
Roma, 12 Dicembre 2016
2. Sommario
o Regolamento europeo sulle statistiche strutturali d’impresa
o Protezione statistica dei dati e quadro normativo
o Structural Business Statistics (SBS) e dettaglio di diffusione
o Applicazione delle regole di riservatezza
o Possibili sviluppi futuri
3. Regolamento europeo sulle statistiche strutturali d’impresa
Il regolamento del parlamento europeo e del consiglio n.295/2008 relativo alle
statistiche strutturali sulle imprese (in breve SBS) istituisce un quadro comune
per la raccolta, l’elaborazione, la trasmissione e la valutazione delle statistiche
comunitarie relativamente alla struttura, all’attività, alla competitività e al
rendimento delle imprese nella Comunità.
L’elaborazione delle statistiche ha per oggetto l’analisi della struttura e
dell’evoluzione delle attività imprenditoriali, delle caratteristiche economiche e di
competitività specifiche delle unità intervistate in relazione a particolari settori di
attività.
L’ambito di applicazione del regolamento SBS è rappresentato dalle attività
economiche individuate dalle sezioni da B a N e dalle sezioni da P a S (attività
industriali e dei servizi) della classificazione Nace rev.2.
4. Protezione statistica dei dati e quadro normativo
La diffusione dei risultati statistici va coniugata con l’obbligo di garantire la
riservatezza delle unità rispondenti.
In Italia, il quadro normativo di riferimento è rappresentato dal D.lgs 322/89 e
dal Codice di deontologia e di buona condotta per i trattamenti di dati personali
a scopi statistici e di ricerca scientifica effettuati nell'ambito del Sistema
statistico nazionale.
Nella fase di predisposizione dei risultati i vincoli legali si traducono in regole
metodologiche e procedure statistiche volte a ridurre (entro limiti prestabiliti) il
rischio d’identificazione.
L’obiettivo degli istituti nazionali di statistica è quello di individuare misure di
protezione dei dati che consentano il rilascio di un adeguato contenuto
informativo.
5. Statistiche SBS
Le statistiche da elaborare per il regolamento SBS sono suddivise in moduli
(allegati). L’Istat produce i dati relativi ai moduli:
• 1, statistiche strutturali annuali
• 2, dettaglio sulle statistiche strutturali nel settore industriale
• 3, dettaglio sulle statistiche strutturali nel settore del commercio
• 4, dettaglio sulle statistiche strutturali nel settore della costruzione
• 8, dettaglio sulle statistiche strutturali sui servizi alle imprese
• 9, dettaglio sulle statistiche strutturali sulla demografia delle imprese
attraverso l’utilizzo del registro statistico delle imprese attive Asia (variabili
strutturali e demografiche), del sistema informativo FrameSBS (Asia + principali
variabili economiche richieste dal regolamento) e attraverso la raccolta di dati
statistici con indagini dirette (PMI, SCI) per la stima delle variabili non presenti
nel FrameSBS.
6. Principali variabili SBS per i moduli 1-4
Statistiche nazionali Statistiche regionali
- numero di imprese - numero di unità locali
- numero di persone occupate
- numero di dipendenti
- numero di ore prestate dai dipendenti
- (ripartiti per qualifica professionale)
- numero di persone occupate
- numero di dipendenti
- fatturato
- valore della produzione
- margine lordo sui beni per la rivendita
- valore aggiunto al costo dei fattori
- risultato lordo di gestione
- acquisti complessivi di beni e servizi
- acquisti di beni e servizi destinati alla rivendita
- acquisti di prodotti energetici
- pagamenti per lavoratori di agenzie
- variazione delle scorte
- costi del personale
- retribuzioni
- costi della previdenza sociale
- ripartizione del fatturato per tipo di attività
- fatturato
- valore aggiunto al costo dei
fattori
- costi del personale
- retribuzioni
- investimenti (ripartiti per tipologia) - investimenti
- investimenti in attrezzature e impianti per il controllo
dell'inquinamento e in accessori speciali antinquinamento
(end of pipe)
- investimenti in attrezzature e impianti collegati alle
tecnologie pulite (tecnologia integrata)
- spese correnti per la tutela ambientale
7. Dettaglio delle statistiche SBS per i moduli 1-4
Le disaggregazioni richieste dal regolamento SBS sono:
• attività economica a 2 cifre (3 cifre nel commercio) per regione
• attività economica a 4 cifre
• attività economica a 3 cifre per le seguenti classi di addetti:
• 0-9, 10-19, 20-49, 50-249, 250+ per industria e costruzioni
• 0-1, 2-9, 10-19, 20-49, 50-249, 250+ per commercio e servizi
Fino all’anno di riferimento 2011 l’Istat ha diffuso le tavole per le sole
disaggregazioni e indicatori richiesti dal regolamento.
A partire dall’anno di riferimento 2012, grazie alla disponibilità dei dati
amministrativi (sistema informativo FrameSBS), il dettaglio informativo è stato
ampliato.
8. Nuovo dettaglio informativo disponibile per le variabili SBS
A partire dall’anno di riferimento 2012, le variabili:
- n. di imprese - n. di persone occupate - n. di dipendenti
- fatturato - valore aggiunto - altri ricavi e proventi
- costi del personale - retribuzione lorda - margine operativo lordo
- acquisto di beni e servizi - godimento beni di terzi - oneri diversi di gestione
- acquisti di materie prime sussidiarie e di consumo
sono disponibili per i seguenti domini:
• attività economica a 3 cifre per classe di addetti 0-1, 2-9, 10-19, 20-49, 50-
249, 250+, totale
• attività economica a 4 cifre per classe di addetti 0-1, 2-9, 10-19, 20-49, 50-
249, 250+, totale
9. Valori medi e indicatori di dispersione (1/2)
Per fornire indicatori della distribuzione sono stati diffusi a partire dal 2012:
• I, II e III quartile
• deviazione standard e scarto interquartile
per le variabili in livello:
• numero di persone occupate e di dipendenti
• fatturato
• valore aggiunto
• margine operativo lordo
• costo del lavoro
e per le variabili pro-capite
• fatturato per persona occupata
• valore aggiunto per persona occupata
• costo del lavoro per dipendente
e per i rapporti:
• valore aggiunto su fatturato (percentuale)
• competitività di costo (percentuale)
10. Tutti gli indicatori sono diffusi per sezione e a 2,3,4 cifre di attività economica
senza distinzione in classi di addetti.
Gli indicatori delle variabili in livello sono calcolati operando una media dei dati
nell’intorno del quartile (5 o 6 dati).
Nel calcolo degli indicatori pro-capite e dei rapporti sono stati esclusi i casi in
cui la variabile al denominatore è pari a zero. Il costo del lavoro pro-capite è
calcolato per le sole imprese con dipendenti.
Anche per coerenza con quanto indicato nelle regole di rilascio del Laboratorio
ADELE, gli indicatori sono calcolati solo per i domini con una frequenza
maggiore o uguale a 50.
Valori medi e indicatori di dispersione (2/2)
11. L’applicazione delle regole di riservatezza ai dati SBS, prevede il trattamento di
tabelle collegate, ovvero di tabelle (riferite alla medesima variabile risposta) con
celle comuni. La figura 1 mostra un esempio del collegamento tra la tabella più
dettagliata, Nace a quattro cifre, classi di addetti (di seguito Nace4xCladd), e
l’aggregato MHT, individuato dal regolamento europeo. Nel caso in esame la
modalità denominata 30B che risulta dalla somma delle modalità 302, 304, 309
è presente (o ricavabile) in entrambe le tabelle.
Il valore 30B nell’aggregato MHT coincide col corrispondente valore marginale
della tabella Nace4xCladd.
In figura 1 la freccia rappresenta il collegamento tra i dati:
Applicazione delle regole di riservatezza: analisi dei dati (1/3)
12. Applicazione delle regole di riservatezza: analisi dei dati (2/3)
MHT
20+
254+
27+
28+
29+
30B (=30-301-303)+
325
Nace4xCladd TIT= (TII+TIS)
dove TIS=(G+H+…+S)
TII=(B+C+…+F)
TII comprende la modalità Nace 30:
… … … …
30
301
3011
3012
303
3030
30B
302
3020
304
3040
309
3091
3092
3099
… … … …
Figura 1
13. Un ulteriore aspetto da tenere in considerazione nella protezione delle tabelle
SBS fa riferimento alle classificazioni gerarchiche con modalità non
mutuamente esclusive (non-nested): almeno una modalità concorre alla
composizione di due o più modalità di livello gerarchico superiore. La Figura 2
riporta il caso dell’aggregato S95 che concorre alla formazione sia della sezione
S, sia della modalità TEUC.
Figura 2
Applicazione delle regole di riservatezza: analisi dei dati (3/3)
14. Il processo di protezione statistica dei dati (1/3)
L’applicazione delle regole di riservatezza a tabelle collegate, con classificazioni
non-nested prevede che siano realizzate le fasi seguenti:
1. Scelta del criterio di protezione da adottare (non-perturbativo)
2. Definizione della regola di rischio
3. Scomposizione dei dati in tabelle collegate, con classificazioni nested
4. Definizione della sequenza di protezione delle tabelle
5. Individuazione dell’algoritmo da utilizzare nella protezione
6. Scelta della variabile costo
7. Protezione delle tabelle
8. Analisi dei risultati
L’Istat utilizza un criterio non-perturbativo per la protezione delle tabelle,
basato sull’introduzione di valori mancanti:
• soppressioni primarie (celle a rischio)
• soppressioni secondarie (necessarie per non permettere che i valori a rischio,
oscurati, siano ‘ricalcolabili’).
15. La regola di rischio adottata è la regola di frequenza, ovvero una cella è
considerata a rischio di intrusione se il numero di contributori ad essa
afferente è inferiore ad un prefissato valore (n).
La disaggregazione dei dati in tabelle deve essere tale da garantire la
presenza dei dettagli pianificati e di classificazioni nested.
L’analisi dei collegamenti consiste nell’individuazione di tutti i legami (celle
in comune) tra le tabelle di cui tener conto per assicurare la coerenza delle
soppressioni.
L’ordine di protezione delle tabelle può influire sul numero complessivo di
soppressioni. La regola è quella di passare dal particolare al generale.
Sebbene il software generalizzato utilizzato tau-Argus implementi
l’opzione ‘tabelle collegate’, nel caso in esame le tabelle superano il
numero massimo che il programma può elaborare costringendo alla
costruzione di file (apriori-file).
Il processo di protezione statistica dei dati (2/3)
16. Le soppressioni secondarie sono individuate utilizzando l’algoritmo modular,
implementato nel software tau-Argus.
La protezione avviene impostando i parametri:
• frequenza (n=3)
• livello di protezione minimo (in percentuale del valore di cella)
• variabile di costo da minimizzare (valore aggiunto).
I risultati ottenuti sono valutati rispetto:
• al livello di protezione conseguito (da confrontare col corrispondente
parametro impostato), calcolato, su ogni tabella, a posteriori dal
programma di audit disponibile in tau-Argus
• alla perdita di contenuto informativo complessivo valutato come somma dei
valori oscurati (nonché come numero di celle soppresse)
Il processo di protezione statistica dei dati (3/3)
17. Sviluppi futuri
• diffondere le variabili principali in maniera più capillare secondo schemi non
programmati, per esempio per tipologia di impresa (artigiana, appartenente
a un gruppo, esportatrice, ecc.). Una possibile soluzione è rappresentata dai
waiver, ovvero dal consenso al rilascio dei dati da parte delle unità
interessate
• applicare la disaggregazione per classe di addetti anche ai dati regionali.
Attualmente l’ostacolo è rappresentato dai tempi di disponibilità dei dati
riferiti all’unità statistica di riferimento nella diffusione dei dati territoriali. Il
regolamento SBS prevede la diffusione per numero di unità locali, il
FrameSBS è organizzato per sede legale delle imprese. Una possibile
soluzione è data dalla stima per unità locale delle variabili economiche
utilizzando il registro Asia delle unità locali, ove questo possa essere
disponibile nei termini stabiliti dal regolamento SBS.
19. Boselli C., Brunetti S., Cammarrota M., De Giorgi V., D’Urzo A., Ricci M., Pazzini R., Seri
G., Siesto G., Virgili L., Il processo di diffusione dei dati delle statistiche strutturali sulle
imprese (Frame-SBS): aspetti normativi e metodologici connessi all’ampliamento del
dettaglio informativo Istat working Papers n.14/2016
http://www.istat.it/it/files/2016/10/IWP_14_2016.pdf
Regolamento (CE) n.295/2008 del Parlamento Europeo e del Consiglio dell'11 marzo
2008 relativo alle statistiche strutturali sulle imprese
Hundepool A. et al. 2010. Handbook on Statistical Disclosure Control Version 1.2.
http://neon.vb.cbs.nl/casc/SDC_Handbook.pdf
Virgili L., and L. Franconi. 2009. Disclosure protection of non-nested linked tables in
business statistics. WP.36 presented at the Joint UNECE/Eurostat work session on
statistical data confidentiality, Bilbao, Spain, December 2-4.
http://www.istat.it/it/files/2013/12/Franconi_Virgili_wp.36.e.pdf
Statistics Netherlands. 2008. τ-Argus Version 3.3 User’s Manual. The Netherlands
http://neon.vb.cbs.nl/casc/Software/TauManualV3.3.pdf
Riferimenti