SlideShare a Scribd company logo
1 of 29
Download to read offline
TellMeQuality
Alessio Melandri, Marco Torchiano, Antonio Vetrò
Obiettivo
Strumento per misurare le caratteristiche di
qualità del dato secondo l’ISO/IEC 25024
Criticità
● Diversi formati di input
○ sintatticamente diversi
○ record, item e value semanticamente diversi (e.g.
un record non è sempre la riga di una tabella)
● Caratteristiche inerenti vs dipendenti dal sistema
● Alcune metriche necessitano di metadati di contesto
(e.g. I-ACC-1 dipende dal datatype)
Soluzione proposta
Utilizzare RDF come stele di Rosetta tra formati, ontologie
standard (e all’occorrenza custom) per gestire il flusso dei
dati e SPARQL per effettuare le misurazioni
Resource
Description
Framework
Lo strumento proposto da W3C per: codifica, scambio e
riutilizzo di dati e metadati strutturati.
Consente l'interoperabilità semantica tra applicazioni che
condividono informazioni.
Vantaggi
● diversi formati riconciliati in un unico formalismo
Vantaggi
● diversi formati riconciliati in un unico formalismo
● metadati associati a livello di dato
Modello per la definizione dei metadati (AGID 2014)
Modello per la definizione dei metadati (AGID 2014)
Vantaggi
● diversi formati riconciliati in un unico formalismo
● metadati associati a livello di dato
● misurazioni tramite query SPARQL
○ facilmente espandibili anche per misurazioni
non ISO/IEC 25024
Vantaggi
● diversi formati riconciliati in un unico formalismo
● metadati associati a livello di dato
● misurazioni tramite query SPARQL
○ facilmente espandibili anche per misurazioni
non ISO/IEC 25024
● dati machine readable e actable tramite l’utilizzo
di ontologie standard (SHACL e DQV)
○ eventualmente espandibili
Shapes Constraint Language (https://www.w3.org/TR/shacl/)
Data Quality Vocabulary (https://www.w3.org/TR/vocab-dqv/)
Possibili svantaggi
● Servono più risorse per gestire triple
Architettura
User journey
1. Alessio vuole analizzare la qualità di una anagrafica in formato CSV
2. Carica il file scelto e delinea i metadati (Shape) in SHACL, aiutato da
un’interfaccia con suggerimenti e autocompletamenti
3. L’attenzione di Alessio si sposta sull’interfaccia di scheduling, dove
trova la lista delle possibili misurazioni di qualità che può compiere. Si
accorge che non può lanciare alcune metriche relative all’accuratezza
perché i metadati che ha inserito non sono completi
4. Alessio torna nella schermata dei metadati e aggiunge le informazioni
mancanti
User journey
5. Ora Alessio lancia tutte e sole le misurazioni relative all’accuratezza: è
la metrica che gli interessa in questo studio
6. Nella schermata finale trova una visualizzazione di sintesi dei risultati: il
valore che vede non è ottimale
7. Alessio apre il dettaglio e scopre che la qualità degli indirizzi della sua
anagrafica è decisamente migliorabile
8. Si scarica allora i risultati in formato JSON e organizza una riunione...
Wireframes
Prima bozza della user interface del tool
Caricamento dati e metadati
Wizard per l’inserimento guidato dei metadati
Cabina di guida :-) per lanciare le misurazioni
Manopole nel dettaglio e fortemente granulari
Sintesi dei risultati sulle metriche lanciate
Dettaglio di una famiglia di metriche
Conclusioni
● Acquisizione di coscienza sulla qualità dei propri dati
○ Vedo quali sono gli aspetti più carenti quindi decido dove investire
per migliorare
○ Feedback costante: posso versionare la qualità dei dati e legarla
allo sviluppo del software
○ Creazione di una certificazione??
● Architettura modulare
○ A prova di futuro tramite ontologie e moduli facilmente espandibili
○ API REST: l’interfaccia può cambiare in base alle necessità

More Related Content

Viewers also liked

3 Proven Sales Email Templates Used by Successful Companies
3 Proven Sales Email Templates Used by Successful Companies3 Proven Sales Email Templates Used by Successful Companies
3 Proven Sales Email Templates Used by Successful CompaniesHubSpot
 
레비트라『 http://x5.ana.kr 』 톡 w2015 ♡ 레비트라판매 ,레비트라가격,레비트라구입방법,레비트라후불구입,레비트라국산, ...
레비트라『 http://x5.ana.kr  』 톡 w2015 ♡ 레비트라판매 ,레비트라가격,레비트라구입방법,레비트라후불구입,레비트라국산, ...레비트라『 http://x5.ana.kr  』 톡 w2015 ♡ 레비트라판매 ,레비트라가격,레비트라구입방법,레비트라후불구입,레비트라국산, ...
레비트라『 http://x5.ana.kr 』 톡 w2015 ♡ 레비트라판매 ,레비트라가격,레비트라구입방법,레비트라후불구입,레비트라국산, ...무우 단
 
레비트라『 http://x5.ana.kr 』 톡 w2015 ♡ 레비트라판매 ,레비트라가격 ,레비트라효과, 레비트라의 또다른 효능, 레비트라가격
레비트라『 http://x5.ana.kr  』 톡 w2015 ♡ 레비트라판매 ,레비트라가격 ,레비트라효과, 레비트라의 또다른 효능, 레비트라가격레비트라『 http://x5.ana.kr  』 톡 w2015 ♡ 레비트라판매 ,레비트라가격 ,레비트라효과, 레비트라의 또다른 효능, 레비트라가격
레비트라『 http://x5.ana.kr 』 톡 w2015 ♡ 레비트라판매 ,레비트라가격 ,레비트라효과, 레비트라의 또다른 효능, 레비트라가격무우 단
 
Pres. Synapta - Tirocini curricolari PoliTO 2017
Pres. Synapta - Tirocini curricolari PoliTO 2017Pres. Synapta - Tirocini curricolari PoliTO 2017
Pres. Synapta - Tirocini curricolari PoliTO 2017Synapta
 
Ingeniería Mesopotamica
Ingeniería MesopotamicaIngeniería Mesopotamica
Ingeniería MesopotamicaAndres Nieto
 
Erick manual
Erick manualErick manual
Erick manualtrust94
 
Enfermedades del sistema circulatorio
Enfermedades del sistema circulatorioEnfermedades del sistema circulatorio
Enfermedades del sistema circulatorioLuis Gerardo Poot
 
Social media: Planning your editorial content
Social media: Planning your editorial contentSocial media: Planning your editorial content
Social media: Planning your editorial contentMingyang Raymond Poon
 
Danube Delta, Romania
Danube Delta, RomaniaDanube Delta, Romania
Danube Delta, RomaniaMakala D.
 
Kit pérdida de peso 1
Kit pérdida de peso 1Kit pérdida de peso 1
Kit pérdida de peso 1Iaso Planet
 

Viewers also liked (14)

3 Proven Sales Email Templates Used by Successful Companies
3 Proven Sales Email Templates Used by Successful Companies3 Proven Sales Email Templates Used by Successful Companies
3 Proven Sales Email Templates Used by Successful Companies
 
레비트라『 http://x5.ana.kr 』 톡 w2015 ♡ 레비트라판매 ,레비트라가격,레비트라구입방법,레비트라후불구입,레비트라국산, ...
레비트라『 http://x5.ana.kr  』 톡 w2015 ♡ 레비트라판매 ,레비트라가격,레비트라구입방법,레비트라후불구입,레비트라국산, ...레비트라『 http://x5.ana.kr  』 톡 w2015 ♡ 레비트라판매 ,레비트라가격,레비트라구입방법,레비트라후불구입,레비트라국산, ...
레비트라『 http://x5.ana.kr 』 톡 w2015 ♡ 레비트라판매 ,레비트라가격,레비트라구입방법,레비트라후불구입,레비트라국산, ...
 
레비트라『 http://x5.ana.kr 』 톡 w2015 ♡ 레비트라판매 ,레비트라가격 ,레비트라효과, 레비트라의 또다른 효능, 레비트라가격
레비트라『 http://x5.ana.kr  』 톡 w2015 ♡ 레비트라판매 ,레비트라가격 ,레비트라효과, 레비트라의 또다른 효능, 레비트라가격레비트라『 http://x5.ana.kr  』 톡 w2015 ♡ 레비트라판매 ,레비트라가격 ,레비트라효과, 레비트라의 또다른 효능, 레비트라가격
레비트라『 http://x5.ana.kr 』 톡 w2015 ♡ 레비트라판매 ,레비트라가격 ,레비트라효과, 레비트라의 또다른 효능, 레비트라가격
 
Mapa 1 ljulio.cmap
Mapa 1  ljulio.cmapMapa 1  ljulio.cmap
Mapa 1 ljulio.cmap
 
PLC
PLCPLC
PLC
 
Bolivia sel2
Bolivia sel2Bolivia sel2
Bolivia sel2
 
Pres. Synapta - Tirocini curricolari PoliTO 2017
Pres. Synapta - Tirocini curricolari PoliTO 2017Pres. Synapta - Tirocini curricolari PoliTO 2017
Pres. Synapta - Tirocini curricolari PoliTO 2017
 
Ingeniería Mesopotamica
Ingeniería MesopotamicaIngeniería Mesopotamica
Ingeniería Mesopotamica
 
Erick manual
Erick manualErick manual
Erick manual
 
Enfermedades del sistema circulatorio
Enfermedades del sistema circulatorioEnfermedades del sistema circulatorio
Enfermedades del sistema circulatorio
 
Jueves 19.35 Dr. Bruna
Jueves 19.35 Dr. BrunaJueves 19.35 Dr. Bruna
Jueves 19.35 Dr. Bruna
 
Social media: Planning your editorial content
Social media: Planning your editorial contentSocial media: Planning your editorial content
Social media: Planning your editorial content
 
Danube Delta, Romania
Danube Delta, RomaniaDanube Delta, Romania
Danube Delta, Romania
 
Kit pérdida de peso 1
Kit pérdida de peso 1Kit pérdida de peso 1
Kit pérdida de peso 1
 

Similar to TellMeQuality

Laboratorio internet: 4. Requisiti (parte II)
Laboratorio internet: 4. Requisiti (parte II)Laboratorio internet: 4. Requisiti (parte II)
Laboratorio internet: 4. Requisiti (parte II)Roberto Polillo
 
Gestione corsi con TYPO3
Gestione corsi con TYPO3Gestione corsi con TYPO3
Gestione corsi con TYPO3Ivano Luberti
 
Presentazione Sviluppo di un prototipo di interfaccia
Presentazione Sviluppo di un prototipo di interfacciaPresentazione Sviluppo di un prototipo di interfaccia
Presentazione Sviluppo di un prototipo di interfacciaLeD87
 
Interfacce applicative al Sistema di Catalogazione del progetto MESSIAH
Interfacce applicative  al Sistema di Catalogazione del progetto MESSIAHInterfacce applicative  al Sistema di Catalogazione del progetto MESSIAH
Interfacce applicative al Sistema di Catalogazione del progetto MESSIAHCostantino Landino
 
LDAP: caratteristiche e funzionalità
LDAP: caratteristiche e funzionalitàLDAP: caratteristiche e funzionalità
LDAP: caratteristiche e funzionalitàTruelite
 
Basi di dati e gis n
Basi di dati e gis nBasi di dati e gis n
Basi di dati e gis nimartini
 
Una griglia per i test web dell PA
Una griglia per i test web dell PAUna griglia per i test web dell PA
Una griglia per i test web dell PAGiacomo Mason
 
Riuso Object Oriented
Riuso Object OrientedRiuso Object Oriented
Riuso Object OrientedStefano Fago
 
Data Profiling with Metanome
Data Profiling with MetanomeData Profiling with Metanome
Data Profiling with MetanomeMatteo Senardi
 
Vassallo Standard Descrittivi E Standard Di Metadati
Vassallo   Standard Descrittivi E Standard Di MetadatiVassallo   Standard Descrittivi E Standard Di Metadati
Vassallo Standard Descrittivi E Standard Di MetadatiSalvatore Vassallo
 
Service Registry Repository Opensource implementato su Semantic Media Wiki
Service Registry Repository Opensource implementato su Semantic Media WikiService Registry Repository Opensource implementato su Semantic Media Wiki
Service Registry Repository Opensource implementato su Semantic Media WikiMatteo Busanelli
 
Opendata, licenze & formati, scoprirli & usarli
Opendata, licenze & formati, scoprirli & usarliOpendata, licenze & formati, scoprirli & usarli
Opendata, licenze & formati, scoprirli & usarliFrancesco Passantino
 

Similar to TellMeQuality (20)

Laboratorio internet: 4. Requisiti (parte II)
Laboratorio internet: 4. Requisiti (parte II)Laboratorio internet: 4. Requisiti (parte II)
Laboratorio internet: 4. Requisiti (parte II)
 
Gestione corsi con TYPO3
Gestione corsi con TYPO3Gestione corsi con TYPO3
Gestione corsi con TYPO3
 
Presentazione Sviluppo di un prototipo di interfaccia
Presentazione Sviluppo di un prototipo di interfacciaPresentazione Sviluppo di un prototipo di interfaccia
Presentazione Sviluppo di un prototipo di interfaccia
 
Interfacce applicative al Sistema di Catalogazione del progetto MESSIAH
Interfacce applicative  al Sistema di Catalogazione del progetto MESSIAHInterfacce applicative  al Sistema di Catalogazione del progetto MESSIAH
Interfacce applicative al Sistema di Catalogazione del progetto MESSIAH
 
Database Data Aggregator
Database Data AggregatorDatabase Data Aggregator
Database Data Aggregator
 
LDAP: caratteristiche e funzionalità
LDAP: caratteristiche e funzionalitàLDAP: caratteristiche e funzionalità
LDAP: caratteristiche e funzionalità
 
Basi di dati e gis n
Basi di dati e gis nBasi di dati e gis n
Basi di dati e gis n
 
Una griglia per i test web dell PA
Una griglia per i test web dell PAUna griglia per i test web dell PA
Una griglia per i test web dell PA
 
Presentazione Tesi
Presentazione TesiPresentazione Tesi
Presentazione Tesi
 
Bachelor Thesis presentation
Bachelor Thesis presentationBachelor Thesis presentation
Bachelor Thesis presentation
 
Riuso Object Oriented
Riuso Object OrientedRiuso Object Oriented
Riuso Object Oriented
 
Presentazione SOStesi
Presentazione SOStesiPresentazione SOStesi
Presentazione SOStesi
 
Open Data in Trentino - Corso Trentino School of Management (TSM)
Open Data in Trentino - Corso Trentino School of Management (TSM)Open Data in Trentino - Corso Trentino School of Management (TSM)
Open Data in Trentino - Corso Trentino School of Management (TSM)
 
Data Profiling with Metanome
Data Profiling with MetanomeData Profiling with Metanome
Data Profiling with Metanome
 
Relazione Agic
Relazione AgicRelazione Agic
Relazione Agic
 
Vassallo Standard Descrittivi E Standard Di Metadati
Vassallo   Standard Descrittivi E Standard Di MetadatiVassallo   Standard Descrittivi E Standard Di Metadati
Vassallo Standard Descrittivi E Standard Di Metadati
 
Database relazionali
Database relazionaliDatabase relazionali
Database relazionali
 
Service Registry Repository Opensource implementato su Semantic Media Wiki
Service Registry Repository Opensource implementato su Semantic Media WikiService Registry Repository Opensource implementato su Semantic Media Wiki
Service Registry Repository Opensource implementato su Semantic Media Wiki
 
Data base elvira asile
Data base elvira asileData base elvira asile
Data base elvira asile
 
Opendata, licenze & formati, scoprirli & usarli
Opendata, licenze & formati, scoprirli & usarliOpendata, licenze & formati, scoprirli & usarli
Opendata, licenze & formati, scoprirli & usarli
 

More from Synapta

Premio pa sostenibile e resiliente 2020 - ContrattiPubblici.org - Synapta PPT
Premio pa sostenibile e resiliente 2020  - ContrattiPubblici.org - Synapta PPTPremio pa sostenibile e resiliente 2020  - ContrattiPubblici.org - Synapta PPT
Premio pa sostenibile e resiliente 2020 - ContrattiPubblici.org - Synapta PPTSynapta
 
Festival della Tecnologia - panel Open data: bene comune - 2019-11-09
Festival della Tecnologia - panel Open data: bene comune - 2019-11-09Festival della Tecnologia - panel Open data: bene comune - 2019-11-09
Festival della Tecnologia - panel Open data: bene comune - 2019-11-09Synapta
 
Analisi della qualità dei dati di ContrattiPubblici.org
Analisi della qualità dei dati di ContrattiPubblici.orgAnalisi della qualità dei dati di ContrattiPubblici.org
Analisi della qualità dei dati di ContrattiPubblici.orgSynapta
 
Data Quality: misurazione della corruzione sul grafo dei contratti pubblici i...
Data Quality: misurazione della corruzione sul grafo dei contratti pubblici i...Data Quality: misurazione della corruzione sul grafo dei contratti pubblici i...
Data Quality: misurazione della corruzione sul grafo dei contratti pubblici i...Synapta
 
Sound Archives and Musical Instrument Collections
Sound Archives and Musical Instrument CollectionsSound Archives and Musical Instrument Collections
Sound Archives and Musical Instrument CollectionsSynapta
 
Pilota CoBiS Linked Data - presentazione MAB
Pilota CoBiS Linked Data - presentazione MABPilota CoBiS Linked Data - presentazione MAB
Pilota CoBiS Linked Data - presentazione MABSynapta
 
CoBiS Linked Open Data Project - IRCDL 2018
CoBiS Linked Open Data Project - IRCDL 2018CoBiS Linked Open Data Project - IRCDL 2018
CoBiS Linked Open Data Project - IRCDL 2018Synapta
 
CoBiS Linked Open Data - presentazione finale del progetto pilota
CoBiS Linked Open Data - presentazione finale del progetto pilotaCoBiS Linked Open Data - presentazione finale del progetto pilota
CoBiS Linked Open Data - presentazione finale del progetto pilotaSynapta
 
Stack tecnologico Per Linked Data
Stack tecnologico Per Linked DataStack tecnologico Per Linked Data
Stack tecnologico Per Linked DataSynapta
 

More from Synapta (9)

Premio pa sostenibile e resiliente 2020 - ContrattiPubblici.org - Synapta PPT
Premio pa sostenibile e resiliente 2020  - ContrattiPubblici.org - Synapta PPTPremio pa sostenibile e resiliente 2020  - ContrattiPubblici.org - Synapta PPT
Premio pa sostenibile e resiliente 2020 - ContrattiPubblici.org - Synapta PPT
 
Festival della Tecnologia - panel Open data: bene comune - 2019-11-09
Festival della Tecnologia - panel Open data: bene comune - 2019-11-09Festival della Tecnologia - panel Open data: bene comune - 2019-11-09
Festival della Tecnologia - panel Open data: bene comune - 2019-11-09
 
Analisi della qualità dei dati di ContrattiPubblici.org
Analisi della qualità dei dati di ContrattiPubblici.orgAnalisi della qualità dei dati di ContrattiPubblici.org
Analisi della qualità dei dati di ContrattiPubblici.org
 
Data Quality: misurazione della corruzione sul grafo dei contratti pubblici i...
Data Quality: misurazione della corruzione sul grafo dei contratti pubblici i...Data Quality: misurazione della corruzione sul grafo dei contratti pubblici i...
Data Quality: misurazione della corruzione sul grafo dei contratti pubblici i...
 
Sound Archives and Musical Instrument Collections
Sound Archives and Musical Instrument CollectionsSound Archives and Musical Instrument Collections
Sound Archives and Musical Instrument Collections
 
Pilota CoBiS Linked Data - presentazione MAB
Pilota CoBiS Linked Data - presentazione MABPilota CoBiS Linked Data - presentazione MAB
Pilota CoBiS Linked Data - presentazione MAB
 
CoBiS Linked Open Data Project - IRCDL 2018
CoBiS Linked Open Data Project - IRCDL 2018CoBiS Linked Open Data Project - IRCDL 2018
CoBiS Linked Open Data Project - IRCDL 2018
 
CoBiS Linked Open Data - presentazione finale del progetto pilota
CoBiS Linked Open Data - presentazione finale del progetto pilotaCoBiS Linked Open Data - presentazione finale del progetto pilota
CoBiS Linked Open Data - presentazione finale del progetto pilota
 
Stack tecnologico Per Linked Data
Stack tecnologico Per Linked DataStack tecnologico Per Linked Data
Stack tecnologico Per Linked Data
 

TellMeQuality

  • 1. TellMeQuality Alessio Melandri, Marco Torchiano, Antonio Vetrò
  • 2. Obiettivo Strumento per misurare le caratteristiche di qualità del dato secondo l’ISO/IEC 25024
  • 3. Criticità ● Diversi formati di input ○ sintatticamente diversi ○ record, item e value semanticamente diversi (e.g. un record non è sempre la riga di una tabella) ● Caratteristiche inerenti vs dipendenti dal sistema ● Alcune metriche necessitano di metadati di contesto (e.g. I-ACC-1 dipende dal datatype)
  • 4. Soluzione proposta Utilizzare RDF come stele di Rosetta tra formati, ontologie standard (e all’occorrenza custom) per gestire il flusso dei dati e SPARQL per effettuare le misurazioni
  • 5. Resource Description Framework Lo strumento proposto da W3C per: codifica, scambio e riutilizzo di dati e metadati strutturati. Consente l'interoperabilità semantica tra applicazioni che condividono informazioni.
  • 6. Vantaggi ● diversi formati riconciliati in un unico formalismo
  • 7.
  • 8. Vantaggi ● diversi formati riconciliati in un unico formalismo ● metadati associati a livello di dato
  • 9. Modello per la definizione dei metadati (AGID 2014)
  • 10. Modello per la definizione dei metadati (AGID 2014)
  • 11. Vantaggi ● diversi formati riconciliati in un unico formalismo ● metadati associati a livello di dato ● misurazioni tramite query SPARQL ○ facilmente espandibili anche per misurazioni non ISO/IEC 25024
  • 12.
  • 13. Vantaggi ● diversi formati riconciliati in un unico formalismo ● metadati associati a livello di dato ● misurazioni tramite query SPARQL ○ facilmente espandibili anche per misurazioni non ISO/IEC 25024 ● dati machine readable e actable tramite l’utilizzo di ontologie standard (SHACL e DQV) ○ eventualmente espandibili
  • 14. Shapes Constraint Language (https://www.w3.org/TR/shacl/)
  • 15. Data Quality Vocabulary (https://www.w3.org/TR/vocab-dqv/)
  • 16. Possibili svantaggi ● Servono più risorse per gestire triple
  • 18.
  • 19.
  • 20. User journey 1. Alessio vuole analizzare la qualità di una anagrafica in formato CSV 2. Carica il file scelto e delinea i metadati (Shape) in SHACL, aiutato da un’interfaccia con suggerimenti e autocompletamenti 3. L’attenzione di Alessio si sposta sull’interfaccia di scheduling, dove trova la lista delle possibili misurazioni di qualità che può compiere. Si accorge che non può lanciare alcune metriche relative all’accuratezza perché i metadati che ha inserito non sono completi 4. Alessio torna nella schermata dei metadati e aggiunge le informazioni mancanti
  • 21. User journey 5. Ora Alessio lancia tutte e sole le misurazioni relative all’accuratezza: è la metrica che gli interessa in questo studio 6. Nella schermata finale trova una visualizzazione di sintesi dei risultati: il valore che vede non è ottimale 7. Alessio apre il dettaglio e scopre che la qualità degli indirizzi della sua anagrafica è decisamente migliorabile 8. Si scarica allora i risultati in formato JSON e organizza una riunione...
  • 22. Wireframes Prima bozza della user interface del tool
  • 23. Caricamento dati e metadati
  • 24. Wizard per l’inserimento guidato dei metadati
  • 25. Cabina di guida :-) per lanciare le misurazioni
  • 26. Manopole nel dettaglio e fortemente granulari
  • 27. Sintesi dei risultati sulle metriche lanciate
  • 28. Dettaglio di una famiglia di metriche
  • 29. Conclusioni ● Acquisizione di coscienza sulla qualità dei propri dati ○ Vedo quali sono gli aspetti più carenti quindi decido dove investire per migliorare ○ Feedback costante: posso versionare la qualità dei dati e legarla allo sviluppo del software ○ Creazione di una certificazione?? ● Architettura modulare ○ A prova di futuro tramite ontologie e moduli facilmente espandibili ○ API REST: l’interfaccia può cambiare in base alle necessità