SlideShare a Scribd company logo
1 of 2
Download to read offline
Aide mémoire Openrefine 3.3 – principales commandes de l’interface. V1.1. Par Mathieu Saby. 19/11/2019 – Licence CC BY
AIDE-MÉMOIRE OPENREFINE 3.3 : PRINCIPALES COMMANDES
Encadré bleu : commandes accessibles depuis la page d’accueil ; Encadré blanc : commandes accessibles depuis un projet.
GÉRER LES PROJETS
Ouvrir un projet
> Ouvrir un projet
Supprimer un projet
Modifier le nom, ajouter des sujets, des
étiquettes, une description
EXPORTER
> Exporter
Un projet Openrefine
> Exporter le projet
Les données du projet
…export complet
> Valeurs séparées par des
tabulations
> Valeurs séparées par des
virgules
> Table HTML
> Excel / Excel 2007
> Opendocument (Libreoffice)
> Data package
…export personnalisé
> Export tabulaire
> Export SQL
> Modélisation
> QuickStatements (Wikidata)
> Publication sur Wikidata
IMPORTER
Un projet Openrefine
> Importer un projet
Des données
(CSV, TSV et variantes, Excel, Libreoffice,
Google Data, texte brut, XML et JSON avec
limitations, RDF, Wikitext)
> Créer un projet
… depuis un ou plusieurs fichiers locaux :
> Cet ordinateur
…par saisie directe :
> Presse-papier
… depuis un Google Doc
> Google Data
… depuis un ou plusieurs fichiers en ligne :
> Adresses web
… depuis un « data package » en ligne ou
local
> Data packages
… depuis une base de données
> Database
AGIR SUR LES LIGNES
Trier
> Trier sur une ou plusieurs colonnes
> Retrier de façon permanente ou Supprimer le tri
Supprimer les lignes affichées (col. Toutes )
> Editer les lignes
> Supprimer les lignes
Signaler des lignes (col. Toutes )
> Editer les lignes
> étoiler/ désétoiler
> marquer / démarquer
Scinder des cellules sur plusieurs lignes et vice versa
> Editer les cellules
> Diviser les cellules multivaluées
Possible de personnaliser le séparateur (regex possible) ; diviser par
longueur de champ
> Joindre les cellules multivaluées
EXPLORER
Filtres de colonnes
> Filtrer le texte (Regex possible)
Facettes de colonnes
> Facette
> Textuelle
> Numérique
> Chronologique
> Textuelle personnalisée (formules)
> Numérique personnalisée
> Personnalisée
> par mots
> par doublons (doublons calculés sur tout le jeu de données,
sans prise en compte des filtres et facettes activés)
> par longueur de texte
> par erreur
> par valeur nulle
> par chaîne vide
> par valeur vide
Facettes globales (col. Toutes)
> Facette par étoile
> Facette par marque
> Facette par valeur vide
> Valeurs non vides par colonnes
> Entrées non vides par colonnes
GÉRER LES EXTENSIONS
> Ouvrir un projet
> Parcourir le dossier de
l’espace de travail
Déposer le dossier contenant l’extension
dans le dossier extension.
GÉRER LES OPTIONS
> Langue
> Préférences
ui.browsing.listFacet.limit
PERSONNALISER L’AFFICHAGE
Afficher les valeurs null (col Toutes)
> Afficher/masquer les valeurs nulles dans les
cellules
Masquer ou afficher des colonnes
> Aperçu
MODE LIGNES ET MODE ENTRÉES
Une entrée regroupe une ou plusieurs lignes en fonction du contenu
de leur 1re colonne.
Modifie le fonctionnement des facettes et des fonctions de scissions
et de vidage/remplissage
Pour prendre en compte les entrées : Voir en … entrées
Pour prendre en compte les lignes : Voir en … lignes
Aide mémoire Openrefine 3.3 – principales commandes de l’interface. V1.1. Par Mathieu Saby. 19/11/2019 – Licence CC BY
AGIR SUR LES COLONNES
Renommer
> Editer la colonne
> Renommer cette colonne
Supprimer
> Editer la colonne
> Supprimer cette colonne
Déplacer
> Editer la colonne
> Déplacer la colonne (en 1er, en dernier, à droite, à gauche)
Supprimer ou déplacer plusieurs colonnes (Col. Toutes )
> Retrier/supprimer les colonnes
Scinder une colonne en plusieurs
> Editer la colonne
> Diviser en plusieurs colonnes
Possible de personnaliser le séparateur (regex possible) ; diviser par
longueur de champ ; limiter le nombre de divisions ; conserver la
colonne d’origine ; désactiver la détection du type de données
Joindre plusieurs colonnes
> Editer la colonne
> Joindre des colonnes
Ajouter une nouvelle colonne basée sur une colonne existante
> Editer la colonne
> Ajouter une colonne en fonction de cette colonne
Ajouter une nouvelle colonne basée sur une requête HTTP
> Editer la colonne
> Ajouter une colonne en moissonnant une URL
Options utiles : délai ; conserver les erreurs ; mettre les réponses en
cache (rapidité) ; entête HTTP personnalisé si le serveur permet la
négociation de contenu (ex : application/json ou text/xml)
Pas de prise en compte des redirections y compris https -> http.
APPLIQUER UNE TRANSFORMATION PERSONNALISÉE
Appliquer une transformation personnalisée à une colonne
> Transformer
Appliquer une transformation personnalisée à plusieurs colonne
Col. Toutes >
> Transformer
Langage : GREL, Python (2,7), Clojure
Saisie de l’expression
Prévisualisation du résultat
Historique des dernières formules
Formules favorites (étoilées)
Aide (limitée mais utile)
Options en cas d’erreur : conserver l’original, vider la cellule, afficher
l’erreur
TRANSPOSER LIGNES ET COLONNES
> Transposer
Passer d’un format « large » à un format « long »
> Transposer les cellules de plusieurs colonnes en lignes
Transposer les cellules en colonnes séparées
> Transposer les cellules en colonnes séparées
Passer d’un format « long » à un format « large »
> Convertir en liste les colonnes de clé/valeur
RÉCONCILIER DEPUIS UNE SOURCE DE DONNÉES EXTÉRIEURE
Réconcilier depuis une source de données extérieure
> Réconcilier > Démarrer la réconciliation
Choisir le service ou en installer un nouveau (par défaut : Wikidata)
Valider le type d’entité cherchée
Pour certains services possibilité d’utiliser d’autres colonnes pour
préciser la requête
Dans la grille, valider les correspondances exactes
AGIR SUR LE CONTENU DES CELLULES
Transformations courantes
> Editer les cellules > Transformations courantes
…supprimer les espaces superflus
> Supprimer les espaces de début et de fin
> Rassembler les espaces consécutifs
…harmoniser la casse
> En initiale majuscules
> En majuscules
> En minuscules
…convertir
> date et texte en nombre
> texte en dates
> nombre et date en texte
…effacer
> en valeurs nulles
> en chaînes vides
Remplacer
> Editer les cellules
> Remplacer (Regex possible)
Vider les valeurs répétées / recopier les valeurs dans les cellules vides
> Editer les cellules
> Vider les valeurs répétées…
> Recopier les valeurs répétées…
Prend en compte les limites des entrées si le mode entrée est activé

More Related Content

What's hot

Exports de r vers office
Exports de r vers officeExports de r vers office
Exports de r vers officefrancoismarical
 
Cours Piles et files en utilisant lesl istes chainées Prof. KHALIFA MANSOURI
Cours Piles et files en utilisant lesl istes chainées Prof. KHALIFA MANSOURI Cours Piles et files en utilisant lesl istes chainées Prof. KHALIFA MANSOURI
Cours Piles et files en utilisant lesl istes chainées Prof. KHALIFA MANSOURI Mansouri Khalifa
 
Les listes simplement chaînées en langage C
Les listes simplement chaînées en langage CLes listes simplement chaînées en langage C
Les listes simplement chaînées en langage CMohamed Lahby
 
Cours les Listes doublement chainées Prof. KHALIFA MANSOURI
Cours les Listes doublement chainées Prof. KHALIFA MANSOURI Cours les Listes doublement chainées Prof. KHALIFA MANSOURI
Cours les Listes doublement chainées Prof. KHALIFA MANSOURI Mansouri Khalifa
 
Programmer dans Openrefine avec GREL
Programmer dans Openrefine avec GRELProgrammer dans Openrefine avec GREL
Programmer dans Openrefine avec GRELMathieu Saby
 
Fonction Excel
Fonction ExcelFonction Excel
Fonction ExcelHouda001
 
R fait du la tex
R fait du la texR fait du la tex
R fait du la texCdiscount
 
Cours python avancé
Cours python avancéCours python avancé
Cours python avancépierrepo
 
Les raccourcis clavier sur microsoft excel
Les raccourcis clavier sur microsoft excelLes raccourcis clavier sur microsoft excel
Les raccourcis clavier sur microsoft excelRodrigue NDINGA
 
Fltau r interface
Fltau r interfaceFltau r interface
Fltau r interfaceCdiscount
 
Les fondamentaux du langage C
Les fondamentaux du langage CLes fondamentaux du langage C
Les fondamentaux du langage CAbdoulaye Dieng
 
Excel formules-et-fonctions
Excel formules-et-fonctionsExcel formules-et-fonctions
Excel formules-et-fonctionsMelek Sellami
 
Chapitre 3 structures séquentielles
Chapitre 3 structures séquentiellesChapitre 3 structures séquentielles
Chapitre 3 structures séquentiellesSana Aroussi
 
Bib2Hal, import par lot dans HAL à partir d'un fichier BibTeX -formation CCSD...
Bib2Hal, import par lot dans HAL à partir d'un fichier BibTeX -formation CCSD...Bib2Hal, import par lot dans HAL à partir d'un fichier BibTeX -formation CCSD...
Bib2Hal, import par lot dans HAL à partir d'un fichier BibTeX -formation CCSD...OAccsd
 
GSI_Chap4-bts-requêtesSQL
GSI_Chap4-bts-requêtesSQLGSI_Chap4-bts-requêtesSQL
GSI_Chap4-bts-requêtesSQLecogestionblog
 

What's hot (20)

Exports de r vers office
Exports de r vers officeExports de r vers office
Exports de r vers office
 
Cours Piles et files en utilisant lesl istes chainées Prof. KHALIFA MANSOURI
Cours Piles et files en utilisant lesl istes chainées Prof. KHALIFA MANSOURI Cours Piles et files en utilisant lesl istes chainées Prof. KHALIFA MANSOURI
Cours Piles et files en utilisant lesl istes chainées Prof. KHALIFA MANSOURI
 
Les listes simplement chaînées en langage C
Les listes simplement chaînées en langage CLes listes simplement chaînées en langage C
Les listes simplement chaînées en langage C
 
Presentation sql
Presentation sqlPresentation sql
Presentation sql
 
Cours les Listes doublement chainées Prof. KHALIFA MANSOURI
Cours les Listes doublement chainées Prof. KHALIFA MANSOURI Cours les Listes doublement chainées Prof. KHALIFA MANSOURI
Cours les Listes doublement chainées Prof. KHALIFA MANSOURI
 
Programmer dans Openrefine avec GREL
Programmer dans Openrefine avec GRELProgrammer dans Openrefine avec GREL
Programmer dans Openrefine avec GREL
 
Fonction Excel
Fonction ExcelFonction Excel
Fonction Excel
 
R fait du la tex
R fait du la texR fait du la tex
R fait du la tex
 
Les listes en Python
Les listes en PythonLes listes en Python
Les listes en Python
 
Cours python avancé
Cours python avancéCours python avancé
Cours python avancé
 
Les raccourcis clavier sur microsoft excel
Les raccourcis clavier sur microsoft excelLes raccourcis clavier sur microsoft excel
Les raccourcis clavier sur microsoft excel
 
Fltau r interface
Fltau r interfaceFltau r interface
Fltau r interface
 
Les fondamentaux du langage C
Les fondamentaux du langage CLes fondamentaux du langage C
Les fondamentaux du langage C
 
Php1
Php1Php1
Php1
 
Initiation r
Initiation rInitiation r
Initiation r
 
Excel formules-et-fonctions
Excel formules-et-fonctionsExcel formules-et-fonctions
Excel formules-et-fonctions
 
Chapitre 3 structures séquentielles
Chapitre 3 structures séquentiellesChapitre 3 structures séquentielles
Chapitre 3 structures séquentielles
 
Bib2Hal, import par lot dans HAL à partir d'un fichier BibTeX -formation CCSD...
Bib2Hal, import par lot dans HAL à partir d'un fichier BibTeX -formation CCSD...Bib2Hal, import par lot dans HAL à partir d'un fichier BibTeX -formation CCSD...
Bib2Hal, import par lot dans HAL à partir d'un fichier BibTeX -formation CCSD...
 
GSI_Chap4-bts-requêtesSQL
GSI_Chap4-bts-requêtesSQLGSI_Chap4-bts-requêtesSQL
GSI_Chap4-bts-requêtesSQL
 
PL/SQL:les curseurs
PL/SQL:les curseursPL/SQL:les curseurs
PL/SQL:les curseurs
 

Similar to Aide mémoire Openrefine 3.3 béta

Tableur avance EXCEL
Tableur avance EXCELTableur avance EXCEL
Tableur avance EXCELwalid sassi
 
Tpdba1
Tpdba1Tpdba1
Tpdba1infcom
 
Programmation en VBA Introduction au language Visual Basic for Applications ...
Programmation en VBA  Introduction au language Visual Basic for Applications ...Programmation en VBA  Introduction au language Visual Basic for Applications ...
Programmation en VBA Introduction au language Visual Basic for Applications ...Bassim ELKHATTABY
 
initiation au javascript
initiation au javascriptinitiation au javascript
initiation au javascriptAbdoulaye Dieng
 
Support formation vidéo : SQL pour les (grands) débutants
Support formation vidéo : SQL pour les (grands) débutants Support formation vidéo : SQL pour les (grands) débutants
Support formation vidéo : SQL pour les (grands) débutants SmartnSkilled
 
Matrice de comparaison des fonctionnalités de 360 view cmc
Matrice de comparaison des fonctionnalités de 360 view cmcMatrice de comparaison des fonctionnalités de 360 view cmc
Matrice de comparaison des fonctionnalités de 360 view cmcSebastien Goiffon
 

Similar to Aide mémoire Openrefine 3.3 béta (10)

Tableur avance EXCEL
Tableur avance EXCELTableur avance EXCEL
Tableur avance EXCEL
 
Tpdba1
Tpdba1Tpdba1
Tpdba1
 
Programmation en VBA Introduction au language Visual Basic for Applications ...
Programmation en VBA  Introduction au language Visual Basic for Applications ...Programmation en VBA  Introduction au language Visual Basic for Applications ...
Programmation en VBA Introduction au language Visual Basic for Applications ...
 
TABLEUR Excel
TABLEUR ExcelTABLEUR Excel
TABLEUR Excel
 
Formulaires
FormulairesFormulaires
Formulaires
 
initiation au javascript
initiation au javascriptinitiation au javascript
initiation au javascript
 
Support formation vidéo : SQL pour les (grands) débutants
Support formation vidéo : SQL pour les (grands) débutants Support formation vidéo : SQL pour les (grands) débutants
Support formation vidéo : SQL pour les (grands) débutants
 
Initiation à Bootstrap
Initiation à BootstrapInitiation à Bootstrap
Initiation à Bootstrap
 
Sql & excel
Sql & excelSql & excel
Sql & excel
 
Matrice de comparaison des fonctionnalités de 360 view cmc
Matrice de comparaison des fonctionnalités de 360 view cmcMatrice de comparaison des fonctionnalités de 360 view cmc
Matrice de comparaison des fonctionnalités de 360 view cmc
 

Aide mémoire Openrefine 3.3 béta

  • 1. Aide mémoire Openrefine 3.3 – principales commandes de l’interface. V1.1. Par Mathieu Saby. 19/11/2019 – Licence CC BY AIDE-MÉMOIRE OPENREFINE 3.3 : PRINCIPALES COMMANDES Encadré bleu : commandes accessibles depuis la page d’accueil ; Encadré blanc : commandes accessibles depuis un projet. GÉRER LES PROJETS Ouvrir un projet > Ouvrir un projet Supprimer un projet Modifier le nom, ajouter des sujets, des étiquettes, une description EXPORTER > Exporter Un projet Openrefine > Exporter le projet Les données du projet …export complet > Valeurs séparées par des tabulations > Valeurs séparées par des virgules > Table HTML > Excel / Excel 2007 > Opendocument (Libreoffice) > Data package …export personnalisé > Export tabulaire > Export SQL > Modélisation > QuickStatements (Wikidata) > Publication sur Wikidata IMPORTER Un projet Openrefine > Importer un projet Des données (CSV, TSV et variantes, Excel, Libreoffice, Google Data, texte brut, XML et JSON avec limitations, RDF, Wikitext) > Créer un projet … depuis un ou plusieurs fichiers locaux : > Cet ordinateur …par saisie directe : > Presse-papier … depuis un Google Doc > Google Data … depuis un ou plusieurs fichiers en ligne : > Adresses web … depuis un « data package » en ligne ou local > Data packages … depuis une base de données > Database AGIR SUR LES LIGNES Trier > Trier sur une ou plusieurs colonnes > Retrier de façon permanente ou Supprimer le tri Supprimer les lignes affichées (col. Toutes ) > Editer les lignes > Supprimer les lignes Signaler des lignes (col. Toutes ) > Editer les lignes > étoiler/ désétoiler > marquer / démarquer Scinder des cellules sur plusieurs lignes et vice versa > Editer les cellules > Diviser les cellules multivaluées Possible de personnaliser le séparateur (regex possible) ; diviser par longueur de champ > Joindre les cellules multivaluées EXPLORER Filtres de colonnes > Filtrer le texte (Regex possible) Facettes de colonnes > Facette > Textuelle > Numérique > Chronologique > Textuelle personnalisée (formules) > Numérique personnalisée > Personnalisée > par mots > par doublons (doublons calculés sur tout le jeu de données, sans prise en compte des filtres et facettes activés) > par longueur de texte > par erreur > par valeur nulle > par chaîne vide > par valeur vide Facettes globales (col. Toutes) > Facette par étoile > Facette par marque > Facette par valeur vide > Valeurs non vides par colonnes > Entrées non vides par colonnes GÉRER LES EXTENSIONS > Ouvrir un projet > Parcourir le dossier de l’espace de travail Déposer le dossier contenant l’extension dans le dossier extension. GÉRER LES OPTIONS > Langue > Préférences ui.browsing.listFacet.limit PERSONNALISER L’AFFICHAGE Afficher les valeurs null (col Toutes) > Afficher/masquer les valeurs nulles dans les cellules Masquer ou afficher des colonnes > Aperçu MODE LIGNES ET MODE ENTRÉES Une entrée regroupe une ou plusieurs lignes en fonction du contenu de leur 1re colonne. Modifie le fonctionnement des facettes et des fonctions de scissions et de vidage/remplissage Pour prendre en compte les entrées : Voir en … entrées Pour prendre en compte les lignes : Voir en … lignes
  • 2. Aide mémoire Openrefine 3.3 – principales commandes de l’interface. V1.1. Par Mathieu Saby. 19/11/2019 – Licence CC BY AGIR SUR LES COLONNES Renommer > Editer la colonne > Renommer cette colonne Supprimer > Editer la colonne > Supprimer cette colonne Déplacer > Editer la colonne > Déplacer la colonne (en 1er, en dernier, à droite, à gauche) Supprimer ou déplacer plusieurs colonnes (Col. Toutes ) > Retrier/supprimer les colonnes Scinder une colonne en plusieurs > Editer la colonne > Diviser en plusieurs colonnes Possible de personnaliser le séparateur (regex possible) ; diviser par longueur de champ ; limiter le nombre de divisions ; conserver la colonne d’origine ; désactiver la détection du type de données Joindre plusieurs colonnes > Editer la colonne > Joindre des colonnes Ajouter une nouvelle colonne basée sur une colonne existante > Editer la colonne > Ajouter une colonne en fonction de cette colonne Ajouter une nouvelle colonne basée sur une requête HTTP > Editer la colonne > Ajouter une colonne en moissonnant une URL Options utiles : délai ; conserver les erreurs ; mettre les réponses en cache (rapidité) ; entête HTTP personnalisé si le serveur permet la négociation de contenu (ex : application/json ou text/xml) Pas de prise en compte des redirections y compris https -> http. APPLIQUER UNE TRANSFORMATION PERSONNALISÉE Appliquer une transformation personnalisée à une colonne > Transformer Appliquer une transformation personnalisée à plusieurs colonne Col. Toutes > > Transformer Langage : GREL, Python (2,7), Clojure Saisie de l’expression Prévisualisation du résultat Historique des dernières formules Formules favorites (étoilées) Aide (limitée mais utile) Options en cas d’erreur : conserver l’original, vider la cellule, afficher l’erreur TRANSPOSER LIGNES ET COLONNES > Transposer Passer d’un format « large » à un format « long » > Transposer les cellules de plusieurs colonnes en lignes Transposer les cellules en colonnes séparées > Transposer les cellules en colonnes séparées Passer d’un format « long » à un format « large » > Convertir en liste les colonnes de clé/valeur RÉCONCILIER DEPUIS UNE SOURCE DE DONNÉES EXTÉRIEURE Réconcilier depuis une source de données extérieure > Réconcilier > Démarrer la réconciliation Choisir le service ou en installer un nouveau (par défaut : Wikidata) Valider le type d’entité cherchée Pour certains services possibilité d’utiliser d’autres colonnes pour préciser la requête Dans la grille, valider les correspondances exactes AGIR SUR LE CONTENU DES CELLULES Transformations courantes > Editer les cellules > Transformations courantes …supprimer les espaces superflus > Supprimer les espaces de début et de fin > Rassembler les espaces consécutifs …harmoniser la casse > En initiale majuscules > En majuscules > En minuscules …convertir > date et texte en nombre > texte en dates > nombre et date en texte …effacer > en valeurs nulles > en chaînes vides Remplacer > Editer les cellules > Remplacer (Regex possible) Vider les valeurs répétées / recopier les valeurs dans les cellules vides > Editer les cellules > Vider les valeurs répétées… > Recopier les valeurs répétées… Prend en compte les limites des entrées si le mode entrée est activé