SlideShare a Scribd company logo
1 of 21
Download to read offline
Exploration du Web

Observer et construire un patrimoine informationnel
           Rencontres OCIM 2009, Dijon

                   Sébastien Heymann
                       INIST-CNRS
                     Novembre 2009
Que signifie observer le Web ?

Le Web est un espace d’écriture à la fois infini,
partagé et dynamique.

Or il n’existe que 2 points d’entrée dans un
navigateur :
• La barre d’URL
• La barre de recherche
qui nous retournent soit un seul site, soit une
liste de sites, dont la pertinence est criticable.



Nous sommes à priori loin de pouvoir obtenir
une vue d’ensemble exhaustive des acteurs et
         des ressources de la CSTI !

                                                            by Kate O’Brien Creative


Exploration du Web – Sébastien Heymann               Rencontres OCIM 2009, Dijon
Que signifie observer le Web ?

Dès lors, comment appréhender cet objet
socio-technique si souvent représenté par
un « nuage » dans les publications
scientifiques ?




Exploration du Web – Sébastien Heymann      Rencontres OCIM 2009, Dijon
Adopter des stratégies de navigation

Aucun repère dans le brouillard :
on peut vite tourner en rond!




On met en place des stratégies                   Brouillard - Wikipedia

d’exploration en surface et en
profondeur.




Exploration du Web – Sébastien Heymann   Rencontres OCIM 2009, Dijon
Dissiper le brouillard...

1.   S’outiller
2.   Explorer cet espace
3.   Définir ses frontières
4.   Catégoriser les ressources
5.   Les hiérarchiser
6.   Construire des cartes




 Exploration du Web – Sébastien Heymann   Rencontres OCIM 2009, Dijon
…et dominer sa complexité !
•   Modéliser




                                 Modèle en couche - WebAtlas
•   Proposer des interfaces de navigation




                                             Wikiopole - RTGI   Caspar David Friedrich , Voyageur contemplant une mer de nuages

Exploration du Web – Sébastien Heymann                                                          Rencontres OCIM 2009, Dijon
Partir à l’aventure

La tâche du premier explorateur est ardue, car il lui faut :
• Défricher le terrain = identifier les ressources
• Relever sa géographie = groupage et frontières entre sous-domaines
• Baliser les points d’intérêt (annotation)




 Grâce à lui, les suivants disposeront d’outils pour :
 • se localiser sur le web
 • accéder aux ressources dans leur contexte
 • faire des recherches ciblées retournant peu de
 « bruit »


                                                                    Carte imagée du Web social


 Exploration du Web – Sébastien Heymann                        Rencontres OCIM 2009, Dijon
Avant…




   Point d’entrée sous forme de « boite
 noire », nous arrosant de documents pas
              toujours ciblés.




Exploration du Web – Sébastien Heymann     Rencontres OCIM 2009, Dijon
Après !




     Bibliothèque numérique capitalisant les
 explorations pour délivrer un contenu pertinent
                  et étudiable.




Exploration du Web – Sébastien Heymann             Rencontres OCIM 2009, Dijon
Veiller le Web, c’est répondre aux questions…

Quoi ? Où ?
Voir le terrain à l’aide d’une boussole thématique et d’une carte topologique,
localiser les ressources.


Qui ? Quand ?
Écouter les discussions et les débats via un suivi temporel des contenus.


Comment ? Et Pourquoi ?
Synthétiser l’information pour identifier les acteurs et comprendre l’organisation
des ressources.




Exploration du Web – Sébastien Heymann                              Rencontres OCIM 2009, Dijon
Construire un patrimoine informationnel, c’est…

•   Archiver les ressources du domaine…
•   au cours du temps (!).
•   Capitaliser les données d’usage et les parcours de navigation.
•   Restituer ces données sous des formes visuelles et des interfaces d’exploration,
•   Pour en faciliter la réappropriation par le public.




Exploration du Web – Sébastien Heymann                              Rencontres OCIM 2009, Dijon
Exemple : l’univers de la CSTI sur le Web en 2005

•    Panorama de la Culture Scientifique Technique et Industrielle sur le web
     francophone (Mathieu Jacomy)
•    Extrait du rapport WebCSTI, LUTIN, 2005. Sous la direction de Dominique
     Boullier.

•    550 sites
•    ~100 000 pages indexées




 Exploration du Web – Sébastien Heymann                            Rencontres OCIM 2009, Dijon
Carte de l’exploration automatique


Un nœud représente un
site.
Un lien représente un lien
hypertexte entre deux
sites.




Exploration du Web – Sébastien Heymann   Rencontres OCIM 2009, Dijon
Hiérarchisation des sites selon leurs liens

•    Parfois découverte de sites
     importants pourtant
     inconnus avant l’exploration
•    Révélation des domaines
     connexes




 Exploration du Web – Sébastien Heymann       Rencontres OCIM 2009, Dijon
Nouvelle catégorisation selon les données collectées




Exploration du Web – Sébastien Heymann     Rencontres OCIM 2009, Dijon
Vue synthétique sur l’organisation des sites




 Exploration du Web – Sébastien Heymann        Rencontres OCIM 2009, Dijon
Rapport d’analyse topologique




Exploration du Web – Sébastien Heymann   Rencontres OCIM 2009, Dijon
Boussole thématique




Exploration du Web – Sébastien Heymann   Rencontres OCIM 2009, Dijon
Rapport d’analyse quali-quantitative




Exploration du Web – Sébastien Heymann   Rencontres OCIM 2009, Dijon
Rapport au territoire « réel »

•    Articulation des collectivités locales avec
     la CSTI vue depuis le Web




 Exploration du Web – Sébastien Heymann            Rencontres OCIM 2009, Dijon
Exploration du Web

      Merci !
      Sébastien Heymann
          INIST-CNRS
        Novembre 2009

More Related Content

Similar to WebCSTI Rencontres OCIM 2009

L'archivage du Web, présentation college de france
L'archivage du Web, présentation college de franceL'archivage du Web, présentation college de france
L'archivage du Web, présentation college de franceJulien Masanès
 
Semantic Information Systems
Semantic Information SystemsSemantic Information Systems
Semantic Information SystemsSerge Garlatti
 
du signalement à la KB
du signalement à la KBdu signalement à la KB
du signalement à la KBNicolas Morin
 
Les bibliothèques et leurs catalogues 20110324
Les bibliothèques et leurs catalogues   20110324Les bibliothèques et leurs catalogues   20110324
Les bibliothèques et leurs catalogues 20110324Sylvain Machefert
 
Web Invisible et Deep Web
Web Invisible et Deep WebWeb Invisible et Deep Web
Web Invisible et Deep Webei4idi
 
Sites internet de services d'archives : comment faire connaître son site ?
Sites internet de services d'archives : comment faire connaître son site ?Sites internet de services d'archives : comment faire connaître son site ?
Sites internet de services d'archives : comment faire connaître son site ?Julie Scheffer
 
Webradio la canourgue_diff
Webradio la canourgue_diffWebradio la canourgue_diff
Webradio la canourgue_diffJean-Paul FILLIT
 
Gestion de projet site web
Gestion de projet site webGestion de projet site web
Gestion de projet site webPierre Naegelen
 
Conclusion du cours Exploration du Web
Conclusion du cours Exploration du WebConclusion du cours Exploration du Web
Conclusion du cours Exploration du WebSébastien
 
Archives et constitution du savoir
Archives et constitution du savoirArchives et constitution du savoir
Archives et constitution du savoirLouise Merzeau
 
Les sites web des bibliothèques : évolutions et animation
Les sites web des bibliothèques : évolutions et animationLes sites web des bibliothèques : évolutions et animation
Les sites web des bibliothèques : évolutions et animationDujol Lionel
 
Publier sur internet et enrichir ses contenus
Publier sur internet et enrichir ses contenusPublier sur internet et enrichir ses contenus
Publier sur internet et enrichir ses contenusElsieRussier
 
Recherche d'information sur Internet
Recherche d'information sur InternetRecherche d'information sur Internet
Recherche d'information sur InternetAurelieB
 
Les réseaux sociaux en BM/BU : maîtriser leurs langages et leurs codes 2/3
Les réseaux sociaux en BM/BU : maîtriser leurs langages et leurs codes 2/3Les réseaux sociaux en BM/BU : maîtriser leurs langages et leurs codes 2/3
Les réseaux sociaux en BM/BU : maîtriser leurs langages et leurs codes 2/3cspirin
 
Veille2012 avec-copies-ecran-120416110404-phpapp01
Veille2012 avec-copies-ecran-120416110404-phpapp01Veille2012 avec-copies-ecran-120416110404-phpapp01
Veille2012 avec-copies-ecran-120416110404-phpapp01Claude Martin
 
Les outils de recherche et veille sur le web
Les outils de recherche et veille sur le webLes outils de recherche et veille sur le web
Les outils de recherche et veille sur le webechangeurba
 
Urfist bordeaux-moteurs
Urfist bordeaux-moteursUrfist bordeaux-moteurs
Urfist bordeaux-moteursolivier
 
Les réseaux sociaux en BM/BU : maîtriser leurs langages et leurs codes 2/3
Les réseaux sociaux en BM/BU : maîtriser leurs langages et leurs codes 2/3Les réseaux sociaux en BM/BU : maîtriser leurs langages et leurs codes 2/3
Les réseaux sociaux en BM/BU : maîtriser leurs langages et leurs codes 2/3cspirin
 

Similar to WebCSTI Rencontres OCIM 2009 (20)

L'archivage du Web, présentation college de france
L'archivage du Web, présentation college de franceL'archivage du Web, présentation college de france
L'archivage du Web, présentation college de france
 
Sem info system_2012
Sem info system_2012Sem info system_2012
Sem info system_2012
 
Semantic Information Systems
Semantic Information SystemsSemantic Information Systems
Semantic Information Systems
 
du signalement à la KB
du signalement à la KBdu signalement à la KB
du signalement à la KB
 
Les bibliothèques et leurs catalogues 20110324
Les bibliothèques et leurs catalogues   20110324Les bibliothèques et leurs catalogues   20110324
Les bibliothèques et leurs catalogues 20110324
 
Web Invisible et Deep Web
Web Invisible et Deep WebWeb Invisible et Deep Web
Web Invisible et Deep Web
 
Oeinria
OeinriaOeinria
Oeinria
 
Sites internet de services d'archives : comment faire connaître son site ?
Sites internet de services d'archives : comment faire connaître son site ?Sites internet de services d'archives : comment faire connaître son site ?
Sites internet de services d'archives : comment faire connaître son site ?
 
Webradio la canourgue_diff
Webradio la canourgue_diffWebradio la canourgue_diff
Webradio la canourgue_diff
 
Gestion de projet site web
Gestion de projet site webGestion de projet site web
Gestion de projet site web
 
Conclusion du cours Exploration du Web
Conclusion du cours Exploration du WebConclusion du cours Exploration du Web
Conclusion du cours Exploration du Web
 
Archives et constitution du savoir
Archives et constitution du savoirArchives et constitution du savoir
Archives et constitution du savoir
 
Les sites web des bibliothèques : évolutions et animation
Les sites web des bibliothèques : évolutions et animationLes sites web des bibliothèques : évolutions et animation
Les sites web des bibliothèques : évolutions et animation
 
Publier sur internet et enrichir ses contenus
Publier sur internet et enrichir ses contenusPublier sur internet et enrichir ses contenus
Publier sur internet et enrichir ses contenus
 
Recherche d'information sur Internet
Recherche d'information sur InternetRecherche d'information sur Internet
Recherche d'information sur Internet
 
Les réseaux sociaux en BM/BU : maîtriser leurs langages et leurs codes 2/3
Les réseaux sociaux en BM/BU : maîtriser leurs langages et leurs codes 2/3Les réseaux sociaux en BM/BU : maîtriser leurs langages et leurs codes 2/3
Les réseaux sociaux en BM/BU : maîtriser leurs langages et leurs codes 2/3
 
Veille2012 avec-copies-ecran-120416110404-phpapp01
Veille2012 avec-copies-ecran-120416110404-phpapp01Veille2012 avec-copies-ecran-120416110404-phpapp01
Veille2012 avec-copies-ecran-120416110404-phpapp01
 
Les outils de recherche et veille sur le web
Les outils de recherche et veille sur le webLes outils de recherche et veille sur le web
Les outils de recherche et veille sur le web
 
Urfist bordeaux-moteurs
Urfist bordeaux-moteursUrfist bordeaux-moteurs
Urfist bordeaux-moteurs
 
Les réseaux sociaux en BM/BU : maîtriser leurs langages et leurs codes 2/3
Les réseaux sociaux en BM/BU : maîtriser leurs langages et leurs codes 2/3Les réseaux sociaux en BM/BU : maîtriser leurs langages et leurs codes 2/3
Les réseaux sociaux en BM/BU : maîtriser leurs langages et leurs codes 2/3
 

More from Sébastien

PhD Defense: Analyse exploratoire de flots de liens pour la détection d'événe...
PhD Defense: Analyse exploratoire de flots de liens pour la détection d'événe...PhD Defense: Analyse exploratoire de flots de liens pour la détection d'événe...
PhD Defense: Analyse exploratoire de flots de liens pour la détection d'événe...Sébastien
 
Monitoring User-System Interactions through Graph-Based Intrinsic Dynamics An...
Monitoring User-System Interactions through Graph-Based Intrinsic Dynamics An...Monitoring User-System Interactions through Graph-Based Intrinsic Dynamics An...
Monitoring User-System Interactions through Graph-Based Intrinsic Dynamics An...Sébastien
 
Gephi short introduction
Gephi short introductionGephi short introduction
Gephi short introductionSébastien
 
Gephi : dynamic features
Gephi : dynamic featuresGephi : dynamic features
Gephi : dynamic featuresSébastien
 
Motivation in FLOSS communities
Motivation in FLOSS communitiesMotivation in FLOSS communities
Motivation in FLOSS communitiesSébastien
 
Outskewer: Using Skewness to Spot Outliers in Samples and Time Series
Outskewer: Using Skewness to Spot Outliers in Samples and Time SeriesOutskewer: Using Skewness to Spot Outliers in Samples and Time Series
Outskewer: Using Skewness to Spot Outliers in Samples and Time SeriesSébastien
 
Réseau thématique Analyse Exploratoire de Données pour les Réseaux Dynamiques
Réseau thématique Analyse Exploratoire de Données pour les Réseaux DynamiquesRéseau thématique Analyse Exploratoire de Données pour les Réseaux Dynamiques
Réseau thématique Analyse Exploratoire de Données pour les Réseaux DynamiquesSébastien
 
IC05 2008 - Le Web, objet de science?
IC05 2008 - Le Web, objet de science?IC05 2008 - Le Web, objet de science?
IC05 2008 - Le Web, objet de science?Sébastien
 
Des traces d'usages aux patterns relationnels : la construction technologique...
Des traces d'usages aux patterns relationnels : la construction technologique...Des traces d'usages aux patterns relationnels : la construction technologique...
Des traces d'usages aux patterns relationnels : la construction technologique...Sébastien
 
Tour d'horizon des personnes morales adhérentes à l'APRIL
Tour d'horizon des personnes morales adhérentes à l'APRILTour d'horizon des personnes morales adhérentes à l'APRIL
Tour d'horizon des personnes morales adhérentes à l'APRILSébastien
 

More from Sébastien (15)

PhD Defense: Analyse exploratoire de flots de liens pour la détection d'événe...
PhD Defense: Analyse exploratoire de flots de liens pour la détection d'événe...PhD Defense: Analyse exploratoire de flots de liens pour la détection d'événe...
PhD Defense: Analyse exploratoire de flots de liens pour la détection d'événe...
 
Monitoring User-System Interactions through Graph-Based Intrinsic Dynamics An...
Monitoring User-System Interactions through Graph-Based Intrinsic Dynamics An...Monitoring User-System Interactions through Graph-Based Intrinsic Dynamics An...
Monitoring User-System Interactions through Graph-Based Intrinsic Dynamics An...
 
Gephi short introduction
Gephi short introductionGephi short introduction
Gephi short introduction
 
Gephi : dynamic features
Gephi : dynamic featuresGephi : dynamic features
Gephi : dynamic features
 
Motivation in FLOSS communities
Motivation in FLOSS communitiesMotivation in FLOSS communities
Motivation in FLOSS communities
 
Outskewer: Using Skewness to Spot Outliers in Samples and Time Series
Outskewer: Using Skewness to Spot Outliers in Samples and Time SeriesOutskewer: Using Skewness to Spot Outliers in Samples and Time Series
Outskewer: Using Skewness to Spot Outliers in Samples and Time Series
 
Réseau thématique Analyse Exploratoire de Données pour les Réseaux Dynamiques
Réseau thématique Analyse Exploratoire de Données pour les Réseaux DynamiquesRéseau thématique Analyse Exploratoire de Données pour les Réseaux Dynamiques
Réseau thématique Analyse Exploratoire de Données pour les Réseaux Dynamiques
 
Diseasome
DiseasomeDiseasome
Diseasome
 
IC05 cours 4
IC05 cours 4IC05 cours 4
IC05 cours 4
 
IC05 cours 3
IC05 cours 3IC05 cours 3
IC05 cours 3
 
IC05 cours 2
IC05 cours 2IC05 cours 2
IC05 cours 2
 
IC05 cours 1
IC05 cours 1IC05 cours 1
IC05 cours 1
 
IC05 2008 - Le Web, objet de science?
IC05 2008 - Le Web, objet de science?IC05 2008 - Le Web, objet de science?
IC05 2008 - Le Web, objet de science?
 
Des traces d'usages aux patterns relationnels : la construction technologique...
Des traces d'usages aux patterns relationnels : la construction technologique...Des traces d'usages aux patterns relationnels : la construction technologique...
Des traces d'usages aux patterns relationnels : la construction technologique...
 
Tour d'horizon des personnes morales adhérentes à l'APRIL
Tour d'horizon des personnes morales adhérentes à l'APRILTour d'horizon des personnes morales adhérentes à l'APRIL
Tour d'horizon des personnes morales adhérentes à l'APRIL
 

WebCSTI Rencontres OCIM 2009

  • 1. Exploration du Web Observer et construire un patrimoine informationnel Rencontres OCIM 2009, Dijon Sébastien Heymann INIST-CNRS Novembre 2009
  • 2. Que signifie observer le Web ? Le Web est un espace d’écriture à la fois infini, partagé et dynamique. Or il n’existe que 2 points d’entrée dans un navigateur : • La barre d’URL • La barre de recherche qui nous retournent soit un seul site, soit une liste de sites, dont la pertinence est criticable. Nous sommes à priori loin de pouvoir obtenir une vue d’ensemble exhaustive des acteurs et des ressources de la CSTI ! by Kate O’Brien Creative Exploration du Web – Sébastien Heymann Rencontres OCIM 2009, Dijon
  • 3. Que signifie observer le Web ? Dès lors, comment appréhender cet objet socio-technique si souvent représenté par un « nuage » dans les publications scientifiques ? Exploration du Web – Sébastien Heymann Rencontres OCIM 2009, Dijon
  • 4. Adopter des stratégies de navigation Aucun repère dans le brouillard : on peut vite tourner en rond! On met en place des stratégies Brouillard - Wikipedia d’exploration en surface et en profondeur. Exploration du Web – Sébastien Heymann Rencontres OCIM 2009, Dijon
  • 5. Dissiper le brouillard... 1. S’outiller 2. Explorer cet espace 3. Définir ses frontières 4. Catégoriser les ressources 5. Les hiérarchiser 6. Construire des cartes Exploration du Web – Sébastien Heymann Rencontres OCIM 2009, Dijon
  • 6. …et dominer sa complexité ! • Modéliser Modèle en couche - WebAtlas • Proposer des interfaces de navigation Wikiopole - RTGI Caspar David Friedrich , Voyageur contemplant une mer de nuages Exploration du Web – Sébastien Heymann Rencontres OCIM 2009, Dijon
  • 7. Partir à l’aventure La tâche du premier explorateur est ardue, car il lui faut : • Défricher le terrain = identifier les ressources • Relever sa géographie = groupage et frontières entre sous-domaines • Baliser les points d’intérêt (annotation) Grâce à lui, les suivants disposeront d’outils pour : • se localiser sur le web • accéder aux ressources dans leur contexte • faire des recherches ciblées retournant peu de « bruit » Carte imagée du Web social Exploration du Web – Sébastien Heymann Rencontres OCIM 2009, Dijon
  • 8. Avant… Point d’entrée sous forme de « boite noire », nous arrosant de documents pas toujours ciblés. Exploration du Web – Sébastien Heymann Rencontres OCIM 2009, Dijon
  • 9. Après ! Bibliothèque numérique capitalisant les explorations pour délivrer un contenu pertinent et étudiable. Exploration du Web – Sébastien Heymann Rencontres OCIM 2009, Dijon
  • 10. Veiller le Web, c’est répondre aux questions… Quoi ? Où ? Voir le terrain à l’aide d’une boussole thématique et d’une carte topologique, localiser les ressources. Qui ? Quand ? Écouter les discussions et les débats via un suivi temporel des contenus. Comment ? Et Pourquoi ? Synthétiser l’information pour identifier les acteurs et comprendre l’organisation des ressources. Exploration du Web – Sébastien Heymann Rencontres OCIM 2009, Dijon
  • 11. Construire un patrimoine informationnel, c’est… • Archiver les ressources du domaine… • au cours du temps (!). • Capitaliser les données d’usage et les parcours de navigation. • Restituer ces données sous des formes visuelles et des interfaces d’exploration, • Pour en faciliter la réappropriation par le public. Exploration du Web – Sébastien Heymann Rencontres OCIM 2009, Dijon
  • 12. Exemple : l’univers de la CSTI sur le Web en 2005 • Panorama de la Culture Scientifique Technique et Industrielle sur le web francophone (Mathieu Jacomy) • Extrait du rapport WebCSTI, LUTIN, 2005. Sous la direction de Dominique Boullier. • 550 sites • ~100 000 pages indexées Exploration du Web – Sébastien Heymann Rencontres OCIM 2009, Dijon
  • 13. Carte de l’exploration automatique Un nœud représente un site. Un lien représente un lien hypertexte entre deux sites. Exploration du Web – Sébastien Heymann Rencontres OCIM 2009, Dijon
  • 14. Hiérarchisation des sites selon leurs liens • Parfois découverte de sites importants pourtant inconnus avant l’exploration • Révélation des domaines connexes Exploration du Web – Sébastien Heymann Rencontres OCIM 2009, Dijon
  • 15. Nouvelle catégorisation selon les données collectées Exploration du Web – Sébastien Heymann Rencontres OCIM 2009, Dijon
  • 16. Vue synthétique sur l’organisation des sites Exploration du Web – Sébastien Heymann Rencontres OCIM 2009, Dijon
  • 17. Rapport d’analyse topologique Exploration du Web – Sébastien Heymann Rencontres OCIM 2009, Dijon
  • 18. Boussole thématique Exploration du Web – Sébastien Heymann Rencontres OCIM 2009, Dijon
  • 19. Rapport d’analyse quali-quantitative Exploration du Web – Sébastien Heymann Rencontres OCIM 2009, Dijon
  • 20. Rapport au territoire « réel » • Articulation des collectivités locales avec la CSTI vue depuis le Web Exploration du Web – Sébastien Heymann Rencontres OCIM 2009, Dijon
  • 21. Exploration du Web Merci ! Sébastien Heymann INIST-CNRS Novembre 2009