SlideShare a Scribd company logo
1 of 24
URFIST-Rennes / 2 octobre 2009 Franck Ghitalla, mai 2009, systèmes d’information et analyse de données (INIST). Cartographie(s) de l’Information
URFIST-Rennes / 2 octobre 2009 Objectifs des procédés cartographiques La cartographie et sciences des réseaux ( NetworkSciences ) : détection de patterns statistiques et visuels des corpus Avant  la cartographie : la phase d’exploration des corpus 1) Cadre scientifique des procédés cartographiques de l’information
URFIST-Rennes / 2 octobre 2009 Ingénierie scientifique et recherche sur la cartographie de l’information pour… L’OBSERVATION   Propriétés statistiques de corpus numérisés Identification de patterns relationnels Construction d’indicateurs liés aux contenus, aux formes techniques ou aux traces sociales LA MODELISATION De structures informationnelles d’architectures documentaires de phénomènes de flux et/ou d’évolution temporelle L’INTERVENTION Dans le cadre  d’une politique d’édition ou de publication Aménagement des territoires numériques (visibilité, organisation de thématiques) Connexion, accompagnement de communautés d’acteurs Conception et développement de systèmes d’information multi-sources intégrant des procédés cartographiques à partir… SOURCES TECHNIQUES BDD scientifiques Corpus de revues ( Hermès ,  Le Temps des Médias …) Web (sources propres crawlées, bases search engines EXALEAD, RTGI…) Bases brevets Bases termes/concepts ( TermSciences ) Bases de connaissances personnelles ou collectives (bookmarks, documents numériques de travail, personnels, listes d’objets…) Traces d’usages (statistiques, logs, signatures…) CHAMPS THEMATIQUES Acteurs et organisations de la société civile Figures contemporaines de la science (émergence de problématiques transversales, éthique, institutions et communautés d’acteurs…) Espace(s) public(s) en réseau, opinion publique Projets politiques d’intervention sur les territoires numériques Objectifs des procédés cartographiques
URFIST-Rennes / 2 octobre 2009 Les systèmes d’information, les masses de données, les systèmes complexes vivants, techniques ou sociaux constituent aujourd’hui l’espace d’investigation privilégié des  NetWork Sciences  (cf.bibliographie). Le web et tous ces systèmes peuvent être explorés comme des « E-cosystems » réglés par une  évolution  et des  régularités fortes  ( strong regularities ). Distribution des contenus, structure hyperliée, traces d’usage, interactions entre composants s’y mêlent à titre de dimensions constitutives, sans oublier les « lois d’expansion » qui les gouvernent ( network dynamics ).  La  visualisation  de  graphes relationnels  et la  manipulation  de leurs  dimensions  permettent de produire des « vues » originales sur les données. En particulier, il s’agit d’identifier des  patterns statistiques  ou des  saillances visuelles  associées aux corpus explorés. C’est le principe d’une géographie de l’information nourrie de problématiques théoriques en  Network Sciences  et qu’il s’agit en même temps de rendre tangible à des usagers ( knowledge mapping tools ). Distances, Densité, diamètre Modèles topologiques, power-law, random/regular graphs Hubs/Authorities, structure d’agrégat Clusters, hiérarchies et ranking Voisinage, centralité/périphérie, inclusion Communautés compétitives Corrélation contenu/structure Topical localities focus crawling Dynamics/evolution of networks Topic Detection and Tracking (TDT) Time Series vizualisation/graphical tracking of information flow La cartographie et sciences des réseaux ( NetworkSciences ) : détection de patterns statistiques et visuels des corpus
URFIST-Rennes / 2 octobre 2009 INTERFACE, DONNEES, EXPLORATION DE CORPUS L'Atelier vise à développer le cadre méthodologique et les outils techniques d'un  processus d'exploration  de grande masses de données (systèmes ouverts, dynamiques et diversement structurés). A ce titre, les interfaces numériques à base de graphes ou cartographiques constituent des espaces puissants de synthèse de l'information mais aussi, parallèlement, d'exploration dynamiques des données. Au delà, l'Atelier intègre à l'activité de production d'interfaces cartographiques l'ensemble de la  chaîne  qui constituent les  systèmes d'information  : outils et méthodes d'extraction des données (crawlers, A.P.I., recueil manuel et semi-automatique...), archivage et indexation des données, algorithmes et filtres de traitement. Les interfaces cartographiques produites seront donc le résultat d'un processus  supervisé  d'exploration et de transformations successives de données où alterneront  phases de synthèse  et de  phases de manipulation  orientées vers la recherche de  patterns  robustes. Avant  la cartographie : la phase d’exploration des corpus
URFIST-Rennes / 2 octobre 2009 Le cycle de production Types de données / Extraction Types de méthodes Classes de cartographies de l’information 2) Cycle de production des cartographies
URFIST-Rennes / 2 octobre 2009 Processing / Cycle de production La production d’interfaces cartographiques relève d’un processus décomposable schématiquement en trois phases principales : l’extraction des données (BDD et fonds propres INIST, sources externes via des API, sources qualifiées manuellement, web crawling…issus de différents domaines comme les réseaux sociaux, les programmes informatiques, gènes, liens hypertextes, distributions statistiques sur des mots-clef, données d’usage…) et enfin la construction cartographique qui comprend à la fois la sélection de « vues » sur les données et le travail sémiologique de mise en forme.  3) Classes de cartographies de l’information Interfaces, spatialisation et production de vues sur les données 1) Types de données Extraction, sources expérimentales, domaines scientifiques 2) Types de Méthodes Traitement, filtrage et enrichissement des données Retours de cycles d’exploration/conception
URFIST-Rennes / 2 octobre 2009 Données web Réseaux sociaux Gènes, pathologies BDD scientifiques 1) Types de données Sources expérimentales, domaines scientifiques
URFIST-Rennes / 2 octobre 2009 1) (bis) Types de données Sources expérimentales, domaines scientifiques Les A.P.I. permettent d’interroger de grandes bases de données structurées, processus indispensable pour produire des cartographies sur de grandes masses d’informations. C’est le cas, notamment, des API dédiées aux  search engines  comme  EXALEAD  (partenaire de l’Atelier) qui compte plus de 16 milliards de références en base web. Dans le cadre d’un partenariat comme avec  EXALEAD , on peut aussi développer une série d’API complémentaires entre elles et mobilisables sur différents sujets ou à différentes occasions. Sur les sujets de controverses « science-société », les API  Exalead  sont indispensables pour produire des « photographies de l’opinion » à grande échelle en prenant en compte, parmi les données web, aussi bien les contenus des pages que les liens hypertextes ou les entités nommées. Cette série spécifique d’API développées par  WebAtlas  a donné lieu à un projet de système intégré et monitoré d’API-Exalead,  EXA-Miner.
URFIST-Rennes / 2 octobre 2009 2) Types de Méthodes Traitement, filtrage et enrichissement des données REDUIRE LES MASSES ET LES DIMENSIONS Produire des indicateurs de masses, de densité, de clustering, de voisinage et de centration Concevoir des filtres Décomposer les dimensions (topologie hypertexte, texte et contenu, indicateurs d’usage…) Modèle(s) de distribution des propriétés des corpus FAIRE EMERGER DES PATTERNS Méthodes de projection spatiale, visualisation des données Identification de saillances logico-graphiques Capitaliser/archiver les phases de transformation des corpus Ingénierie de l’exploration des corpus par :  Fusion  des données de données hétérogènes Niveaux  de navigation/zoom Réduction  (algorithmes de hiérarchisation/clustering…) Projection  (fonds géoréférencés, schémas fonctionnels, organigrammes…) CONSTRUIRE DES FIGURES Principes d’agrégation Organisation, architecture et sous-ensembles Couches et profondeurs des corpus Temporalités et événements
URFIST-Rennes / 2 octobre 2009 Cartographies statiques posters papier Cartographies statiques explorables en ligne Générateur de graphes GEPHI Cartographies dynamiques explorables en ligne Communication scientifique Analyse de l’information 3) Classes de cartographies de l’information Interfaces, spatialisation et production de vues sur les données
URFIST-Rennes / 2 octobre 2009 3) Exemples radicaux libres principes actifs cosmetiques naturels produits cosmetiques produits de soins peaux seches produits de beaute produits de soin soins du visage produits naturels anti-rides soin du visage huiles vegetales complements alimentaires anti-age institut de beaute soins du corps type de peau soins beaute cosmetiques bio
URFIST-Rennes / 2 octobre 2009 Classes de cartographies de l’information Interfaces, spatialisation et production de vues sur les données Communication scientifique - « Place des Controverses » Stand commun Sciences-Po/WebAtlas/Microsoft – Ville Européenne des Sciences, novembre 2008, Grand-Palais. La conception de dispositifs d’exposition conduit à mettre en scène la science dans sa dimension expérimentale. En proposant à des spectateurs d’arpenter physiquement un graphe géant posé au sol, le principe des grands graphes de mots-clefs (souvent assez abstraits) épouse la physique d’un parcours corporel de découverte d’une succession de 8 controverses sociétales, reliées entre elles par des mots clefs communs.  L’un des objectifs de l’Atelier est ainsi de tester d’autres modes d’interaction avec les masses de données que l’écran numérique. Les dispositifs scénographiques, immersifs ou mobiles font partie du champ d’expérimentation de l’Atelier.
URFIST-Rennes / 2 octobre 2009 Le projet « The Human Disease Network » Données empruntées à Kwang-Il Goh, Michael E. Cusick, David Valle, Barton Childs, Marc Vidal & Albert-László Barabási Exemple d’un travail pluri-disciplinaire en ingénierie des connaissances au sein de l’USR “Ingénierie des Connaissances”  (Magali Roux, Franck Ghitalla, Sébastien Heymann et Mathieu Bastian). The Map the of disease gene-disorder a pour objectif de vérifier pour la première fois à grande échelle cette…« ….strong evidence that at least one mutation in the particular gene is causative to the disorder.”  En association avec Magali Roux, l’équipe GEPHI a repris les données et produit de nouvelles visualisations de près de 2.000 maladies classées et de près d’autant de gènes impliqués sous forme de liens relationnels. Ce travail démontre la possibilité de mobiliser des compétences et des technologies issues du web-mining vers d’autres domaines scientifiques, l’une des pierres angulaires de la démarche de l’atelier. La version explorable accessible en ligne :  http:// diseasome.eu
URFIST-Rennes / 2 octobre 2009 Le système d’exploration en ligne associé au projet « The Human Disease Network » -  http://gephi.org/diseasome Une cartographie en ligne a été associée au projet,  Diseasome . Basé sur une interface RTGI, elle donne accès à une cartographie dynamique où l’on peut sélectionner un nœuds, l’explorer, zoomer, sélectionner des rubriques, rechercher par mot-clefs…Les nœuds cliquables renvoient chacun vers une article de  wikipedia  mais pourront aussi être associés à  Cat-inist  ou à  Termsciences . De la page d’accueil de  Diseasome , on peut aussi télécharger la cartographie imprimable en grand format ou accéder à l’ouvrage associé de Magali Roux,  La biologie, l’ère numérique.
URFIST-Rennes / 2 octobre 2009 Système géoréférencé pour la la région Picardie et Réseaux Numériques de Picardie (RENUPI) Géoréférencement des ressources web en Picardie (2005). A partir de plusieurs milliers de sites web crawlés et traitant de différents aspects de la Picardie en termes de contenus, plusieurs cartes géographiques de la région et de ses départements ont été produites, en fonction notamment des catégories classant les sites. Ainsi, à l’échelle de l’Aisne, on peut comprendre sur quels lieux ou thématiques sont concentrés les sites francophones traitant du tourisme dans le département (mesure de visibilité sur le web du patrimoine touristique). On peut aussi comprendre, à l’échelle de l’Oise, de quoi traitent les sites web consacrés au département et à quelles catégories d’acteurs ils se rattachent.
URFIST-Rennes / 2 octobre 2009 Cartographie de thématiques scientifiques transversales La question de l’Arctique sur le web 1715 mots-clés  reliés par 6676 liens. Ce graphe a été construit à partir des données du moteur web Exalead. Plus de 21000 sites ont été indexés pour obtenir ce corpus.  Deux expressions sont liées si elles sont présentes en même temps dans de nombreuses pages.  Les noeuds sont plus gros quand ils ont beaucoup de liens entrants.
URFIST-Rennes / 2 octobre 2009 Cartographie de thématiques scientifiques transversales Cartographie des grands domaines scientifiques constituant le champ des « Arctic Sciences ». Le graphe a été construit à partir des 8772 publications scientifiques issues de  Web of Science . L’Arctique constitue aujourd’hui une question importante en termes géo-politiques, économiques et de protection de l’environnement. Un travail de mapping des publications sur le sujet permet de comprendre quelles thématiques sont privilégiées (environnement, glaciologie, biologie, anthropologie…ou ingénierie des forages, industries pétrolières, navigation), par quels pays, quels types de laboratoires ou dans quel cadre de coopération internationale 100 pays reliés par 1362 liens. Ce graphe a été construit à partir des données de 8772 publications scientifiques de 2007 et 2008.
URFIST-Rennes / 2 octobre 2009 CAC40 – Entreprises et mandats au C.A. CAC 40 - Avril 2009 / Administrateurs membres d’un CA ou d’un CS avec 2 mandats minimum / Le graphe des administrateurs des entreprises du CAC40 exerçant au moins deux mandats différents laisse entrevoir un « petit monde » dont le diamètre (distance moyenne entre chaque paire de nœuds de la matrice de graphe) est proche de 2 et structuré autour de quelques nœuds centraux comme Jean-Martin FOLZ, Michel PEBEREAU ou Louis SCHWEITZER.
URFIST-Rennes / 2 octobre 2009 Cpan Explorer : An interactive exploration of the PERL ecosystem http:// labs.rtgi.eu /fpw09/   Le projet Cpan Explorer s’accompagne d’une cartographique dynamique en ligne où ont été indexées les URL associées à la communauté PERL. Cette interface dynamique développée par RTGI permet de visualiser synthétiquement une grande masse d’information mais aussi de produire des focus sur une URL particulière et son environnement.
URFIST-Rennes / 2 octobre 2009 Dispositifs/développement technologique Le Navicrawler logiciel libre sous license GPL 3.  Version 1.53 :  http://webatlas.fr/index.php?option=com_content&view=article&id=56:navicrawler&catid=46:presentations&Itemid=74 GEPHI The Gephi team will present a  demo   paper  at the  ICWSM 2009 , 3rd Int’l AAAI Conference on Weblogs and Social Media conference (San Francisco, May 2009). The Gephi project has been selected by Google to be part of the  Summer   of  Code 2009  (GSoC). Paper:   Gephi  : An Open Source Software for  Exploring   and   Manipulating  Networks . Gephi  0.6 Beta2  released   :  http://gephi.org/ MAGELLAN Web Search http://www.magellan-project.com/ RTGI Innovative Web Technologies http://www.wahlradar.de/map/ http://linkfluence.net/?lang=fr http://rtgi.fr/ EXALEAD Laboratories – Innovatives Web Technologies http://constellations.labs.exalead.com/?q=gephi&nhits=50&lang=en http://labs.exalead.com/ MEDIA-LAB – Sciences-Po http://medialab.sciences-po.fr/ Cartographie(s) de l’Information Technologies/Expérimentations/Systèmes d’information
URFIST-Rennes / 2 octobre 2009 Cartographie(s) de l’Information Ouvrages de référence en  Network Sciences Cadres conceptuels A.-L. BARABASI  linked  -  the new science of networks , new ed. 2005. M. BUCHANAN - Nexus, Small Worlds and the groundbreaking Theory of Networks  2003. Théorie des graphes D. WATTS  six degrees - the science of a connected age , 2004. S. STROGATZ -  sync: the emerging science of spontaneous order , 2004. M. NEWMAN -  the structure and dynamics of networks,  2003. Web-Mining S. CHAKRABARTI  mining the web , 2002. J. KLEINBERG -  algorithm design,  2006. InfoViz B. SHNEIDERMAN -  readings in information visualization: using vision to think,  1999.
URFIST-Rennes / 2 octobre 2009 Cartographie(s) de l’Information Articles/publications/contributions scientifiques Ouvrages collectifs La Navigation , F. Ghitalla (sous la dir.), Les Cahiers du Numérique, Hermès Editions, Paris, 2003 L’Outre Lecture, Manipuler, s'approprier, interpréter le web , F. Ghitalla, D. Boullier, A. Neau, L. Le Douarin, P. Guoskhou, Coll. Etudes et Recherches, Bibliothèque Publique d'Information - Centre Georges Pompidou, Paris, 2004. Articles publiés (Computer Sciences) « Automated Metadata Hierarchy Derivation », Amjad Abou Assali, Hugo Zanghi,  Proceedings of IEEE ICTTA06 , Damascus, Syria, 2006. « Extracting and Exploring Aggregates of Web documents with Experimental Visualisation Tools », Franck Ghitalla, Fabien Pfaender, Camille Maussang, Conférence EUROPIA-10, 12-14 september 2005, Damascus, Syria « TARENTe: an Experimental Tool for Extracting and Exploring Web Aggregates », Franck Ghitalla, Eustache Diemert, Camille Maussang, Fabien Pfaender,  Conférence ICTTA-04 , IEEE International Conference on Information & Communication Technologies : From Theory to Applications, Damascus, Syria, march 2004. « Des documents, des liens et des acteurs », Franck Ghitalla, Alain Le Berre, Matthieu Renault, Conférence  H2PTM , 2005. « La naissance d'une géographie du web ? », F. Ghitalla, sous la rédaction en chef de Jean-Marc Darrigol – YAHOO !-France ,  AAE Ensimag  – N°42 – Janvier 2009. « Two Visions of the Web, from globality to localities », Fabien Pfaender, Mathieu Jacomy, Guilhem Fouetillou, Proceedings of IEEE ICTTA06, Damascus, Syria, 2006. « Explorer et appréhender le web », Fabien Pfaender, Mathieu Jacomy, 13e journées de Rochebrune : Rencontres interdisciplinaires sur les systèmes complexes naturels et artificiels, ENST 2006 S001, 2006. Articles publiés (SHS) « Questions autour de l’archivage du Web », Franck Ghitalla,  Les Nouveaux Cahiers de l’Audiovisuel , n°5 juin-juillet 2005, Institut National de l’Audiovisuel. « Le Web ou l'utopie d'un espace documentaire », Franck Ghitalla, Dominique Boullier, revue  3I , 2004. « Les Territoires de l'Information : navigation et construction des espaces de compréhension sur le web, Franck Ghitalla, Charles Lenay, présenté au Congrès de l'ARCO (Association pour la Recherche en sciences COgnitives) à Lyon en dec. 2001 et publié dans « La Navigation »,  Les Cahiers du Numérique , Hermès Editions, Paris, 2003. « L'Age des Cartes Electroniques : outils graphiques de navigation sur le web », Franck Ghitalla,  Communication et Langages  n°131, Armand Colin, Paris, 2002. « Arpenter le web : liens, indices, cartes », Franck Ghitalla,  Terminal  n°86, Hiver 2001-2002, L'Harmattan, Paris. « L'espace du document numérique », Franck Ghitalla,  Communication et Langages , n°126, Armand Colin, dec. 2000. « Ecriture et NTIC », Franck Ghitalla,  Communication et Langages , n°119, Editions Retz, 1999. White Papers « Cartographie Web du domaine de la coopération Nord-Sud autour des TICE », Alain Le Berre, Mathieu Jacomy, Franck Ghitalla, 2004 « Du nuage aux abymes, Dimensions heuristique et expérimentale des modèles web », F. Ghitalla, 2009. « L'atelier de cartographie », F. Ghitalla, 2008. « Détection et visualisation d’agrégats de documents web : L’exemple du domaine thématique de la Culture Scientifique, Technique et Industrielle », F. Ghitalla, M. Jacomy, F. Pfaender, 2006. « Panorama de la Culture Scientifique et Technique sur le Web », M. Jacomy, Extrait du rapport de l'étude WebCSTI - LUTIN, 2005. « La géographie des agrégats de documents sur le web », Franck Ghitalla, 2004.  « Du web à l’idée du Web », Sébastien Heymann, 2008 (web-mining.fr) « Moteur de recherche et Compétition », Sébastien Heymann, 2009 (web-mining.fr)
URFIST-Rennes / 2 octobre 2009 Franck Ghitalla, mai 2009, systèmes d’information et analyse de données (INIST). Cartographie(s) de l’Information

More Related Content

Viewers also liked

Panorama des licences libres
Panorama des licences libresPanorama des licences libres
Panorama des licences libresAlexandre Zermati
 
Global
GlobalGlobal
GlobalFing
 
capturer les données, vers l'internet des objets
capturer les données, vers l'internet des objetscapturer les données, vers l'internet des objets
capturer les données, vers l'internet des objetsrichard peirano
 
Lb web mobile_slideshare
Lb web mobile_slideshareLb web mobile_slideshare
Lb web mobile_slideshareALTICS
 
Magazine du CNFPT : dossier relation usagers
Magazine du CNFPT :  dossier relation usagersMagazine du CNFPT :  dossier relation usagers
Magazine du CNFPT : dossier relation usagersFranck Confino
 
Vidusign presentation Catalan
Vidusign presentation CatalanVidusign presentation Catalan
Vidusign presentation CatalanJoel Josephson
 
Plan national dematerialisation marchés publics
Plan national dematerialisation marchés publicsPlan national dematerialisation marchés publics
Plan national dematerialisation marchés publicsEl Gaton
 
7 conseils pour commercialiser votre offre de voyage de groupe sur le Web - B...
7 conseils pour commercialiser votre offre de voyage de groupe sur le Web - B...7 conseils pour commercialiser votre offre de voyage de groupe sur le Web - B...
7 conseils pour commercialiser votre offre de voyage de groupe sur le Web - B...Parkour3
 
Nidia maritza mora valbuena actividad1 2mapa c
Nidia maritza mora valbuena actividad1  2mapa cNidia maritza mora valbuena actividad1  2mapa c
Nidia maritza mora valbuena actividad1 2mapa cNidia Valbuena
 
Expresiones fraccionarias
Expresiones fraccionariasExpresiones fraccionarias
Expresiones fraccionariasXaviSei
 
1ère Infolettre de l'AQIA
1ère Infolettre de l'AQIA1ère Infolettre de l'AQIA
1ère Infolettre de l'AQIAJulie Jean
 
Gerencia de proyectos
Gerencia de proyectos Gerencia de proyectos
Gerencia de proyectos Mercedes Ortiz
 

Viewers also liked (20)

Panorama des licences libres
Panorama des licences libresPanorama des licences libres
Panorama des licences libres
 
Global
GlobalGlobal
Global
 
Outils en ligne pour la veille informationnelle
Outils en ligne pour la veille informationnelleOutils en ligne pour la veille informationnelle
Outils en ligne pour la veille informationnelle
 
capturer les données, vers l'internet des objets
capturer les données, vers l'internet des objetscapturer les données, vers l'internet des objets
capturer les données, vers l'internet des objets
 
Lb web mobile_slideshare
Lb web mobile_slideshareLb web mobile_slideshare
Lb web mobile_slideshare
 
Retouche photo
Retouche photoRetouche photo
Retouche photo
 
Ulls de colors
Ulls de colorsUlls de colors
Ulls de colors
 
Las menores beben y fuman más
Las menores beben y fuman másLas menores beben y fuman más
Las menores beben y fuman más
 
Magazine du CNFPT : dossier relation usagers
Magazine du CNFPT :  dossier relation usagersMagazine du CNFPT :  dossier relation usagers
Magazine du CNFPT : dossier relation usagers
 
Vidusign presentation Catalan
Vidusign presentation CatalanVidusign presentation Catalan
Vidusign presentation Catalan
 
Plan national dematerialisation marchés publics
Plan national dematerialisation marchés publicsPlan national dematerialisation marchés publics
Plan national dematerialisation marchés publics
 
7 conseils pour commercialiser votre offre de voyage de groupe sur le Web - B...
7 conseils pour commercialiser votre offre de voyage de groupe sur le Web - B...7 conseils pour commercialiser votre offre de voyage de groupe sur le Web - B...
7 conseils pour commercialiser votre offre de voyage de groupe sur le Web - B...
 
Nidia maritza mora valbuena actividad1 2mapa c
Nidia maritza mora valbuena actividad1  2mapa cNidia maritza mora valbuena actividad1  2mapa c
Nidia maritza mora valbuena actividad1 2mapa c
 
Redes informaticas
Redes informaticasRedes informaticas
Redes informaticas
 
Redes sociales
Redes socialesRedes sociales
Redes sociales
 
Expresiones fraccionarias
Expresiones fraccionariasExpresiones fraccionarias
Expresiones fraccionarias
 
L'agriculture sans chimie, moi j'dis oui panneau n°4
L'agriculture sans chimie, moi j'dis oui panneau n°4L'agriculture sans chimie, moi j'dis oui panneau n°4
L'agriculture sans chimie, moi j'dis oui panneau n°4
 
1ère Infolettre de l'AQIA
1ère Infolettre de l'AQIA1ère Infolettre de l'AQIA
1ère Infolettre de l'AQIA
 
Greeshma
GreeshmaGreeshma
Greeshma
 
Gerencia de proyectos
Gerencia de proyectos Gerencia de proyectos
Gerencia de proyectos
 

Similar to formation URFIST Rennes 2009

Sfsic14 140604-hachour szoniecky
Sfsic14 140604-hachour szonieckySfsic14 140604-hachour szoniecky
Sfsic14 140604-hachour szonieckySFSIC Association
 
L'ingénierie des ENA fondée sur le web des données ouvertes et liées
L'ingénierie des ENA fondée sur le web des données ouvertes et liéesL'ingénierie des ENA fondée sur le web des données ouvertes et liées
L'ingénierie des ENA fondée sur le web des données ouvertes et liéesGilbert Paquette
 
Réseau thématique Analyse Exploratoire de Données pour les Réseaux Dynamiques
Réseau thématique Analyse Exploratoire de Données pour les Réseaux DynamiquesRéseau thématique Analyse Exploratoire de Données pour les Réseaux Dynamiques
Réseau thématique Analyse Exploratoire de Données pour les Réseaux DynamiquesSébastien
 
Webatlas à l'inauguration du médialab Sciences Po
Webatlas à l'inauguration du médialab Sciences PoWebatlas à l'inauguration du médialab Sciences Po
Webatlas à l'inauguration du médialab Sciences PomedialabSciencesPo
 
AGMQ 2011 : Les données libres et le territoire
AGMQ 2011 : Les données libres et le territoireAGMQ 2011 : Les données libres et le territoire
AGMQ 2011 : Les données libres et le territoirenoucher
 
Cersic: culture informationnelle et institutions
Cersic: culture informationnelle et institutionsCersic: culture informationnelle et institutions
Cersic: culture informationnelle et institutionsolivier
 
De la recherche d'information aux pratiques scientifiques : vers de nouveaux ...
De la recherche d'information aux pratiques scientifiques : vers de nouveaux ...De la recherche d'information aux pratiques scientifiques : vers de nouveaux ...
De la recherche d'information aux pratiques scientifiques : vers de nouveaux ...olivier
 
Plateformes génériques pour le partage de données et de traitements : exemple...
Plateformes génériques pour le partage de données et de traitements : exemple...Plateformes génériques pour le partage de données et de traitements : exemple...
Plateformes génériques pour le partage de données et de traitements : exemple...Desconnets Jean-Christophe
 
Kristell MICHEL : Une IDG au service des Observatoires sur l’eau: retour d'ex...
Kristell MICHEL : Une IDG au service des Observatoires sur l’eau: retour d'ex...Kristell MICHEL : Une IDG au service des Observatoires sur l’eau: retour d'ex...
Kristell MICHEL : Une IDG au service des Observatoires sur l’eau: retour d'ex...kmichel69
 
9 30 fandre-dist_cnrs_piv_2017
9 30 fandre-dist_cnrs_piv_20179 30 fandre-dist_cnrs_piv_2017
9 30 fandre-dist_cnrs_piv_2017Bertrand Tavitian
 
Recherche documentaire et Information Scientifique et Technique (IST) enjeux,...
Recherche documentaire et Information Scientifique et Technique (IST) enjeux,...Recherche documentaire et Information Scientifique et Technique (IST) enjeux,...
Recherche documentaire et Information Scientifique et Technique (IST) enjeux,...Alain Marois
 
Webinar EEIE #06 : Datavisualisation, faites parler la data
Webinar EEIE #06 : Datavisualisation, faites parler la dataWebinar EEIE #06 : Datavisualisation, faites parler la data
Webinar EEIE #06 : Datavisualisation, faites parler la dataGroupe EEIE
 
Atelier documentaire du chercheur à l'INRIA
Atelier documentaire du chercheur à l'INRIAAtelier documentaire du chercheur à l'INRIA
Atelier documentaire du chercheur à l'INRIAADBSAquidoc
 
Artefacts numériques et matérialités
Artefacts numériques et matérialitésArtefacts numériques et matérialités
Artefacts numériques et matérialitésAlexandre Monnin
 

Similar to formation URFIST Rennes 2009 (20)

L'Atelier de cartographie
L'Atelier de cartographieL'Atelier de cartographie
L'Atelier de cartographie
 
Vsst 2010 le_semiopole_26102010
Vsst 2010 le_semiopole_26102010Vsst 2010 le_semiopole_26102010
Vsst 2010 le_semiopole_26102010
 
Sfsic14 140604-hachour szoniecky
Sfsic14 140604-hachour szonieckySfsic14 140604-hachour szoniecky
Sfsic14 140604-hachour szoniecky
 
L'ingénierie des ENA fondée sur le web des données ouvertes et liées
L'ingénierie des ENA fondée sur le web des données ouvertes et liéesL'ingénierie des ENA fondée sur le web des données ouvertes et liées
L'ingénierie des ENA fondée sur le web des données ouvertes et liées
 
La recherche en biodiversite
La recherche en biodiversiteLa recherche en biodiversite
La recherche en biodiversite
 
Réseau thématique Analyse Exploratoire de Données pour les Réseaux Dynamiques
Réseau thématique Analyse Exploratoire de Données pour les Réseaux DynamiquesRéseau thématique Analyse Exploratoire de Données pour les Réseaux Dynamiques
Réseau thématique Analyse Exploratoire de Données pour les Réseaux Dynamiques
 
Webatlas à l'inauguration du médialab Sciences Po
Webatlas à l'inauguration du médialab Sciences PoWebatlas à l'inauguration du médialab Sciences Po
Webatlas à l'inauguration du médialab Sciences Po
 
Cartes des sciences
Cartes des sciencesCartes des sciences
Cartes des sciences
 
AGMQ 2011 : Les données libres et le territoire
AGMQ 2011 : Les données libres et le territoireAGMQ 2011 : Les données libres et le territoire
AGMQ 2011 : Les données libres et le territoire
 
Cersic: culture informationnelle et institutions
Cersic: culture informationnelle et institutionsCersic: culture informationnelle et institutions
Cersic: culture informationnelle et institutions
 
De la recherche d'information aux pratiques scientifiques : vers de nouveaux ...
De la recherche d'information aux pratiques scientifiques : vers de nouveaux ...De la recherche d'information aux pratiques scientifiques : vers de nouveaux ...
De la recherche d'information aux pratiques scientifiques : vers de nouveaux ...
 
Plateformes génériques pour le partage de données et de traitements : exemple...
Plateformes génériques pour le partage de données et de traitements : exemple...Plateformes génériques pour le partage de données et de traitements : exemple...
Plateformes génériques pour le partage de données et de traitements : exemple...
 
Kristell MICHEL : Une IDG au service des Observatoires sur l’eau: retour d'ex...
Kristell MICHEL : Une IDG au service des Observatoires sur l’eau: retour d'ex...Kristell MICHEL : Une IDG au service des Observatoires sur l’eau: retour d'ex...
Kristell MICHEL : Une IDG au service des Observatoires sur l’eau: retour d'ex...
 
9 30 fandre-dist_cnrs_piv_2017
9 30 fandre-dist_cnrs_piv_20179 30 fandre-dist_cnrs_piv_2017
9 30 fandre-dist_cnrs_piv_2017
 
Recherche documentaire et Information Scientifique et Technique (IST) enjeux,...
Recherche documentaire et Information Scientifique et Technique (IST) enjeux,...Recherche documentaire et Information Scientifique et Technique (IST) enjeux,...
Recherche documentaire et Information Scientifique et Technique (IST) enjeux,...
 
Webinar EEIE #06 : Datavisualisation, faites parler la data
Webinar EEIE #06 : Datavisualisation, faites parler la dataWebinar EEIE #06 : Datavisualisation, faites parler la data
Webinar EEIE #06 : Datavisualisation, faites parler la data
 
Ic05plan
Ic05planIc05plan
Ic05plan
 
Utc2011
Utc2011Utc2011
Utc2011
 
Atelier documentaire du chercheur à l'INRIA
Atelier documentaire du chercheur à l'INRIAAtelier documentaire du chercheur à l'INRIA
Atelier documentaire du chercheur à l'INRIA
 
Artefacts numériques et matérialités
Artefacts numériques et matérialitésArtefacts numériques et matérialités
Artefacts numériques et matérialités
 

Recently uploaded

Bernard Réquichot.pptx Peintre français
Bernard Réquichot.pptx   Peintre françaisBernard Réquichot.pptx   Peintre français
Bernard Réquichot.pptx Peintre françaisTxaruka
 
SciencesPo_Aix_InnovationPédagogique_Atelier_FormationRecherche.pdf
SciencesPo_Aix_InnovationPédagogique_Atelier_FormationRecherche.pdfSciencesPo_Aix_InnovationPédagogique_Atelier_FormationRecherche.pdf
SciencesPo_Aix_InnovationPédagogique_Atelier_FormationRecherche.pdfSKennel
 
Bibdoc 2024 - Ecologie du livre et creation de badge.pdf
Bibdoc 2024 - Ecologie du livre et creation de badge.pdfBibdoc 2024 - Ecologie du livre et creation de badge.pdf
Bibdoc 2024 - Ecologie du livre et creation de badge.pdfBibdoc 37
 
SciencesPo_Aix_InnovationPédagogique_Conférence_SK.pdf
SciencesPo_Aix_InnovationPédagogique_Conférence_SK.pdfSciencesPo_Aix_InnovationPédagogique_Conférence_SK.pdf
SciencesPo_Aix_InnovationPédagogique_Conférence_SK.pdfSKennel
 
Cours SE Gestion des périphériques - IG IPSET
Cours SE Gestion des périphériques - IG IPSETCours SE Gestion des périphériques - IG IPSET
Cours SE Gestion des périphériques - IG IPSETMedBechir
 
PIE-A2-P 5- Supports stagiaires.pptx.pdf
PIE-A2-P 5- Supports stagiaires.pptx.pdfPIE-A2-P 5- Supports stagiaires.pptx.pdf
PIE-A2-P 5- Supports stagiaires.pptx.pdfRiDaHAziz
 
Principe de fonctionnement d'un moteur 4 temps
Principe de fonctionnement d'un moteur 4 tempsPrincipe de fonctionnement d'un moteur 4 temps
Principe de fonctionnement d'un moteur 4 tempsRajiAbdelghani
 
Presentation de la plateforme Moodle - avril 2024
Presentation de la plateforme Moodle - avril 2024Presentation de la plateforme Moodle - avril 2024
Presentation de la plateforme Moodle - avril 2024Gilles Le Page
 
Cours de Management des Systèmes d'information
Cours de Management des Systèmes d'informationCours de Management des Systèmes d'information
Cours de Management des Systèmes d'informationpapediallo3
 
Le Lean sur une ligne de production : Formation et mise en application directe
Le Lean sur une ligne de production : Formation et mise en application directeLe Lean sur une ligne de production : Formation et mise en application directe
Le Lean sur une ligne de production : Formation et mise en application directeXL Groupe
 
Zotero avancé - support de formation doctorants SHS 2024
Zotero avancé - support de formation doctorants SHS 2024Zotero avancé - support de formation doctorants SHS 2024
Zotero avancé - support de formation doctorants SHS 2024Alain Marois
 
SciencesPo_Aix_InnovationPédagogique_Bilan.pdf
SciencesPo_Aix_InnovationPédagogique_Bilan.pdfSciencesPo_Aix_InnovationPédagogique_Bilan.pdf
SciencesPo_Aix_InnovationPédagogique_Bilan.pdfSKennel
 
SciencesPo_Aix_InnovationPédagogique_Atelier_EtudiantActeur.pdf
SciencesPo_Aix_InnovationPédagogique_Atelier_EtudiantActeur.pdfSciencesPo_Aix_InnovationPédagogique_Atelier_EtudiantActeur.pdf
SciencesPo_Aix_InnovationPédagogique_Atelier_EtudiantActeur.pdfSKennel
 
Bibdoc 2024 - Les maillons de la chaine du livre face aux enjeux écologiques.pdf
Bibdoc 2024 - Les maillons de la chaine du livre face aux enjeux écologiques.pdfBibdoc 2024 - Les maillons de la chaine du livre face aux enjeux écologiques.pdf
Bibdoc 2024 - Les maillons de la chaine du livre face aux enjeux écologiques.pdfBibdoc 37
 
Annie Ernaux Extérieurs. pptx. Exposition basée sur un livre .
Annie   Ernaux  Extérieurs. pptx. Exposition basée sur un livre .Annie   Ernaux  Extérieurs. pptx. Exposition basée sur un livre .
Annie Ernaux Extérieurs. pptx. Exposition basée sur un livre .Txaruka
 
LA MONTÉE DE L'ÉDUCATION DANS LE MONDE DE LA PRÉHISTOIRE À L'ÈRE CONTEMPORAIN...
LA MONTÉE DE L'ÉDUCATION DANS LE MONDE DE LA PRÉHISTOIRE À L'ÈRE CONTEMPORAIN...LA MONTÉE DE L'ÉDUCATION DANS LE MONDE DE LA PRÉHISTOIRE À L'ÈRE CONTEMPORAIN...
LA MONTÉE DE L'ÉDUCATION DANS LE MONDE DE LA PRÉHISTOIRE À L'ÈRE CONTEMPORAIN...Faga1939
 
SciencesPo_Aix_InnovationPédagogique_Atelier_IA.pdf
SciencesPo_Aix_InnovationPédagogique_Atelier_IA.pdfSciencesPo_Aix_InnovationPédagogique_Atelier_IA.pdf
SciencesPo_Aix_InnovationPédagogique_Atelier_IA.pdfSKennel
 
Cours SE Le système Linux : La ligne de commande bash - IG IPSET
Cours SE Le système Linux : La ligne de commande bash - IG IPSETCours SE Le système Linux : La ligne de commande bash - IG IPSET
Cours SE Le système Linux : La ligne de commande bash - IG IPSETMedBechir
 
PIE-A2-P4-support stagiaires sept 22-validé.pdf
PIE-A2-P4-support stagiaires sept 22-validé.pdfPIE-A2-P4-support stagiaires sept 22-validé.pdf
PIE-A2-P4-support stagiaires sept 22-validé.pdfRiDaHAziz
 

Recently uploaded (20)

Bernard Réquichot.pptx Peintre français
Bernard Réquichot.pptx   Peintre françaisBernard Réquichot.pptx   Peintre français
Bernard Réquichot.pptx Peintre français
 
SciencesPo_Aix_InnovationPédagogique_Atelier_FormationRecherche.pdf
SciencesPo_Aix_InnovationPédagogique_Atelier_FormationRecherche.pdfSciencesPo_Aix_InnovationPédagogique_Atelier_FormationRecherche.pdf
SciencesPo_Aix_InnovationPédagogique_Atelier_FormationRecherche.pdf
 
Bibdoc 2024 - Ecologie du livre et creation de badge.pdf
Bibdoc 2024 - Ecologie du livre et creation de badge.pdfBibdoc 2024 - Ecologie du livre et creation de badge.pdf
Bibdoc 2024 - Ecologie du livre et creation de badge.pdf
 
SciencesPo_Aix_InnovationPédagogique_Conférence_SK.pdf
SciencesPo_Aix_InnovationPédagogique_Conférence_SK.pdfSciencesPo_Aix_InnovationPédagogique_Conférence_SK.pdf
SciencesPo_Aix_InnovationPédagogique_Conférence_SK.pdf
 
Cours SE Gestion des périphériques - IG IPSET
Cours SE Gestion des périphériques - IG IPSETCours SE Gestion des périphériques - IG IPSET
Cours SE Gestion des périphériques - IG IPSET
 
DO PALÁCIO À ASSEMBLEIA .
DO PALÁCIO À ASSEMBLEIA                 .DO PALÁCIO À ASSEMBLEIA                 .
DO PALÁCIO À ASSEMBLEIA .
 
PIE-A2-P 5- Supports stagiaires.pptx.pdf
PIE-A2-P 5- Supports stagiaires.pptx.pdfPIE-A2-P 5- Supports stagiaires.pptx.pdf
PIE-A2-P 5- Supports stagiaires.pptx.pdf
 
Principe de fonctionnement d'un moteur 4 temps
Principe de fonctionnement d'un moteur 4 tempsPrincipe de fonctionnement d'un moteur 4 temps
Principe de fonctionnement d'un moteur 4 temps
 
Presentation de la plateforme Moodle - avril 2024
Presentation de la plateforme Moodle - avril 2024Presentation de la plateforme Moodle - avril 2024
Presentation de la plateforme Moodle - avril 2024
 
Cours de Management des Systèmes d'information
Cours de Management des Systèmes d'informationCours de Management des Systèmes d'information
Cours de Management des Systèmes d'information
 
Le Lean sur une ligne de production : Formation et mise en application directe
Le Lean sur une ligne de production : Formation et mise en application directeLe Lean sur une ligne de production : Formation et mise en application directe
Le Lean sur une ligne de production : Formation et mise en application directe
 
Zotero avancé - support de formation doctorants SHS 2024
Zotero avancé - support de formation doctorants SHS 2024Zotero avancé - support de formation doctorants SHS 2024
Zotero avancé - support de formation doctorants SHS 2024
 
SciencesPo_Aix_InnovationPédagogique_Bilan.pdf
SciencesPo_Aix_InnovationPédagogique_Bilan.pdfSciencesPo_Aix_InnovationPédagogique_Bilan.pdf
SciencesPo_Aix_InnovationPédagogique_Bilan.pdf
 
SciencesPo_Aix_InnovationPédagogique_Atelier_EtudiantActeur.pdf
SciencesPo_Aix_InnovationPédagogique_Atelier_EtudiantActeur.pdfSciencesPo_Aix_InnovationPédagogique_Atelier_EtudiantActeur.pdf
SciencesPo_Aix_InnovationPédagogique_Atelier_EtudiantActeur.pdf
 
Bibdoc 2024 - Les maillons de la chaine du livre face aux enjeux écologiques.pdf
Bibdoc 2024 - Les maillons de la chaine du livre face aux enjeux écologiques.pdfBibdoc 2024 - Les maillons de la chaine du livre face aux enjeux écologiques.pdf
Bibdoc 2024 - Les maillons de la chaine du livre face aux enjeux écologiques.pdf
 
Annie Ernaux Extérieurs. pptx. Exposition basée sur un livre .
Annie   Ernaux  Extérieurs. pptx. Exposition basée sur un livre .Annie   Ernaux  Extérieurs. pptx. Exposition basée sur un livre .
Annie Ernaux Extérieurs. pptx. Exposition basée sur un livre .
 
LA MONTÉE DE L'ÉDUCATION DANS LE MONDE DE LA PRÉHISTOIRE À L'ÈRE CONTEMPORAIN...
LA MONTÉE DE L'ÉDUCATION DANS LE MONDE DE LA PRÉHISTOIRE À L'ÈRE CONTEMPORAIN...LA MONTÉE DE L'ÉDUCATION DANS LE MONDE DE LA PRÉHISTOIRE À L'ÈRE CONTEMPORAIN...
LA MONTÉE DE L'ÉDUCATION DANS LE MONDE DE LA PRÉHISTOIRE À L'ÈRE CONTEMPORAIN...
 
SciencesPo_Aix_InnovationPédagogique_Atelier_IA.pdf
SciencesPo_Aix_InnovationPédagogique_Atelier_IA.pdfSciencesPo_Aix_InnovationPédagogique_Atelier_IA.pdf
SciencesPo_Aix_InnovationPédagogique_Atelier_IA.pdf
 
Cours SE Le système Linux : La ligne de commande bash - IG IPSET
Cours SE Le système Linux : La ligne de commande bash - IG IPSETCours SE Le système Linux : La ligne de commande bash - IG IPSET
Cours SE Le système Linux : La ligne de commande bash - IG IPSET
 
PIE-A2-P4-support stagiaires sept 22-validé.pdf
PIE-A2-P4-support stagiaires sept 22-validé.pdfPIE-A2-P4-support stagiaires sept 22-validé.pdf
PIE-A2-P4-support stagiaires sept 22-validé.pdf
 

formation URFIST Rennes 2009

  • 1. URFIST-Rennes / 2 octobre 2009 Franck Ghitalla, mai 2009, systèmes d’information et analyse de données (INIST). Cartographie(s) de l’Information
  • 2. URFIST-Rennes / 2 octobre 2009 Objectifs des procédés cartographiques La cartographie et sciences des réseaux ( NetworkSciences ) : détection de patterns statistiques et visuels des corpus Avant la cartographie : la phase d’exploration des corpus 1) Cadre scientifique des procédés cartographiques de l’information
  • 3. URFIST-Rennes / 2 octobre 2009 Ingénierie scientifique et recherche sur la cartographie de l’information pour… L’OBSERVATION Propriétés statistiques de corpus numérisés Identification de patterns relationnels Construction d’indicateurs liés aux contenus, aux formes techniques ou aux traces sociales LA MODELISATION De structures informationnelles d’architectures documentaires de phénomènes de flux et/ou d’évolution temporelle L’INTERVENTION Dans le cadre d’une politique d’édition ou de publication Aménagement des territoires numériques (visibilité, organisation de thématiques) Connexion, accompagnement de communautés d’acteurs Conception et développement de systèmes d’information multi-sources intégrant des procédés cartographiques à partir… SOURCES TECHNIQUES BDD scientifiques Corpus de revues ( Hermès , Le Temps des Médias …) Web (sources propres crawlées, bases search engines EXALEAD, RTGI…) Bases brevets Bases termes/concepts ( TermSciences ) Bases de connaissances personnelles ou collectives (bookmarks, documents numériques de travail, personnels, listes d’objets…) Traces d’usages (statistiques, logs, signatures…) CHAMPS THEMATIQUES Acteurs et organisations de la société civile Figures contemporaines de la science (émergence de problématiques transversales, éthique, institutions et communautés d’acteurs…) Espace(s) public(s) en réseau, opinion publique Projets politiques d’intervention sur les territoires numériques Objectifs des procédés cartographiques
  • 4. URFIST-Rennes / 2 octobre 2009 Les systèmes d’information, les masses de données, les systèmes complexes vivants, techniques ou sociaux constituent aujourd’hui l’espace d’investigation privilégié des NetWork Sciences (cf.bibliographie). Le web et tous ces systèmes peuvent être explorés comme des « E-cosystems » réglés par une évolution et des régularités fortes ( strong regularities ). Distribution des contenus, structure hyperliée, traces d’usage, interactions entre composants s’y mêlent à titre de dimensions constitutives, sans oublier les « lois d’expansion » qui les gouvernent ( network dynamics ). La visualisation de graphes relationnels et la manipulation de leurs dimensions permettent de produire des « vues » originales sur les données. En particulier, il s’agit d’identifier des patterns statistiques ou des saillances visuelles associées aux corpus explorés. C’est le principe d’une géographie de l’information nourrie de problématiques théoriques en Network Sciences et qu’il s’agit en même temps de rendre tangible à des usagers ( knowledge mapping tools ). Distances, Densité, diamètre Modèles topologiques, power-law, random/regular graphs Hubs/Authorities, structure d’agrégat Clusters, hiérarchies et ranking Voisinage, centralité/périphérie, inclusion Communautés compétitives Corrélation contenu/structure Topical localities focus crawling Dynamics/evolution of networks Topic Detection and Tracking (TDT) Time Series vizualisation/graphical tracking of information flow La cartographie et sciences des réseaux ( NetworkSciences ) : détection de patterns statistiques et visuels des corpus
  • 5. URFIST-Rennes / 2 octobre 2009 INTERFACE, DONNEES, EXPLORATION DE CORPUS L'Atelier vise à développer le cadre méthodologique et les outils techniques d'un processus d'exploration de grande masses de données (systèmes ouverts, dynamiques et diversement structurés). A ce titre, les interfaces numériques à base de graphes ou cartographiques constituent des espaces puissants de synthèse de l'information mais aussi, parallèlement, d'exploration dynamiques des données. Au delà, l'Atelier intègre à l'activité de production d'interfaces cartographiques l'ensemble de la chaîne qui constituent les systèmes d'information : outils et méthodes d'extraction des données (crawlers, A.P.I., recueil manuel et semi-automatique...), archivage et indexation des données, algorithmes et filtres de traitement. Les interfaces cartographiques produites seront donc le résultat d'un processus supervisé d'exploration et de transformations successives de données où alterneront phases de synthèse et de phases de manipulation orientées vers la recherche de patterns robustes. Avant la cartographie : la phase d’exploration des corpus
  • 6. URFIST-Rennes / 2 octobre 2009 Le cycle de production Types de données / Extraction Types de méthodes Classes de cartographies de l’information 2) Cycle de production des cartographies
  • 7. URFIST-Rennes / 2 octobre 2009 Processing / Cycle de production La production d’interfaces cartographiques relève d’un processus décomposable schématiquement en trois phases principales : l’extraction des données (BDD et fonds propres INIST, sources externes via des API, sources qualifiées manuellement, web crawling…issus de différents domaines comme les réseaux sociaux, les programmes informatiques, gènes, liens hypertextes, distributions statistiques sur des mots-clef, données d’usage…) et enfin la construction cartographique qui comprend à la fois la sélection de « vues » sur les données et le travail sémiologique de mise en forme. 3) Classes de cartographies de l’information Interfaces, spatialisation et production de vues sur les données 1) Types de données Extraction, sources expérimentales, domaines scientifiques 2) Types de Méthodes Traitement, filtrage et enrichissement des données Retours de cycles d’exploration/conception
  • 8. URFIST-Rennes / 2 octobre 2009 Données web Réseaux sociaux Gènes, pathologies BDD scientifiques 1) Types de données Sources expérimentales, domaines scientifiques
  • 9. URFIST-Rennes / 2 octobre 2009 1) (bis) Types de données Sources expérimentales, domaines scientifiques Les A.P.I. permettent d’interroger de grandes bases de données structurées, processus indispensable pour produire des cartographies sur de grandes masses d’informations. C’est le cas, notamment, des API dédiées aux search engines comme EXALEAD (partenaire de l’Atelier) qui compte plus de 16 milliards de références en base web. Dans le cadre d’un partenariat comme avec EXALEAD , on peut aussi développer une série d’API complémentaires entre elles et mobilisables sur différents sujets ou à différentes occasions. Sur les sujets de controverses « science-société », les API Exalead sont indispensables pour produire des « photographies de l’opinion » à grande échelle en prenant en compte, parmi les données web, aussi bien les contenus des pages que les liens hypertextes ou les entités nommées. Cette série spécifique d’API développées par WebAtlas a donné lieu à un projet de système intégré et monitoré d’API-Exalead, EXA-Miner.
  • 10. URFIST-Rennes / 2 octobre 2009 2) Types de Méthodes Traitement, filtrage et enrichissement des données REDUIRE LES MASSES ET LES DIMENSIONS Produire des indicateurs de masses, de densité, de clustering, de voisinage et de centration Concevoir des filtres Décomposer les dimensions (topologie hypertexte, texte et contenu, indicateurs d’usage…) Modèle(s) de distribution des propriétés des corpus FAIRE EMERGER DES PATTERNS Méthodes de projection spatiale, visualisation des données Identification de saillances logico-graphiques Capitaliser/archiver les phases de transformation des corpus Ingénierie de l’exploration des corpus par : Fusion des données de données hétérogènes Niveaux de navigation/zoom Réduction (algorithmes de hiérarchisation/clustering…) Projection (fonds géoréférencés, schémas fonctionnels, organigrammes…) CONSTRUIRE DES FIGURES Principes d’agrégation Organisation, architecture et sous-ensembles Couches et profondeurs des corpus Temporalités et événements
  • 11. URFIST-Rennes / 2 octobre 2009 Cartographies statiques posters papier Cartographies statiques explorables en ligne Générateur de graphes GEPHI Cartographies dynamiques explorables en ligne Communication scientifique Analyse de l’information 3) Classes de cartographies de l’information Interfaces, spatialisation et production de vues sur les données
  • 12. URFIST-Rennes / 2 octobre 2009 3) Exemples radicaux libres principes actifs cosmetiques naturels produits cosmetiques produits de soins peaux seches produits de beaute produits de soin soins du visage produits naturels anti-rides soin du visage huiles vegetales complements alimentaires anti-age institut de beaute soins du corps type de peau soins beaute cosmetiques bio
  • 13. URFIST-Rennes / 2 octobre 2009 Classes de cartographies de l’information Interfaces, spatialisation et production de vues sur les données Communication scientifique - « Place des Controverses » Stand commun Sciences-Po/WebAtlas/Microsoft – Ville Européenne des Sciences, novembre 2008, Grand-Palais. La conception de dispositifs d’exposition conduit à mettre en scène la science dans sa dimension expérimentale. En proposant à des spectateurs d’arpenter physiquement un graphe géant posé au sol, le principe des grands graphes de mots-clefs (souvent assez abstraits) épouse la physique d’un parcours corporel de découverte d’une succession de 8 controverses sociétales, reliées entre elles par des mots clefs communs. L’un des objectifs de l’Atelier est ainsi de tester d’autres modes d’interaction avec les masses de données que l’écran numérique. Les dispositifs scénographiques, immersifs ou mobiles font partie du champ d’expérimentation de l’Atelier.
  • 14. URFIST-Rennes / 2 octobre 2009 Le projet « The Human Disease Network » Données empruntées à Kwang-Il Goh, Michael E. Cusick, David Valle, Barton Childs, Marc Vidal & Albert-László Barabási Exemple d’un travail pluri-disciplinaire en ingénierie des connaissances au sein de l’USR “Ingénierie des Connaissances” (Magali Roux, Franck Ghitalla, Sébastien Heymann et Mathieu Bastian). The Map the of disease gene-disorder a pour objectif de vérifier pour la première fois à grande échelle cette…« ….strong evidence that at least one mutation in the particular gene is causative to the disorder.” En association avec Magali Roux, l’équipe GEPHI a repris les données et produit de nouvelles visualisations de près de 2.000 maladies classées et de près d’autant de gènes impliqués sous forme de liens relationnels. Ce travail démontre la possibilité de mobiliser des compétences et des technologies issues du web-mining vers d’autres domaines scientifiques, l’une des pierres angulaires de la démarche de l’atelier. La version explorable accessible en ligne : http:// diseasome.eu
  • 15. URFIST-Rennes / 2 octobre 2009 Le système d’exploration en ligne associé au projet « The Human Disease Network » - http://gephi.org/diseasome Une cartographie en ligne a été associée au projet, Diseasome . Basé sur une interface RTGI, elle donne accès à une cartographie dynamique où l’on peut sélectionner un nœuds, l’explorer, zoomer, sélectionner des rubriques, rechercher par mot-clefs…Les nœuds cliquables renvoient chacun vers une article de wikipedia mais pourront aussi être associés à Cat-inist ou à Termsciences . De la page d’accueil de Diseasome , on peut aussi télécharger la cartographie imprimable en grand format ou accéder à l’ouvrage associé de Magali Roux, La biologie, l’ère numérique.
  • 16. URFIST-Rennes / 2 octobre 2009 Système géoréférencé pour la la région Picardie et Réseaux Numériques de Picardie (RENUPI) Géoréférencement des ressources web en Picardie (2005). A partir de plusieurs milliers de sites web crawlés et traitant de différents aspects de la Picardie en termes de contenus, plusieurs cartes géographiques de la région et de ses départements ont été produites, en fonction notamment des catégories classant les sites. Ainsi, à l’échelle de l’Aisne, on peut comprendre sur quels lieux ou thématiques sont concentrés les sites francophones traitant du tourisme dans le département (mesure de visibilité sur le web du patrimoine touristique). On peut aussi comprendre, à l’échelle de l’Oise, de quoi traitent les sites web consacrés au département et à quelles catégories d’acteurs ils se rattachent.
  • 17. URFIST-Rennes / 2 octobre 2009 Cartographie de thématiques scientifiques transversales La question de l’Arctique sur le web 1715 mots-clés reliés par 6676 liens. Ce graphe a été construit à partir des données du moteur web Exalead. Plus de 21000 sites ont été indexés pour obtenir ce corpus. Deux expressions sont liées si elles sont présentes en même temps dans de nombreuses pages. Les noeuds sont plus gros quand ils ont beaucoup de liens entrants.
  • 18. URFIST-Rennes / 2 octobre 2009 Cartographie de thématiques scientifiques transversales Cartographie des grands domaines scientifiques constituant le champ des « Arctic Sciences ». Le graphe a été construit à partir des 8772 publications scientifiques issues de Web of Science . L’Arctique constitue aujourd’hui une question importante en termes géo-politiques, économiques et de protection de l’environnement. Un travail de mapping des publications sur le sujet permet de comprendre quelles thématiques sont privilégiées (environnement, glaciologie, biologie, anthropologie…ou ingénierie des forages, industries pétrolières, navigation), par quels pays, quels types de laboratoires ou dans quel cadre de coopération internationale 100 pays reliés par 1362 liens. Ce graphe a été construit à partir des données de 8772 publications scientifiques de 2007 et 2008.
  • 19. URFIST-Rennes / 2 octobre 2009 CAC40 – Entreprises et mandats au C.A. CAC 40 - Avril 2009 / Administrateurs membres d’un CA ou d’un CS avec 2 mandats minimum / Le graphe des administrateurs des entreprises du CAC40 exerçant au moins deux mandats différents laisse entrevoir un « petit monde » dont le diamètre (distance moyenne entre chaque paire de nœuds de la matrice de graphe) est proche de 2 et structuré autour de quelques nœuds centraux comme Jean-Martin FOLZ, Michel PEBEREAU ou Louis SCHWEITZER.
  • 20. URFIST-Rennes / 2 octobre 2009 Cpan Explorer : An interactive exploration of the PERL ecosystem http:// labs.rtgi.eu /fpw09/ Le projet Cpan Explorer s’accompagne d’une cartographique dynamique en ligne où ont été indexées les URL associées à la communauté PERL. Cette interface dynamique développée par RTGI permet de visualiser synthétiquement une grande masse d’information mais aussi de produire des focus sur une URL particulière et son environnement.
  • 21. URFIST-Rennes / 2 octobre 2009 Dispositifs/développement technologique Le Navicrawler logiciel libre sous license GPL 3. Version 1.53 : http://webatlas.fr/index.php?option=com_content&view=article&id=56:navicrawler&catid=46:presentations&Itemid=74 GEPHI The Gephi team will present a demo paper at the ICWSM 2009 , 3rd Int’l AAAI Conference on Weblogs and Social Media conference (San Francisco, May 2009). The Gephi project has been selected by Google to be part of the Summer of Code 2009 (GSoC). Paper: Gephi : An Open Source Software for Exploring and Manipulating Networks . Gephi 0.6 Beta2 released : http://gephi.org/ MAGELLAN Web Search http://www.magellan-project.com/ RTGI Innovative Web Technologies http://www.wahlradar.de/map/ http://linkfluence.net/?lang=fr http://rtgi.fr/ EXALEAD Laboratories – Innovatives Web Technologies http://constellations.labs.exalead.com/?q=gephi&nhits=50&lang=en http://labs.exalead.com/ MEDIA-LAB – Sciences-Po http://medialab.sciences-po.fr/ Cartographie(s) de l’Information Technologies/Expérimentations/Systèmes d’information
  • 22. URFIST-Rennes / 2 octobre 2009 Cartographie(s) de l’Information Ouvrages de référence en Network Sciences Cadres conceptuels A.-L. BARABASI linked - the new science of networks , new ed. 2005. M. BUCHANAN - Nexus, Small Worlds and the groundbreaking Theory of Networks 2003. Théorie des graphes D. WATTS six degrees - the science of a connected age , 2004. S. STROGATZ - sync: the emerging science of spontaneous order , 2004. M. NEWMAN - the structure and dynamics of networks, 2003. Web-Mining S. CHAKRABARTI mining the web , 2002. J. KLEINBERG - algorithm design, 2006. InfoViz B. SHNEIDERMAN - readings in information visualization: using vision to think, 1999.
  • 23. URFIST-Rennes / 2 octobre 2009 Cartographie(s) de l’Information Articles/publications/contributions scientifiques Ouvrages collectifs La Navigation , F. Ghitalla (sous la dir.), Les Cahiers du Numérique, Hermès Editions, Paris, 2003 L’Outre Lecture, Manipuler, s'approprier, interpréter le web , F. Ghitalla, D. Boullier, A. Neau, L. Le Douarin, P. Guoskhou, Coll. Etudes et Recherches, Bibliothèque Publique d'Information - Centre Georges Pompidou, Paris, 2004. Articles publiés (Computer Sciences) « Automated Metadata Hierarchy Derivation », Amjad Abou Assali, Hugo Zanghi, Proceedings of IEEE ICTTA06 , Damascus, Syria, 2006. « Extracting and Exploring Aggregates of Web documents with Experimental Visualisation Tools », Franck Ghitalla, Fabien Pfaender, Camille Maussang, Conférence EUROPIA-10, 12-14 september 2005, Damascus, Syria « TARENTe: an Experimental Tool for Extracting and Exploring Web Aggregates », Franck Ghitalla, Eustache Diemert, Camille Maussang, Fabien Pfaender, Conférence ICTTA-04 , IEEE International Conference on Information & Communication Technologies : From Theory to Applications, Damascus, Syria, march 2004. « Des documents, des liens et des acteurs », Franck Ghitalla, Alain Le Berre, Matthieu Renault, Conférence H2PTM , 2005. « La naissance d'une géographie du web ? », F. Ghitalla, sous la rédaction en chef de Jean-Marc Darrigol – YAHOO !-France , AAE Ensimag – N°42 – Janvier 2009. « Two Visions of the Web, from globality to localities », Fabien Pfaender, Mathieu Jacomy, Guilhem Fouetillou, Proceedings of IEEE ICTTA06, Damascus, Syria, 2006. « Explorer et appréhender le web », Fabien Pfaender, Mathieu Jacomy, 13e journées de Rochebrune : Rencontres interdisciplinaires sur les systèmes complexes naturels et artificiels, ENST 2006 S001, 2006. Articles publiés (SHS) « Questions autour de l’archivage du Web », Franck Ghitalla, Les Nouveaux Cahiers de l’Audiovisuel , n°5 juin-juillet 2005, Institut National de l’Audiovisuel. « Le Web ou l'utopie d'un espace documentaire », Franck Ghitalla, Dominique Boullier, revue  3I , 2004. « Les Territoires de l'Information : navigation et construction des espaces de compréhension sur le web, Franck Ghitalla, Charles Lenay, présenté au Congrès de l'ARCO (Association pour la Recherche en sciences COgnitives) à Lyon en dec. 2001 et publié dans « La Navigation »,  Les Cahiers du Numérique , Hermès Editions, Paris, 2003. « L'Age des Cartes Electroniques : outils graphiques de navigation sur le web », Franck Ghitalla, Communication et Langages  n°131, Armand Colin, Paris, 2002. « Arpenter le web : liens, indices, cartes », Franck Ghitalla, Terminal  n°86, Hiver 2001-2002, L'Harmattan, Paris. « L'espace du document numérique », Franck Ghitalla, Communication et Langages , n°126, Armand Colin, dec. 2000. « Ecriture et NTIC », Franck Ghitalla, Communication et Langages , n°119, Editions Retz, 1999. White Papers « Cartographie Web du domaine de la coopération Nord-Sud autour des TICE », Alain Le Berre, Mathieu Jacomy, Franck Ghitalla, 2004 « Du nuage aux abymes, Dimensions heuristique et expérimentale des modèles web », F. Ghitalla, 2009. « L'atelier de cartographie », F. Ghitalla, 2008. « Détection et visualisation d’agrégats de documents web : L’exemple du domaine thématique de la Culture Scientifique, Technique et Industrielle », F. Ghitalla, M. Jacomy, F. Pfaender, 2006. « Panorama de la Culture Scientifique et Technique sur le Web », M. Jacomy, Extrait du rapport de l'étude WebCSTI - LUTIN, 2005. « La géographie des agrégats de documents sur le web », Franck Ghitalla, 2004. « Du web à l’idée du Web », Sébastien Heymann, 2008 (web-mining.fr) « Moteur de recherche et Compétition », Sébastien Heymann, 2009 (web-mining.fr)
  • 24. URFIST-Rennes / 2 octobre 2009 Franck Ghitalla, mai 2009, systèmes d’information et analyse de données (INIST). Cartographie(s) de l’Information