Tour d'horizon des personnes morales adhérentes à l'APRIL
IC05 2008 - Le Web, objet de science?
1. IC 05 / semestre printemps 2008 Le Web, objet de science? [email_address] Département TSH / équipe de recherche COSTECH Président de l’association loi-1901 WebAtlas
2. IC 05 / semestre printemps 2008 Objectifs de l’U.V. 1/ Interroger les propriétés de cet « espace technique » qu’est le web 1-a) Nature des propriétés 1-b) Types de propriétés 1-c) Dimension expérimentale des propriétés 2/ Etre capable de représenter/cartographier ces propriétés 3/ concevoir/développer des outils, des méthodes, des stratégies de représentation et/ou d’intervention des territoires numériques 3-a) cartographie et « design idéologique » 3-b) observer/veiller ou transformer? 3-c) valoriser, diffuser, agréger 2-a) la théorie des graphes 2-b) Isoler des patterns 2-c) construire des « cartes »
3. IC 05 / semestre printemps 2008 Objectifs de l’U.V. 1/ Interroger les propriétés de cet « espace technique » qu’est le web 1-a) Nature des propriétés 1-b) Types de propriétés 1-c) Dimension expérimentale des propriétés Le réseau ARPA en 1969 La première page web (Tim Berners Lee) Mapping des quelques 6 millions de router-Internet en 2001
4. IC 05 / semestre printemps 2008 1-a) Nature des propriétés Objectifs de l’U.V. Statistiques? Chiffres, tendances, mesures… Techniques? Description de l’infrastructure, circulation des flux, distribution des routers et des serveurs… Informationnelles? Analyse et indexation des fichiers, des documents… Industrielles, économiques? Rôle des technologies propriétaires, logiciels libres, normes technologiques, langage de programmation…. Sociales? Le système comme mémoire des traces d’usage, usagers et communautés… Crawler de fichiers Torrent avec génération dynamique de graphes
5. IC 05 / semestre printemps 2008 1-b) Types de propriétés Objectifs de l’U.V. Doit-on faire appel aux mathématiques ? Aux computer sciences ? À la sociologie ? Aux marketing ? A l’ingénierie des réseaux et de leurs modèles formels? À la biologie , la physique , l’épidémiologie ? Au design ou l’architecture? A l’histoire des systèmes techniques? Albert-László Barabási University of Notre Dame Department of Physics Soumen Chakrabarti Associate Professor Computer Science and Engineering Indian Institute of Technology Bombay Mark Granovetter Joan Butler Ford Professor in the School of Humanities and Sciences. DUNCAN J. WATTS Professor Department of Sociology
6. IC 05 / semestre printemps 2008 1-c) Dimension expérimentale des propriétés Objectifs de l’U.V. Dispositifs de mesures (capteurs), d’indexation des données, de traitement des données, de calcul des patterns statistiques, de visualisation des propriétés méthodes de traitement des données, de corrélation entre types de données (ex.contenu des documents web / distribution des liens ou connectivité), de design des instruments technologiques dédiés à l’exploration du système Projet R.T.G.I. et le dispositif TARENTe en 2003. TARENTe était un Système d’Information Web dédié à l’exploration des petits corpus de documents web (pages/sites). Il comprenait un crawler, des modules de recherche et d’indexation de mots-clef et une interface dynamique de visualisation de graphes.
7. IC 05 / semestre printemps 2008 Objectifs de l’U.V. 2/ Etre capable de représenter/cartographier ces propriétés 2-a) la théorie des graphes 2-b) Isoler des patterns 2-c) construire des « cartes »
8. IC 05 / semestre printemps 2008 2-a) la théorie des graphes Objectifs de l’U.V. Théorie des graphes Outils et méthodes statistiques pour réduire les phénomènes complexes (médecine, chimie, ingénierie industrielle, sociologie des organisations, épidémiologie, physique…) Visualisation de graphes Projection de données ( nœuds ) sur un plan et de leurs liens réciproques ( arcs ). Familles de graphes Réguliers, power-law, random, scale-free… Types de graphes (sociaux, hypertextes, sémantiques…) Web mining / ex.connectivité hypertexte nœuds = pages/sites arcs = liens hypertextes
9. IC 05 / semestre printemps 2008 2-b) isoler des patterns Objectifs de l’U.V. Propriétés statistiques et visuelles Question de la forme des objets d’investigation Agrégats de documents web Densité, diamètre Cœur et périphérie Connectivité entrante et sortante Hiérarchisation, clusterisation Spatialisation et géographie Couronne, filament, chemins, couches
10. IC 05 / semestre printemps 2008 2-c) construire des cartes Objectifs de l’U.V. Le référendum sur le Traité sur la Constitution Européenne, mai 2005. Indexation de 2,5 millions de pages web francophones sur le sujet Repérage des sites les plus connectés de l’agrégat ( Hubs et Authorities ) Analyse du contenu (pour/contre/neutre) Projection visuelle sur un graphe des sites Schéma explicatif
11. IC 05 / semestre printemps 2008 3/ concevoir/développer des outils, des méthodes, des stratégies de représentation et/ou d’intervention des territoires numériques 3-a) cartographie et « design idéologique » 3-b) observer/veiller ou transformer? 3-c) valoriser, diffuser, agréger Sébastien Heymann, septembre 2007
12. IC 05 / semestre printemps 2008 3-a) cartographie et « design idéologique » Objectifs de l’U.V. Etude CSTI – Mathieu Jacomy – cité des Sciences et de l’Industrie - 2005 Modèle d’organisation des ressources web consacrées à la « grippe aviaire » - 2005 Modèle cartographique pour la « Blogopole » politique française – Guilhem fouetillou, RTGI-SAS, 2006. Rendre compte à des usagers d’un univers construit par les usagers
13. IC 05 / semestre printemps 2008 3-b) observer/veiller ou transformer? Objectifs de l’U.V. La « Segoland » sur le web français en avril 2007. Cartographie géo-référencée des blogs militants pour S. Royal au moment de la campagne présidentielle.
14. IC 05 / semestre printemps 2008 3-c) valoriser, diffuser, agréger Objectifs de l’U.V. radicaux libres principes actifs cosmetiques naturels produits cosmetiques produits de soins peaux seches produits de beaute produits de soin soins du visage produits naturels anti-rides soin du visage huiles vegetales complements alimentaires anti-age institut de beaute soins du corps type de peau soins beaute cosmetiques bio Le Cluster « COSMETIQUES » / Etude Exalead-Ministère de la Recherche-WebAtlas, novembre 2007. Valoriser l’étude et les résultats pour des politiques stratégiques ou marketing? Diffuser les résultats , les soumettre à la communauté scientifique pour évaluation et dissémination? Agréger une ou des communautés d’utilisateurs pour modifier le paysage conceptuel associé aux cosmétiques?
15. IC 05 / semestre printemps 2008 Cadres conceptuels A.-L. BARABASI linked - the new science of networks , new ed. 2005. S. JONHSON - emergence: the connected lives of ants, brains, cities, and software, 2002. Théorie des graphes D. WATTS six degrees - the science of a connected age , 2004. S. STROGATZ - sync: the emerging science of spontaneous order , 2004. M. NEWMAN - the structure and dynamics of networks, 2003. Web-Mining S. CHAKRABARTI mining the web , 2002. J. KLEINBERG - algorithm design, 2006. InfoViz B. SHNEIDERMAN - readings in information visualization: using vision to think, 1999. Ouvrages de référence en Network Sciences