Comment l’intelligence artificielle réinvente la fouille de texte

Comment l’intelligence artificielle
réinvente la fouille de texte
Documation – Data Information Forum 2016
William Lesguillier – Product manager offre Valorisation des Contenus

2
Antidot – Qui sommes-nous ?
● Editeur de logiciels
● Moteurs de recherche| enrichissement des données
● Depuis 1999 | Paris, Lyon, Aix-en-Provence
● 47 collaborateurs, +150 clients
● Mission : délivrer à nos clients des solutions hautement
configurables et innovantes qui créent de la valeur à partir de
leurs données et augmentent leur performance
opérationnelle

3
Parmi nos clients
● Production de contenus
● Industrie
● E-Commerce
● Santé

4
Qu’est-ce que le Machine Learning
● Définition : faculté donnée à un
ordinateur d’apprendre un
comportement à partir d’exemples
● Discipline scientifique : l’Intelligence Artificielle
(IA)
● Mais fondée sur une approche probabiliste, par
opposition aux approches par règles

5
Re-re-renaissance de l’IA
● Après une histoire mouvementée,
l’Intelligence Artificielle est de retour sur le
devant de la scène
● Deux facteurs techniques principaux :
● Le développement de la puissance de calcul
● La disponibilités accrues des données
● Et surtout : des applications directes

6
L’événement qui change tout
William Wilkinson’s ‘An account of the principalities of Wallachia and Modavia’ inspired this author’s most famous novel.

7
● Puissance de calcul : 100 servers
● Données disponibles : 200 millions de pages

8

9
ML : illustrations des principes
Dire si un logement se
trouve à New York ou
San Francisco
Altitude des logements
Concept d’attribut
Crédit : http://www.r2d3.us

10
Dire si un logement se
San Francisco
Concept de modèle
d’entrainement

11
Données
d’entrainement
Données de test
Dire si une maison se
San Francisco
Concept de
surentrainement

12
Qu’est-ce que le Deep Learning ?
● Se base sur les algorithmes de réseaux de
neurones
● Très adapté pour la reconnaissances de signaux
: analyse d’images photo ou vidéo,
reconnaissance sonore, reconnaissance
vocale…
● Avènement grâce à la puissance des GPU
(Graphic Computing Units) très adaptés à ce type
de calcul

13
Approche par couches d’attributs
Yann LeCun, leçon inaugurale au Collège de France : http://www.college-de-france.fr/site/yann-lecun/inaugural-lecture-
2016-02-04-18h00.htm

14
Reconnaissance de texte
Yann LeCun, Collège de France : http://www.college-de-france.fr/site/yann-lecun/inaugural-lecture-2016-02-04-18h00.htm

15
Détection de piétons
Yann LeCun : https://www.youtube.com/watch?v=MnZNSZGNGyc

18
Machine Learning : pour quoi faire ?
● Reconnaissance du
texte (y compris
manuscrit) et de la
voix
● Traduction
automatique
● Text mining
● Aide à la recherche
d’information
● Assistants personnels
● Assistance au
diagnostic médical
● Smart cities
● Sécurité informatique
● Voiture autonome
● Robotique
● …

19
Le Machine Learning chez Antidot
Enrich Access
Search
Semantic & ComplexText mining
Graph &
Linked Data

20
Classification automatique de texte
Droit de la famille
Droit fiscal
Droit pénal

21
Classification sur rechercheisidore.fr

23
Classifier à partir d’un corpus catégorisé

24
Ou d’un corpus non catégorisé

29
Boucle d’amélioration continue

31
Mesurer la qualité des résultats

32
Mesurer la qualité des résultats

34
Extraction d’entités nommées

36
Les avantages du ML pour le text mining

37
Nos autres rendez-vous Documation
● Démonstration Content Classifier
● Speed Demo sur le stand de Sollan aujourd’hui de
12h30 à 12h45
● Conférence avec Spark Archives
● Demain à 10h30
● Notre stand D23

38
Sources et ressources
● Wikipedia : Histoire de l’intelligence artificielle
● TEDx: Ken Jennings, « Watson, Jeopardy and me, the obsolete know-it-all »
● TechRepublic : IBM Watson: The inside story of how the Jeopardy-winning supercomputer was
born, and what it wants to do next
● A visual introduction to machine learning
● Wired : Google’s Artificial Brain Learns to Find Cat Videos
● IBM : machine learning applications
● Le Monde : série d’articles de Morgane Tual sur l’intelligence artificielle
● Yann LeCun : leçon inaugurale au Collège de France
● Yann LeCun, Marc'Aurelio Ranzato : Deep Learning tutorial
● Olivier Ezratty : série de billets de blog sur l’IA
● Tastehit.com : Google DeepMind's AlphaGo: How it works

Merci de votre attention
A vos questions !
@AntidotNet
info@antidot.net

Comment l’intelligence artificielle réinvente la fouille de texte

Recommended

Recommended

More Related Content

What's hot

What's hot (11)

Similar to Comment l’intelligence artificielle réinvente la fouille de texte

Similar to Comment l’intelligence artificielle réinvente la fouille de texte (20)

More from Antidot

More from Antidot (20)

Comment l’intelligence artificielle réinvente la fouille de texte

Editor's Notes