SlideShare a Scribd company logo
1 of 73
Université de Tunis
ECOLE SUPERIEURE DES SCIENCES ET TECHNIQUES
DE TUNIS
Projet du cours « TAL »
1ère
année Mastère de recherche en Informatique
Traduction DES SMS
Réalisé par l’équipe N°2 composée de :
Khaled Fayala
Taieb Sadem
Yosra Hasnaoui
Asma Mdaini
Balkiss Hamad
Takwa Laamiri
Année universitaire 2012 – 2013
i
Table des matières
Table des Figures............................................................................................................................. iii
Liste des Tableaux ........................................................................................................................... iv
Introduction générale ..................................................................................................................1
............................................................................................................1Partie 1 : Etude théorique
chapitre1 : Etude Préalable ......................................................................................................2
1. Introduction...........................................................................................................................................2
2. Emergence des TIC...............................................................................................................................2
3. Définition de SMS ................................................................................................................................2
4. Historique .............................................................................................................................................2
5. Utilisation des SMS ..............................................................................................................................3
6. Les bénéfices de l’utilisation des SMS.................................................................................................3
7. Les limites de l’utilisation des SMS .....................................................................................................3
8. Conclusion............................................................................................................................................4
Chapitre 2 : Le langage SMS.......................................................................................................5
1. Introduction...........................................................................................................................................5
2. Définition du langage SMS...................................................................................................................5
3. Les procédés utilisés dans le langage SMS...........................................................................................5
3.1. La phonétique ...............................................................................................................................5
3.2. Le rébus typographique ................................................................................................................6
3.3. L’abréviation.................................................................................................................................6
3.4. Les émotions.................................................................................................................................7
4. Le langage SMS entre approbation et rejet...........................................................................................7
4.1. Les risques de langage SMS .........................................................................................................8
4.2. Les intérêts de langage SMS.........................................................................................................8
5. Conclusion............................................................................................................................................8
Chapitre 3 : Les dictionnaires et les corpus SMS..........................................................9
1. Introduction...........................................................................................................................................9
2. Les Dictionnaires des SMS...................................................................................................................9
2.1. Le dictionnaire-sms.......................................................................................................................9
2.2. Le dictionnaire deblok ................................................................................................................10
ii
2.3. Le dictionnaire mobilou..............................................................................................................10
2.4. Le dictionnaire langageSMS.......................................................................................................11
3. Corpus SMS........................................................................................................................................11
3.1. Corpus SMS de Caroline Tagg ...................................................................................................12
3.2. Corpus du DELI..........................................................................................................................12
3.3. Projet « SMS4science »..............................................................................................................12
4. Conclusion..........................................................................................................................................12
Chapitre 4 : Les traducteurs SMS existants ..................................................................13
1. Introduction.........................................................................................................................................13
2. Les différents traducteurs SMS...........................................................................................................13
2.1. Le traducteur du site « www.TraducteurSMS.com ».................................................................13
2.2. Le traducteur du site « www.aidoweb.com » .............................................................................14
2.3. Le traducteur du site « www.1fo.co ».........................................................................................15
3. Conclusion..........................................................................................................................................15
............................................................................................................13Partie 2 : Etude Pratique
Chapitre 1 : Analyse et spécification des besoins.......................................................14
1. Introduction.........................................................................................................................................16
2. L’objectif du projet.............................................................................................................................16
3. Analyse des besoins............................................................................................................................16
3.1. Définition des besoins fonctionnels.................................................................................................16
3.2. Définition des besoins non fonctionnels..........................................................................................16
4. Vue des cas d’utilisation.....................................................................................................................17
4.1. Identification des acteurs ............................................................................................................17
4.2. Identification des cas d’utilisations.............................................................................................17
5. Conclusion..........................................................................................................................................18
Chapitre 2 : Construction des dictionnaires .................................................................19
1. Introduction.........................................................................................................................................19
2. Environnement et outils de travail......................................................................................................19
2.1. Environnement logiciel...............................................................................................................19
2.2. Environnement matériel..............................................................................................................19
3. Construction des dictionnaires............................................................................................................20
3.1. Pourquoi XML ?.........................................................................................................................20
3.2. Les étapes d’élaboration des dictionnaires .................................................................................20
3.2.1. Le fichier « traduction.xml » ..............................................................................................21
3.2.2. Le fichier « dico-fr.xml » .....................................................................................................23
iii
3.2.3. Le fichier « dico-fo.xml ».....................................................................................................24
4. Conclusion..........................................................................................................................................24
Chapitre 3 : Interfaces de l’application...........................................................................19
1. Introduction.........................................................................................................................................25
2. Les interfaces réalisées .......................................................................................................................25
2.1. Le découpage en tokens..............................................................................................................25
2.2. La traduction des mots SMS connus...........................................................................................26
2.2.1. L’identification des mots.....................................................................................................26
2.2.2. La traduction.......................................................................................................................27
2.3. La traduction des mots SMS inconnus........................................................................................28
3. Conclusion..........................................................................................................................................29
Chapitre 4 : Evaluation de l’application ..........................................................................20
1. Introduction.........................................................................................................................................30
2. Evaluation par rapport au « corpus-sms-test.txt » ..............................................................................30
3. Comparaison par rapport aux autres traducteurs ................................................................................33
3.1. Le résultat de notre traducteur SMS ...........................................................................................33
3.2. Le résultat du traducteur « www.1fo.co »...................................................................................34
3.3. Le résultat du traducteur « www.TraducteurSMS.com » ...........................................................34
4. Conclusion..........................................................................................................................................35
Chapitre 5 : Gestion du projet.................................................................................................30
1. Introduction.........................................................................................................................................36
2. Démarche utilisé pour organiser le projet...........................................................................................36
3. Répartion des tâches de rédaction du rapport .....................................................................................37
4. Les apports de projet...........................................................................................................................38
5. Les problèmes rencontrés et solutions proposées ...............................................................................38
6. Conclusion..........................................................................................................................................38
Conclusion générale....................................................................................................................39
Références .........................................................................................................................................40
Annexes.................................................................................................................................................41
iv
Table des Figures
Figure 1 : Le dictionnaire-sms......................................................................................................................9
Figure 2 : Le dictionnaire deblok................................................................................................................10
Figure 3 : Le dictionnaire mobilou .............................................................................................................10
Figure 4 : Le dictionnaire langageSMS ......................................................................................................11
Figure 5 : Le traducteurSMS.com...............................................................................................................13
Figure 6 : Le traducteur SMS AidoWeb.....................................................................................................14
Figure 7 : Le traducteur SMS 1fo...............................................................................................................15
Figure 8 : Diagramme de cas d’utilisation générale ...................................................................................17
Figure 9 : Extrait du dictionnaire « traduction.xml »..................................................................................21
Figure 10 : Structure de la balise <Dictionnaire>.......................................................................................22
Figure 11 : Extrait du dictionnaire « dico-fr.xml ».....................................................................................23
Figure 12 : Extrait du dictionnaire « dico-fr.xml ».....................................................................................24
Figure 13 : Interface de découpage en tokens.............................................................................................25
Figure 14 : Interface de détection de locution ............................................................................................27
Figure 15 : Interface de traduction des mots SMS connus .........................................................................28
Figure 16 : Interface de traduction des mots SMS inconnus ......................................................................29
Figure 17 : Traduction de la phrase 1 de corpus-sms-test...........................................................................30
Figure 18 : Traduction de la phrase 47 de corpus-sms-test.........................................................................31
Figure 19 : Traduction d'une phrase avec mot inconnu ..............................................................................32
Figure 20 : Interface de traduction de notre Traducteur SMS ....................................................................33
Figure 21 : Interface de traduction du traducteur www.1fo.co...................................................................34
Figure 22 : Interface de traduction de traducteur www. TraducteurSMS.com...........................................34
Liste des Tableaux
Tableau 1 : Exemples de phonétisation ........................................................................................................5
Tableau 2 : Exemples du rébus typographique.............................................................................................6
Tableau 3 : Exemples d'abréviation..............................................................................................................6
Tableau 4 : Exemple des émotions ...............................................................................................................7
Tableau 5 : Avantage et inconvénients de l'outil TraducteurSMS.com......................................................14
Tableau 6 : Avantages et inconvénients de l’outil AidoWeb .....................................................................14
Tableau 7 : Avantages et inconvénients de l’outil 1fo................................................................................15
Tableau 8 : Un tableau comparatif de traducteurs SMS .............................................................................35
Tableau 9: Répartition des tâches ...............................................................................................................37
Introduction générale
Introduction générale
1
L'essor des technologies de l'information et de la communication (TIC) a marqué de façon
décisive le vingtième siècle: par la radiodiffusion, la télévision, la téléphonie ou Internet. La
communication entre les personnes a subi une véritable évolution [1]. Cette évolution,
notamment dans le domaine de l’informatique, a donné naissance à des nouvelles formes de
communication entre locuteurs tel que le SMS. Ce dernier est un moyen de contact rapide et
moins coûteux.
Cependant, le SMS adopte une écriture qui s’affranchisse de la norme orthographique. Il amène
l’utilisateur à abréger les mots de sa langue française et à utiliser des émotions. Ces
modifications du langage naturel permettent de ne pas dépasser le nombre de caractères prévu
par le message SMS et pour accélérer la saisie de celui-ci. Ceci fait l'apparition d'un nouvel
langage : langage SMS.
Or, l’émergence de ce nouveau langage à donner lieu à deux opinions opposées : Certains
favorise l'utilisation de ce langage à cause de sa simplicité et les bénéficies associe. D’autre le
considère comme une source de danger parce que les usagers de ce langage ignorent les normes
orthographiques et grammaticales. Dans ce cadre, le Traitement Automatique du Langage (TAL)
s'intéresse à étudier ce phénomène en raison des diverses applications possibles: synthèse vocale,
traduction automatique SMS, etc. [2]
Dans le cadre de ce projet, il nous a été confié d'étudier le langage SMS et de développer un
traducteur de langage SMS. Ce rapport présente donc le travail réalisé à cet effet. L’élaboration
du projet a été fondée sur deux axes, axe théorique et axe pratique. La première partie est
constituée de quatre chapitres alors que la deuxième partie est constituée de 5 chapitres.
Partie 1 : Etude théorique
chapitre1 : Etude Préalable
Chapitre 1 : Etude préalable
2
1. Introduction
Lorsque les premiers téléphones mobiles ont été lancés, ils étaient surtout destinés à passer des
appels par les utilisateurs. Aujourd'hui, l'appel n'est plus le moyen de communication le plus
utilisé, il a cédé sa place au SMS, qui est devenu le moyen de communication le plus privilégié
pour les usagers. Dans ce chapitre, nous définissons en premier lieu le SMS, et nous présentons
un petit aperçu sur leur historique. Ensuite, nous présentons l’utilisation des SMS en Tunisie.
Finalement nous citons les bénéfices de l’utilisation des SMS, et leurs limites.
2. Emergence des TIC
La technologie et les vagues d'innovations qui sont succédé durant les dernières décennies dans
le domaine des technologies de l’information et de la communication, ont profondément modifié
la nature de la communication entre les correspondants en contact. Les concepts de temps et de
distance ont perdu leur significativité. Cette évolution a rendu la transmission des informations
plus facile grâce aux diversités des moyens de communications utilisés tel que le SMS.
3. Définition de SMS
Un SMS (Short Message Service) également appelé texto est une suite de caractères transmis
d’un téléphone mobile ou un terminal informatique vers un ou plusieurs autres téléphones. La
longueur d’un SMS est limitée, la ponctuation et les espaces sont comptés. Le SMS semble
correspondre à des besoins de communication rapide. C’est un service accessible depuis tous les
terminaux mobiles et qui connaît un très fort développement notamment chez les jeunes qui
n’hésitent pas à y consacrer des sommes d’argent importante pour échanger les messages entre
eux. [3]
4. Historique
Le premier message court de l'Histoire ("Merry Christmas!") a en effet été envoyé le 3 décembre
1992 par un ingénieur anglais de la société Sema Group à un collègue de l'opérateur Vodafone.
Neil Papworth est donc à l'origine de cette invention. Mais il ne s'agissait de mettre en place un
service grand public. Au contraire ! Exploité par Vodafone, ce système était au départ réservé à
un usage interne, notamment pour permettre aux dirigeants de communiquer avec leurs
secrétaires. Bien qu'au début, cette innovation n’est pas destinée au grand public, les SMS ont
fini par faire partie intégrante de la vie quotidienne des gens notamment les jeunes utilisateurs.
[4]
Chapitre 1 : Etude préalable
3
5. Utilisation des SMS
Le SMS prend aujourd’hui un ascendant significatif en termes d’utilisation. En Tunisie,
l’utilisation des SMS a connu une véritable explosion, même les candidats du baccalauréat
peuvent obtenir leurs résultats via SMS. Les jeunes ont beaucoup profités de cette évolution
pour envoyer énormément des SMS chaque jour, pour participer à des concours ou des jeux
télévisés, avoir des informations sur le trafic des transports, etc.
Heureusement pour eux tous les opérateurs ont intégré les SMS illimités dans la plupart de leurs
offres téléphoniques. Par contre la majorité de personnes âgées préfère toujours la
communication directe par téléphone parce qu’ils ont beaucoup de mal avec les nouveaux
téléphones portables. Cela veut dire que le SMS à des avantages d’une coté et des inconvénients
de l’autre côté.
6. Les bénéfices de l’utilisation des SMS
Le SMS est un service très pratique, dans la partie suivante nous allons mettre l’accent sur les
principaux points forts des SMS : [3]
 Il permet une communication silencieuse, et rapide
 La réception des SMS est gratuite, elle n’induit pas donc aucune charge financière pour le
récepteur, et peuvent être consultés malgré un forfait épuisé.
 Pour transmettre un message bref, le SMS est le moyen de communication le moins cher,
si on le compare au prix d’une communication courte sur un mobile.
 Il est possible, d’utiliser un terminal informatique connecté à l’internet pour envoyer des
SMS de façon gratuit depuis des sites Web.
 Il est mieux de transmettre un message à une personne sans vouloir la déranger (réunion,
heure tardive…) ou bien lorsque son environnement immédiat ne permet pas une
conversation téléphonique dans de bonnes conditions (bus, train, lieux bruyants).
7. Les limites de l’utilisation des SMS
Nous allons maintenant se concentrer sur les faiblesses, et les limites des SMS. Parmi les
problèmes principaux des SMS : [3]
Chapitre 1 : Etude préalable
4
 L’écriture d’un texte sur un téléphone mobile n’est pas très simple pour les personnes
utilisant peu ce mode de communication. Un peu d’entraînement semble nécessaire,
surtout chez les plus âgés et malgré les efforts des constructeurs pour proposer des
interfaces conviviales et intuitives par rapport au format réduit du terminal.
 A l’inverse d’un courrier papier ou d’un message courriel, la longueur du message SMS
est limitée.
8. Conclusion
La limitation du nombre de caractères, le coût, et les difficultés de saisie ont conduit les jeunes à
simplifier les règles orthographiques et chercher à réduire la longueur de ses messages. Ils ont
donc réinventé un langage propre à eux : le langage SMS.
Chapitre 2 : Le langage SMS
Chapitre 2 : Le langage SMS
5
1. Introduction
Le SMS a connu un grand succès aux prés de ses usagers. Cependant, ils présentent des lacunes
en termes de limitation de nombres de caractères. Pour combler ces lacunes, un nouveau langage,
langage SMS, a été réinventé. Dans ce chapitre, nous allons présenter le langage SMS avec
toutes ses spécificités. Par la suite, nous citons les apports et les limites de ce langage.
2. Définition du langage SMS
Le langage SMS est un moyen de communication qui modifie les caractéristiques
orthographiques voire grammaticales de la langue française. Il permet de réduire la longueur des
messages écrits afin de diminuer la durée requise pour composer un texto. Ce langage vise aussi
à respecter le seuil maximum des caractères imposé par le système de la téléphonie mobile. [5]
3. Les procédés utilisés dans le langage SMS
Le langage SMS fait recours à certains procédés pour réduire le nombre de caractères dans un
message : la phonétique, le rébus typographique, l’abréviation et les émotions [6] [7].
3.1.La phonétique
La phonétique est l’étude scientifique des sons du langage humain [8]. Cette technique consiste à
écrire les mots comme ils se prononcent toute on négligeant les règles orthographiques. Elle
remplace un son par une lettre ou chiffre dont ils ont la même valeur sonore. Cependant, elle
assure une transcription1
phonétique claire et nette, ce qui facilite la compréhension d’un texto.
Le tableau ci-dessous montre des exemples de phonétisation.
Langage SMS Langage naturel
Kdo cadeau
swaré soirée
KC casser
D100 descend
7 Cet(te)
G J’ai
C cho C'est chaud
Tableau 1 : Exemples de phonétisation
1
Pouravoir plus sur la transcription, veuillez consultez ce lien :
http://post.queensu.ca/~lessardg/Cours/215/chap2.html
Chapitre 2 : Le langage SMS
6
Au niveau de mot cadeau, la lettre « o » remplace le son de la séquence de lettre « eau » et la
lettre « k » remplace le son de « ca ». D’après ce qui qui précède, on remarque que la
transcription phonétique est encore lisible. (Tableau 1)
3.2.Le rébus typographique
« Le rébus typographique est le procédé par lequel certaines séquences de lettres, d’un mot ou
d’une suite de mots, sont remplacées par un arrangement de chiffres, de lettres et signes divers.
Ce procédé est basé essentiellement sur la phonétique » [6]. Le tableau ci-dessous illustre des
exemples de rébus typographique.
Langage SMS Langage naturel
ab1to A bientôt
a2m1 A demain
D100 descend
jtm Je t’aime
C cho C'est chaud
// parallèle
5* Cinq étoiles
Tableau 2 : Exemples du rébus typographique
Dans l’exemple « A bientôt », on a remplacé la suite de caractère « ien » par le chiffre « 1 » et
les caractères « ôt » par l’alphabet « o ». Ceci explique que le chiffre « 1 » et la lettre « o » ont
respectivement la même valeur phonétique que « ien » et « ôt ». (Tableau 2)
3.3.L’abréviation
Une abréviation est la réduction d'un mot par retranchement des lettres moins pertinentes [9],
tout en gardant un mot clair et compréhensible [6]. Le tableau suivant contient quelques
exemples des mots en langage SMS et leurs équivalents en langage naturel.
Langage SMS Langage naturel
tt tout
TAL Traitement Automatique des Langues
Télé Télévision
net internet
Tableau 3 : Exemples d'abréviation
Chapitre 2 : Le langage SMS
7
Comme le montre le Tableau 3, l'abréviation a réduit la taille des mots. Dans le cas du mot tout,
on a éliminé les alphabets « o » et « u » et on a gardé les deux alphabets les plus informatives « t
» et « t ». Dans le deuxième exemple, on a abrégé le mot Traitement Automatique des Langues
en un groupe des lettres initiales « TAL ». Pour raccourcir les mots télévision et Internet, on a
appliqué la technique de troncation2
. Cette technique fait recours à deux phénomènes :
« apocope » et « aphérèse » [7]. L’apocope c’est la suppression de la dernière partie d’un mot (le
cas de mot télévision). L’aphérèse consiste à supprimer le début d’un mot (internet devient net).
3.4. Les émotions
Les émotions est la combinaison de plusieurs caractères outre que les chiffres et les lettres. Il
s’agit des petits visages exprimant l’état de l’esprit d’une personne. Le tableau suivant montre
des exemples des émotions.
Tableau 4 : Exemple des émotions
Note :
 La répétition des ponctuations et lettres d’un mot exprime l’intensité des émotions. Par
exemple « je t’aiiiiiiiiiiiiiiiiime !!!!!!!! »
 Il est possible de combiner plusieurs procédés simultanément comme le montre
l’exemple suivant : j'ai passé la plus belle nuit de ma vie --> g pac la plu bel nui 2 ma vi.
4. Le langage SMS entre approbation et rejet
Le langage SMS est de plus en plus utilisé par les jeunes. En revanche, il utilise des procédés
qui visent à abréger les mots tout en négligeant les normes orthographiques. De ce fait, l’usage
d’un tel langage angoisse particulièrement les linguistes. Les questions qui se posent ici :
Pourquoi ce langage est considéré comme étant une source d'inquiétude ? Ce moyen de
communication présente- il des apports pour ses utilisateurs ?
2
La troncation consiste à supprimer certaines parties de mots.
Langage SMS Signification
:-) Sourire
:-( Triste
:’( Une larme
:-* bisou
Chapitre 2 : Le langage SMS
8
4.1.Les risques de langage SMS
Le langage SMS représente une menace contre les fondamentaux de la langue française. D’après
Danièle Manesse3
« le niveau d’orthographe des jeunes est beaucoup plus faible aujourd’hui
qu’il y a vingt ans » [10]. En fait, Les personnes qui s’expriment trop par le langage SMS
risquent d’oublier graduellement les règles de grammaire et d'orthographe. Devant un tel constat,
ces personnes commencent à ne plus distinguer entre le langage SMS et la langue française.
Par ailleurs, ceux qui ne maitrisent pas convenablement la langue française trouvent peinent à
déchiffrer le langage SMS. Pour les raisons énoncés précédemment, un comité4
de lutte contre le
langage SMS et les fautes volontaires sur Internet a d’ailleurs vu le jour. En fait, ce comité interdit
l’utilisation de ce mode de communication, langage SMS, sur Internet.
4.2.Les intérêts de langage SMS
Plusieurs arguments appuient l’utilisation du langage SMS. Parmi ceci, la simplicité et la rapidité
de la communication vu que ce langage n’exige pas le respect des normes linguistiques. En
outre, il renforce le sentiment d’appartenance à un groupe social. Ainsi, Le langage SMS offre à
chaque scripteur5
la possibilité de créer son propre langage et de jouer avec les mots. Ceci
procure un sentiment de plaisir lors de rédaction des messages. Il permet aussi d’enrichir le
contenu d’un message tout en respectant le seuil maximum de caractère autorisé par les SMS.
5. Conclusion
Le langage SMS se manifeste comme étant une véritable révolution de langue. Il propose une
écriture indépendante des normes de la langue française. Ce langage a donné lieu à plusieurs
romans6
, entièrement rédigés en langage SMS. Outre que l’apparition des dictionnaires
spécifiques à ce langage. Pour les usagers de ce langage, il suffit de consulter un dictionnaire
répertoriant ces nouveautés pour s’habituer rapidement à leur lecture.
3
Danièle Manesse professeure de sciences du langage à la Sorbonne
4
http://sms.informatiquefrance.com/
5
Un scripteur : Personne qui a écrit un texte
6
Exemple du livre « Pa sage a taba vo SMS » http://livre.fnac.com/a1572830/Phil-Marso-Pa-sage-a-taba-
vo-SMS
Chapitre 3 : Les dictionnaires et les
corpus SMS
Chapitre 3 : Les dictionnaires et les corpus SMS
9
1. Introduction
Le langage SMS est très pratique et rapide pour échanger des textos entres personnes.
Cependant, il n’est pas toujours évident d’appréhende tous les procédés auxquels a recours ce
langage. C'est la raison pour laquelle des dictionnaires et des corpus du langage SMS sont
accessibles depuis internet. Nous verrons dans ce chapitre, quelques exemples de dictionnaires et
corpus de SMS.
2. Les Dictionnaires des SMS
La partie suivante est consacrée à la présentation de quelques dictionnaires de langage SMS.
L’évaluation7
de ces traducteurs est faite à l’aide de quelques exemples écrits en langage
SMS.
2.1. Le dictionnaire-sms
Le dictionnaire-sms8
propose 300 mots français, classés par ordre alphabétique et traduits en
langage SMS [11]. Il est caractérisé par une interface conviviale et claire avec des couleurs
agréables. (Figure 1)
Figure 1 : Le dictionnaire-sms
7
Voir Annexe B
8
http://www.dictionnaire-sms.com
Chapitre 3 : Les dictionnaires et les corpus SMS
10
2.2. Le dictionnaire deblok
Le dictionnaire deblok9
permet d’obtenir la signification d’un mot écrit en langage SMS. Il
utilise un classement par lettre et par catégories (émotions, loisirs etc.). Ce qui permet d’offrir
aux internautes une navigation libre. (Figure 2)
Figure 2 : Le dictionnaire deblok
2.3. Le dictionnaire mobilou
Le dictionnaire mobilou10
est réalisé par Phil Marso [11]. Il présente les mots français dans
l'ordre alphabétique accompagnés de leur traduction en langage SMS. L’interface du site n’est
pas trop ergonomique. (Figure 3)
Figure 3 : Le dictionnaire mobilou
9
http://www.deblok.net/dicosms/
10
www.mobilou.info/ 10kosms.htm
Chapitre 3 : Les dictionnaires et les corpus SMS
11
2.4.Le dictionnaire langageSMS
Le dictionnaire langageSMS11
offre une liste limitée des mots traduit en langage texto. Il possède
une interface simple et claire. (Figure 4)
Figure 4 : Le dictionnaire langageSMS
D’après ce qui précède, on peut constater que tous les dictionnaires proposent des listes non
exhaustives des mots traduit en langage SMS. Ainsi, le langage SMS évolue rapidement ce qui
pose des problèmes de mise à jour. De plus, ces dictionnaires se limitent à quelques variantes
d’un mot : exemple pour « demain » : 2m1, dmin, dem1, 2min. Pour résumé, Il existe sur
Internet plusieurs dictionnaires12
de langage SMS mais on ne trouve pas pour l'instant un
dictionnaire officiel de langage SMS.
3. Corpus SMS
Le corpus SMS est une collection d’un grand nombre des SMS rédigés par un grand nombre de
personnes différentes. Le but d’un corpus est de constituer une référence qui puisse servir pour
des études linguistiques. Dans cette partie on va présenter quelques exemples de corpus SMS.
11
http://www.langagesms.com/dictionnaire.html
12
Voir Annexe A
Chapitre 3 : Les dictionnaires et les corpus SMS
12
3.1. Corpus SMS de Caroline Tagg
Caroline Tagg, de l’université de Birmingham en Angleterre, a analysé l’orthographe, la
grammaire et les abréviations dans les SMS. Pour son étude, elle a demandé à ses amis et aux
membres de sa famille de lui renvoyer tous les messages qu’ils recevaient ou envoyaient. Elle a
ainsi récolté environ 11 000 SMS, soit près de 190 000 mots. [12]
3.2.Corpus du DELI
Ce corpus compte 13 400 SMS pour environ 156 620 mots. Une partie des SMS ont été récoltés
entre 2000 et 2004 par des étudiants de l’université de Provence en France, dans le cadre de
travaux pratiques ou mémoires. Se sont rajoutés des SMS provenant d’utilisateurs ayant donné
leur accord à Orange pour que leurs SMS soient utilisés à des fin de recherche. [12]
3.3.Projet « SMS4science »
Le projet, qui se veut international, a débuté en Belgique en 2004. Il a permis de récolter plus de
75 000 SMS grâce à 3200 participants. Parmi ces participants, 2775 ont acceptés de répondre à
un questionnaire « portant sur leur profil et leurs pratiques ». Le corpus constitué est à la fois
homogène concerne seulement les SMS et diversifié puisque les participants sont différents donc
leur utilisation des SMS l’est aussi. En effet, les participants ont entre 12 et 73 ans et
appartiennent à des catégories différentes (étudiants, employés, etc.). [13]
La récolte des SMS s’est faite par un numéro spécial. Les participants envoyaient leurs SMS
directement à ce numéro gratuit. Ce procédé a évité des erreurs de saisie ou d’interprétation en
recopiant manuellement les SMS. C’est un problème qui a été observé dans des projets d’analyse
de SMS qui se sont réalisés dans différentes universités. [12]
4. Conclusion
La limite majeure de la collecte des messages est qu’elle est réalisée dans un cercle proche des
universités, de la famille, des amis, ou un nombre limité des personnes. Elle ne concerne donc
qu'une partie restreinte du public utilisateur des SMS et par ailleurs, elle implique généralement
une phase de recopiage des messages qui peut être la source d'erreurs. [14]
Chapitre 4 : Les traducteurs SMS
existants
Chapitre 4 : Les traducteurs SMS existants
13
1. Introduction
La recherche dans la traduction des SMS a mené a réalisé des logiciels de traduction des SMS.
Ces traducteurs se sont des outils intéressants qui permettent de traduire des SMS envoyés avec
un téléphone portable. Ils traduits les mots en langage SMS et les remplaces par les mots
correspondants, mais ils ne corrigent pas les éventuelles fautes de français. L’objectif de ce
chapitre et de présenter et tester quelque applications de traduction du langage SMS vers le
langage naturel.
2. Les différents traducteurs SMS
Il existe sur Internet différents sites qui proposent des traducteurs du langage SMS vers le
français.
2.1. Le traducteur du site « www.TraducteurSMS.com »
Le site www.TraducteurSMS.com13
met à la disposition de ses utilisateurs un traducteur en ligne
gratuit du langage SMS vers la langue française. De plus il contient un dictionnaire du langage
SMS et la signification des smileys. (Figure 5)
Figure 5 : Le traducteurSMS.com
13
http://www.TraducteurSMS.com
Chapitre 4 : Les traducteurs SMS existants
14
 Avantages et inconvénients
Le tableau ci-dessous montre les avantages et les inconvénients associé à ce traducteur.
Avantages Inconvénients
+ Bonne ergonomie
+ Reconnaissance des Smiley
+ Disponibilité d’un dictionnaire pour le
langage SMS et la signification des
Smileys
- Outil faible
- Le dictionnaire utilisé ne contient pas
beaucoup de mot même les plus utilisés
SLT -> Salut
RDV -> Rendez-Vous
ss -> Sous
Tableau 5 : Avantage et inconvénients de l'outil TraducteurSMS.com
2.2.Le traducteur du site « www.aidoweb.com »
Le site web www.aidoweb.com14
, met à notre disposition un outil de traduction SMS, nous
permettant de décrypter un texte écrit en langage SMS vers du français correcte. Il comporte
pour le moment 6350 mots. [16] (Figure 6)
Figure 6 : Le traducteur SMS AidoWeb
 Avantages et inconvénients
Le tableau suivant montre les avantages et les inconvénients associé à ce traducteur.
Avantages Inconvénients
- Outil simple
- Reconnait beaucoup de Rébus
Typographique : tel que C C’est,
auj aujourd’hui, svoi se voit
Malgré le fait qu’il soit puissant, le dictionnaire
qu’il utilise n’est pas implémenter par tous les
rébus (normale vu le fait que chaque jour de
nouveaux mots naissent)
Exemple : Raf  Rien à faire
12C4  Un de ces quatre
jTappel Je t’appel
Tableau 6 : Avantages et inconvénients de l’outil AidoWeb
14
http:// www.aidoweb.com
Chapitre 4 : Les traducteurs SMS existants
15
2.3.Le traducteur du site « www.1fo.co »
Le site web www.1fo.co15
, met à notre disposition un outil de traduction SMS qui se base sur
tous les mots présents dans le dictionnaire SMS du site lui-même. Ce dictionnaire comporte plus
de 400 abréviations SMS. [17] (Figure 7)
Figure 7 : Le traducteur SMS 1fo
 Avantages et inconvénients
Le tableau suivant présente les avantages et les inconvénients associé à ce traducteur.
Avantage Inconvénients
- Outil un peu puissant
- Reconnait un certain nombre de Rébus
typographique
Mais il reste tout de même assez incomplet.
Son dictionnaire ne contient pas beaucoup de
mots (400 mots reste vraiment peu suffisant
pour une base lexicale qui peut faire le poids)
Tableau 7 : Avantages et inconvénients de l’outil 1fo
3. Conclusion
Dans ce chapitre nous avons ouvert une fenêtre sur les outils que l’on trouve sur internet et qui
peuvent nous aider à faire une traduction du langage SMS vers un Français classique. Cela a été
riche en enseignement, vu le nombre assez grand de ce genre de logiciel sur la toile, nous avons
testé quelque uns, qui étaient soit peu ou très performant.
15
http : // www.1fo.co
Partie 2 : Etude Pratique
Chapitre 1 : Analyse et spécification
des besoins
Chapitre 1 : Analyse et spécification des besoins
16
1. Introduction
La phase d’analyse et de spécification et des besoins est sans doute l’une des plus importantes
phases dans le cycle de développement de toute application informatique. Ce chapitre est
consacré à la description des différents besoins fonctionnels et non fonctionnels dégagés lors de
la phase d’analyse. Ainsi que la description de modèle de cas d’utilisation prévus pour bien
comprendre le fonctionnement de l’application.
2. L’objectif du projet
L’objectif de ce projet est de concevoir un logiciel permettant de traduire un texte écrit en
langage SMS vers la langue française.
3. Analyse des besoins
Nous présentons dans cette partie les besoins fonctionnels et non fonctionnels de notre système.
3.1. Définition des besoins fonctionnels
Le système à mettre en place doit offrir à l’utilisateur les fonctionnalités suivantes :
 Saisir le texte en langage SMS
 Traduire le texte saisi en langage SMS vers la langue française
 Voir le pourcentage de traduction correcte
3.2. Définition des besoins non fonctionnels
Outre que les besoins fonctionnels, il faut tenir compte de certains besoins non fonctionnels
nécessaires pour une exploitation simple et consistante de notre système.
Nous distinguons essentiellement les trois points suivants :
 Simplicité : l’application doit offrir une interface simple avec des fonctionnalités
compréhensibles.
 Ergonomie : l’interface doit être ergonomique proche de la réalité du domaine
d’application, facile à utiliser.
 Rapidité : l’application doit offrir un temps de réponse acceptable qui dépend en grande
partie de la complexité du code implémenté.
Chapitre 1 : Analyse et spécification des besoins
17
4. Vue des cas d’utilisation
Pour bien spécifier les besoins de notre application, nous avons recours au langage de
modélisation unifié UML. Nous allons décrire les différents acteurs ainsi que les cas d'utilisation.
Cette activité permet d'obtenir une vue interne idéale du système.
4.1.Identification des acteurs
Un acteur représente un ensemble cohérant de rôles joués par des entités externes (utilisateurs,
dispositifs matériels ou autres systèmes) qui interagissent directement avec l’application. De ce
fait, le seul acteur de notre application est un utilisateur quelconque tel que : un élève, un
étudiant, un professeur, etc…
4.2.Identification des cas d’utilisations
Les cas d’utilisation représentent un élément essentiel de la modélisation : c’est une étape
primordiale assurant la conception et la construction d’un système adapté aux besoins
fonctionnels de l’utilisateur. La figure ci-dessous décrit les fonctionnalités pouvant être effectué
par l’utilisateur.
Figure 8 : Diagramme de cas d’utilisation générale
<<include>>
<<include>>
Utilisateur
Traduire le texte saisi du langage
SMS vers la langue française
Consulter l'interface
Saisir le texte en langage SMS
Consulter le résultat de la traduction
Chapitre 1 : Analyse et spécification des besoins
18
En consultant notre interface, l’utilisateur a le pouvoir de saisir le texte, en langage SMS, qu’il
veut traduire. Ainsi, la traduction du langage SMS en langue française sera effectuée et notre
client pourra par la suite consulter le résultat de sa traduction. La première relation de type «
include » entre « traduire le texte saisi du langage sms vers langue française » et « saisir le texte
en langage sms » exige la saisie du texte par l’utilisateur avant de faire toute traduction possible.
La deuxième relation de type « include » entre « traduire le texte saisi du langage sms vers
langue française » et « consulter le résultat de la traduction » exige de la part de l’utilisateur une
traduction du texte saisie, sinon la consultation du résultat et logiquement impossible à percevoir.
5. Conclusion
Dans ce chapitre, nous avons essayé de présenter des différents besoins fonctionnels et non
fonctionnels dégagés lors de la phase d’analyse. Dans le chapitre qui va suivre, nous entamerons
la phase de la réalisation. Nous allons énumérer les différentes technologies que nous avons
adoptées pour la réalisation de notre application et les différentes étapes de création du notre
base de donnée (en XML).
Chapitre 2 : Construction des
dictionnaires
Chapitre 2 : Construction des dictionnaires
19
1. Introduction
Après avoir achevé l'étape d’analyse et spécification des besoins, nous entamons dans ce chapitre
la partie réalisation qui constitue le dernier volet de ce rapport et qui a pour objectif d'exposer le
travail réalisé. Pour ce faire, nous allons commencer, tout d'abord, par préciser l'environnement
matériel et logiciel de notre travail. Ensuite nous allons présenter les différentes étapes de
construction des dictionnaires.
2. Environnement et outils de travail
Dans cette partie nous allons présenter l’environnement logiciel et matériel de notre travail.
2.1. Environnement logiciel
Notre projet a été développé avec le langage de programmations C#. Pour cela, nous avons
utilisé l’outil Microsoft Visual C# 2010 Express.
Pour la création des dictionnaires, nous avons utilisé le langage XML (Extensible Markup
Language) qui peut être traduit en français par langage de balisage extensible.
2.2.Environnement matériel
Lors de la réalisation de ce projet, nous avons utilisé six micro-ordinateurs dont nous allons citer
les caractéristiques du certains parmi eux:
 Micro-ordinateur 1 :
- Processeur : Pentium ® DualCore CPU T4200 @ 2.00 GHz.
- Mémoire vive RAM: 4,00 Go.
- Disque dur: 370 Go.
- Système d'exploitation : Windows Vista.
 Micro-ordinateur 2 :
- Processeur : Pentium [R] 4 CPU 2.8 GHz.
- Mémoire vive RAM: 1,OO Go.
- Disque dur: 160 Go.
- Système d'exploitation : SE XP sweet.
Chapitre 2 : Construction des dictionnaires
20
3. Construction des dictionnaires
L’évolution rapide du langage SMS a donné lieu à l’apparition des dictionnaires spécifiques à ce
langage. Ces dictionnaires servent principalement à répertorier les nouveautés du ce langage et
prendre en charge la vaste quantité de variant que peut avoir un même mot. Par exemple le mot
bonne nuit, il peut être exprimé sous forme (bn8, bn, BN, bn8…). Donc ces dictionnaires
peuvent être utiles pour traduire un SMS à condition qu’ils soient mis à jour régulièrement et que
le problème des formes multiples soit résolu.
3.1.Pourquoi XML ?
Le langage XML (Extensible Markup Language) présente plusieurs avantages par rapport aux
autres moyens de stockage des données tel que le fichier texte ou base de données. Un fichier
XML est : [18]
 Lisible : Aucun pré requis n’est nécessaire pour comprendre un fichier XML.
 Auto descriptif et bien structuré.
 Extensible : un document XML peut être utilisable dans toute applications possibles.
 Présente une structure arborescente : structurant et hiérarchisant tout problème
informatique possible.
 Portabilité.
 Dé ployable : il peut être facilement distribué par n'importe quels protocoles à même de
transporter du texte, comme http.
 Intégrabilité : un document XML est utilisable par toute application pourvue d'un parseur
(c'est-à-dire un logiciel permettant d'analyser un code XML).
 Accès plus rapide.
3.2.Les étapes d’élaboration des dictionnaires
Dans cette partie nous allons explorer nos 3 fichiers XML, afin de décrire l'architecture de nos
fichiers et la logique qu'ils expriment. Chacune des balises transcrites dans ces fichiers seront
expliquées et éclaircies.
Chapitre 2 : Construction des dictionnaires
21
3.2.1.Le fichier « traduction.xml »
Ce dictionnaire a pour objectif de traduire des mots SMS en leur équivalent en français.
(Figure 9)
Figure 9 : Extrait du dictionnaire « traduction.xml »
Il faut spécifier à celui qui va lire le fichier que ce soit un logiciel ou un navigateur WEB que le
fichier présent est en langage XML. Donc il faut ajouter la syntaxe ci-dessus en en-tête de
fichier.
<dictionnaire> c'est la balise mère. Chaque fichier XML doit impérativement avoir une balise
mère pour pouvoir être lu.
Chapitre 2 : Construction des dictionnaires
22
La figure ci-dessus montre un extrait du fichier « traduction.xml » qui décrit la structure de la balise
<Dictionnaire>.
Figure 10 : Structure de la balise <Dictionnaire>
 La balise mot contient un attribut « valeur » qui représente le mot en langage sms.
 La balise signification indique l’équivalent de mot « bnjr » dans la langue française.
 Le type : cet attribut permet d’indiquer le type de mot
0 : sans type
1 : un mot masculin singulier.
2 : un mot féminin singulier.
3 : un mot masculin pluriel.
4 : un mot féminin pluriel.
5 : un mot au pluriel.
6 : un mot au singulier.
Comme le montre l’exemple ci-dessous, le mot « pom de ter » saisi en langage SMS peut être
traduit de plusieurs manières vers la langue française. En effet, l’accord orthographique du mot
SMS « pom de ter » change selon le type qui lui correspond. Autrement dit, si le type associé est
égale à 1, c'est-à-dire « masculin singulier » donc on aura pomme de terre sans ‘s’. si le type
associé est égale à zéro. Dans ce cas, il s’agit d’un type inconnu, on lui affecte donc tous les
traductions possibles (pomme ou pommes de terre).
Chapitre 2 : Construction des dictionnaires
23
3.2.2.Le fichier « dico-fr.xml »
Le fichier « dico-fr.xml » représente le dictionnaire français. Il contient des mots en français
avec leurs types. La figure suivante présente un extrait du dictionnaire français. Dans l’entête,
on remarque l’utilisation de balise mère <dictionnaireFrancais>. Chaque fichier XML doit
impérativement avoir une balise mère pour pouvoir être lu.
Figure 11 : Extrait du dictionnaire « dico-fr.xml »
L’exemple suivant illustre l’utilisation de type pour identifier la valeur correspondante au mot
SMS.
 Le mot « enfants » est un mot masculin pluriel.
 Le mot « enfant » est un mot au masculin singulier
Chapitre 2 : Construction des dictionnaires
24
3.2.3.Le fichier « dico-fo.xml »
C’est un dictionnaire phonétique qui permet de traduire les mots du langage SMS vers la langue
française selon leurs transcriptions phonétiques, c’est-à-dire la manière dont ils se prononcent.
La figure ci-dessous décrit un extrait du fichier XML « dico-fr.xml ». (Figure 12)
Figure 12 : Extrait du dictionnaire « dico-fr.xml »
Dans cet exemple le mot SMS « k » peut être traduit en plusieurs mots selon la manière dont il
est prononcé.
4. Conclusion
Nous avons décrit dans cette partie l’environnement du travail et les différentes étapes de
construction des trois dictionnaires. Dans la partie suivante, nous détaillons notre application.
Chapitre 3 : Interfaces de
l’application
Chapitre 3 : Interfaces de l’application
25
1. Introduction
Dans ce chapitre nous décrivons le travail accompli tout au long de ce projet pour achever avec
une exposition des problèmes rencontrés.
2. Les interfaces réalisées
Au cours de cette section, nous nous attachons à présenter les étapes de réalisation de notre
traducteur SMS à travers quelques interfaces. Au niveau de chaque étape nous allons décrire les
problèmes rencontrés et les solutions envisagés. Les étapes à mettre en œuvre sont les suivantes :
 Le découpage en tokens
 La traduction des mots SMS connus
 La traduction des mots inconnus
 L’évaluation (cette étape sera décrite dans le chapitre suivant)
2.1.Le découpage en tokens
Le rôle de cette étape est de convertir une chaîne de caractères représentant une phrase SMS en
une suite de tokens. La figure suivante prouve que notre traducteur SMS a bien segmenté la
phrase.
Figure 13 : Interface de découpage en tokens
Chapitre 3 : Interfaces de l’application
26
 Les problèmes rencontrés et les solutions proposées
Le type de séparateur à utiliser ? Est-ce que nous allons utiliser les ponctuations « . , ; : ! ? »
comme séparateur ou bien nous allons utiliser l’espace seulement.
 Nous avons choisi donc comme délimiteur des tokens les points, les virgules, les espaces et le
retour chariot car ils sont les plus utilisés. Les autres ponctuations vont être considérées comme
des mots. En outre, si nous allons considérer les : ; comme des séparateurs notre logiciel ne peut
pas distinguer les émotions.
2.2.La traduction des mots SMS connus
Le but de cette étape est de remplacer les séquences de caractères correspondant à un mot SMS
présent dans le fichier « traductions.xml » en sa traduction en français. Pour cela, nous
procéderons en deux étapes : l’identification des mots et la traduction.
2.2.1.L’identification des mots
Cette étape16
consiste à détecter les tokens correspondant à un mot SMS présent dans le
dictionnaire. Cette étape doit détecter aussi les tokens qui correspondent à des mots du français à
l’aide de « dico-fr.xml ».
 Les problèmes rencontrés et les solutions proposées
Comment nous allons détecter les locutions ? Certains mots (SMS ou français) sont composés de
plusieurs tokens. Dans ce cas, ces différents tokens devront être regroupés ensemble.
 Après la phase de segmentation, notre traducteur prend le premier token (pom) et le combine
avec le deuxième token (de) pour construire un nouveau mot (pom de). Puis il consulte le
dictionnaire (dico-fr.xml ou traductions.xml) pour vérifier si ce dernier existe ou non. Si le
nouveau mot existe dans le dictionnaire, le traducteur va le conserver dans une variable
temporaire et le concatène avec le troisième token (pom de ter).
Ensuite, le traducteur consulte de nouveau le dictionnaire si le mot existe il va écraser l’ancien
contenu de la variable temporaire et mettre ce nouveau mot (pom de ter). De même, le traducteur
combine le nouveau mot (pom de ter) avec le quatrième token (pom de ter ). Si le mot existe, il
va l’afficher sinon le traducteur affiche le contenu de la variable temporaire (pom de ter) car
nous avons limité le nombre de combinaison permis à quatre.
16
Enoncé de projet « traduction des SMS »
Chapitre 3 : Interfaces de l’application
27
La figure ci-dessous montre la détection de la locution « pomme de terre » par notre traducteur.
Figure 14 : Interface de détection de locution
2.2.2.La traduction
La dernière étape consiste à effectuer la traduction des mots SMS en leur équivalent en français,
tel qu’ils sont décrit dans le fichier « traduction.xml ». Cette étape ne va traduire que les mots de
type sms.
 Les problèmes rencontrés et les solutions proposées
Il arrive dans certains cas, que notre logiciel ne reconnait pas les mots SMS car ils n’existent pas
dans le dictionnaire « traductions.xml ».
Donc on a recours à enrichir manuellement notre dictionnaire pour augmenter la performance
du notre système. Plus qu’on alimente notre dictionnaire, plus que le logiciel reconnait
correctement les mots SMS. En revanche, le temps de réponse augmente et la performance du
logiciel diminue.
• Pour traiter le cas d’étirement, nous avons fixé le nombre maximum de répétition des lettres à
deux. Le logiciel essaie de faire toute les combinaisons possibles des mots par exemple, les
combinaisons du mot « sllllttttttt » engendre ces nouveaux mots « slt », « sllt » et « sltt ».
Chapitre 3 : Interfaces de l’application
28
Le traducteur consulte le dictionnaire pour valider l’un des nouveaux mots. Il vérifie l’existence
de l’un de ces mots dans le dictionnaire français en premier lieu après dans le dictionnaire SMS
en deuxième lieu. S’il l’a trouvé, il l’affiche sinon il affiche le premier mot rencontré « slt ».
L’exemple choisie combines plusieurs procèdes (Abréviation, phonétique). Notre traducteur a su
identifié les mots SMS et les traduire en langue française. (Figure 14)
Figure 15 : Interface de traduction des mots SMS connus
2.3.La traduction des mots SMS inconnus
Le but de cette étape17
est d’essayer de « déchiffrer » des mots SMS absents dans le dictionnaire
« traduction.xml ».
 Les problèmes rencontrés et les solutions proposées
- Le dictionnaire « traduction.xml » ne comporte qu’une partie du vocabulaire SMS.
Pour cela, on va utiliser la transcription phonétique des mots (la manière dont ils se
prononcent) pour essayer de retrouver des mots français correspondants. Nous avons créé un
dictionnaire phonétique « dico-fo.xml » à travers lequel nous allons traduire les mots inconnus.
17
Enoncé de projet « traduction des SMS »
Chapitre 3 : Interfaces de l’application
29
- Plus qu’on augmente la taille du mot, plus que le nombre de combinaison possible ce qui
influe sur la durée du traitement.
Nous avons fixé un seuil pour le nombre de caractère du mot inconnu qui égale à cinq. Par
exemple le mot « klke » donne 432 combinaisons possibles dont le « k » possède six valeurs
dans le dictionnaire phonétique, pour « l » quatre valeurs et trois valeurs pour « e ». La
multiplication nous donne 6*4*6*3 combinaisons.
-Plus qu’on augmente la taille du dictionnaire plus que le temps de réponse augmente et la
performance diminue
 Pour optimiser les dictionnaires utilisés, nous avons alimenté nos dictionnaires que par des
mots minuscules. Lors de la traduction, nous avons converti tous les mots SMS vers la
minuscule d’une manière transparente pour l’utilisateur.
La figure suivante montre que notre traducteur a réussi l’opération de déchiffrement des mots
inconnu.
Figure 16 : Interface de traduction des mots SMS inconnus
3. Conclusion
Nous avons achevé dans ce chapitre, la description des interfaces les plus significatives de notre
application. Il semble indispensable de critiquer notre travail et de l’évaluer. Ceci sera détaillé
dans le chapitre suivant.
Chapitre 4 : Evaluation de
l’application
Chapitre 4 : Evaluation de l’application
30
1. Introduction
L’évaluation de l’application consiste à vérifier si elle a atteint ses objectifs et de déterminer
quelles sont leurs forces et leurs faiblesses pour émettre des recommandations pour une
amélioration future. C’est dans ce cadre s’inscrit ce chapitre qui est composé de deux parties,
premièrement nous allons évaluer l’application par rapport à un corpus de test, ensuite, nous
allons comparer notre système avec d’autres traducteurs existants sur Internet.
2. Evaluation par rapport au « corpus-sms-test.txt »
Cette partie est consacrée à l’évaluation de l'efficacité du notre traducteur SMS. Elle nous
indique si nous avons atteint nos objectifs ou non. Pour cela, nous procédons d’abord par
traduire quelques phrases du fichier « corpus-sms-test.txt » à l’aide de notre application. Puis,
nous comparons-les aux phrases de « corpus-fr-test.txt ».
 Exemple 1
La figure suivante présente le résultat de traduction de la phrase " Mais pq t debout ? nan
j’éteind jamais mon gsm :-)".
Figure 17 : Traduction de la phrase 1 de corpus-sms-test
Chapitre 4 : Evaluation de l’application
31
La comparaison de notre résultat et celle de « corpus-fr-test.txt » " Mais pourquoi t'es debout?
Non, j'éteins jamais mon GSM :-) " permet de faire les constatations suivantes :
 La traduction des mots SMS connus (pq ,nan ) est correcte et identique aux résultats de «
corpus-fr-test.txt » .
 Notre traducteur connaît le sigle GSM.
 L’apport de notre application est la signification des smileys :-) : sourire
 Exemple 2
La figure ci-dessous présente la traduction de la phrase "Lol... Pk pa vnu today? Probleme
derection ??".
Figure 18 : Traduction de la phrase 47 de corpus-sms-test
Notre traducteur SMS donne un résultat pareil au résultat de corpus "Lol... Pourquoi pas venu
today? Problème d'érection ??". Ainsi, notre traducteur donne la signification de l’abréviation
Lol.
Chapitre 4 : Evaluation de l’application
32
 Exemple 3
La figure ci-dessous illustre la traduction de la phrase "g né pas bocop aimé cette piece de
théâtre. Il faut dire que g lé vue dans de mauvaises conditions: le rideau était levé...".
Figure 19 : Traduction d'une phrase avec mot inconnu
Notre application a atteint son but de déchiffrer des mots SMS inconnus en utilisant la
transcription phonétique des mots pour essayer de retrouver des mots français correspondants
comme le montre le mot « bocop».
 Comparaison entre les différentes approches
Dans la réalisation de notre projet nous avons opté à utiliser une approche hybride qui applique
d’abord le dictionnaire puis traite les mots restants à l’aide de leur prononciation. Vu que
l’utilisation unique d’un dictionnaire de traduction a plusieurs limites : il représente une
ressource limitée puisque le langage SMS évolue rapidement .Il ne prend pas en compte la
totalité des mécanismes de création d’un mot SMS (un même mot possède plusieurs écriture
possible).
De même, l’approche qui considère tous les mots comme inconnus et passe par leur
phonétisation n’apporte pas une solution optimale puisque un seul mot peut avoir plusieurs
formes.
Chapitre 4 : Evaluation de l’application
33
3. Comparaison par rapport aux autres traducteurs
Au niveau de cette partie, nous allons comparer le résultat de traduction du notre logiciel par
rapport aux traducteurs SMS existants :
- Le traducteur 1 de site : www.1fo.co
- Le traducteur 2 de site : www.TraducteurSMS.com
- Les traducteurs des sites : www.Traducteur-sms.com et www.aidoweb.com18
Nous a avons fixé le choix sur l’exemple suivant car il combine plusieurs procédés
simultanément (étirement, phonétique, abréviation) :
- Exemple : lé enfon manj dé pom de terrrrrrrrrr elles sont bn ;)
- Traduction : les enfants mangent des pommes de terre elles sont bonnes ;)
3.1.Le résultat de notre traducteur SMS
L’interface suivante illustre la traduction de l’exemple cité auparavant.
Figure 20 : Interface de traduction de notre Traducteur SMS
Notre application a traduit correctement l’exemple écrit en langage SMS. En effet, elle a
appliqué les règles de conjugaison (manj  mangent) et les règles d’orthographes (des pommes,
elles sont bonnes). Ainsi, notre traducteur est capable d’éliminer l’étirement (terrrrrrrrrrrr 
terre). Outre qu’il a réussi la traduction de l’émotion ;)  (clin d’œil) (Figure 19)
18
Consulter Annexe C pour voir le résultat de traduction des Traducteur-sms.com et www.aidoweb.com
Chapitre 4 : Evaluation de l’application
34
3.2.Le résultat du traducteur « www.1fo.co »
Ce traducteur a échoué la traduction. Il n’a traité aucun mot SMS. (Figure 20)
Figure 21 : Interface de traduction du traducteur www.1fo.co
3.3.Le résultat du traducteur « www.TraducteurSMS.com »
Ce traducteur n’a traduit qu’un seul mot SMS sachant que cette traduction est erronée.
Autrement dit, il a considéré le mot SMS « bn » comme étant « bonne nuit » alors qu’il s’agit de
l’adjectif « bon ». (Figure 21)
Figure 22 : Interface de traduction de traducteur www. TraducteurSMS.com
Chapitre 4 : Evaluation de l’application
35
4. Un tableau comparatif de traducteurs SMS19
Le tableau suivant résume l’étude comparative entre notre logiciel et les autres traducteurs SMS.
La case cochée montre que le traducteur en question a réussi la gestion du procèdes
correspondant et la case vide reflet le cas d’échéance.
Nom des traducteurs
Procédés utilisés dans l’exemple
Notreapplication
www.1fo.co
www.TraducteurS
MS.com
www.Traducteur-
sms.com
www.aidoweb.com
Phonétique   
Abréviation   
Elimination d’étirement  
Conjugaison 
Accord orthographique 
émotion 
Tableau 8 : Un tableau comparatif de traducteurs SMS
4. Conclusion
A travers ce chapitre, nous avons remarqué d’après la comparaison de notre système avec les
autres traducteurs qu’aucun d’entre eux n’a pas réussi à faire la traduction total es mot SM. Ceci
montre que la traduction des SMS n’est pas une tâche simple, et l’évaluation est une étape
primordiale pour ce type d’application pour savoir surtout les limites de l’application.
19
Consulter Annexe C pour voir le résultat de traduction d’autres traducteurs
Chapitre 5 : Gestion du projet
Chapitre 5 : Gestion de projet
36
1. Introduction
Ce chapitre décrit la répartition des tâches entre les membres de l’équipe et les difficultés
rencontrés au cours de la réalisation de ce projet. Ainsi, nous allons critiquer notre démarche de
gestion de projet et proposer des solutions pour ne pas commettre ces erreurs dans le futur.
2. Démarche utilisé pour organiser le projet
Le choix de chef d’équipe est réalisé à travers un vote sur notre groupe Facebook. Tous les
membres de l’équipe ont participé dans l’élection de chef du groupe. Après le vote, le chef
d’équipe élu a proposé la démarche suivante pour organiser le travail tout au long de ce projet.
Pour l’étude théorique, tous les membres de l’équipe ont commencé la recherche bibliographique
du sujet d’une manière individuel pendant quelques jours. Ceci a pour objectif de bien
comprendre le sujet et fixer une idée préalable sur les points clé du plan du rapport.
Par la suite, le chef d’équipe propose des réunions régulières pour collecter les idées de
recherches et fixer un plan final. L’étape suivante consiste à affecter à chaque membre de
l’équipe une partie de rédaction du rapport. Cette affectation a été basée sur l’avancement des
recherches bibliographiques déjà réalisées et selon le désir de chaque membre de l’équipe.
Après cette phase, une réunion a été fixée pour valider le travail.
Pour l’étude pratique, le chef d’équipe a fixé une réunion pour déterminer l’environnement de
travail et bien comprendre les différentes étapes de l’application. Contrairement à l’étude
théorique, cette partie est plus délicate car les tâches sont dépendantes et le développement de
l’application parait difficile. C’est pourquoi nous avons décidé de ne pas partager les tâches de
développement. Donc, chaque membre de l’équipe a prescrit les solutions possibles pour
résoudre les problèmes associés à chaque étape de l’application. Lors des réunions, nous avons
partagé les idées et choisir les meilleurs solutions.
Avec cette démarche, tous les membres de l’équipe contribuent au développement de
l’application toute en gardant l’esprit collaboratif. Chaque réunion a été clôturée par un compte
rendu20
rédigé par le chef d’équipe ainsi que la fusion et la validation de la copie finale du
rapport. L’échange des informations a été effectué à travers notre groupe de discussion
Facebook.
20
Consulter l’annexe D pour voir un exemple de compte rendu
Chapitre 5 : Gestion de projet
37
3. Répartion des tâches de rédaction du rapport
Le tableau suivant résume l’affectation des taches de rédaction du rapport entre les membres
d’équipe.
Yosra Asma Balkiss Takwa Taieb khaled
Partie 1 : Etude théorique
Introduction générale      
Chapitre 1   
Chapitre 2   
Chapitre 3: Dictionnaires
 
Coprus  
Chapitre 4  
Partie 2 : Etude Pratique
Chapitre 1  
Chapitre 2    
Chapitre 3   
Chapitre 4 : Evaluation  
Comparaison 
Chapitre 5      
Conclusion générale
Conclusion générale      
Tableau 9: Répartition des tâches
Chapitre 5 : Gestion de projet
38
4. Les apports de projet
Nous allons citer dans cette partie les différents apports associés au chef du projet et les autres
membres de l’équipe.
 Les apports de projet pour le chef d’équipe :
- Diriger une équipe
- Assurer le bon fonctionnement d'une équipe de travail pour mener à bien une
production dans le respect des objectifs fixés.
- Clarifier les objectifs
- Essayer de ne pas donner un avis critique publiquement
- Encourager et apprécier le rendement de chaque membre de l’équipe
 Les apports de projet pour les membres d’équipe :
- Echanger les informations
- Apprendre à écouter
- Créer des décisions plus pertinentes
- Respecter les délais et répondre à des problèmes plus rapidement
- Partager les bonnes pratiques
Le domaine du TAL est très vaste et intéressent. Cependant, en pratique nous avons confrontés
des problèmes dus principalement à nos connaissances limitées. Ce projet nous a permis
d’améliorer nos compétences et d’approfondir nos connaissances.
5. Les problèmes rencontrés et solutions proposées
Parmi les problèmes rencontrés au cours de la réalisation de ce projet, nous citons la difficulté de
construction des dictionnaires et la correction d’orthographe et de conjugaison mais nous avons
surmonté ce problème grâce à la coopération des membres d’équipe.
6. Conclusion
Au cours de ce projet, nous avons décrit la démarche suivie par l’équipe pour bien planifier le
projet et respecter les délais des livrables.
Conclusion générale
Conclusion générale
39
Nous avons eu l’opportunité au cours de ce projet, de participer à la conception et à la mise en
place d’un système informatique de traduction des SMS en langue française sous le langage C#
de Microsoft.
Durant ce projet, nous avons rencontré des difficultés dues à nos connaissances minimes dans le
domaine de langage SMS. Néanmoins, nous avons pu surmonter ces difficultés grâce à beaucoup
de documentation et de persévérance.
La plus grande difficulté à laquelle nous nous somme confrontées est l’inexpérience dans le
domaine du « Traitement Automatique des Langages », les technologies que nous avons utilisées
tel que le langage XML avec qui nous avons développé des dictionnaires sur lesquels repose tout
notre travail.
Il faut tout de même mentionner que cette expérience a été bénéfique pour notre formation. En
effet, nous avons eu l’occasion d’utiliser de nouvelles technologies tel que Microsoft Visual C#
ainsi que la mise en œuvre de différents outils acquis durant notre cursus universitaires à l’Ecole
Supérieure des Sciences et Techniques de Tunis.
En guise de perspective, nous pouvons évoquer l’augmentation de la taille du notre dictionnaire
pour qu'il puisse gérer le maximum de mots écris en langage SMS et ainsi essayer de couvrir
le plus de mots possible utilisé. On peut aussi prévoir un dictionnaire automatique qui s’alimente
au fur et à mesure disposant d’un outil d’apprentissage pour lui permettre d’évoluer à chaque
utilisation.
Nous espérons, durant ce projet, avoir réalisé un travail sérieux et convenable tout en ayant laissé
une bonne impression.
40
Références
[1] http://www.linguistik-online.de/48_11/cougnonFrancois.pdf (Consulté le 19/03/2013)
[2] http://sebastien.fessard.free.fr/documents/RapportDeStageSebastienFessard.pdf (Consulté le
19/03/2013)
[3] http://outils.diesenet.conseil-recherche-innovation.net/doc/Etude-Telephone-Mobile-
Insertion.pdf (Consulté le 19/03/2013)
[4] http://www.zdnet.fr/actualites/20-ans-du-sms-une-invention-qui-au-depart-n-etait-pas-
destinee-au-grand-public-39785028.htm (Consulté le 19/03/2013)
[5] http://fr.wikipedia.org/wiki/Orthographes_alternatives_du_fran%C3%A7ais
[6] https://forge.info.unicaen.fr/attachments/382/Rapport_final.pdf (Consulté le 18/03/2013)
[7] http://books.google.fr/books?id=bjNjfL-Z01kC&pg=PA61&lpg=PA61&dq=sms+et+
tal&source=bl&ots=9zHhJoNVZh&sig=7CzLLdslMP3a7gc8CoqUl4VeQg0&hl=fr&sa=
X&ei=mT9HUbymD8Xl4QTZlYCgDw&ved=0CD0Q6AEwADgK#v=onepage&q=sms%20et%
20tal&f=false (Consulté le 08/03/2013)
[8] http://post.queensu.ca/~lessardg/Cours/215/chap2.html (Consulté le 19/03/2013)
[9] http://www.linternaute.com/dictionnaire/fr/definition/abreviation/ (Consulté le 18/03/2013)
[10] http://www.projet-voltaire.fr/blog/actualite/l%E2%80%99ecriture-sms-est-elle-reellement-
un-danger-pour-l%E2%80%99orthographe (Consulté le 19/03/2013)
[11] http://www.texto.exionnaire.com/annuaire-sites-sms.php (Consulté le 19/03/2013)
[12] http://dumas.ccsd.cnrs.fr/docs/00/56/19/95/PDF/CHABERT_Gaelle_M2R.pdf (Consulté le
19/03/2013)
[13] http://www.sms4science.org/?q=fr/node/2 (Consulté le 19/03/2013)
[14] http://www.sms4science.org/userfiles/le%20langage%20SMS%20r%C3%A9v%C3%
A9lateur%20d%271comp%C3%A9tence.pdf (Consulté le 19/03/2013)
[15] http://www.traducteur-sms.com/ (Consulté le 19/03/2013)
[16] http://www.aidoweb.com/outils/traducteur-sms/ (Consulté le 19/03/2013)
[17] http://www.1fo.co/traducteur-sms-francais.php (Consulté le 19/03/2013)
[18] http://glossaire.infowebmaster.fr/xml/ (Consulté le 25/04/2013)
Annexes
Annexes
42
Annexe A
Les dictionnaires SMS
1. Les dictionnaires SMS
Il existe plusieurs sites qui proposent des dictionnaires SMS.
1.1. Le dictionnaire de site «www.maison-facile.com »
Le site «www.maison-facile.com » propose un dictionnaire d’abréviations françaises qui permet
de décoder le langage SMS. (Figure 1)
Figure 1 : Dictionnaire de site «www.maison-facile.com »
Annexes
43
1.2.Le dictionnaire de site « www.1fo.co »
Le site « www.1fo.co » met à la disposition des internautes un petit dictionnaire du langage
SMS. Ce dictionnaire est sous la forme d’un petit tableau trié dans l'ordre alphabétique avec les
expressions et termes sms les plus courants. (Figure 2)
Figure 2 : Le dictionnaire de site « www.1fo.co »
2. Le dictionnaire des émotions
Le langage SMS permet aussi de passer des émotions via un message. Il existe alors des
dictionnaires des smileys qui permettent de décoder ces petits symboles. La figure suivante
présente un exemple de dictionnaire des smileys (appelés aussi binettes). (Figure 3)
Figure 3 : Le dictionnaire de smileys
Annexes
44
Annexe B
Les traducteurs SMS
1. Le traducteur « TraducteurSMS.com »
L’outil est simple à utiliser, il suffit d’entrer le message que nous voulons traduire et appuyer sur
le bouton « traduire » pour avoir la traduction du texte entré. Pour vérifier la fiabilité de cet outil,
nous avons entré quelques phrases pour les traduire. (Tableau 1).
Tableau 1 : Test de l'outil TraducteurSMS.com
Annexes
45
2. Le traducteur « Traducteur-sms.com »
L’utilisation de cet outil est simple, il suffit d’entrer le texte à traduire puis appuyer sur le bouton
« Traduire ». Pour vérifier l’efficacité de cet traducteur, nous avons entré quelques exemples en
langages SMS pour les traduire. (Tableau 2)
Langage SMS Traduction
SLT, jtapL 2m1 si T dispo on sboi 1 cafE !
On svoi 2m1 ou 12C4 et on sfé un 6né
C cho auj , on par a la mer
Raf auj, rdv ds 5 min ss la tour
Tableau 2 : Test de l'outil Traducteur-SMS.com
3. Le traducteur du site « Aidoweb »
Grâce à des phrases en langage SMS, nous effectuerons quelques essaie pour vérifier la fiabilité
de ce traducteur. (Tableau 3)
SLT, jtapL 2m1 si T dispo on sboi
1 cafE !
On svoi 2m1 ou 12C4 et on sfé un
6né
C choauj , on par a la mer
Raf auj, rdv ds 5 min ss la tour
Tableau 3: Teste de l’outil AidoWeb
4. Le traducteur du site « 1fo »
L’outil que nous propose « 1fo.co » est assez intéressant. Il nous permet non seulement de
traduire du langage SMS en français classique, mais l’inverse aussi, (Français  SMS).
Maintenant, grâce aux phrases tests, que nous avons utilisé tout au long de ce chapitre, nous
effectuerons quelques essaie pour vérifier la fiabilité de ce traducteur. (Tableau 4)
Annexes
46
Langage SMS Traduction
SLT, jtapL 2m1 si T dispo on sboi 1 cafE ! salut, jtapldemainsi t'esdispo on sboiun cafe
!
On svoi 2m1 ou 12C4 et on sfé un 6né on svoidemain ou 12c4 et on sfé un ciné
C choauj, on par a la mer c'est chaud aujourd'hui, on par a la mer
Raf auj, rdv ds 5 min ss la tour rien à faire aujourd'hui, rendez-vous dans 5
min ss la tour
Tableau 4 : Teste de l’outil 1fo
5. Le Traducteur du site « WebJunior »
Le site www.webjunior.com met à notre disposition un traducteur SMS capable de traduire les
abréviations, l'épelure21
et les rébus typographique que l’on lui donne [3]. L’interface du logiciel
est sous la forme d’un téléphone portable avec un champ texte et un bouton traduire. (Figure 4)
Figure 4 : Traducteur SMS WebJunior
Grâce à des phrase écrit en langage SMS, nous effectuerons quelques essaie pour vérifier la
fiabilité de ce traducteur. (Tableau 5)
21
L'épelure, résultat de l'épellation des lettres d'un mot. Valeur épellative des lettres, des chiffres et des
caractères : G pour « j'ai », C pour « c'est », NRJ pour « énergie », a12c4 pour « À un de ces quatre » 2m1,
« demain », bi1, « bien », koi 2 9, « quoi de neuf »
Annexes
47
Langage SMS Traduction
SLT, jtapL 2m1 si T dispo on sboi 1 cafE !
On svoi 2m1 ou 12C4 et on sfé un 6né
C choauj , on par a la mer
Raf auj, rdv ds 5 min ss la tour
Tableau 5 : Teste de l’outil WebJunior
Avantages et inconvénients
Le tableau suivant présente les avantages et les inconvénients associé à ce traducteur.
Avantage Inconvénients
Malgré ça simplicité, il reste un outil assez
intéressant, capable de résoudre quelque
rébus typographique.
Il reste quand même très loin d’être performant,
son dictionnaire n’est pas assez riche en mot
Par exemple : 6né  Cinéma
raf  Rien à faire
Tableau 6 : Avantages et Inconvénients de l’outil WebJunior
6. Le traducteur du site « www.Traducteur-sms.com »
Le site www.Traducteur-SMS.com met à la disposition de ses utilisateurs un outil de traduction
SMS, ce traducteur contient plus que 9900 mots en mémoire et des nombreuses règles logiques.
[15] (Figure 5)
Annexes
48
Figure 5: Le Traducteur-SMS.com
 Avantages et inconvénients
Le tableau suivant présente les avantages et les inconvénients associé à ce traducteur.
Avantages Inconvénients
+ Bonne ergonomie
+ Outil très puissant
+ Possibilité d’ajouter des mots dans le
dictionnaire
+ Application des règles grammaticales
- Quelques mots ne sont pas traduits correctement
on part -> on par
disponible -> dispo
Tableau 7 : Avantage et Inconvénients de l'outil Traducteur-SMS.com
Annexes
49
Annexe C
Comparaison avec les traducteurs SMS existant
1. Le résultat de traducteur « www.Traducteur-sms.com »
Ce traducteur a presque su traduire tous les mots SMS. Il n’a pas reconnu le mot ‘enfon’.
Autrement dit, il a bien géré l’étirement (terrrrrrrrr -> terre), l’abréviation (pom -> pomme et bn-
>bon) et la phonétique (manj -> mange). Cependant, il n’a pas respecté les règles de
conjugaison et d’orthographe et il n’a pas traité l’émotion. (Figure 6)
Figure 6: Interface de comparaison de traducteur www.Traducteur-sms.com
Annexes
50
2. Le résultat de traducteur « www.aidoweb.com »
Ce traducteur a réussi la traduction de certains mots SMS ( lé -> les, mang -> mange, dé -> des,
pom -> pomme et bn->bon) tandis qu’il n’a pas reconnu le mot terrrrr et enfon ni l’émotions.
(Figure 7)
Figure 7: Interface de comparaison de traducteur www.aidoweb.com
Annexes
51
Annexe D
Exemple de compte rendu
Discussion de projet TAL
[Date de la réunion : 04-03-2013] [Heure de la réunion : 12:30] [Lieu de la réunion : ESSTT]
REUNION ORGANISEE PAR
Yosra HASNAOUI
TYPE DE REUNION
Réunion d’information et de prise de décision
PARTICIPANTS
Taieb SADDEM , Khaled FAYALA, Balkiss HAMAD, Asma MDAINI,
Takwa LAAMIRI
DISCUSSION Etude de l’art (les thèmes)
* Le langage SMS * Traduction du langage SMS
- Définition du terme SMS - Les étapes de traduction des SMS
- Définition de langage SMS et son intérêt - Les dictionnaires existants (les + et les -)
- Pourquoi la traduction des SMS ? - Les corpus existants (avantages et limites)
- Les domaines d’utilisations de ce langage * Applications de traduction SMS
- Avantages et inconvénients de ce langage - Les applications existants
- Les utilisateurs de ce langage - Avantages et inconvénients des
applications
Développement de l’application
- Le langage de programmation : C#
- Interface de l’application : Sous la forme d’un téléphone pour le moment (voir ce lien
http://www.traducteur-sms.com/)
- Un dictionnaire sous forme d’une base de données ou sous la forme d’un fichier XML.
- Utilisation de l’analyseur lexical : gplex
Annexes
52
Rédaction du Rapport
- Conforme au modèle déposé par notre enseignante sur la plateforme.
- Chacun rédige sa partie avec les mises en formes appropriés et dépose une copie sur le groupe
pour la valider.
- Il faut mettre la bibliographie.
- La copie finale va être fusionnée et validée par le chef d’équipe
CONCLUSIONS
- Commencer la recherche bibliographie
- Choisir le dictionnaire nécessaire pour commencer le développement de l’application
- Ajouter d’autres thèmes si c’est possible pour enrichir l’étude de l’art.
Chacun des membres de l’équipe dois laisser une trace sur la validation des copies des autres membres.
C’est-à-dire le membre qui vérifie la copie doit laisser son nom (de même pour les autres membres). Une
copie qui ne contient pas tous les noms des membres de l’équipe ne sera pas validée. Lors de dépôt d’une
nouvelle copie il faut marquer tous les noms des membres pour les notifier qu’il existe une copie à
vérifier.
MESURES A PRENDRE
PERSONNE
RESPONSABLE
DELAI A
RESPECTER
Certains membres proposent de diviser les thèmes de recherches.
La répartition des thèmes est affectée par un tirage au sort.
Les autres membres préfèrent une recherche exhaustive.
On réparti alors les thèmes et les membres qui veulent une
recherches exhaustive communique les modifications ajoutées au
chef d’équipe.
La décision finale sera faite par le chef d’équipe (ou peut-être on
fait recours à des votes si on a plus de temps).
Tous les membres
vont participer pour
faire la recherche
bibliographie
La validation
des parties
séparées doit
être faite avant
20 Mars 2013.
La copie finale
doit être prête
avant 21 Mars
2013.
Annexes
53

More Related Content

What's hot

Indice del libro "Fare blogging - Il mio metodo per scrivere contenuti vincen...
Indice del libro "Fare blogging - Il mio metodo per scrivere contenuti vincen...Indice del libro "Fare blogging - Il mio metodo per scrivere contenuti vincen...
Indice del libro "Fare blogging - Il mio metodo per scrivere contenuti vincen...Enrico Flaccovio
 
Ap French Description
Ap French DescriptionAp French Description
Ap French Descriptionjjneill
 
Dc3 base de données
Dc3 base de donnéesDc3 base de données
Dc3 base de donnéeslycee
 
Business Summer Session 2014
Business Summer Session 2014Business Summer Session 2014
Business Summer Session 2014Liisa Dumas
 
Rapport de stage - gestion commerciale @REC MEDIA
Rapport de stage - gestion commerciale @REC MEDIARapport de stage - gestion commerciale @REC MEDIA
Rapport de stage - gestion commerciale @REC MEDIAREDOUANIAbdessamad
 
mise en place d'un système de classes virtuelles utilisant le webRTC + openfi...
mise en place d'un système de classes virtuelles utilisant le webRTC + openfi...mise en place d'un système de classes virtuelles utilisant le webRTC + openfi...
mise en place d'un système de classes virtuelles utilisant le webRTC + openfi...Bassirou Dime
 
La génération 2.0 chinoise
La génération 2.0 chinoiseLa génération 2.0 chinoise
La génération 2.0 chinoisesvenska33
 
Terminaux et Réseaux - Répartir l'intelligence
Terminaux et Réseaux - Répartir l'intelligenceTerminaux et Réseaux - Répartir l'intelligence
Terminaux et Réseaux - Répartir l'intelligencePhilippe DEWOST
 
Dossier permettant de vérifier la conformité des erp d'accessibilité et de...
Dossier permettant de vérifier la conformité des erp d'accessibilité et de...Dossier permettant de vérifier la conformité des erp d'accessibilité et de...
Dossier permettant de vérifier la conformité des erp d'accessibilité et de...Marchitecture
 
Observatoire 2011 du marché des noms de domaine en France
Observatoire 2011 du marché des noms de domaine en FranceObservatoire 2011 du marché des noms de domaine en France
Observatoire 2011 du marché des noms de domaine en FranceAfnic
 
Fusex: 2009-2010 SAT'LAUNCH (CLES-FACIL, INSA de LYON)
Fusex: 2009-2010 SAT'LAUNCH (CLES-FACIL, INSA de LYON)Fusex: 2009-2010 SAT'LAUNCH (CLES-FACIL, INSA de LYON)
Fusex: 2009-2010 SAT'LAUNCH (CLES-FACIL, INSA de LYON)CLES-FACIL
 
Amadou Bory Diallo (document sur la téléphonie sur IP)
Amadou Bory Diallo (document sur la téléphonie sur IP)Amadou Bory Diallo (document sur la téléphonie sur IP)
Amadou Bory Diallo (document sur la téléphonie sur IP)Bory DIALLO
 
Rapport sur la condition de vie et de santé des étudiants
Rapport sur la condition de vie et de santé des étudiantsRapport sur la condition de vie et de santé des étudiants
Rapport sur la condition de vie et de santé des étudiantsrennesmetropole
 

What's hot (17)

Indice del libro "Fare blogging - Il mio metodo per scrivere contenuti vincen...
Indice del libro "Fare blogging - Il mio metodo per scrivere contenuti vincen...Indice del libro "Fare blogging - Il mio metodo per scrivere contenuti vincen...
Indice del libro "Fare blogging - Il mio metodo per scrivere contenuti vincen...
 
Bla
BlaBla
Bla
 
Ap French Description
Ap French DescriptionAp French Description
Ap French Description
 
Dc3 base de données
Dc3 base de donnéesDc3 base de données
Dc3 base de données
 
Business Summer Session 2014
Business Summer Session 2014Business Summer Session 2014
Business Summer Session 2014
 
Rapport de stage - gestion commerciale @REC MEDIA
Rapport de stage - gestion commerciale @REC MEDIARapport de stage - gestion commerciale @REC MEDIA
Rapport de stage - gestion commerciale @REC MEDIA
 
champ
champchamp
champ
 
mise en place d'un système de classes virtuelles utilisant le webRTC + openfi...
mise en place d'un système de classes virtuelles utilisant le webRTC + openfi...mise en place d'un système de classes virtuelles utilisant le webRTC + openfi...
mise en place d'un système de classes virtuelles utilisant le webRTC + openfi...
 
La génération 2.0 chinoise
La génération 2.0 chinoiseLa génération 2.0 chinoise
La génération 2.0 chinoise
 
Terminaux et Réseaux - Répartir l'intelligence
Terminaux et Réseaux - Répartir l'intelligenceTerminaux et Réseaux - Répartir l'intelligence
Terminaux et Réseaux - Répartir l'intelligence
 
Dossier permettant de vérifier la conformité des erp d'accessibilité et de...
Dossier permettant de vérifier la conformité des erp d'accessibilité et de...Dossier permettant de vérifier la conformité des erp d'accessibilité et de...
Dossier permettant de vérifier la conformité des erp d'accessibilité et de...
 
Ebook2
Ebook2Ebook2
Ebook2
 
Observatoire 2011 du marché des noms de domaine en France
Observatoire 2011 du marché des noms de domaine en FranceObservatoire 2011 du marché des noms de domaine en France
Observatoire 2011 du marché des noms de domaine en France
 
31
3131
31
 
Fusex: 2009-2010 SAT'LAUNCH (CLES-FACIL, INSA de LYON)
Fusex: 2009-2010 SAT'LAUNCH (CLES-FACIL, INSA de LYON)Fusex: 2009-2010 SAT'LAUNCH (CLES-FACIL, INSA de LYON)
Fusex: 2009-2010 SAT'LAUNCH (CLES-FACIL, INSA de LYON)
 
Amadou Bory Diallo (document sur la téléphonie sur IP)
Amadou Bory Diallo (document sur la téléphonie sur IP)Amadou Bory Diallo (document sur la téléphonie sur IP)
Amadou Bory Diallo (document sur la téléphonie sur IP)
 
Rapport sur la condition de vie et de santé des étudiants
Rapport sur la condition de vie et de santé des étudiantsRapport sur la condition de vie et de santé des étudiants
Rapport sur la condition de vie et de santé des étudiants
 

Viewers also liked

Clasificación de la traducción iniciación - 12131
Clasificación de la traducción   iniciación - 12131Clasificación de la traducción   iniciación - 12131
Clasificación de la traducción iniciación - 12131iniciaciontraduccion12131
 
Traducción e interpretación
Traducción e interpretaciónTraducción e interpretación
Traducción e interpretaciónGherardy
 
Los enfoques de la traducción
Los enfoques de la traducciónLos enfoques de la traducción
Los enfoques de la traducciónnobedi12
 
HISTORIA DE LA TRADUCCION E INTERPRETACION
HISTORIA DE LA TRADUCCION E INTERPRETACIONHISTORIA DE LA TRADUCCION E INTERPRETACION
HISTORIA DE LA TRADUCCION E INTERPRETACIONkajoe
 
Preguntas De ExáMen Tema3
Preguntas De ExáMen Tema3Preguntas De ExáMen Tema3
Preguntas De ExáMen Tema3Juan Buendia
 

Viewers also liked (6)

Clasificación de la traducción iniciación - 12131
Clasificación de la traducción   iniciación - 12131Clasificación de la traducción   iniciación - 12131
Clasificación de la traducción iniciación - 12131
 
Historia de la_traduccion
Historia de la_traduccionHistoria de la_traduccion
Historia de la_traduccion
 
Traducción e interpretación
Traducción e interpretaciónTraducción e interpretación
Traducción e interpretación
 
Los enfoques de la traducción
Los enfoques de la traducciónLos enfoques de la traducción
Los enfoques de la traducción
 
HISTORIA DE LA TRADUCCION E INTERPRETACION
HISTORIA DE LA TRADUCCION E INTERPRETACIONHISTORIA DE LA TRADUCCION E INTERPRETACION
HISTORIA DE LA TRADUCCION E INTERPRETACION
 
Preguntas De ExáMen Tema3
Preguntas De ExáMen Tema3Preguntas De ExáMen Tema3
Preguntas De ExáMen Tema3
 

Similar to Traduction des sms

D g zach.1231
D g zach.1231D g zach.1231
D g zach.1231dongnghi
 
Thèse shellcode polymorphiques
Thèse shellcode polymorphiquesThèse shellcode polymorphiques
Thèse shellcode polymorphiquesNabil Babaci
 
Rapport de diagnostic
Rapport de diagnosticRapport de diagnostic
Rapport de diagnosticsabouni21
 
Support ssm vsm_vers_finale
Support ssm vsm_vers_finaleSupport ssm vsm_vers_finale
Support ssm vsm_vers_finaleLaid Kahloul
 
Les serious games - Mémoire de master en Sc. Educ de Bernard Lamailloux
Les serious games - Mémoire de master en Sc. Educ de Bernard LamaillouxLes serious games - Mémoire de master en Sc. Educ de Bernard Lamailloux
Les serious games - Mémoire de master en Sc. Educ de Bernard LamaillouxBernard Lamailloux
 
l'utilisation des matériaux dans la radioprotection
l'utilisation des matériaux dans la radioprotectionl'utilisation des matériaux dans la radioprotection
l'utilisation des matériaux dans la radioprotectionIsmailMorsli1
 
016 v 3 supervisors report
016 v 3 supervisors report016 v 3 supervisors report
016 v 3 supervisors reporteuteipir
 
Polycopie excel.pdf
Polycopie excel.pdfPolycopie excel.pdf
Polycopie excel.pdfSafiatouSore
 
Rapport Stage Alstom Otmane Douieb
Rapport Stage Alstom Otmane DouiebRapport Stage Alstom Otmane Douieb
Rapport Stage Alstom Otmane DouiebOtmaneDouieb
 
Rapport de stage développement informatique
Rapport de stage développement informatique Rapport de stage développement informatique
Rapport de stage développement informatique MehdiOuqas
 
Mise en place d'une solution de détection des pirates et des malwares dans le...
Mise en place d'une solution de détection des pirates et des malwares dans le...Mise en place d'une solution de détection des pirates et des malwares dans le...
Mise en place d'une solution de détection des pirates et des malwares dans le...Mohamed Ben Bouzid
 
Appel à communication festival de géopolitique 2015 de Grenoble Ecole de Mana...
Appel à communication festival de géopolitique 2015 de Grenoble Ecole de Mana...Appel à communication festival de géopolitique 2015 de Grenoble Ecole de Mana...
Appel à communication festival de géopolitique 2015 de Grenoble Ecole de Mana...Jean-François Fiorina
 
Les bases fondamentales du langage transact sql
Les bases fondamentales du langage transact sqlLes bases fondamentales du langage transact sql
Les bases fondamentales du langage transact sqlZineb Meryem
 
Simulation par CFD du sillage d’une petite éolienne
Simulation par CFD du sillage d’une petite éolienneSimulation par CFD du sillage d’une petite éolienne
Simulation par CFD du sillage d’une petite éolienneInes Issaoui
 
Maaouia Hamza Rapport de stage
Maaouia Hamza Rapport de stageMaaouia Hamza Rapport de stage
Maaouia Hamza Rapport de stageMaaouia Hamza
 
Projet Fin d'année version finale
Projet Fin d'année version finaleProjet Fin d'année version finale
Projet Fin d'année version finaleHoussem AZZOUZ
 
CCNA Voice 640-461 FR.pdf
CCNA Voice 640-461 FR.pdfCCNA Voice 640-461 FR.pdf
CCNA Voice 640-461 FR.pdfDjamelR
 
Application du modèle de prévision météorologique WRF au Vietnam
Application du modèle de prévision météorologique WRF au VietnamApplication du modèle de prévision météorologique WRF au Vietnam
Application du modèle de prévision météorologique WRF au VietnamViet-Trung TRAN
 

Similar to Traduction des sms (20)

D g zach.1231
D g zach.1231D g zach.1231
D g zach.1231
 
Thèse shellcode polymorphiques
Thèse shellcode polymorphiquesThèse shellcode polymorphiques
Thèse shellcode polymorphiques
 
Rapport de diagnostic
Rapport de diagnosticRapport de diagnostic
Rapport de diagnostic
 
Support de cours
Support de coursSupport de cours
Support de cours
 
Support ssm vsm_vers_finale
Support ssm vsm_vers_finaleSupport ssm vsm_vers_finale
Support ssm vsm_vers_finale
 
Les serious games - Mémoire de master en Sc. Educ de Bernard Lamailloux
Les serious games - Mémoire de master en Sc. Educ de Bernard LamaillouxLes serious games - Mémoire de master en Sc. Educ de Bernard Lamailloux
Les serious games - Mémoire de master en Sc. Educ de Bernard Lamailloux
 
l'utilisation des matériaux dans la radioprotection
l'utilisation des matériaux dans la radioprotectionl'utilisation des matériaux dans la radioprotection
l'utilisation des matériaux dans la radioprotection
 
016 v 3 supervisors report
016 v 3 supervisors report016 v 3 supervisors report
016 v 3 supervisors report
 
Polycopie excel.pdf
Polycopie excel.pdfPolycopie excel.pdf
Polycopie excel.pdf
 
Rapport Stage Alstom Otmane Douieb
Rapport Stage Alstom Otmane DouiebRapport Stage Alstom Otmane Douieb
Rapport Stage Alstom Otmane Douieb
 
Rapport de stage développement informatique
Rapport de stage développement informatique Rapport de stage développement informatique
Rapport de stage développement informatique
 
Mise en place d'une solution de détection des pirates et des malwares dans le...
Mise en place d'une solution de détection des pirates et des malwares dans le...Mise en place d'une solution de détection des pirates et des malwares dans le...
Mise en place d'une solution de détection des pirates et des malwares dans le...
 
Appel à communication festival de géopolitique 2015 de Grenoble Ecole de Mana...
Appel à communication festival de géopolitique 2015 de Grenoble Ecole de Mana...Appel à communication festival de géopolitique 2015 de Grenoble Ecole de Mana...
Appel à communication festival de géopolitique 2015 de Grenoble Ecole de Mana...
 
TER
TERTER
TER
 
Les bases fondamentales du langage transact sql
Les bases fondamentales du langage transact sqlLes bases fondamentales du langage transact sql
Les bases fondamentales du langage transact sql
 
Simulation par CFD du sillage d’une petite éolienne
Simulation par CFD du sillage d’une petite éolienneSimulation par CFD du sillage d’une petite éolienne
Simulation par CFD du sillage d’une petite éolienne
 
Maaouia Hamza Rapport de stage
Maaouia Hamza Rapport de stageMaaouia Hamza Rapport de stage
Maaouia Hamza Rapport de stage
 
Projet Fin d'année version finale
Projet Fin d'année version finaleProjet Fin d'année version finale
Projet Fin d'année version finale
 
CCNA Voice 640-461 FR.pdf
CCNA Voice 640-461 FR.pdfCCNA Voice 640-461 FR.pdf
CCNA Voice 640-461 FR.pdf
 
Application du modèle de prévision météorologique WRF au Vietnam
Application du modèle de prévision météorologique WRF au VietnamApplication du modèle de prévision météorologique WRF au Vietnam
Application du modèle de prévision météorologique WRF au Vietnam
 

More from Khaled Fayala

Les critères d’une utilisabilité efficace d’API et comment améliorer cette ut...
Les critères d’une utilisabilité efficace d’API et comment améliorer cette ut...Les critères d’une utilisabilité efficace d’API et comment améliorer cette ut...
Les critères d’une utilisabilité efficace d’API et comment améliorer cette ut...Khaled Fayala
 
Étude comparative de la consommation d'énergie des applications mobiles ( Ca...
Étude comparative de la consommation d'énergie des applications mobiles  ( Ca...Étude comparative de la consommation d'énergie des applications mobiles  ( Ca...
Étude comparative de la consommation d'énergie des applications mobiles ( Ca...Khaled Fayala
 
Big data et le marketing
Big data et le marketingBig data et le marketing
Big data et le marketingKhaled Fayala
 
Développement d’une application mobile bancaire pour QNB Tunisie
Développement d’une application mobile bancaire pour QNB TunisieDéveloppement d’une application mobile bancaire pour QNB Tunisie
Développement d’une application mobile bancaire pour QNB TunisieKhaled Fayala
 
Conception et réalisation d’une application Mobile banking
Conception et réalisation d’une application  Mobile banking  Conception et réalisation d’une application  Mobile banking
Conception et réalisation d’une application Mobile banking Khaled Fayala
 
Le commerce electronique au Canada
Le commerce electronique au CanadaLe commerce electronique au Canada
Le commerce electronique au CanadaKhaled Fayala
 
Détection des droites par la transformée de Hough
Détection des droites par la transformée de HoughDétection des droites par la transformée de Hough
Détection des droites par la transformée de HoughKhaled Fayala
 
Maquettes pour une application mobile
Maquettes pour une application mobile Maquettes pour une application mobile
Maquettes pour une application mobile Khaled Fayala
 
Plateforme d'enseignement à distance : efront
Plateforme d'enseignement à distance : efrontPlateforme d'enseignement à distance : efront
Plateforme d'enseignement à distance : efrontKhaled Fayala
 
Application mobile bancaire sous la plateforme Android
Application mobile bancaire sous la plateforme AndroidApplication mobile bancaire sous la plateforme Android
Application mobile bancaire sous la plateforme AndroidKhaled Fayala
 
BPMN : Business Process Modelling Notation
BPMN : Business Process Modelling NotationBPMN : Business Process Modelling Notation
BPMN : Business Process Modelling NotationKhaled Fayala
 
SCORM : Sharable Content Object Reference Model
SCORM: Sharable Content Object Reference ModelSCORM: Sharable Content Object Reference Model
SCORM : Sharable Content Object Reference ModelKhaled Fayala
 
Les bibliothèques de calcul scientifiques
Les bibliothèques de calcul scientifiquesLes bibliothèques de calcul scientifiques
Les bibliothèques de calcul scientifiquesKhaled Fayala
 
LE MANAGEMENT STRATEGIQUE
LE MANAGEMENT STRATEGIQUELE MANAGEMENT STRATEGIQUE
LE MANAGEMENT STRATEGIQUEKhaled Fayala
 
E-Front : Plateforme d’enseignement à distance
E-Front : Plateforme d’enseignement à distanceE-Front : Plateforme d’enseignement à distance
E-Front : Plateforme d’enseignement à distanceKhaled Fayala
 

More from Khaled Fayala (17)

Les critères d’une utilisabilité efficace d’API et comment améliorer cette ut...
Les critères d’une utilisabilité efficace d’API et comment améliorer cette ut...Les critères d’une utilisabilité efficace d’API et comment améliorer cette ut...
Les critères d’une utilisabilité efficace d’API et comment améliorer cette ut...
 
Étude comparative de la consommation d'énergie des applications mobiles ( Ca...
Étude comparative de la consommation d'énergie des applications mobiles  ( Ca...Étude comparative de la consommation d'énergie des applications mobiles  ( Ca...
Étude comparative de la consommation d'énergie des applications mobiles ( Ca...
 
Big data et le marketing
Big data et le marketingBig data et le marketing
Big data et le marketing
 
Développement d’une application mobile bancaire pour QNB Tunisie
Développement d’une application mobile bancaire pour QNB TunisieDéveloppement d’une application mobile bancaire pour QNB Tunisie
Développement d’une application mobile bancaire pour QNB Tunisie
 
Conception et réalisation d’une application Mobile banking
Conception et réalisation d’une application  Mobile banking  Conception et réalisation d’une application  Mobile banking
Conception et réalisation d’une application Mobile banking
 
Le commerce electronique au Canada
Le commerce electronique au CanadaLe commerce electronique au Canada
Le commerce electronique au Canada
 
Détection des droites par la transformée de Hough
Détection des droites par la transformée de HoughDétection des droites par la transformée de Hough
Détection des droites par la transformée de Hough
 
Maquettes pour une application mobile
Maquettes pour une application mobile Maquettes pour une application mobile
Maquettes pour une application mobile
 
Plateforme d'enseignement à distance : efront
Plateforme d'enseignement à distance : efrontPlateforme d'enseignement à distance : efront
Plateforme d'enseignement à distance : efront
 
Application mobile bancaire sous la plateforme Android
Application mobile bancaire sous la plateforme AndroidApplication mobile bancaire sous la plateforme Android
Application mobile bancaire sous la plateforme Android
 
BPMN : Business Process Modelling Notation
BPMN : Business Process Modelling NotationBPMN : Business Process Modelling Notation
BPMN : Business Process Modelling Notation
 
SCORM : Sharable Content Object Reference Model
SCORM: Sharable Content Object Reference ModelSCORM: Sharable Content Object Reference Model
SCORM : Sharable Content Object Reference Model
 
Les bibliothèques de calcul scientifiques
Les bibliothèques de calcul scientifiquesLes bibliothèques de calcul scientifiques
Les bibliothèques de calcul scientifiques
 
LE MANAGEMENT STRATEGIQUE
LE MANAGEMENT STRATEGIQUELE MANAGEMENT STRATEGIQUE
LE MANAGEMENT STRATEGIQUE
 
E-Front : Plateforme d’enseignement à distance
E-Front : Plateforme d’enseignement à distanceE-Front : Plateforme d’enseignement à distance
E-Front : Plateforme d’enseignement à distance
 
E business
E businessE business
E business
 
Traduction des SMS
Traduction des SMSTraduction des SMS
Traduction des SMS
 

Traduction des sms

  • 1. Université de Tunis ECOLE SUPERIEURE DES SCIENCES ET TECHNIQUES DE TUNIS Projet du cours « TAL » 1ère année Mastère de recherche en Informatique Traduction DES SMS Réalisé par l’équipe N°2 composée de : Khaled Fayala Taieb Sadem Yosra Hasnaoui Asma Mdaini Balkiss Hamad Takwa Laamiri Année universitaire 2012 – 2013
  • 2. i Table des matières Table des Figures............................................................................................................................. iii Liste des Tableaux ........................................................................................................................... iv Introduction générale ..................................................................................................................1 ............................................................................................................1Partie 1 : Etude théorique chapitre1 : Etude Préalable ......................................................................................................2 1. Introduction...........................................................................................................................................2 2. Emergence des TIC...............................................................................................................................2 3. Définition de SMS ................................................................................................................................2 4. Historique .............................................................................................................................................2 5. Utilisation des SMS ..............................................................................................................................3 6. Les bénéfices de l’utilisation des SMS.................................................................................................3 7. Les limites de l’utilisation des SMS .....................................................................................................3 8. Conclusion............................................................................................................................................4 Chapitre 2 : Le langage SMS.......................................................................................................5 1. Introduction...........................................................................................................................................5 2. Définition du langage SMS...................................................................................................................5 3. Les procédés utilisés dans le langage SMS...........................................................................................5 3.1. La phonétique ...............................................................................................................................5 3.2. Le rébus typographique ................................................................................................................6 3.3. L’abréviation.................................................................................................................................6 3.4. Les émotions.................................................................................................................................7 4. Le langage SMS entre approbation et rejet...........................................................................................7 4.1. Les risques de langage SMS .........................................................................................................8 4.2. Les intérêts de langage SMS.........................................................................................................8 5. Conclusion............................................................................................................................................8 Chapitre 3 : Les dictionnaires et les corpus SMS..........................................................9 1. Introduction...........................................................................................................................................9 2. Les Dictionnaires des SMS...................................................................................................................9 2.1. Le dictionnaire-sms.......................................................................................................................9 2.2. Le dictionnaire deblok ................................................................................................................10
  • 3. ii 2.3. Le dictionnaire mobilou..............................................................................................................10 2.4. Le dictionnaire langageSMS.......................................................................................................11 3. Corpus SMS........................................................................................................................................11 3.1. Corpus SMS de Caroline Tagg ...................................................................................................12 3.2. Corpus du DELI..........................................................................................................................12 3.3. Projet « SMS4science »..............................................................................................................12 4. Conclusion..........................................................................................................................................12 Chapitre 4 : Les traducteurs SMS existants ..................................................................13 1. Introduction.........................................................................................................................................13 2. Les différents traducteurs SMS...........................................................................................................13 2.1. Le traducteur du site « www.TraducteurSMS.com ».................................................................13 2.2. Le traducteur du site « www.aidoweb.com » .............................................................................14 2.3. Le traducteur du site « www.1fo.co ».........................................................................................15 3. Conclusion..........................................................................................................................................15 ............................................................................................................13Partie 2 : Etude Pratique Chapitre 1 : Analyse et spécification des besoins.......................................................14 1. Introduction.........................................................................................................................................16 2. L’objectif du projet.............................................................................................................................16 3. Analyse des besoins............................................................................................................................16 3.1. Définition des besoins fonctionnels.................................................................................................16 3.2. Définition des besoins non fonctionnels..........................................................................................16 4. Vue des cas d’utilisation.....................................................................................................................17 4.1. Identification des acteurs ............................................................................................................17 4.2. Identification des cas d’utilisations.............................................................................................17 5. Conclusion..........................................................................................................................................18 Chapitre 2 : Construction des dictionnaires .................................................................19 1. Introduction.........................................................................................................................................19 2. Environnement et outils de travail......................................................................................................19 2.1. Environnement logiciel...............................................................................................................19 2.2. Environnement matériel..............................................................................................................19 3. Construction des dictionnaires............................................................................................................20 3.1. Pourquoi XML ?.........................................................................................................................20 3.2. Les étapes d’élaboration des dictionnaires .................................................................................20 3.2.1. Le fichier « traduction.xml » ..............................................................................................21 3.2.2. Le fichier « dico-fr.xml » .....................................................................................................23
  • 4. iii 3.2.3. Le fichier « dico-fo.xml ».....................................................................................................24 4. Conclusion..........................................................................................................................................24 Chapitre 3 : Interfaces de l’application...........................................................................19 1. Introduction.........................................................................................................................................25 2. Les interfaces réalisées .......................................................................................................................25 2.1. Le découpage en tokens..............................................................................................................25 2.2. La traduction des mots SMS connus...........................................................................................26 2.2.1. L’identification des mots.....................................................................................................26 2.2.2. La traduction.......................................................................................................................27 2.3. La traduction des mots SMS inconnus........................................................................................28 3. Conclusion..........................................................................................................................................29 Chapitre 4 : Evaluation de l’application ..........................................................................20 1. Introduction.........................................................................................................................................30 2. Evaluation par rapport au « corpus-sms-test.txt » ..............................................................................30 3. Comparaison par rapport aux autres traducteurs ................................................................................33 3.1. Le résultat de notre traducteur SMS ...........................................................................................33 3.2. Le résultat du traducteur « www.1fo.co »...................................................................................34 3.3. Le résultat du traducteur « www.TraducteurSMS.com » ...........................................................34 4. Conclusion..........................................................................................................................................35 Chapitre 5 : Gestion du projet.................................................................................................30 1. Introduction.........................................................................................................................................36 2. Démarche utilisé pour organiser le projet...........................................................................................36 3. Répartion des tâches de rédaction du rapport .....................................................................................37 4. Les apports de projet...........................................................................................................................38 5. Les problèmes rencontrés et solutions proposées ...............................................................................38 6. Conclusion..........................................................................................................................................38 Conclusion générale....................................................................................................................39 Références .........................................................................................................................................40 Annexes.................................................................................................................................................41
  • 5. iv
  • 6. Table des Figures Figure 1 : Le dictionnaire-sms......................................................................................................................9 Figure 2 : Le dictionnaire deblok................................................................................................................10 Figure 3 : Le dictionnaire mobilou .............................................................................................................10 Figure 4 : Le dictionnaire langageSMS ......................................................................................................11 Figure 5 : Le traducteurSMS.com...............................................................................................................13 Figure 6 : Le traducteur SMS AidoWeb.....................................................................................................14 Figure 7 : Le traducteur SMS 1fo...............................................................................................................15 Figure 8 : Diagramme de cas d’utilisation générale ...................................................................................17 Figure 9 : Extrait du dictionnaire « traduction.xml »..................................................................................21 Figure 10 : Structure de la balise <Dictionnaire>.......................................................................................22 Figure 11 : Extrait du dictionnaire « dico-fr.xml ».....................................................................................23 Figure 12 : Extrait du dictionnaire « dico-fr.xml ».....................................................................................24 Figure 13 : Interface de découpage en tokens.............................................................................................25 Figure 14 : Interface de détection de locution ............................................................................................27 Figure 15 : Interface de traduction des mots SMS connus .........................................................................28 Figure 16 : Interface de traduction des mots SMS inconnus ......................................................................29 Figure 17 : Traduction de la phrase 1 de corpus-sms-test...........................................................................30 Figure 18 : Traduction de la phrase 47 de corpus-sms-test.........................................................................31 Figure 19 : Traduction d'une phrase avec mot inconnu ..............................................................................32 Figure 20 : Interface de traduction de notre Traducteur SMS ....................................................................33 Figure 21 : Interface de traduction du traducteur www.1fo.co...................................................................34 Figure 22 : Interface de traduction de traducteur www. TraducteurSMS.com...........................................34
  • 7. Liste des Tableaux Tableau 1 : Exemples de phonétisation ........................................................................................................5 Tableau 2 : Exemples du rébus typographique.............................................................................................6 Tableau 3 : Exemples d'abréviation..............................................................................................................6 Tableau 4 : Exemple des émotions ...............................................................................................................7 Tableau 5 : Avantage et inconvénients de l'outil TraducteurSMS.com......................................................14 Tableau 6 : Avantages et inconvénients de l’outil AidoWeb .....................................................................14 Tableau 7 : Avantages et inconvénients de l’outil 1fo................................................................................15 Tableau 8 : Un tableau comparatif de traducteurs SMS .............................................................................35 Tableau 9: Répartition des tâches ...............................................................................................................37
  • 9. Introduction générale 1 L'essor des technologies de l'information et de la communication (TIC) a marqué de façon décisive le vingtième siècle: par la radiodiffusion, la télévision, la téléphonie ou Internet. La communication entre les personnes a subi une véritable évolution [1]. Cette évolution, notamment dans le domaine de l’informatique, a donné naissance à des nouvelles formes de communication entre locuteurs tel que le SMS. Ce dernier est un moyen de contact rapide et moins coûteux. Cependant, le SMS adopte une écriture qui s’affranchisse de la norme orthographique. Il amène l’utilisateur à abréger les mots de sa langue française et à utiliser des émotions. Ces modifications du langage naturel permettent de ne pas dépasser le nombre de caractères prévu par le message SMS et pour accélérer la saisie de celui-ci. Ceci fait l'apparition d'un nouvel langage : langage SMS. Or, l’émergence de ce nouveau langage à donner lieu à deux opinions opposées : Certains favorise l'utilisation de ce langage à cause de sa simplicité et les bénéficies associe. D’autre le considère comme une source de danger parce que les usagers de ce langage ignorent les normes orthographiques et grammaticales. Dans ce cadre, le Traitement Automatique du Langage (TAL) s'intéresse à étudier ce phénomène en raison des diverses applications possibles: synthèse vocale, traduction automatique SMS, etc. [2] Dans le cadre de ce projet, il nous a été confié d'étudier le langage SMS et de développer un traducteur de langage SMS. Ce rapport présente donc le travail réalisé à cet effet. L’élaboration du projet a été fondée sur deux axes, axe théorique et axe pratique. La première partie est constituée de quatre chapitres alors que la deuxième partie est constituée de 5 chapitres.
  • 10. Partie 1 : Etude théorique
  • 11. chapitre1 : Etude Préalable
  • 12. Chapitre 1 : Etude préalable 2 1. Introduction Lorsque les premiers téléphones mobiles ont été lancés, ils étaient surtout destinés à passer des appels par les utilisateurs. Aujourd'hui, l'appel n'est plus le moyen de communication le plus utilisé, il a cédé sa place au SMS, qui est devenu le moyen de communication le plus privilégié pour les usagers. Dans ce chapitre, nous définissons en premier lieu le SMS, et nous présentons un petit aperçu sur leur historique. Ensuite, nous présentons l’utilisation des SMS en Tunisie. Finalement nous citons les bénéfices de l’utilisation des SMS, et leurs limites. 2. Emergence des TIC La technologie et les vagues d'innovations qui sont succédé durant les dernières décennies dans le domaine des technologies de l’information et de la communication, ont profondément modifié la nature de la communication entre les correspondants en contact. Les concepts de temps et de distance ont perdu leur significativité. Cette évolution a rendu la transmission des informations plus facile grâce aux diversités des moyens de communications utilisés tel que le SMS. 3. Définition de SMS Un SMS (Short Message Service) également appelé texto est une suite de caractères transmis d’un téléphone mobile ou un terminal informatique vers un ou plusieurs autres téléphones. La longueur d’un SMS est limitée, la ponctuation et les espaces sont comptés. Le SMS semble correspondre à des besoins de communication rapide. C’est un service accessible depuis tous les terminaux mobiles et qui connaît un très fort développement notamment chez les jeunes qui n’hésitent pas à y consacrer des sommes d’argent importante pour échanger les messages entre eux. [3] 4. Historique Le premier message court de l'Histoire ("Merry Christmas!") a en effet été envoyé le 3 décembre 1992 par un ingénieur anglais de la société Sema Group à un collègue de l'opérateur Vodafone. Neil Papworth est donc à l'origine de cette invention. Mais il ne s'agissait de mettre en place un service grand public. Au contraire ! Exploité par Vodafone, ce système était au départ réservé à un usage interne, notamment pour permettre aux dirigeants de communiquer avec leurs secrétaires. Bien qu'au début, cette innovation n’est pas destinée au grand public, les SMS ont fini par faire partie intégrante de la vie quotidienne des gens notamment les jeunes utilisateurs. [4]
  • 13. Chapitre 1 : Etude préalable 3 5. Utilisation des SMS Le SMS prend aujourd’hui un ascendant significatif en termes d’utilisation. En Tunisie, l’utilisation des SMS a connu une véritable explosion, même les candidats du baccalauréat peuvent obtenir leurs résultats via SMS. Les jeunes ont beaucoup profités de cette évolution pour envoyer énormément des SMS chaque jour, pour participer à des concours ou des jeux télévisés, avoir des informations sur le trafic des transports, etc. Heureusement pour eux tous les opérateurs ont intégré les SMS illimités dans la plupart de leurs offres téléphoniques. Par contre la majorité de personnes âgées préfère toujours la communication directe par téléphone parce qu’ils ont beaucoup de mal avec les nouveaux téléphones portables. Cela veut dire que le SMS à des avantages d’une coté et des inconvénients de l’autre côté. 6. Les bénéfices de l’utilisation des SMS Le SMS est un service très pratique, dans la partie suivante nous allons mettre l’accent sur les principaux points forts des SMS : [3]  Il permet une communication silencieuse, et rapide  La réception des SMS est gratuite, elle n’induit pas donc aucune charge financière pour le récepteur, et peuvent être consultés malgré un forfait épuisé.  Pour transmettre un message bref, le SMS est le moyen de communication le moins cher, si on le compare au prix d’une communication courte sur un mobile.  Il est possible, d’utiliser un terminal informatique connecté à l’internet pour envoyer des SMS de façon gratuit depuis des sites Web.  Il est mieux de transmettre un message à une personne sans vouloir la déranger (réunion, heure tardive…) ou bien lorsque son environnement immédiat ne permet pas une conversation téléphonique dans de bonnes conditions (bus, train, lieux bruyants). 7. Les limites de l’utilisation des SMS Nous allons maintenant se concentrer sur les faiblesses, et les limites des SMS. Parmi les problèmes principaux des SMS : [3]
  • 14. Chapitre 1 : Etude préalable 4  L’écriture d’un texte sur un téléphone mobile n’est pas très simple pour les personnes utilisant peu ce mode de communication. Un peu d’entraînement semble nécessaire, surtout chez les plus âgés et malgré les efforts des constructeurs pour proposer des interfaces conviviales et intuitives par rapport au format réduit du terminal.  A l’inverse d’un courrier papier ou d’un message courriel, la longueur du message SMS est limitée. 8. Conclusion La limitation du nombre de caractères, le coût, et les difficultés de saisie ont conduit les jeunes à simplifier les règles orthographiques et chercher à réduire la longueur de ses messages. Ils ont donc réinventé un langage propre à eux : le langage SMS.
  • 15. Chapitre 2 : Le langage SMS
  • 16. Chapitre 2 : Le langage SMS 5 1. Introduction Le SMS a connu un grand succès aux prés de ses usagers. Cependant, ils présentent des lacunes en termes de limitation de nombres de caractères. Pour combler ces lacunes, un nouveau langage, langage SMS, a été réinventé. Dans ce chapitre, nous allons présenter le langage SMS avec toutes ses spécificités. Par la suite, nous citons les apports et les limites de ce langage. 2. Définition du langage SMS Le langage SMS est un moyen de communication qui modifie les caractéristiques orthographiques voire grammaticales de la langue française. Il permet de réduire la longueur des messages écrits afin de diminuer la durée requise pour composer un texto. Ce langage vise aussi à respecter le seuil maximum des caractères imposé par le système de la téléphonie mobile. [5] 3. Les procédés utilisés dans le langage SMS Le langage SMS fait recours à certains procédés pour réduire le nombre de caractères dans un message : la phonétique, le rébus typographique, l’abréviation et les émotions [6] [7]. 3.1.La phonétique La phonétique est l’étude scientifique des sons du langage humain [8]. Cette technique consiste à écrire les mots comme ils se prononcent toute on négligeant les règles orthographiques. Elle remplace un son par une lettre ou chiffre dont ils ont la même valeur sonore. Cependant, elle assure une transcription1 phonétique claire et nette, ce qui facilite la compréhension d’un texto. Le tableau ci-dessous montre des exemples de phonétisation. Langage SMS Langage naturel Kdo cadeau swaré soirée KC casser D100 descend 7 Cet(te) G J’ai C cho C'est chaud Tableau 1 : Exemples de phonétisation 1 Pouravoir plus sur la transcription, veuillez consultez ce lien : http://post.queensu.ca/~lessardg/Cours/215/chap2.html
  • 17. Chapitre 2 : Le langage SMS 6 Au niveau de mot cadeau, la lettre « o » remplace le son de la séquence de lettre « eau » et la lettre « k » remplace le son de « ca ». D’après ce qui qui précède, on remarque que la transcription phonétique est encore lisible. (Tableau 1) 3.2.Le rébus typographique « Le rébus typographique est le procédé par lequel certaines séquences de lettres, d’un mot ou d’une suite de mots, sont remplacées par un arrangement de chiffres, de lettres et signes divers. Ce procédé est basé essentiellement sur la phonétique » [6]. Le tableau ci-dessous illustre des exemples de rébus typographique. Langage SMS Langage naturel ab1to A bientôt a2m1 A demain D100 descend jtm Je t’aime C cho C'est chaud // parallèle 5* Cinq étoiles Tableau 2 : Exemples du rébus typographique Dans l’exemple « A bientôt », on a remplacé la suite de caractère « ien » par le chiffre « 1 » et les caractères « ôt » par l’alphabet « o ». Ceci explique que le chiffre « 1 » et la lettre « o » ont respectivement la même valeur phonétique que « ien » et « ôt ». (Tableau 2) 3.3.L’abréviation Une abréviation est la réduction d'un mot par retranchement des lettres moins pertinentes [9], tout en gardant un mot clair et compréhensible [6]. Le tableau suivant contient quelques exemples des mots en langage SMS et leurs équivalents en langage naturel. Langage SMS Langage naturel tt tout TAL Traitement Automatique des Langues Télé Télévision net internet Tableau 3 : Exemples d'abréviation
  • 18. Chapitre 2 : Le langage SMS 7 Comme le montre le Tableau 3, l'abréviation a réduit la taille des mots. Dans le cas du mot tout, on a éliminé les alphabets « o » et « u » et on a gardé les deux alphabets les plus informatives « t » et « t ». Dans le deuxième exemple, on a abrégé le mot Traitement Automatique des Langues en un groupe des lettres initiales « TAL ». Pour raccourcir les mots télévision et Internet, on a appliqué la technique de troncation2 . Cette technique fait recours à deux phénomènes : « apocope » et « aphérèse » [7]. L’apocope c’est la suppression de la dernière partie d’un mot (le cas de mot télévision). L’aphérèse consiste à supprimer le début d’un mot (internet devient net). 3.4. Les émotions Les émotions est la combinaison de plusieurs caractères outre que les chiffres et les lettres. Il s’agit des petits visages exprimant l’état de l’esprit d’une personne. Le tableau suivant montre des exemples des émotions. Tableau 4 : Exemple des émotions Note :  La répétition des ponctuations et lettres d’un mot exprime l’intensité des émotions. Par exemple « je t’aiiiiiiiiiiiiiiiiime !!!!!!!! »  Il est possible de combiner plusieurs procédés simultanément comme le montre l’exemple suivant : j'ai passé la plus belle nuit de ma vie --> g pac la plu bel nui 2 ma vi. 4. Le langage SMS entre approbation et rejet Le langage SMS est de plus en plus utilisé par les jeunes. En revanche, il utilise des procédés qui visent à abréger les mots tout en négligeant les normes orthographiques. De ce fait, l’usage d’un tel langage angoisse particulièrement les linguistes. Les questions qui se posent ici : Pourquoi ce langage est considéré comme étant une source d'inquiétude ? Ce moyen de communication présente- il des apports pour ses utilisateurs ? 2 La troncation consiste à supprimer certaines parties de mots. Langage SMS Signification :-) Sourire :-( Triste :’( Une larme :-* bisou
  • 19. Chapitre 2 : Le langage SMS 8 4.1.Les risques de langage SMS Le langage SMS représente une menace contre les fondamentaux de la langue française. D’après Danièle Manesse3 « le niveau d’orthographe des jeunes est beaucoup plus faible aujourd’hui qu’il y a vingt ans » [10]. En fait, Les personnes qui s’expriment trop par le langage SMS risquent d’oublier graduellement les règles de grammaire et d'orthographe. Devant un tel constat, ces personnes commencent à ne plus distinguer entre le langage SMS et la langue française. Par ailleurs, ceux qui ne maitrisent pas convenablement la langue française trouvent peinent à déchiffrer le langage SMS. Pour les raisons énoncés précédemment, un comité4 de lutte contre le langage SMS et les fautes volontaires sur Internet a d’ailleurs vu le jour. En fait, ce comité interdit l’utilisation de ce mode de communication, langage SMS, sur Internet. 4.2.Les intérêts de langage SMS Plusieurs arguments appuient l’utilisation du langage SMS. Parmi ceci, la simplicité et la rapidité de la communication vu que ce langage n’exige pas le respect des normes linguistiques. En outre, il renforce le sentiment d’appartenance à un groupe social. Ainsi, Le langage SMS offre à chaque scripteur5 la possibilité de créer son propre langage et de jouer avec les mots. Ceci procure un sentiment de plaisir lors de rédaction des messages. Il permet aussi d’enrichir le contenu d’un message tout en respectant le seuil maximum de caractère autorisé par les SMS. 5. Conclusion Le langage SMS se manifeste comme étant une véritable révolution de langue. Il propose une écriture indépendante des normes de la langue française. Ce langage a donné lieu à plusieurs romans6 , entièrement rédigés en langage SMS. Outre que l’apparition des dictionnaires spécifiques à ce langage. Pour les usagers de ce langage, il suffit de consulter un dictionnaire répertoriant ces nouveautés pour s’habituer rapidement à leur lecture. 3 Danièle Manesse professeure de sciences du langage à la Sorbonne 4 http://sms.informatiquefrance.com/ 5 Un scripteur : Personne qui a écrit un texte 6 Exemple du livre « Pa sage a taba vo SMS » http://livre.fnac.com/a1572830/Phil-Marso-Pa-sage-a-taba- vo-SMS
  • 20. Chapitre 3 : Les dictionnaires et les corpus SMS
  • 21. Chapitre 3 : Les dictionnaires et les corpus SMS 9 1. Introduction Le langage SMS est très pratique et rapide pour échanger des textos entres personnes. Cependant, il n’est pas toujours évident d’appréhende tous les procédés auxquels a recours ce langage. C'est la raison pour laquelle des dictionnaires et des corpus du langage SMS sont accessibles depuis internet. Nous verrons dans ce chapitre, quelques exemples de dictionnaires et corpus de SMS. 2. Les Dictionnaires des SMS La partie suivante est consacrée à la présentation de quelques dictionnaires de langage SMS. L’évaluation7 de ces traducteurs est faite à l’aide de quelques exemples écrits en langage SMS. 2.1. Le dictionnaire-sms Le dictionnaire-sms8 propose 300 mots français, classés par ordre alphabétique et traduits en langage SMS [11]. Il est caractérisé par une interface conviviale et claire avec des couleurs agréables. (Figure 1) Figure 1 : Le dictionnaire-sms 7 Voir Annexe B 8 http://www.dictionnaire-sms.com
  • 22. Chapitre 3 : Les dictionnaires et les corpus SMS 10 2.2. Le dictionnaire deblok Le dictionnaire deblok9 permet d’obtenir la signification d’un mot écrit en langage SMS. Il utilise un classement par lettre et par catégories (émotions, loisirs etc.). Ce qui permet d’offrir aux internautes une navigation libre. (Figure 2) Figure 2 : Le dictionnaire deblok 2.3. Le dictionnaire mobilou Le dictionnaire mobilou10 est réalisé par Phil Marso [11]. Il présente les mots français dans l'ordre alphabétique accompagnés de leur traduction en langage SMS. L’interface du site n’est pas trop ergonomique. (Figure 3) Figure 3 : Le dictionnaire mobilou 9 http://www.deblok.net/dicosms/ 10 www.mobilou.info/ 10kosms.htm
  • 23. Chapitre 3 : Les dictionnaires et les corpus SMS 11 2.4.Le dictionnaire langageSMS Le dictionnaire langageSMS11 offre une liste limitée des mots traduit en langage texto. Il possède une interface simple et claire. (Figure 4) Figure 4 : Le dictionnaire langageSMS D’après ce qui précède, on peut constater que tous les dictionnaires proposent des listes non exhaustives des mots traduit en langage SMS. Ainsi, le langage SMS évolue rapidement ce qui pose des problèmes de mise à jour. De plus, ces dictionnaires se limitent à quelques variantes d’un mot : exemple pour « demain » : 2m1, dmin, dem1, 2min. Pour résumé, Il existe sur Internet plusieurs dictionnaires12 de langage SMS mais on ne trouve pas pour l'instant un dictionnaire officiel de langage SMS. 3. Corpus SMS Le corpus SMS est une collection d’un grand nombre des SMS rédigés par un grand nombre de personnes différentes. Le but d’un corpus est de constituer une référence qui puisse servir pour des études linguistiques. Dans cette partie on va présenter quelques exemples de corpus SMS. 11 http://www.langagesms.com/dictionnaire.html 12 Voir Annexe A
  • 24. Chapitre 3 : Les dictionnaires et les corpus SMS 12 3.1. Corpus SMS de Caroline Tagg Caroline Tagg, de l’université de Birmingham en Angleterre, a analysé l’orthographe, la grammaire et les abréviations dans les SMS. Pour son étude, elle a demandé à ses amis et aux membres de sa famille de lui renvoyer tous les messages qu’ils recevaient ou envoyaient. Elle a ainsi récolté environ 11 000 SMS, soit près de 190 000 mots. [12] 3.2.Corpus du DELI Ce corpus compte 13 400 SMS pour environ 156 620 mots. Une partie des SMS ont été récoltés entre 2000 et 2004 par des étudiants de l’université de Provence en France, dans le cadre de travaux pratiques ou mémoires. Se sont rajoutés des SMS provenant d’utilisateurs ayant donné leur accord à Orange pour que leurs SMS soient utilisés à des fin de recherche. [12] 3.3.Projet « SMS4science » Le projet, qui se veut international, a débuté en Belgique en 2004. Il a permis de récolter plus de 75 000 SMS grâce à 3200 participants. Parmi ces participants, 2775 ont acceptés de répondre à un questionnaire « portant sur leur profil et leurs pratiques ». Le corpus constitué est à la fois homogène concerne seulement les SMS et diversifié puisque les participants sont différents donc leur utilisation des SMS l’est aussi. En effet, les participants ont entre 12 et 73 ans et appartiennent à des catégories différentes (étudiants, employés, etc.). [13] La récolte des SMS s’est faite par un numéro spécial. Les participants envoyaient leurs SMS directement à ce numéro gratuit. Ce procédé a évité des erreurs de saisie ou d’interprétation en recopiant manuellement les SMS. C’est un problème qui a été observé dans des projets d’analyse de SMS qui se sont réalisés dans différentes universités. [12] 4. Conclusion La limite majeure de la collecte des messages est qu’elle est réalisée dans un cercle proche des universités, de la famille, des amis, ou un nombre limité des personnes. Elle ne concerne donc qu'une partie restreinte du public utilisateur des SMS et par ailleurs, elle implique généralement une phase de recopiage des messages qui peut être la source d'erreurs. [14]
  • 25. Chapitre 4 : Les traducteurs SMS existants
  • 26. Chapitre 4 : Les traducteurs SMS existants 13 1. Introduction La recherche dans la traduction des SMS a mené a réalisé des logiciels de traduction des SMS. Ces traducteurs se sont des outils intéressants qui permettent de traduire des SMS envoyés avec un téléphone portable. Ils traduits les mots en langage SMS et les remplaces par les mots correspondants, mais ils ne corrigent pas les éventuelles fautes de français. L’objectif de ce chapitre et de présenter et tester quelque applications de traduction du langage SMS vers le langage naturel. 2. Les différents traducteurs SMS Il existe sur Internet différents sites qui proposent des traducteurs du langage SMS vers le français. 2.1. Le traducteur du site « www.TraducteurSMS.com » Le site www.TraducteurSMS.com13 met à la disposition de ses utilisateurs un traducteur en ligne gratuit du langage SMS vers la langue française. De plus il contient un dictionnaire du langage SMS et la signification des smileys. (Figure 5) Figure 5 : Le traducteurSMS.com 13 http://www.TraducteurSMS.com
  • 27. Chapitre 4 : Les traducteurs SMS existants 14  Avantages et inconvénients Le tableau ci-dessous montre les avantages et les inconvénients associé à ce traducteur. Avantages Inconvénients + Bonne ergonomie + Reconnaissance des Smiley + Disponibilité d’un dictionnaire pour le langage SMS et la signification des Smileys - Outil faible - Le dictionnaire utilisé ne contient pas beaucoup de mot même les plus utilisés SLT -> Salut RDV -> Rendez-Vous ss -> Sous Tableau 5 : Avantage et inconvénients de l'outil TraducteurSMS.com 2.2.Le traducteur du site « www.aidoweb.com » Le site web www.aidoweb.com14 , met à notre disposition un outil de traduction SMS, nous permettant de décrypter un texte écrit en langage SMS vers du français correcte. Il comporte pour le moment 6350 mots. [16] (Figure 6) Figure 6 : Le traducteur SMS AidoWeb  Avantages et inconvénients Le tableau suivant montre les avantages et les inconvénients associé à ce traducteur. Avantages Inconvénients - Outil simple - Reconnait beaucoup de Rébus Typographique : tel que C C’est, auj aujourd’hui, svoi se voit Malgré le fait qu’il soit puissant, le dictionnaire qu’il utilise n’est pas implémenter par tous les rébus (normale vu le fait que chaque jour de nouveaux mots naissent) Exemple : Raf  Rien à faire 12C4  Un de ces quatre jTappel Je t’appel Tableau 6 : Avantages et inconvénients de l’outil AidoWeb 14 http:// www.aidoweb.com
  • 28. Chapitre 4 : Les traducteurs SMS existants 15 2.3.Le traducteur du site « www.1fo.co » Le site web www.1fo.co15 , met à notre disposition un outil de traduction SMS qui se base sur tous les mots présents dans le dictionnaire SMS du site lui-même. Ce dictionnaire comporte plus de 400 abréviations SMS. [17] (Figure 7) Figure 7 : Le traducteur SMS 1fo  Avantages et inconvénients Le tableau suivant présente les avantages et les inconvénients associé à ce traducteur. Avantage Inconvénients - Outil un peu puissant - Reconnait un certain nombre de Rébus typographique Mais il reste tout de même assez incomplet. Son dictionnaire ne contient pas beaucoup de mots (400 mots reste vraiment peu suffisant pour une base lexicale qui peut faire le poids) Tableau 7 : Avantages et inconvénients de l’outil 1fo 3. Conclusion Dans ce chapitre nous avons ouvert une fenêtre sur les outils que l’on trouve sur internet et qui peuvent nous aider à faire une traduction du langage SMS vers un Français classique. Cela a été riche en enseignement, vu le nombre assez grand de ce genre de logiciel sur la toile, nous avons testé quelque uns, qui étaient soit peu ou très performant. 15 http : // www.1fo.co
  • 29. Partie 2 : Etude Pratique
  • 30. Chapitre 1 : Analyse et spécification des besoins
  • 31. Chapitre 1 : Analyse et spécification des besoins 16 1. Introduction La phase d’analyse et de spécification et des besoins est sans doute l’une des plus importantes phases dans le cycle de développement de toute application informatique. Ce chapitre est consacré à la description des différents besoins fonctionnels et non fonctionnels dégagés lors de la phase d’analyse. Ainsi que la description de modèle de cas d’utilisation prévus pour bien comprendre le fonctionnement de l’application. 2. L’objectif du projet L’objectif de ce projet est de concevoir un logiciel permettant de traduire un texte écrit en langage SMS vers la langue française. 3. Analyse des besoins Nous présentons dans cette partie les besoins fonctionnels et non fonctionnels de notre système. 3.1. Définition des besoins fonctionnels Le système à mettre en place doit offrir à l’utilisateur les fonctionnalités suivantes :  Saisir le texte en langage SMS  Traduire le texte saisi en langage SMS vers la langue française  Voir le pourcentage de traduction correcte 3.2. Définition des besoins non fonctionnels Outre que les besoins fonctionnels, il faut tenir compte de certains besoins non fonctionnels nécessaires pour une exploitation simple et consistante de notre système. Nous distinguons essentiellement les trois points suivants :  Simplicité : l’application doit offrir une interface simple avec des fonctionnalités compréhensibles.  Ergonomie : l’interface doit être ergonomique proche de la réalité du domaine d’application, facile à utiliser.  Rapidité : l’application doit offrir un temps de réponse acceptable qui dépend en grande partie de la complexité du code implémenté.
  • 32. Chapitre 1 : Analyse et spécification des besoins 17 4. Vue des cas d’utilisation Pour bien spécifier les besoins de notre application, nous avons recours au langage de modélisation unifié UML. Nous allons décrire les différents acteurs ainsi que les cas d'utilisation. Cette activité permet d'obtenir une vue interne idéale du système. 4.1.Identification des acteurs Un acteur représente un ensemble cohérant de rôles joués par des entités externes (utilisateurs, dispositifs matériels ou autres systèmes) qui interagissent directement avec l’application. De ce fait, le seul acteur de notre application est un utilisateur quelconque tel que : un élève, un étudiant, un professeur, etc… 4.2.Identification des cas d’utilisations Les cas d’utilisation représentent un élément essentiel de la modélisation : c’est une étape primordiale assurant la conception et la construction d’un système adapté aux besoins fonctionnels de l’utilisateur. La figure ci-dessous décrit les fonctionnalités pouvant être effectué par l’utilisateur. Figure 8 : Diagramme de cas d’utilisation générale <<include>> <<include>> Utilisateur Traduire le texte saisi du langage SMS vers la langue française Consulter l'interface Saisir le texte en langage SMS Consulter le résultat de la traduction
  • 33. Chapitre 1 : Analyse et spécification des besoins 18 En consultant notre interface, l’utilisateur a le pouvoir de saisir le texte, en langage SMS, qu’il veut traduire. Ainsi, la traduction du langage SMS en langue française sera effectuée et notre client pourra par la suite consulter le résultat de sa traduction. La première relation de type « include » entre « traduire le texte saisi du langage sms vers langue française » et « saisir le texte en langage sms » exige la saisie du texte par l’utilisateur avant de faire toute traduction possible. La deuxième relation de type « include » entre « traduire le texte saisi du langage sms vers langue française » et « consulter le résultat de la traduction » exige de la part de l’utilisateur une traduction du texte saisie, sinon la consultation du résultat et logiquement impossible à percevoir. 5. Conclusion Dans ce chapitre, nous avons essayé de présenter des différents besoins fonctionnels et non fonctionnels dégagés lors de la phase d’analyse. Dans le chapitre qui va suivre, nous entamerons la phase de la réalisation. Nous allons énumérer les différentes technologies que nous avons adoptées pour la réalisation de notre application et les différentes étapes de création du notre base de donnée (en XML).
  • 34. Chapitre 2 : Construction des dictionnaires
  • 35. Chapitre 2 : Construction des dictionnaires 19 1. Introduction Après avoir achevé l'étape d’analyse et spécification des besoins, nous entamons dans ce chapitre la partie réalisation qui constitue le dernier volet de ce rapport et qui a pour objectif d'exposer le travail réalisé. Pour ce faire, nous allons commencer, tout d'abord, par préciser l'environnement matériel et logiciel de notre travail. Ensuite nous allons présenter les différentes étapes de construction des dictionnaires. 2. Environnement et outils de travail Dans cette partie nous allons présenter l’environnement logiciel et matériel de notre travail. 2.1. Environnement logiciel Notre projet a été développé avec le langage de programmations C#. Pour cela, nous avons utilisé l’outil Microsoft Visual C# 2010 Express. Pour la création des dictionnaires, nous avons utilisé le langage XML (Extensible Markup Language) qui peut être traduit en français par langage de balisage extensible. 2.2.Environnement matériel Lors de la réalisation de ce projet, nous avons utilisé six micro-ordinateurs dont nous allons citer les caractéristiques du certains parmi eux:  Micro-ordinateur 1 : - Processeur : Pentium ® DualCore CPU T4200 @ 2.00 GHz. - Mémoire vive RAM: 4,00 Go. - Disque dur: 370 Go. - Système d'exploitation : Windows Vista.  Micro-ordinateur 2 : - Processeur : Pentium [R] 4 CPU 2.8 GHz. - Mémoire vive RAM: 1,OO Go. - Disque dur: 160 Go. - Système d'exploitation : SE XP sweet.
  • 36. Chapitre 2 : Construction des dictionnaires 20 3. Construction des dictionnaires L’évolution rapide du langage SMS a donné lieu à l’apparition des dictionnaires spécifiques à ce langage. Ces dictionnaires servent principalement à répertorier les nouveautés du ce langage et prendre en charge la vaste quantité de variant que peut avoir un même mot. Par exemple le mot bonne nuit, il peut être exprimé sous forme (bn8, bn, BN, bn8…). Donc ces dictionnaires peuvent être utiles pour traduire un SMS à condition qu’ils soient mis à jour régulièrement et que le problème des formes multiples soit résolu. 3.1.Pourquoi XML ? Le langage XML (Extensible Markup Language) présente plusieurs avantages par rapport aux autres moyens de stockage des données tel que le fichier texte ou base de données. Un fichier XML est : [18]  Lisible : Aucun pré requis n’est nécessaire pour comprendre un fichier XML.  Auto descriptif et bien structuré.  Extensible : un document XML peut être utilisable dans toute applications possibles.  Présente une structure arborescente : structurant et hiérarchisant tout problème informatique possible.  Portabilité.  Dé ployable : il peut être facilement distribué par n'importe quels protocoles à même de transporter du texte, comme http.  Intégrabilité : un document XML est utilisable par toute application pourvue d'un parseur (c'est-à-dire un logiciel permettant d'analyser un code XML).  Accès plus rapide. 3.2.Les étapes d’élaboration des dictionnaires Dans cette partie nous allons explorer nos 3 fichiers XML, afin de décrire l'architecture de nos fichiers et la logique qu'ils expriment. Chacune des balises transcrites dans ces fichiers seront expliquées et éclaircies.
  • 37. Chapitre 2 : Construction des dictionnaires 21 3.2.1.Le fichier « traduction.xml » Ce dictionnaire a pour objectif de traduire des mots SMS en leur équivalent en français. (Figure 9) Figure 9 : Extrait du dictionnaire « traduction.xml » Il faut spécifier à celui qui va lire le fichier que ce soit un logiciel ou un navigateur WEB que le fichier présent est en langage XML. Donc il faut ajouter la syntaxe ci-dessus en en-tête de fichier. <dictionnaire> c'est la balise mère. Chaque fichier XML doit impérativement avoir une balise mère pour pouvoir être lu.
  • 38. Chapitre 2 : Construction des dictionnaires 22 La figure ci-dessus montre un extrait du fichier « traduction.xml » qui décrit la structure de la balise <Dictionnaire>. Figure 10 : Structure de la balise <Dictionnaire>  La balise mot contient un attribut « valeur » qui représente le mot en langage sms.  La balise signification indique l’équivalent de mot « bnjr » dans la langue française.  Le type : cet attribut permet d’indiquer le type de mot 0 : sans type 1 : un mot masculin singulier. 2 : un mot féminin singulier. 3 : un mot masculin pluriel. 4 : un mot féminin pluriel. 5 : un mot au pluriel. 6 : un mot au singulier. Comme le montre l’exemple ci-dessous, le mot « pom de ter » saisi en langage SMS peut être traduit de plusieurs manières vers la langue française. En effet, l’accord orthographique du mot SMS « pom de ter » change selon le type qui lui correspond. Autrement dit, si le type associé est égale à 1, c'est-à-dire « masculin singulier » donc on aura pomme de terre sans ‘s’. si le type associé est égale à zéro. Dans ce cas, il s’agit d’un type inconnu, on lui affecte donc tous les traductions possibles (pomme ou pommes de terre).
  • 39. Chapitre 2 : Construction des dictionnaires 23 3.2.2.Le fichier « dico-fr.xml » Le fichier « dico-fr.xml » représente le dictionnaire français. Il contient des mots en français avec leurs types. La figure suivante présente un extrait du dictionnaire français. Dans l’entête, on remarque l’utilisation de balise mère <dictionnaireFrancais>. Chaque fichier XML doit impérativement avoir une balise mère pour pouvoir être lu. Figure 11 : Extrait du dictionnaire « dico-fr.xml » L’exemple suivant illustre l’utilisation de type pour identifier la valeur correspondante au mot SMS.  Le mot « enfants » est un mot masculin pluriel.  Le mot « enfant » est un mot au masculin singulier
  • 40. Chapitre 2 : Construction des dictionnaires 24 3.2.3.Le fichier « dico-fo.xml » C’est un dictionnaire phonétique qui permet de traduire les mots du langage SMS vers la langue française selon leurs transcriptions phonétiques, c’est-à-dire la manière dont ils se prononcent. La figure ci-dessous décrit un extrait du fichier XML « dico-fr.xml ». (Figure 12) Figure 12 : Extrait du dictionnaire « dico-fr.xml » Dans cet exemple le mot SMS « k » peut être traduit en plusieurs mots selon la manière dont il est prononcé. 4. Conclusion Nous avons décrit dans cette partie l’environnement du travail et les différentes étapes de construction des trois dictionnaires. Dans la partie suivante, nous détaillons notre application.
  • 41. Chapitre 3 : Interfaces de l’application
  • 42. Chapitre 3 : Interfaces de l’application 25 1. Introduction Dans ce chapitre nous décrivons le travail accompli tout au long de ce projet pour achever avec une exposition des problèmes rencontrés. 2. Les interfaces réalisées Au cours de cette section, nous nous attachons à présenter les étapes de réalisation de notre traducteur SMS à travers quelques interfaces. Au niveau de chaque étape nous allons décrire les problèmes rencontrés et les solutions envisagés. Les étapes à mettre en œuvre sont les suivantes :  Le découpage en tokens  La traduction des mots SMS connus  La traduction des mots inconnus  L’évaluation (cette étape sera décrite dans le chapitre suivant) 2.1.Le découpage en tokens Le rôle de cette étape est de convertir une chaîne de caractères représentant une phrase SMS en une suite de tokens. La figure suivante prouve que notre traducteur SMS a bien segmenté la phrase. Figure 13 : Interface de découpage en tokens
  • 43. Chapitre 3 : Interfaces de l’application 26  Les problèmes rencontrés et les solutions proposées Le type de séparateur à utiliser ? Est-ce que nous allons utiliser les ponctuations « . , ; : ! ? » comme séparateur ou bien nous allons utiliser l’espace seulement.  Nous avons choisi donc comme délimiteur des tokens les points, les virgules, les espaces et le retour chariot car ils sont les plus utilisés. Les autres ponctuations vont être considérées comme des mots. En outre, si nous allons considérer les : ; comme des séparateurs notre logiciel ne peut pas distinguer les émotions. 2.2.La traduction des mots SMS connus Le but de cette étape est de remplacer les séquences de caractères correspondant à un mot SMS présent dans le fichier « traductions.xml » en sa traduction en français. Pour cela, nous procéderons en deux étapes : l’identification des mots et la traduction. 2.2.1.L’identification des mots Cette étape16 consiste à détecter les tokens correspondant à un mot SMS présent dans le dictionnaire. Cette étape doit détecter aussi les tokens qui correspondent à des mots du français à l’aide de « dico-fr.xml ».  Les problèmes rencontrés et les solutions proposées Comment nous allons détecter les locutions ? Certains mots (SMS ou français) sont composés de plusieurs tokens. Dans ce cas, ces différents tokens devront être regroupés ensemble.  Après la phase de segmentation, notre traducteur prend le premier token (pom) et le combine avec le deuxième token (de) pour construire un nouveau mot (pom de). Puis il consulte le dictionnaire (dico-fr.xml ou traductions.xml) pour vérifier si ce dernier existe ou non. Si le nouveau mot existe dans le dictionnaire, le traducteur va le conserver dans une variable temporaire et le concatène avec le troisième token (pom de ter). Ensuite, le traducteur consulte de nouveau le dictionnaire si le mot existe il va écraser l’ancien contenu de la variable temporaire et mettre ce nouveau mot (pom de ter). De même, le traducteur combine le nouveau mot (pom de ter) avec le quatrième token (pom de ter ). Si le mot existe, il va l’afficher sinon le traducteur affiche le contenu de la variable temporaire (pom de ter) car nous avons limité le nombre de combinaison permis à quatre. 16 Enoncé de projet « traduction des SMS »
  • 44. Chapitre 3 : Interfaces de l’application 27 La figure ci-dessous montre la détection de la locution « pomme de terre » par notre traducteur. Figure 14 : Interface de détection de locution 2.2.2.La traduction La dernière étape consiste à effectuer la traduction des mots SMS en leur équivalent en français, tel qu’ils sont décrit dans le fichier « traduction.xml ». Cette étape ne va traduire que les mots de type sms.  Les problèmes rencontrés et les solutions proposées Il arrive dans certains cas, que notre logiciel ne reconnait pas les mots SMS car ils n’existent pas dans le dictionnaire « traductions.xml ». Donc on a recours à enrichir manuellement notre dictionnaire pour augmenter la performance du notre système. Plus qu’on alimente notre dictionnaire, plus que le logiciel reconnait correctement les mots SMS. En revanche, le temps de réponse augmente et la performance du logiciel diminue. • Pour traiter le cas d’étirement, nous avons fixé le nombre maximum de répétition des lettres à deux. Le logiciel essaie de faire toute les combinaisons possibles des mots par exemple, les combinaisons du mot « sllllttttttt » engendre ces nouveaux mots « slt », « sllt » et « sltt ».
  • 45. Chapitre 3 : Interfaces de l’application 28 Le traducteur consulte le dictionnaire pour valider l’un des nouveaux mots. Il vérifie l’existence de l’un de ces mots dans le dictionnaire français en premier lieu après dans le dictionnaire SMS en deuxième lieu. S’il l’a trouvé, il l’affiche sinon il affiche le premier mot rencontré « slt ». L’exemple choisie combines plusieurs procèdes (Abréviation, phonétique). Notre traducteur a su identifié les mots SMS et les traduire en langue française. (Figure 14) Figure 15 : Interface de traduction des mots SMS connus 2.3.La traduction des mots SMS inconnus Le but de cette étape17 est d’essayer de « déchiffrer » des mots SMS absents dans le dictionnaire « traduction.xml ».  Les problèmes rencontrés et les solutions proposées - Le dictionnaire « traduction.xml » ne comporte qu’une partie du vocabulaire SMS. Pour cela, on va utiliser la transcription phonétique des mots (la manière dont ils se prononcent) pour essayer de retrouver des mots français correspondants. Nous avons créé un dictionnaire phonétique « dico-fo.xml » à travers lequel nous allons traduire les mots inconnus. 17 Enoncé de projet « traduction des SMS »
  • 46. Chapitre 3 : Interfaces de l’application 29 - Plus qu’on augmente la taille du mot, plus que le nombre de combinaison possible ce qui influe sur la durée du traitement. Nous avons fixé un seuil pour le nombre de caractère du mot inconnu qui égale à cinq. Par exemple le mot « klke » donne 432 combinaisons possibles dont le « k » possède six valeurs dans le dictionnaire phonétique, pour « l » quatre valeurs et trois valeurs pour « e ». La multiplication nous donne 6*4*6*3 combinaisons. -Plus qu’on augmente la taille du dictionnaire plus que le temps de réponse augmente et la performance diminue  Pour optimiser les dictionnaires utilisés, nous avons alimenté nos dictionnaires que par des mots minuscules. Lors de la traduction, nous avons converti tous les mots SMS vers la minuscule d’une manière transparente pour l’utilisateur. La figure suivante montre que notre traducteur a réussi l’opération de déchiffrement des mots inconnu. Figure 16 : Interface de traduction des mots SMS inconnus 3. Conclusion Nous avons achevé dans ce chapitre, la description des interfaces les plus significatives de notre application. Il semble indispensable de critiquer notre travail et de l’évaluer. Ceci sera détaillé dans le chapitre suivant.
  • 47. Chapitre 4 : Evaluation de l’application
  • 48. Chapitre 4 : Evaluation de l’application 30 1. Introduction L’évaluation de l’application consiste à vérifier si elle a atteint ses objectifs et de déterminer quelles sont leurs forces et leurs faiblesses pour émettre des recommandations pour une amélioration future. C’est dans ce cadre s’inscrit ce chapitre qui est composé de deux parties, premièrement nous allons évaluer l’application par rapport à un corpus de test, ensuite, nous allons comparer notre système avec d’autres traducteurs existants sur Internet. 2. Evaluation par rapport au « corpus-sms-test.txt » Cette partie est consacrée à l’évaluation de l'efficacité du notre traducteur SMS. Elle nous indique si nous avons atteint nos objectifs ou non. Pour cela, nous procédons d’abord par traduire quelques phrases du fichier « corpus-sms-test.txt » à l’aide de notre application. Puis, nous comparons-les aux phrases de « corpus-fr-test.txt ».  Exemple 1 La figure suivante présente le résultat de traduction de la phrase " Mais pq t debout ? nan j’éteind jamais mon gsm :-)". Figure 17 : Traduction de la phrase 1 de corpus-sms-test
  • 49. Chapitre 4 : Evaluation de l’application 31 La comparaison de notre résultat et celle de « corpus-fr-test.txt » " Mais pourquoi t'es debout? Non, j'éteins jamais mon GSM :-) " permet de faire les constatations suivantes :  La traduction des mots SMS connus (pq ,nan ) est correcte et identique aux résultats de « corpus-fr-test.txt » .  Notre traducteur connaît le sigle GSM.  L’apport de notre application est la signification des smileys :-) : sourire  Exemple 2 La figure ci-dessous présente la traduction de la phrase "Lol... Pk pa vnu today? Probleme derection ??". Figure 18 : Traduction de la phrase 47 de corpus-sms-test Notre traducteur SMS donne un résultat pareil au résultat de corpus "Lol... Pourquoi pas venu today? Problème d'érection ??". Ainsi, notre traducteur donne la signification de l’abréviation Lol.
  • 50. Chapitre 4 : Evaluation de l’application 32  Exemple 3 La figure ci-dessous illustre la traduction de la phrase "g né pas bocop aimé cette piece de théâtre. Il faut dire que g lé vue dans de mauvaises conditions: le rideau était levé...". Figure 19 : Traduction d'une phrase avec mot inconnu Notre application a atteint son but de déchiffrer des mots SMS inconnus en utilisant la transcription phonétique des mots pour essayer de retrouver des mots français correspondants comme le montre le mot « bocop».  Comparaison entre les différentes approches Dans la réalisation de notre projet nous avons opté à utiliser une approche hybride qui applique d’abord le dictionnaire puis traite les mots restants à l’aide de leur prononciation. Vu que l’utilisation unique d’un dictionnaire de traduction a plusieurs limites : il représente une ressource limitée puisque le langage SMS évolue rapidement .Il ne prend pas en compte la totalité des mécanismes de création d’un mot SMS (un même mot possède plusieurs écriture possible). De même, l’approche qui considère tous les mots comme inconnus et passe par leur phonétisation n’apporte pas une solution optimale puisque un seul mot peut avoir plusieurs formes.
  • 51. Chapitre 4 : Evaluation de l’application 33 3. Comparaison par rapport aux autres traducteurs Au niveau de cette partie, nous allons comparer le résultat de traduction du notre logiciel par rapport aux traducteurs SMS existants : - Le traducteur 1 de site : www.1fo.co - Le traducteur 2 de site : www.TraducteurSMS.com - Les traducteurs des sites : www.Traducteur-sms.com et www.aidoweb.com18 Nous a avons fixé le choix sur l’exemple suivant car il combine plusieurs procédés simultanément (étirement, phonétique, abréviation) : - Exemple : lé enfon manj dé pom de terrrrrrrrrr elles sont bn ;) - Traduction : les enfants mangent des pommes de terre elles sont bonnes ;) 3.1.Le résultat de notre traducteur SMS L’interface suivante illustre la traduction de l’exemple cité auparavant. Figure 20 : Interface de traduction de notre Traducteur SMS Notre application a traduit correctement l’exemple écrit en langage SMS. En effet, elle a appliqué les règles de conjugaison (manj  mangent) et les règles d’orthographes (des pommes, elles sont bonnes). Ainsi, notre traducteur est capable d’éliminer l’étirement (terrrrrrrrrrrr  terre). Outre qu’il a réussi la traduction de l’émotion ;)  (clin d’œil) (Figure 19) 18 Consulter Annexe C pour voir le résultat de traduction des Traducteur-sms.com et www.aidoweb.com
  • 52. Chapitre 4 : Evaluation de l’application 34 3.2.Le résultat du traducteur « www.1fo.co » Ce traducteur a échoué la traduction. Il n’a traité aucun mot SMS. (Figure 20) Figure 21 : Interface de traduction du traducteur www.1fo.co 3.3.Le résultat du traducteur « www.TraducteurSMS.com » Ce traducteur n’a traduit qu’un seul mot SMS sachant que cette traduction est erronée. Autrement dit, il a considéré le mot SMS « bn » comme étant « bonne nuit » alors qu’il s’agit de l’adjectif « bon ». (Figure 21) Figure 22 : Interface de traduction de traducteur www. TraducteurSMS.com
  • 53. Chapitre 4 : Evaluation de l’application 35 4. Un tableau comparatif de traducteurs SMS19 Le tableau suivant résume l’étude comparative entre notre logiciel et les autres traducteurs SMS. La case cochée montre que le traducteur en question a réussi la gestion du procèdes correspondant et la case vide reflet le cas d’échéance. Nom des traducteurs Procédés utilisés dans l’exemple Notreapplication www.1fo.co www.TraducteurS MS.com www.Traducteur- sms.com www.aidoweb.com Phonétique    Abréviation    Elimination d’étirement   Conjugaison  Accord orthographique  émotion  Tableau 8 : Un tableau comparatif de traducteurs SMS 4. Conclusion A travers ce chapitre, nous avons remarqué d’après la comparaison de notre système avec les autres traducteurs qu’aucun d’entre eux n’a pas réussi à faire la traduction total es mot SM. Ceci montre que la traduction des SMS n’est pas une tâche simple, et l’évaluation est une étape primordiale pour ce type d’application pour savoir surtout les limites de l’application. 19 Consulter Annexe C pour voir le résultat de traduction d’autres traducteurs
  • 54. Chapitre 5 : Gestion du projet
  • 55. Chapitre 5 : Gestion de projet 36 1. Introduction Ce chapitre décrit la répartition des tâches entre les membres de l’équipe et les difficultés rencontrés au cours de la réalisation de ce projet. Ainsi, nous allons critiquer notre démarche de gestion de projet et proposer des solutions pour ne pas commettre ces erreurs dans le futur. 2. Démarche utilisé pour organiser le projet Le choix de chef d’équipe est réalisé à travers un vote sur notre groupe Facebook. Tous les membres de l’équipe ont participé dans l’élection de chef du groupe. Après le vote, le chef d’équipe élu a proposé la démarche suivante pour organiser le travail tout au long de ce projet. Pour l’étude théorique, tous les membres de l’équipe ont commencé la recherche bibliographique du sujet d’une manière individuel pendant quelques jours. Ceci a pour objectif de bien comprendre le sujet et fixer une idée préalable sur les points clé du plan du rapport. Par la suite, le chef d’équipe propose des réunions régulières pour collecter les idées de recherches et fixer un plan final. L’étape suivante consiste à affecter à chaque membre de l’équipe une partie de rédaction du rapport. Cette affectation a été basée sur l’avancement des recherches bibliographiques déjà réalisées et selon le désir de chaque membre de l’équipe. Après cette phase, une réunion a été fixée pour valider le travail. Pour l’étude pratique, le chef d’équipe a fixé une réunion pour déterminer l’environnement de travail et bien comprendre les différentes étapes de l’application. Contrairement à l’étude théorique, cette partie est plus délicate car les tâches sont dépendantes et le développement de l’application parait difficile. C’est pourquoi nous avons décidé de ne pas partager les tâches de développement. Donc, chaque membre de l’équipe a prescrit les solutions possibles pour résoudre les problèmes associés à chaque étape de l’application. Lors des réunions, nous avons partagé les idées et choisir les meilleurs solutions. Avec cette démarche, tous les membres de l’équipe contribuent au développement de l’application toute en gardant l’esprit collaboratif. Chaque réunion a été clôturée par un compte rendu20 rédigé par le chef d’équipe ainsi que la fusion et la validation de la copie finale du rapport. L’échange des informations a été effectué à travers notre groupe de discussion Facebook. 20 Consulter l’annexe D pour voir un exemple de compte rendu
  • 56. Chapitre 5 : Gestion de projet 37 3. Répartion des tâches de rédaction du rapport Le tableau suivant résume l’affectation des taches de rédaction du rapport entre les membres d’équipe. Yosra Asma Balkiss Takwa Taieb khaled Partie 1 : Etude théorique Introduction générale       Chapitre 1    Chapitre 2    Chapitre 3: Dictionnaires   Coprus   Chapitre 4   Partie 2 : Etude Pratique Chapitre 1   Chapitre 2     Chapitre 3    Chapitre 4 : Evaluation   Comparaison  Chapitre 5       Conclusion générale Conclusion générale       Tableau 9: Répartition des tâches
  • 57. Chapitre 5 : Gestion de projet 38 4. Les apports de projet Nous allons citer dans cette partie les différents apports associés au chef du projet et les autres membres de l’équipe.  Les apports de projet pour le chef d’équipe : - Diriger une équipe - Assurer le bon fonctionnement d'une équipe de travail pour mener à bien une production dans le respect des objectifs fixés. - Clarifier les objectifs - Essayer de ne pas donner un avis critique publiquement - Encourager et apprécier le rendement de chaque membre de l’équipe  Les apports de projet pour les membres d’équipe : - Echanger les informations - Apprendre à écouter - Créer des décisions plus pertinentes - Respecter les délais et répondre à des problèmes plus rapidement - Partager les bonnes pratiques Le domaine du TAL est très vaste et intéressent. Cependant, en pratique nous avons confrontés des problèmes dus principalement à nos connaissances limitées. Ce projet nous a permis d’améliorer nos compétences et d’approfondir nos connaissances. 5. Les problèmes rencontrés et solutions proposées Parmi les problèmes rencontrés au cours de la réalisation de ce projet, nous citons la difficulté de construction des dictionnaires et la correction d’orthographe et de conjugaison mais nous avons surmonté ce problème grâce à la coopération des membres d’équipe. 6. Conclusion Au cours de ce projet, nous avons décrit la démarche suivie par l’équipe pour bien planifier le projet et respecter les délais des livrables.
  • 59. Conclusion générale 39 Nous avons eu l’opportunité au cours de ce projet, de participer à la conception et à la mise en place d’un système informatique de traduction des SMS en langue française sous le langage C# de Microsoft. Durant ce projet, nous avons rencontré des difficultés dues à nos connaissances minimes dans le domaine de langage SMS. Néanmoins, nous avons pu surmonter ces difficultés grâce à beaucoup de documentation et de persévérance. La plus grande difficulté à laquelle nous nous somme confrontées est l’inexpérience dans le domaine du « Traitement Automatique des Langages », les technologies que nous avons utilisées tel que le langage XML avec qui nous avons développé des dictionnaires sur lesquels repose tout notre travail. Il faut tout de même mentionner que cette expérience a été bénéfique pour notre formation. En effet, nous avons eu l’occasion d’utiliser de nouvelles technologies tel que Microsoft Visual C# ainsi que la mise en œuvre de différents outils acquis durant notre cursus universitaires à l’Ecole Supérieure des Sciences et Techniques de Tunis. En guise de perspective, nous pouvons évoquer l’augmentation de la taille du notre dictionnaire pour qu'il puisse gérer le maximum de mots écris en langage SMS et ainsi essayer de couvrir le plus de mots possible utilisé. On peut aussi prévoir un dictionnaire automatique qui s’alimente au fur et à mesure disposant d’un outil d’apprentissage pour lui permettre d’évoluer à chaque utilisation. Nous espérons, durant ce projet, avoir réalisé un travail sérieux et convenable tout en ayant laissé une bonne impression.
  • 60. 40 Références [1] http://www.linguistik-online.de/48_11/cougnonFrancois.pdf (Consulté le 19/03/2013) [2] http://sebastien.fessard.free.fr/documents/RapportDeStageSebastienFessard.pdf (Consulté le 19/03/2013) [3] http://outils.diesenet.conseil-recherche-innovation.net/doc/Etude-Telephone-Mobile- Insertion.pdf (Consulté le 19/03/2013) [4] http://www.zdnet.fr/actualites/20-ans-du-sms-une-invention-qui-au-depart-n-etait-pas- destinee-au-grand-public-39785028.htm (Consulté le 19/03/2013) [5] http://fr.wikipedia.org/wiki/Orthographes_alternatives_du_fran%C3%A7ais [6] https://forge.info.unicaen.fr/attachments/382/Rapport_final.pdf (Consulté le 18/03/2013) [7] http://books.google.fr/books?id=bjNjfL-Z01kC&pg=PA61&lpg=PA61&dq=sms+et+ tal&source=bl&ots=9zHhJoNVZh&sig=7CzLLdslMP3a7gc8CoqUl4VeQg0&hl=fr&sa= X&ei=mT9HUbymD8Xl4QTZlYCgDw&ved=0CD0Q6AEwADgK#v=onepage&q=sms%20et% 20tal&f=false (Consulté le 08/03/2013) [8] http://post.queensu.ca/~lessardg/Cours/215/chap2.html (Consulté le 19/03/2013) [9] http://www.linternaute.com/dictionnaire/fr/definition/abreviation/ (Consulté le 18/03/2013) [10] http://www.projet-voltaire.fr/blog/actualite/l%E2%80%99ecriture-sms-est-elle-reellement- un-danger-pour-l%E2%80%99orthographe (Consulté le 19/03/2013) [11] http://www.texto.exionnaire.com/annuaire-sites-sms.php (Consulté le 19/03/2013) [12] http://dumas.ccsd.cnrs.fr/docs/00/56/19/95/PDF/CHABERT_Gaelle_M2R.pdf (Consulté le 19/03/2013) [13] http://www.sms4science.org/?q=fr/node/2 (Consulté le 19/03/2013) [14] http://www.sms4science.org/userfiles/le%20langage%20SMS%20r%C3%A9v%C3% A9lateur%20d%271comp%C3%A9tence.pdf (Consulté le 19/03/2013) [15] http://www.traducteur-sms.com/ (Consulté le 19/03/2013) [16] http://www.aidoweb.com/outils/traducteur-sms/ (Consulté le 19/03/2013) [17] http://www.1fo.co/traducteur-sms-francais.php (Consulté le 19/03/2013) [18] http://glossaire.infowebmaster.fr/xml/ (Consulté le 25/04/2013)
  • 62. Annexes 42 Annexe A Les dictionnaires SMS 1. Les dictionnaires SMS Il existe plusieurs sites qui proposent des dictionnaires SMS. 1.1. Le dictionnaire de site «www.maison-facile.com » Le site «www.maison-facile.com » propose un dictionnaire d’abréviations françaises qui permet de décoder le langage SMS. (Figure 1) Figure 1 : Dictionnaire de site «www.maison-facile.com »
  • 63. Annexes 43 1.2.Le dictionnaire de site « www.1fo.co » Le site « www.1fo.co » met à la disposition des internautes un petit dictionnaire du langage SMS. Ce dictionnaire est sous la forme d’un petit tableau trié dans l'ordre alphabétique avec les expressions et termes sms les plus courants. (Figure 2) Figure 2 : Le dictionnaire de site « www.1fo.co » 2. Le dictionnaire des émotions Le langage SMS permet aussi de passer des émotions via un message. Il existe alors des dictionnaires des smileys qui permettent de décoder ces petits symboles. La figure suivante présente un exemple de dictionnaire des smileys (appelés aussi binettes). (Figure 3) Figure 3 : Le dictionnaire de smileys
  • 64. Annexes 44 Annexe B Les traducteurs SMS 1. Le traducteur « TraducteurSMS.com » L’outil est simple à utiliser, il suffit d’entrer le message que nous voulons traduire et appuyer sur le bouton « traduire » pour avoir la traduction du texte entré. Pour vérifier la fiabilité de cet outil, nous avons entré quelques phrases pour les traduire. (Tableau 1). Tableau 1 : Test de l'outil TraducteurSMS.com
  • 65. Annexes 45 2. Le traducteur « Traducteur-sms.com » L’utilisation de cet outil est simple, il suffit d’entrer le texte à traduire puis appuyer sur le bouton « Traduire ». Pour vérifier l’efficacité de cet traducteur, nous avons entré quelques exemples en langages SMS pour les traduire. (Tableau 2) Langage SMS Traduction SLT, jtapL 2m1 si T dispo on sboi 1 cafE ! On svoi 2m1 ou 12C4 et on sfé un 6né C cho auj , on par a la mer Raf auj, rdv ds 5 min ss la tour Tableau 2 : Test de l'outil Traducteur-SMS.com 3. Le traducteur du site « Aidoweb » Grâce à des phrases en langage SMS, nous effectuerons quelques essaie pour vérifier la fiabilité de ce traducteur. (Tableau 3) SLT, jtapL 2m1 si T dispo on sboi 1 cafE ! On svoi 2m1 ou 12C4 et on sfé un 6né C choauj , on par a la mer Raf auj, rdv ds 5 min ss la tour Tableau 3: Teste de l’outil AidoWeb 4. Le traducteur du site « 1fo » L’outil que nous propose « 1fo.co » est assez intéressant. Il nous permet non seulement de traduire du langage SMS en français classique, mais l’inverse aussi, (Français  SMS). Maintenant, grâce aux phrases tests, que nous avons utilisé tout au long de ce chapitre, nous effectuerons quelques essaie pour vérifier la fiabilité de ce traducteur. (Tableau 4)
  • 66. Annexes 46 Langage SMS Traduction SLT, jtapL 2m1 si T dispo on sboi 1 cafE ! salut, jtapldemainsi t'esdispo on sboiun cafe ! On svoi 2m1 ou 12C4 et on sfé un 6né on svoidemain ou 12c4 et on sfé un ciné C choauj, on par a la mer c'est chaud aujourd'hui, on par a la mer Raf auj, rdv ds 5 min ss la tour rien à faire aujourd'hui, rendez-vous dans 5 min ss la tour Tableau 4 : Teste de l’outil 1fo 5. Le Traducteur du site « WebJunior » Le site www.webjunior.com met à notre disposition un traducteur SMS capable de traduire les abréviations, l'épelure21 et les rébus typographique que l’on lui donne [3]. L’interface du logiciel est sous la forme d’un téléphone portable avec un champ texte et un bouton traduire. (Figure 4) Figure 4 : Traducteur SMS WebJunior Grâce à des phrase écrit en langage SMS, nous effectuerons quelques essaie pour vérifier la fiabilité de ce traducteur. (Tableau 5) 21 L'épelure, résultat de l'épellation des lettres d'un mot. Valeur épellative des lettres, des chiffres et des caractères : G pour « j'ai », C pour « c'est », NRJ pour « énergie », a12c4 pour « À un de ces quatre » 2m1, « demain », bi1, « bien », koi 2 9, « quoi de neuf »
  • 67. Annexes 47 Langage SMS Traduction SLT, jtapL 2m1 si T dispo on sboi 1 cafE ! On svoi 2m1 ou 12C4 et on sfé un 6né C choauj , on par a la mer Raf auj, rdv ds 5 min ss la tour Tableau 5 : Teste de l’outil WebJunior Avantages et inconvénients Le tableau suivant présente les avantages et les inconvénients associé à ce traducteur. Avantage Inconvénients Malgré ça simplicité, il reste un outil assez intéressant, capable de résoudre quelque rébus typographique. Il reste quand même très loin d’être performant, son dictionnaire n’est pas assez riche en mot Par exemple : 6né  Cinéma raf  Rien à faire Tableau 6 : Avantages et Inconvénients de l’outil WebJunior 6. Le traducteur du site « www.Traducteur-sms.com » Le site www.Traducteur-SMS.com met à la disposition de ses utilisateurs un outil de traduction SMS, ce traducteur contient plus que 9900 mots en mémoire et des nombreuses règles logiques. [15] (Figure 5)
  • 68. Annexes 48 Figure 5: Le Traducteur-SMS.com  Avantages et inconvénients Le tableau suivant présente les avantages et les inconvénients associé à ce traducteur. Avantages Inconvénients + Bonne ergonomie + Outil très puissant + Possibilité d’ajouter des mots dans le dictionnaire + Application des règles grammaticales - Quelques mots ne sont pas traduits correctement on part -> on par disponible -> dispo Tableau 7 : Avantage et Inconvénients de l'outil Traducteur-SMS.com
  • 69. Annexes 49 Annexe C Comparaison avec les traducteurs SMS existant 1. Le résultat de traducteur « www.Traducteur-sms.com » Ce traducteur a presque su traduire tous les mots SMS. Il n’a pas reconnu le mot ‘enfon’. Autrement dit, il a bien géré l’étirement (terrrrrrrrr -> terre), l’abréviation (pom -> pomme et bn- >bon) et la phonétique (manj -> mange). Cependant, il n’a pas respecté les règles de conjugaison et d’orthographe et il n’a pas traité l’émotion. (Figure 6) Figure 6: Interface de comparaison de traducteur www.Traducteur-sms.com
  • 70. Annexes 50 2. Le résultat de traducteur « www.aidoweb.com » Ce traducteur a réussi la traduction de certains mots SMS ( lé -> les, mang -> mange, dé -> des, pom -> pomme et bn->bon) tandis qu’il n’a pas reconnu le mot terrrrr et enfon ni l’émotions. (Figure 7) Figure 7: Interface de comparaison de traducteur www.aidoweb.com
  • 71. Annexes 51 Annexe D Exemple de compte rendu Discussion de projet TAL [Date de la réunion : 04-03-2013] [Heure de la réunion : 12:30] [Lieu de la réunion : ESSTT] REUNION ORGANISEE PAR Yosra HASNAOUI TYPE DE REUNION Réunion d’information et de prise de décision PARTICIPANTS Taieb SADDEM , Khaled FAYALA, Balkiss HAMAD, Asma MDAINI, Takwa LAAMIRI DISCUSSION Etude de l’art (les thèmes) * Le langage SMS * Traduction du langage SMS - Définition du terme SMS - Les étapes de traduction des SMS - Définition de langage SMS et son intérêt - Les dictionnaires existants (les + et les -) - Pourquoi la traduction des SMS ? - Les corpus existants (avantages et limites) - Les domaines d’utilisations de ce langage * Applications de traduction SMS - Avantages et inconvénients de ce langage - Les applications existants - Les utilisateurs de ce langage - Avantages et inconvénients des applications Développement de l’application - Le langage de programmation : C# - Interface de l’application : Sous la forme d’un téléphone pour le moment (voir ce lien http://www.traducteur-sms.com/) - Un dictionnaire sous forme d’une base de données ou sous la forme d’un fichier XML. - Utilisation de l’analyseur lexical : gplex
  • 72. Annexes 52 Rédaction du Rapport - Conforme au modèle déposé par notre enseignante sur la plateforme. - Chacun rédige sa partie avec les mises en formes appropriés et dépose une copie sur le groupe pour la valider. - Il faut mettre la bibliographie. - La copie finale va être fusionnée et validée par le chef d’équipe CONCLUSIONS - Commencer la recherche bibliographie - Choisir le dictionnaire nécessaire pour commencer le développement de l’application - Ajouter d’autres thèmes si c’est possible pour enrichir l’étude de l’art. Chacun des membres de l’équipe dois laisser une trace sur la validation des copies des autres membres. C’est-à-dire le membre qui vérifie la copie doit laisser son nom (de même pour les autres membres). Une copie qui ne contient pas tous les noms des membres de l’équipe ne sera pas validée. Lors de dépôt d’une nouvelle copie il faut marquer tous les noms des membres pour les notifier qu’il existe une copie à vérifier. MESURES A PRENDRE PERSONNE RESPONSABLE DELAI A RESPECTER Certains membres proposent de diviser les thèmes de recherches. La répartition des thèmes est affectée par un tirage au sort. Les autres membres préfèrent une recherche exhaustive. On réparti alors les thèmes et les membres qui veulent une recherches exhaustive communique les modifications ajoutées au chef d’équipe. La décision finale sera faite par le chef d’équipe (ou peut-être on fait recours à des votes si on a plus de temps). Tous les membres vont participer pour faire la recherche bibliographie La validation des parties séparées doit être faite avant 20 Mars 2013. La copie finale doit être prête avant 21 Mars 2013.