"Traitements
Algorithmiques"
Traitements
Algorithmiques

Objectifs
Ma”triser la communication
Concevoir un artefact
Qui accepte des productions langagires
Qui les interprte
Applications
Traductions
Recherches dŐinformations

Thmes de recherche
Outils et mŽthodes
Pour le traitement algorithmique des langages
Langage = naturel et/ou artificiel
Systmes transformationnels
¨ Toujours un rŽsultat
Langages SpŽcialisŽs
¨ SYGMART

"Un mode de reprŽsentation R"
Un mode de reprŽsentation R
Textes, Formes logiques, Arbres, Graphes, Vecteurs, É
Les instances potentielles : Univers de R
Structure S(M) = Un objet acceptable dans M
Des opŽrations internes associŽes :
Transformations S1(M) ˆ S2(M)

"ApprŽhension"
ApprŽhension
transformation avec chgt de modle
$f : S1(M1) ˆ S2(M2)
S1(LN) ˆ S2(Logique)
Pierre aime Marie ˆ aimer(Pierre, Marie)
ComprŽhension
ApprŽhension +
ƒvaluation de la structure obtenue / structure cible
Par exemple, une Ç bonne Č comprŽhension
Min. distance(arbre obtenu / arbre dŽsirŽ)
Min. rappel / (silence + bruit)

Moyens
Modle
Textes (flots de caractres) - T
Forts ˆ multi-Žtiquette partagŽes - F
Vecteurs conceptuels - V
Transformation
Projections S1(T) §ˆ S2 (F)
S1(F) ˆ S2 (F)
Traitement
algorithme de Markov sur F

Moyens
Algorithmes
DŽfinition de linguiciels
Variables + Dictionnaires + Grammaires
Etiquettes
Instanciation du jeu de variables
Structures
Forts ˆ Žtiquettes partagŽs
Simulation de graphes, de treillis, etc.

Moyens
SYGMART
Rapide
Traitement sur de gros volumes
Texte de 256 Ko (50000 mots - 100 pages)
--> 20Min sur un pentium III 500 Mhz (128 Mo)
--> structure de > 84000 points
--> sortie (texte) > 1 Mo

Domaines
Ressources lexicales
Dictionnaires
Vecteurs

Projets
Fe* (Malais -Thai - Vietnamien)

Projets
Fe* (Malais -Thai - Vietnamien)

Vecteurs conceptuels
Un jeu de concepts
Th. Larousse (873 idŽes de bases)
Une idŽe = un 873 uplet dŐentiers

Propagation
Sur des arbres dŐanalyse

Propagation
Sur des arbres dŐanalyse

Propagation
Sur des arbres dŐanalyse

Propagation
Sur des arbres dŐanalyse

Propagation
Sur des arbres dŐanalyse

Propagation
Sur des arbres dŐanalyse

Propagation
Sur des arbres dŐanalyse

Propagation
Sur des arbres dŐanalyse

Propagation
Sur des arbres dŐanalyse

Propagation
Tri sur les sens = selon dist(Vi.j, VŐi).

Vecteurs conceptuels
Distance
Angle entre deux vecteurs
Si 0 alors colinŽaires - mme idŽe
Si pi/2 alors ortho. - rien ˆ voir.

Fonctions vectorielles
S: NP(ART,N)
--> V(NP) = V(N)
S: NP1(NP2,N)
--> V(NP1) = aV(NP1)+V(N) 0<a<1
V(bateau ˆ voile) = V(bateau) + 1/2V(voile)
V(voile de bateau) = 1/2V(bateau) + V(voile)

Fonctions vectorielles
Pas seulement linŽaire
S: GA(GADV(ADV),ADJ)
--> V(GA) = V(ADJ)^p(ADV)
p(trs) = 2
V(trs content) = V(content)^2
p(peu) = 1/2
V(peu content) = V(content)^1/2

RŽtropropagation
V(Ni j) = V(Ni j) € V(Ni)
 produit terme ˆ terme

Application
Indexation de documents
Multilingue
ReprŽsente le domaine
chevaux <--> Žquitation
GranularitŽ
Document, paragraphe, etc.
Index = (Vi, doc i)*
rechercher = minimiser dist
angle (V(requette) , V(doc i) )

Diapositive 28