"Traitements Algorithmiques" |
Traitements Algorithmiques |
Objectifs |
Matriser la communication | |||
Concevoir un artefact | |||
Qui accepte des productions langagires | |||
Qui les interprte | |||
Applications | |||
Traductions | |||
Recherches dŐinformations |
Thmes de recherche |
Outils et mthodes | |||
Pour le traitement algorithmique des langages | |||
Langage = naturel et/ou artificiel | |||
Systmes transformationnels | |||
¨ Toujours un rsultat | |||
Langages Spcialiss | |||
¨ SYGMART |
"Un mode de reprsentation R" |
Un mode de reprsentation R | |||
Textes, Formes logiques, Arbres, Graphes, Vecteurs, É | |||
Les instances potentielles : Univers de R | |||
Structure S(M) = Un objet acceptable dans M | |||
Des oprations internes associes : | |||
Transformations S1(M) S2(M) | |||
"Apprhension" |
Apprhension | |||
transformation avec chgt de modle | |||
$f : S1(M1) S2(M2) | |||
S1(LN) S2(Logique) | |||
Pierre aime Marie aimer(Pierre, Marie) | |||
Comprhension | |||
Apprhension + | |||
valuation de la structure obtenue / structure cible | |||
Par exemple, une Ç bonne Č comprhension | |||
Min. distance(arbre obtenu / arbre dsir) | |||
Min. rappel / (silence + bruit) |
Moyens |
Modle | ||
Textes (flots de caractres) - T | ||
Forts multi-tiquette partages - F | ||
Vecteurs conceptuels - V | ||
Transformation | ||
Projections S1(T) § S2 (F) | ||
S1(F) S2 (F) | ||
Traitement | ||
algorithme de Markov sur F |
Moyens |
Algorithmes | ||
Dfinition de linguiciels | ||
Variables + Dictionnaires + Grammaires | ||
Etiquettes | ||
Instanciation du jeu de variables | ||
Structures | ||
Forts tiquettes partags | ||
Simulation de graphes, de treillis, etc. |
Moyens |
SYGMART | |||
Rapide | |||
Traitement sur de gros volumes | |||
Texte de 256 Ko (50000 mots - 100 pages) | |||
--> 20Min sur un pentium III 500 Mhz (128 Mo) | |||
--> structure de > 84000 points | |||
--> sortie (texte) > 1 Mo |
Domaines |
Ressources lexicales | ||
Dictionnaires | ||
Vecteurs | ||
Projets |
Fe* (Malais -Thai - Vietnamien) |
Projets |
Fe* (Malais -Thai - Vietnamien) |
Vecteurs conceptuels |
Un jeu de concepts | ||
Th. Larousse (873 ides de bases) | ||
Une ide = un 873 uplet dŐentiers |
Propagation |
Sur des arbres dŐanalyse |
Propagation |
Sur des arbres dŐanalyse |
Propagation |
Sur des arbres dŐanalyse |
Propagation |
Sur des arbres dŐanalyse |
Propagation |
Sur des arbres dŐanalyse |
Propagation |
Sur des arbres dŐanalyse |
Propagation |
Sur des arbres dŐanalyse |
Propagation |
Sur des arbres dŐanalyse |
Propagation |
Sur des arbres dŐanalyse |
Propagation |
Tri sur les sens = selon dist(Vi.j, VŐi). |
Vecteurs conceptuels |
Distance | ||
Angle entre deux vecteurs | ||
Si 0 alors colinaires - mme ide | ||
Si pi/2 alors ortho. - rien voir. |
Fonctions vectorielles |
S: NP(ART,N) | ||
--> V(NP) = V(N) | ||
S: NP1(NP2,N) | ||
--> V(NP1) = aV(NP1)+V(N) 0<a<1 | ||
V(bateau voile) = V(bateau) + 1/2V(voile) | ||
V(voile de bateau) = 1/2V(bateau) + V(voile) |
Fonctions vectorielles |
Pas seulement linaire | ||
S: GA(GADV(ADV),ADJ) | ||
--> V(GA) = V(ADJ)^p(ADV) | ||
p(trs) = 2 | ||
V(trs content) = V(content)^2 | ||
p(peu) = 1/2 | ||
V(peu content) = V(content)^1/2 |
Rtropropagation |
V(Ni j) = V(Ni j) V(Ni) | |
produit terme terme |
Application |
Indexation de documents | |||
Multilingue | |||
Reprsente le domaine | |||
chevaux <--> quitation | |||
Granularit | |||
Document, paragraphe, etc. | |||
Index = (Vi, doc i)* | |||
rechercher = minimiser dist | |||
angle (V(requette) , V(doc i) ) |
Diapositive 28 |