<HTML><HEAD><!-- This document was created from RTF source by rtftohtml version 3.0.1 -->    <META NAME="keywords" CONTENT="ALAO, langue seconde, apprentissage, lexique,collocation, lexique mental, TAG">   <META NAME="author" CONTENT="Thierry Selva"   <META NAME="description" CONTENT="Repr&eacute;sentation et utilisation de connaissances dans un syst&egrave;me d'aide &agrave; l'apprentissage lexical">   <TITLE>Repr&eacute;sentation et utilisation de connaissances dans un syst&egrave;me d'aide &agrave; l'apprentissage lexical</TITLE></HEAD><BODY BGCOLOR=#FFFFFF><CENTER><b>Repr&eacute;sentation et utilisation de connaissances dans unsyst&egrave;me d'aide &agrave; l'apprentissage lexical</b><p></CENTER><BR><BR><UL><LI><A HREF="#Heading1">1. Introduction</A><LI><A HREF="#Heading2">2. Corpus de textes</A><LI><A HREF="#Heading3">3. Dictionnaire g&eacute;n&eacute;ral</A><UL><LI><A HREF="#Heading4">3.1. Organisation du lexique mental</A><LI><A HREF="#Heading5">3.2. Informations lexicales</A><LI><A HREF="#Heading6">3.3. R&eacute;seau lexical</A><LI><A HREF="#Heading7">3.4. Consultation du dictionnaire</A></UL><LI><A HREF="#Heading8">4. Module compr&eacute;hension</A><LI><A HREF="#Heading9">5. Dictionnaire personnel et mod&egrave;le de l'apprenant</A><LI><A HREF="#Heading10">6. G&eacute;n&eacute;ration et analyse</A><UL><LI><A HREF="#Heading11">6.1. Activit&eacute;s lexicales</A><LI><A HREF="#Heading12">6.2. Le formalisme des grammaires d'arbres adjoints</A><LI><A HREF="#Heading13">6.3. Description de la grammaire</A><UL><LI><A HREF="#Heading14">Exemple:</A></UL><LI><A HREF="#Heading15">6.4. Un algorithme d'analyse pour les TAGs</A><LI><A HREF="#Heading16">6.5. Production de l'apprenant</A></UL><LI><A HREF="#Heading17">Bibliographie</A></UL><hr size=4><CENTER><H1>Repr&eacute;sentation et utilisation de connaissances dans un syst&egrave;me d'aide &agrave; l'apprentissage lexical</H1></CENTER><BR><BR><CENTER><TABLE><TR><TD><center><b>Thierry SELVA</b><BR>LRL - D&eacute;partement de Linguistique<BR>Universit&eacute; Clermont 2  <BR>34 avenue Carnot<BR>63000 Clermont-Ferrand <BR>e-mail<tt> :</tt><BR><tt></tt>selva@lrl.univ-bpclermont.fr <BR></center><p></TD><TD><center><b>Fabrice ISSAC</b><BR>LIPN - URA 1507<BR> Universit&eacute; Paris-Nord <BR>avenue J.B. Cl&eacute;ment <BR>93430 Villetaneuse <BR>e-mail <tt>:</tt><BR><tt></center><center></tt>fabrice.issac@ura1507.univ-paris13.fr<BR></center><p></TD></TR></TABLE></CENTER><BR><BR><BR><HR><BR><b>R&eacute;sum&eacute; : </b>Nous pr&eacute;sentons dans cet article lamani&egrave;re dont sont structur&eacute;es et utilis&eacute;es lesinformations dans un environnement informatique d'aide &agrave; l'acquisitionlexicale du fran&ccedil;ais langue seconde  : AlexiA. Le syst&egrave;me proposeune aide en compr&eacute;hension et en production, ce qui permet &agrave;l'apprenant de consolider et de valider le vocabulaire &eacute;tudi&eacute;.Nous avons organis&eacute; les donn&eacute;es lexicales du syst&egrave;me,d'une part en fonction des travaux en psycholinguistique sur le lexique mental,et d'autre part en fonction des travaux en linguistique appliqu&eacute;e surl'acquisition/apprentissage. Nous avons utilis&eacute; le formalisme desgrammaires d'arbres adjoints pour repr&eacute;senter les donn&eacute;essyntaxiques. Ce syst&egrave;me est d&eacute;velopp&eacute; sur une plateformeMacintosh &agrave; partir d'Hypercard et comprend diff&eacute;rents modules enProlog et en C.<p><p><b>Mots cl&eacute;s : </b>ALAO, langue seconde, apprentissage, lexique,collocation, lexique mental, TAG<p><HR><h1><A NAME="Heading1">1. Introduction</A></h1><b></b><p>Jusqu'&agrave; pr&eacute;sent, le domaine de l'acquisition des langues aeu tendance &agrave; privil&eacute;gier la grammaire par rapport au lexique etle mot &eacute;tait rel&eacute;gu&eacute; au second plan. Toutefois depuisquelques ann&eacute;es les chercheurs red&eacute;couvrent que pour s'exprimercorrectement dans une langue &eacute;trang&egrave;re une bonne connaissance dulexique est importante. En effet, de plus en plus d'&eacute;tudes en didactiqueet en psycholinguistique soulignent l'importance du lexique non seulement dansla ma&icirc;trise mais aussi dans l'apprentissage d'une langue&eacute;trang&egrave;re. Nous pr&eacute;sentons, dans cet article, lesdiff&eacute;rentes bases de connaissances utilis&eacute;es dans unenvironnement d'aide &agrave; l'apprentissage lexical individualis&eacute;appel&eacute; AlexiA (Chanier et al. 1995). Celui-ci propose une aide lexicalepersonnalis&eacute;e en production et en compr&eacute;hension. Ilconsid&egrave;re &agrave; la fois les strat&eacute;gies standard d'acc&egrave;slexicaux, celles d&eacute;crites par les travaux en psycholinguistique, pourmod&eacute;liser la base de donn&eacute;es lexicales, et  cellesemploy&eacute;es par l'utilisateur. Le syst&egrave;me propose &eacute;galementdes activit&eacute;s lexicales pour l'aide &agrave; la r&eacute;tentionbas&eacute;es sur le lexique &eacute;tudi&eacute; par l'apprenant lors de sestravaux de compr&eacute;hension ou/et de production. De plus, il permet&agrave; l'utilisateur de structurer ses propres connaissances lors de laconstruction et de l'utilisation d'un dictionnaire personnel. Le lexique telque nous l'envisageons ne se restreint pas aux mots simples mais englobe aussiles collocations et les cooccurrences<a name="fnB0" href="#fn0">[1]</a> quitiennent une place importante dans la ma&icirc;trise d'une langue. En effet,l'utilisation de ces expressions en contexte s'av&egrave;re d&eacute;licatepour des non-natifs tandis que les natifs y ont souvent recours. L'emploi parun apprenant de collocations est un bon indice de ses comp&eacute;tenceslangagi&egrave;res. L'apprentissage du lexique n'est pas une t&acirc;che simplequi peut &ecirc;tre effectu&eacute;e en une seule phase. Car conna&icirc;tre unmot c'est non seulement le reconna&icirc;tre visuellement, savoir le prononcer,conna&icirc;tre ses propri&eacute;t&eacute;s morphologiques, syntaxiques ets&eacute;mantiques, mais aussi conna&icirc;tre le contexte dans lequel ils'emploie et les fonctions pragmatiques qu'il remplit. AlexiA comporteplusieurs modules et plusieurs bases de connaissances. L'environnement utiliseprincipalement trois bases de connaissances. Un <b>corpus de textes</b> surlequel l'apprenant va travailler. Un <b>dictionnaire &eacute;lectroniqueg&eacute;n&eacute;ral</b> qui contient les ressources lexicales :propri&eacute;t&eacute;s morphologiques, syntaxiques, pragmatiques ets&eacute;mantiques ainsi que des associations entre mots. Et une grammairelexicale &agrave; partir de laquelle sont extraites les informationssyntaxiques. Ces bases sont utilis&eacute;es dans quatre modulesdiff&eacute;rents. Un module <b>compr&eacute;hension</b>, o&ugrave; l'apprenant&eacute;tudie le vocabulaire &agrave; partir d'un textes&eacute;lectionn&eacute;. Un module de gestion du <b>dictionnairepersonnel</b> qui permet &agrave; l'apprenant d'organiser lui-m&ecirc;me lesinformations sur le vocabulaire qu'il a &eacute;tudi&eacute;. Un module<b>mod&egrave;le de l'apprenant</b> qui contient des informations sur lest&acirc;ches qu'il a effectu&eacute;es. Enfin, un module <b>activit&eacute;slexicales</b> qui lui permet de pratiquer des exercices favorisantl'acquisition, certains d'entre eux ayant recours &agrave; un analyseursyntaxique.<h1><A NAME="Heading2">2. Corpus de textes</A></h1><b></b><p>Notre travail porte sur le fran&ccedil;ais courant et actuel, celui quetout natif poss&egrave;de et utilise pour communiquer. Afin d'obtenir uneanalyse fine des donn&eacute;es, nous avons d&eacute;limit&eacute; un champs&eacute;mantique, tous les textes du corpus ayant trait au travail, &agrave;l'emploi et au ch&ocirc;mage. En principe, tout natif, quel que soit son niveaud'&eacute;ducation ou son niveau social, ma&icirc;trise ce champ. Bien entendu,cela suppose que l'apprenant soit un adulte. Le corpus a &eacute;t&eacute;constitu&eacute; en recueillant des textes du fran&ccedil;ais contemporain(livres, quotidiens, revues g&eacute;n&eacute;rales ousp&eacute;cialis&eacute;es, etc...) en relation avec le champ s&eacute;mantique&eacute;tudi&eacute;. Il est essentiellement constitu&eacute; de textes&eacute;crits mais comporte &eacute;galement quelques interviews afin d'avoirdes donn&eacute;es sur le fran&ccedil;ais oral. Ce corpus a servi &agrave;d&eacute;finir les mots caract&eacute;ristiques du domaine, &agrave; extraireles collocations, &agrave; mener des &eacute;tudes linguistiques sur ces motset &agrave; les illustrer par des exemples tir&eacute;s des textes. De plus ilva permettre de d&eacute;finir des activit&eacute;s lexicales pour l'apprenant.Une fois ces textes num&eacute;ris&eacute;s et mis sous format&eacute;lectronique, nous leur avons appliqu&eacute; un traitement statistiquedestin&eacute; &agrave; recueillir les mots les plus courants,caract&eacute;ristiques du champ s&eacute;mantique. Pour cela, nous avons&eacute;tabli des listes de mots class&eacute;s par fr&eacute;quence et avonsenlev&eacute; les mots grammaticaux et les verbes courants ("avoir","&ecirc;tre", "faire","mettre", etc.) que l'on retrouve dans tous les textes.Puis nous avons isol&eacute; une soixantaine de mots qui nous paraissaientd&eacute;crire le champ : <b>les mots p&ocirc;les</b>. En ce qui concerne lescollocations, elles ont &eacute;t&eacute; introduites &agrave; partie des motsp&ocirc;les (un mot p&ocirc;le fait toujours partie d'une collocation) soitmanuellement, soit par le r&eacute;sultat d'un deuxi&egrave;me traitementstatistique.  A partir des mots p&ocirc;les et de leurs collocations, on aajout&eacute; des d&eacute;riv&eacute;s, des synonymes et antonymes, desactants ainsi que des d&eacute;riv&eacute;s s&eacute;mantiques (reli&eacute;saux mots p&ocirc;les par des relations s&eacute;mantiquespr&eacute;d&eacute;finies). On a ainsi constitu&eacute; un lexique de quelques250 entr&eacute;es de base.<h1><A NAME="Heading3">3. Dictionnaire g&eacute;n&eacute;ral</A></h1><b></b><h2><A NAME="Heading4">3.1. Organisation du lexique mental</A></h2><b></b><p>Lors de la production d'un discours, le choix d'un mot, ou d'uneexpression, se fait &agrave; un rythme tr&egrave;s soutenu avec un tauxd'erreur tr&egrave;s faible<a name="fnB1" href="#fn1">[2]</a>. Desexp&eacute;riences en psycholinguistique sur l'organisation du lexique mentalmontrent que les relations entre les &eacute;l&eacute;ments du lexique sont dedeux types. Il existe des relations intrins&egrave;ques, oucat&eacute;gorielles, qui contiennent des informations linguistiques surl'unit&eacute; lexicale elle-m&ecirc;me, et des relations associatives quiregroupent les unit&eacute;s dont la fr&eacute;quence d'apparition dans unm&ecirc;me contexte est importante ("ouvrier" avec "usine" ou "travail")(Bogaards 1994). On peut d&eacute;composer les relations intrins&egrave;ques enrelations s&eacute;mantiques comme la synonymie ou l'antonymie, morphologiques,c'est-&agrave;-dire du domaine de la d&eacute;rivation ("comp&eacute;tent","comp&eacute;tence", "incomp&eacute;tence"), et phonologiques, pour les motscommen&ccedil;ant ou se terminant par les m&ecirc;mes phon&egrave;mes. Lesrelations entre les "items mentaux" forment ainsi un r&eacute;seau dans lequelles noeuds ne sont pas les mots eux-m&ecirc;mes, mais leurs sens particuliers.Quant &agrave; la collocation, il apparait probable qu'elle soit stock&eacute;enon pas comme une association de mots, mais comme une seule unit&eacute;&agrave; part enti&egrave;re.<h2><A NAME="Heading5">3.2. Informations lexicales</A></h2><b></b><p>Dans la base lexicale, le lex&egrave;me (c'est-&agrave;-dire soit le motsimple, s&eacute;par&eacute; par deux blancs, soit l'expression) estcaract&eacute;ris&eacute; par deux repr&eacute;sentations : une interne et uneexterne. La repr&eacute;sentation externe est celle qui est vue etmanipul&eacute;e par l'utilisateur &agrave; partir de liens hypertexte dansl'interface : il s'agit de la forme graphique classique mise sous formecanonique suivie de la cat&eacute;gorie grammaticale entre parenth&egrave;ses.La repr&eacute;sentation interne, utilis&eacute;e dans le codage de la baselexicale, est une repr&eacute;sentation arbitraire unique, associ&eacute;e&agrave; un lex&egrave;me d&eacute;sambigu&iuml;s&eacute; par sacat&eacute;gorie, utilis&eacute;e par les diff&eacute;rents algorithmes dusyst&egrave;me et invisible pour l'utilisateur. Pour chaque lex&egrave;me, labase lexicale contient la graphie, la cat&eacute;gorie grammaticale, la ou lesd&eacute;finitions, le genre et le nombre de la forme canonique, le niveau delangue, les fr&eacute;quences<a name="fnB2" href="#fn2">[3]</a>, laconstruction syntaxique, les exemples en contexte, les cooccurrences etcollocations et les liens s&eacute;mantiques avec d'autres mots ou expressions.L'entr&eacute;e du dictionnaire est consid&eacute;r&eacute;e sur deux niveaux :l'entr&eacute;e polys&eacute;mique et l'entr&eacute;e univoque,c'est-&agrave;-dire l'entr&eacute;e prise dans un de ses sens particulier. Dansla repr&eacute;sentation interne, l'entr&eacute;e univoque est une fonction etest d&eacute;sambigu&iuml;s&eacute;e par un indice. La repr&eacute;sentationexterne est rep&eacute;r&eacute;e par un num&eacute;ro de sens. Lesinformations g&eacute;n&eacute;rales seront associ&eacute;es &agrave;l'entr&eacute;e polys&eacute;mique (la cat&eacute;gorie, le genre et le nombre,la repr&eacute;sentation graphique ainsi que la fr&eacute;quence<a name="fnB3"href="#fn3">[4]</a> ). Par contre, les informations comme la d&eacute;finition,les exemples, le niveau de langue et la construction syntaxique seront propres&agrave; un sens de l'entr&eacute;e. <b>Les d&eacute;finitions</b> sontinspir&eacute;es du Collins Cobuild (Collins 1994). Contrairement aux autresdictionnaires classiques, ce sont des phrases, ce qui permet d'indiquer demani&egrave;re fluide et directe une foule de renseignements concernant le motcomme par exemple les structures grammaticales ou les informations de contexteet d'usage. Pour un verbe, ce proc&eacute;d&eacute; permet d'exprimerfacilement des contraintes sur le sujet (plus difficile &agrave; rendre compteavec les d&eacute;finitions plus traditionnelles). <b>Les niveaux de langue</b>regroupent plusieurs registres ; on retrouve la distinction formel-familierainsi que les registres litt&eacute;raire, technique, &eacute;crit etparl&eacute;. <b>Les exemples</b> sont tir&eacute;s autant que possible ducorpus. Les entr&eacute;es sont rep&eacute;r&eacute;es gr&acirc;ce &agrave; unconcordanceur<a name="fnB4" href="#fn4">[5]</a> et le sens de l'entr&eacute;edans l'exemple est d&eacute;termin&eacute; manuellement. Le corpus,repr&eacute;sentatif d'un champ s&eacute;mantique donn&eacute;, peut ne paslivrer tous les sens d'une entr&eacute;e. Dans ce cas, l'exemple estinvent&eacute;.<h2><A NAME="Heading6">3.3. R&eacute;seau lexical</A></h2><b></b><p>Pour que l'apprenant acc&egrave;de aux unit&eacute;s de la base lexicalede mani&egrave;re <i>naturelle</i>, celle-ci peut &ecirc;tre utilis&eacute;e etvue sous forme d'un r&eacute;seau s&eacute;mantique. L'entr&eacute;e, pourvuede tous ces attributs, est reli&eacute;e &agrave; d'autres par des lienss&eacute;mantiques dans un r&eacute;seau lexical. Les noeuds de cer&eacute;seau sont toujours des entr&eacute;es univoques. Cependant, ledictionnaire ne couvrant pas toute la langue et &eacute;tant donc incomplet,certains noeuds ne seront pas d&eacute;crits en tant qu'entr&eacute;e. Ils sontsimplement cit&eacute;s et consid&eacute;r&eacute;s dans leur dimensionpolys&eacute;mique. Ces sous-r&eacute;seaux s&eacute;mantiques autour d'uneentr&eacute;e pourront &ecirc;tre visualis&eacute;s &agrave; l'&eacute;cran.Cela permet d'une part, de faciliter la circulation parmi lesdiff&eacute;rentes entr&eacute;es, et d'autre part de pouvoir les comparer lesunes par rapport aux autres. Ainsi on peut distinguer clairement, notammentdans le cas des synonymes, les informations qui les diff&eacute;rencient (parexemple le niveau de langue ou les types de synonymie). Parmi les lienss&eacute;mantiques, on retrouve les classiques quasi-synonymie, hyponymie,hyperonymie, synonymie intersective et antonymie. On a aussi des relationsactancielles (<i>agent, patient, lieu, mani&egrave;re, r&eacute;sultat</i>,etc.). De plus, on utilise les fonctions lexicales les plus courantes tellesqu'elles ont &eacute;t&eacute; d&eacute;finies dans le DEC (Mel'cuk 1992)(<i>magn, oper, anti, incep, fin, cont, bon</i>, etc.). Outre ces lienss&eacute;mantiques, les entr&eacute;es sont aussi li&eacute;es par le mot ;c'est le cas des cooccurrences dont la base est une entr&eacute;e dudictionnaire (ex "travailler" et "travailler comme une b&ecirc;te" sontreli&eacute;es par le mot "travailler" et par la fonction <i>magn </i>qui estun intensificateur). Cela permet de retrouver les collocations &agrave; partird'un des mots la constituant.<p>Ces fonctions lexicales, pr&eacute;sentes seulement dans le DEC, ont unr&ocirc;le tr&egrave;s important notamment en production. A partir d'un mot etd'un lien s&eacute;mantique exprim&eacute; par la fonction, on produit un autremot. C'est l&agrave; tout l'int&eacute;r&ecirc;t de la th&eacute;orie Sens-Texte.<h2><A NAME="Heading7">3.4. Consultation du dictionnaire</A></h2><b></b><p>L'interface a &eacute;t&eacute; r&eacute;alis&eacute;e en HyperCard surMacintosh. Les ressources lexicales sont pour l'instant en Prolog tout commeles programmes d'acc&egrave;s au lexique. Hypercard et Prolog communiquent aumoyen d'Apple Events. On utilise beaucoup les liens hypertexte lorsque lesinformations cit&eacute;es font r&eacute;f&eacute;rence &agrave; desentr&eacute;es de la base lexicale. En cliquant dessus, on parvient &agrave;l'entr&eacute;e s&eacute;lectionn&eacute;e. L'interface est constitu&eacute;ed'une s&eacute;rie de cartes organis&eacute;es hi&eacute;rarchiquement (Figure1). On y circule au moyen de boutons toujours pr&eacute;sents qui font monterou descendre dans la hi&eacute;rarchie.<p><p><CENTER><IMG HEIGHT=280 WIDTH=556 SRC="JCSC9601.GIF"></CENTER><p><center>Figure 1 : <i>Hi&eacute;rarchie des cartes du dictionnaireg&eacute;n&eacute;ral</i><p><i></center></i><p><i><center></i>Lorsqu'on acc&egrave;de au dictionnaire g&eacute;n&eacute;ral,on arrive sur la liste des entr&eacute;es du dictionnaire. L'ajout de lacat&eacute;gorie entre parenth&egrave;ses permet de distinguer un premierniveau d'homonymie entre mots de cat&eacute;gories syntaxiquesdiff&eacute;rentes (par ex : b&ucirc;cher (v) et b&ucirc;cher (n)). Quant auxautres homonymes, qui ont perdu le lien s&eacute;mantique qui les unissaientjadis (par ex : "contracter une maladie" et "contracter un muscle"), unefen&ecirc;tre interm&eacute;diaire qui contient les homonymes et une rapidedescription s&eacute;mantique, permet de faire la diff&eacute;rence.L'apprenant sait alors de mani&egrave;re claire quel est le mot quil'int&eacute;resse et dont il va consulter les informations.<p></center>Une fois cette &eacute;tape optionnelle franchie, s'offrent &agrave;lui deux possibilit&eacute;s : soit l'entr&eacute;e s&eacute;lectionn&eacute;eposs&egrave;de des collocations (ex "petit boulot" pour "boulot") et alors, surla m&ecirc;me carte, s'affiche une liste de collocations (et de cooccurrences)ayant l'entr&eacute;e s&eacute;lectionn&eacute;e en commun. Il faut alorschoisir une collocation ou tout simplement le mot lui-m&ecirc;me pour arriver&agrave; la carte des d&eacute;finitions. Soit l'entr&eacute;e n'enposs&egrave;de pas et on passe directement &agrave; la carte desd&eacute;finitions. Le point important est que l'on pr&eacute;sente lescollocations tout de suite, contrairement aux dictionnaires classiques qui lescitent dans l'article du mot de base<a name="fnB5" href="#fn5">[6]</a> (quel'on a d'ailleurs parfois du mal &agrave; d&eacute;terminer). La liste descollocations permet de voir toutes les expressions dans lesquellesl'entr&eacute;e est utilis&eacute;e.<p>La carte des d&eacute;finitions permet de conna&icirc;tre les diff&eacute;rentssens d'une unit&eacute; lexicale et donc d'en choisir un. Lorsqu'on yacc&egrave;de, on obtient tout d'abord les informations relatives &agrave;l'entr&eacute;e polys&eacute;mique : cat&eacute;gorie, genre, nombre etfr&eacute;quence. On obtient ensuite la liste des d&eacute;finitionscorrespondant aux sens. Il faut en s&eacute;lectionner une pour avoiracc&egrave;s aux exemples, aux constructions syntaxiques, au niveau de langueet aux synonymes, antonymes, collocations, actants, d&eacute;riv&eacute;ss&eacute;mantiques et syntaxiques. Ces derni&egrave;res informations sontpr&eacute;sent&eacute;es sur quatre cartes qui sont au m&ecirc;me niveauhi&eacute;rarchique. On les parcourt de mani&egrave;re circulaire et &agrave;chaque carte, la fl&egrave;che qui remonte d'un niveau donne acc&egrave;s&agrave; la carte des d&eacute;finitions. La carte des synonymes et antonymesindique aussi leur d&eacute;finition et leur niveau de langue (lorsque cesinformations figurent dans la base lexicale). Cela permet de bien saisir lesnuances entre les mots. Des boutons radios permettent de choisir le type desynonymie ou d'antonymie (exacte, plus large, plus &eacute;troite,intersective). La carte des actants les pr&eacute;sente en indiquant larelation d'actance. Quant aux d&eacute;riv&eacute;s syntaxiques, on lespr&eacute;sente en s'appuyant sur la structure syntaxique du verbeassoci&eacute;. Les deux derni&egrave;res cartes indiquent les lienss&eacute;mantiques qui unissent les collocations et les d&eacute;riv&eacute;ss&eacute;mantiques avec l'entr&eacute;e. Ces liens sont pr&eacute;sent&eacute;ssous forme de fonctions lexicales expliqu&eacute;es et illustr&eacute;es parune aide.<p><p>Cette fragmentation et cette structuration de l'information relative &agrave;une entr&eacute;e (pr&eacute;sentation par cartes hi&eacute;rarchis&eacute;es)permet &agrave; l'apprenant d'une part, de bien avoir conscience du typed'information qu'il visualise et d'autre part, d'avoir la libert&eacute; dechoisir le type d'information qu'il veut consulter. Dans les dictionnairesclassiques, les informations, bien que structur&eacute;es, sontpr&eacute;sent&eacute;es en m&ecirc;me temps et l'on a sous les yeux &agrave;la fois celles qui nous sont utiles comme celles, souvent bien plus nombreuses,qui ne nous int&eacute;ressent pas.<h1><A NAME="Heading8">4. Module compr&eacute;hension</A></h1><b></b><p>L'apprenant a &agrave; sa disposition un corpus de textes pour lequel unprogramme de consultation a &eacute;t&eacute; cr&eacute;&eacute;.L'acc&egrave;s &agrave; un texte peut se faire &agrave; partir d'une recherchepar titre, par mot-cl&eacute;, par registre ou par r&eacute;f&eacute;rence del'article. Lors de l'&eacute;tude du texte choisi, l'apprenant peut &agrave;tout moment acc&eacute;der au dictionnaire g&eacute;n&eacute;ral. Ledictionnaire personnel est aussi accessible &agrave; tout moment, soit pour leconsulter, soit pour l'augmenter. Il a aussi la possibilit&eacute; des&eacute;lectionner une phrase ou un groupe de mots afin d'en obtenir, par lebiais de l'analyseur syntaxique TAG (voir ci-dessous), d'une part sesconstituants, dont les collocations (ce qui est tr&egrave;s important pourl'apprenant car les collocations sont loin d'&ecirc;tre &eacute;videntes&agrave; reconna&icirc;tre), et d'autre part une visualisation textuelle ougraphique de sa structure syntaxique. <h1><A NAME="Heading9">5. Dictionnaire personnel et mod&egrave;le de l'apprenant</A></h1><b></b><p>Le syst&egrave;me offre &agrave; l'apprenant la possibilit&eacute; deconstruire son propre dictionnaire. Il s'agit en fait du vocabulaire&eacute;tudi&eacute; que l'apprenant regroupe &agrave; sa mani&egrave;re sousforme de r&eacute;seau lexical, favorisant ainsi sa m&eacute;morisation.<p>Pour ces deux parties, nous nous inspirons directement des travaux deGoodfellow (Goodfellow 1994). D'apr&egrave;s la th&eacute;orie (Aitchison1987), deux facteurs d&eacute;terminent la possibilit&eacute; de production demots. Il s'agit, d'une part, du niveau d'activation de "base" du mot(c'est-&agrave;-dire du  niveau d'activation au moment o&ugrave; le processuscommence) ainsi que du nombre et des types de liens que ce mot poss&egrave;deavec d'autres dans le r&eacute;seau. Plus un mot a de lien, plus sa productionsera possible m&ecirc;me si son niveau d'activation est bas. De m&ecirc;me,plus le niveau d'activation du mot est haut, plus celui-ci est susceptibled'&ecirc;tre produit, m&ecirc;me s'il est peu li&eacute; au reste dur&eacute;seau. D&egrave;s lors, une strat&eacute;gie d'apprentissage se doit defavoriser au maximum le nombre de connexions du r&eacute;seau, et de placer lesniveaux d'activation de base le plus haut possible.<p>C'est ce que le syst&egrave;me propose de d&eacute;velopper chez l'apprenant,en lui donnant la possibilit&eacute; de cr&eacute;er son propre r&eacute;seauavec ses propres liens (dans une activit&eacute; de regroupement) ainsi que lapossibilit&eacute; d'"activer" les mots qu'il d&eacute;sire &eacute;tudier.Pour cela, il peut soit les s&eacute;lectionner dans les textes, soit consulterdes informations sur eux dans le dictionnaire g&eacute;n&eacute;ral monolingue,soit leur ajouter des annotations ou soit les manipuler dans le regroupement.<p>Le regroupement des mots se fait dans le dictionnaire personnel. L'apprenants&eacute;lectionne tout d'abord les mots qui l'int&eacute;ressent, soit destextes, soit du dictionnaire g&eacute;n&eacute;ral ou soit saisis au clavier,et les met dans une liste. Il cr&eacute;e ensuite des groupes suivant descrit&egrave;res de sens, de forme ou de syntaxe, puis les compl&egrave;te&agrave; partir des mots de la liste.<p><p>Le mod&egrave;le de l'apprenant contient la trace des op&eacute;rationseffectu&eacute;es. Il se doit aussi de stocker les mots que l'apprenant atravaill&eacute;s, leur degr&eacute; d'activation, leur degr&eacute; deconnexion (nombre de groupes qui les contient) et le fait qu'ils aient&eacute;t&eacute; annot&eacute;s ou non.<p>Toutes ces informations sont stock&eacute;es dans des variables. Ellespermettent d&egrave;s lors d'&eacute;tablir un statut pour chaque mot (par ex :tr&egrave;s, assez ou peu "travaill&eacute;"), puis &agrave; partir de cesstatuts de d&eacute;clencher des activit&eacute;s lexicalesappropri&eacute;es.<p><p>Toutes ces donn&eacute;es sont visibles pour l'apprenant. De plus, en examinantles dates de chaque op&eacute;ration, le syst&egrave;me peut d&eacute;terminerun taux et une vitesse d'apprentissage. Cela donne &agrave; l'&eacute;tudiantla possibilit&eacute; de s'auto-&eacute;valuer et de pouvoir comparer avec lessessions pr&eacute;c&eacute;dentes. <h1><A NAME="Heading10">6. G&eacute;n&eacute;ration et analyse</A></h1><b></b><h2><A NAME="Heading11">6.1. Activit&eacute;s lexicales</A></h2><b></b><p>Comme nous venons de le voir, l'ensemble des informations contenue dansle mod&egrave;le de l'apprenant permet de sugg&eacute;rer, par un "conseiller",le type d'activit&eacute;s lexicales les plus appropri&eacute;es en fonction dustatut des mots. Suivant que le mot est plus ou moins connu, le "conseiller"propose telle ou telle activit&eacute; lexicale. Parmi les activit&eacute;slexicales traditionnelles en compr&eacute;hension et en production, nous avonsretenu : reconstitution d'une partie de r&eacute;seau, groupements de motssuivant diff&eacute;rents crit&egrave;res, exercices &agrave; trous, paraphrased'une expression, choix entre diff&eacute;rentes paraphrases en contexte,d&eacute;termination du sens d'un mot ou d'une expression &agrave; partir d'untexte dans lequel il (elle) est introduit de fa&ccedil;on redondante, recherchedu sens d'un mot ou d'une expression &agrave; partir d'informationsfragmentaires (concept du "mot sur le bout de la langue"), etc. Cesactivit&eacute;s n&eacute;cessitent pour une grande part l'utilisation ducorpus de textes, de la base de donn&eacute;es lexicales et de l'analyseursyntaxique.<p><p>AlexiA utilise aussi une base de donn&eacute;es syntaxique. Elle estconsult&eacute;e en compr&eacute;hension, dans le dictionnaireg&eacute;n&eacute;ral ou lorsque l'apprenant d&eacute;sire conna&icirc;tre lastructure d'une phrase, et en production afin d'&eacute;valuer les performancesde l'apprenant. Nous avons donc choisi de ne pas coder les informationssyntaxiques de mani&egrave;re fig&eacute;e, mais plut&ocirc;t de lesg&eacute;n&eacute;rer &agrave; partir d'un formalisme grammatical. Parmi lesdiff&eacute;rents formalismes existants, nous avons choisi celui des<i>Grammaires d'Arbres Adjoints</i> (Abeille 1990) (TAG). Nous nous sommesint&eacute;ress&eacute;s &agrave; ce formalisme pour trois raisons :<p><p><br>*	Les grammaires TAG sont <b>lexicalis&eacute;es</b>, c'est-&agrave;-direqu'&agrave; chaque item lexical correspond une structure syntaxique. Cette<b>lexicalisation</b> a des cons&eacute;quences linguistiques et informatiquesmais surtout elle nous parait adapt&eacute;e &agrave; un syst&egrave;me d'aide&agrave; l'apprentissage lexical.<p><br>*	Les TAGs ont une repr&eacute;sentation graphique directe sous formed'arbres syntagmatiques. Cette repr&eacute;sentation pourra &ecirc;tremontr&eacute;e &agrave; l'apprenant soit pour offrir une information plusgraphique d'une structure syntaxique, soit pour lui permettre de manipuler<i>&agrave; la main</i> des phrases (passivation, nominalisation, ...).<p><br>*	Comme, par d&eacute;finition, &agrave; chaque item lexical correspond unestructure, ce formalisme offre la possibilit&eacute; de repr&eacute;senter lescollocations comme une structure atomique.<h2><A NAME="Heading12">6.2. Le formalisme des grammaires d'arbres adjoints</A></h2><b></b><p>Le langage g&eacute;n&eacute;r&eacute; par la grammaire TAG est obtenupar l'application de deux op&eacute;rations de composition sur les arbres&eacute;l&eacute;mentaires, ou encore sur les arbres d&eacute;riv&eacute;s deces op&eacute;rations, l'<i>adjonction</i> et la <i>substitution</i> (figure2). On appelle <i>arbre de d&eacute;rivation</i> l'arbre  repr&eacute;sentantla combinaison des arbres &eacute;l&eacute;mentaires ainsi que lesop&eacute;rations utilis&eacute;es pour les combiner entre eux, c'est uned&eacute;finition plus <i>s&eacute;mantique</i> de la phrase. A un m&ecirc;mearbre d&eacute;riv&eacute; peuvent correspondre plusieurs arbres ded&eacute;rivation.<p><p><CENTER><IMG HEIGHT=158 WIDTH=543 SRC="JCSC9602.GIF"></CENTER><p><p><center>Figure 2 : <i>Grammaire et arbres d&eacute;riv&eacute;s</i><p></center><p><p>On associe aux noeuds des arbres &eacute;l&eacute;mentaires une structure detraits, c'est-&agrave;-dire un ensemble de couples attribut/valeur. Lescontraintes d'unification de ces traits lors des op&eacute;rations desubstitution et d'adjonction permettent le calcul des traits correspondantspour les arbres d&eacute;riv&eacute;s.<h2><A NAME="Heading13">6.3. Description de la grammaire</A></h2><b></b><p>La grammaire que nous utilisons pour AlexiA est compos&eacute;e d'unanalyseur morphologique, d'un lexique morpho-syntaxique et d'un ensemble de<b>familles d'arbres</b>. Une famille d'arbres est un ensemble d'arbres&eacute;l&eacute;mentaires correspondant &agrave; diff&eacute;rentes structuressyntaxiques partageant le m&ecirc;me type de sous-cat&eacute;gorisation. Il ya, par exemple, une famille d'arbres pour chaque verbe suivant sasous-cat&eacute;gorisation (un ou deux compl&eacute;ments, introduit par uncompl&eacute;ment ou non, ...). Nous utilisons un analyseur morphologique,d&eacute;velopp&eacute; pr&eacute;c&eacute;demment, pour s&eacute;lectionnerdans la base de donn&eacute;es des familles d'arbres, les famillescorrespondant aux informations morphologiques des mots. L'analyseurmorphologique a 55000 entr&eacute;es lexicales et 199 traitsmorpho-syntaxiques. Cette m&eacute;thode ne permettant pas deg&eacute;n&eacute;rer toutes les unit&eacute;s lexicales, en particulier lescollocations, nous utilisons un lexique morpho-syntaxique pours&eacute;lectionner directement les familles d'arbres ad&eacute;quates. Unecollocation est d&eacute;finie comme un arbre pr&eacute;-construitd'apr&egrave;s un sch&eacute;ma pr&eacute;d&eacute;fini.<p><p><h3><A NAME="Heading14">Exemple:</A></h3><p><p><p>S/NP(V[m&acirc;cher])NP[la_besogne]P[&agrave;]NP			Nom de la nouvellestructure<p><p>S/NP(V[m&acirc;cher])NPPNP					Famille de base<p>	SS NP NP/DET(N[besogne]) 			Substitution avec une autre famille<p>		SS DET [la]				Substitution d'un mot<p>	SS P [&agrave;]						Substitution d'un mot<p>	-R2						On enl&egrave;ve la variation syntaxique R2<p>	-Q2						On enl&egrave;ve la variation syntaxique Q2<p><p>R2 et Q2 sont respectivement les variations <i>relatives</i> et <i>question</i>de la famille S/NP(V)NPPNP.<p>Cela signifie que l'expression "m&acirc;cher la besogne &agrave; quelqu'un" nepeut &ecirc;tre mis sous forme relative ou interrogative sans perdre son sensidiomatique.<p><p><h2><A NAME="Heading15">6.4. Un algorithme d'analyse pour les TAGs</A></h2><b></b><p>Notre objectif est d'offrir &agrave; l'apprenant le plus d'informationspossible sur la phrase qu'il a produite. Il faut notamment qu'en cas deproduction incorrecte, le syst&egrave;me lui indique le type de l'erreurcommise (mauvais placement d'un item lexical, oubli ou rajout d'un item, ...)et quelles sont les parties de phrase correctes. Par exemple la phrase<sup>*</sup><i>Jean beaucoup semble travailler</i> doit donner apr&egrave;sanalyse J<i>ean semble travailler</i> et <i>beaucoup</i>. Nous avons doncchoisi d'&eacute;crire un algorithme purement montant (Issac 1994),c'est-&agrave;-dire que l'on part des mots puis on reconstruit la phrase&agrave; l'aide des op&eacute;rations d'adjonction et de substitution.<h2><A NAME="Heading16">6.5. Production de l'apprenant</A></h2><b></b><p>Toutes les productions de l'apprenant, quelque soit le type d'exercice,devront &ecirc;tre fortement guid&eacute;es par le syst&egrave;me car celui-cine poss&egrave;de pas de module s&eacute;mantique. M&ecirc;me si le formalismedes TAG, &agrave; l'aide duquel seront analys&eacute;es les productions del'apprenant, int&egrave;gre quelques traits s&eacute;mantiques qui contraignentla construction syntaxique, cela reste de bas niveau. Les diagnostics faits surles productions de l'apprenant se feront au niveau syntaxique.<p><p>Pour une phrase &eacute;crite par un apprenant on peut distinguer trois typesde r&eacute;ponses de l'analyseur. Soit la <b>grammaire estincoh&eacute;rente</b>, ce qui signifie que les unit&eacute;s lexicaleschoisies par l'apprenant ne pourront jamais se combiner pour former une phrasecorrecte. Dans ce cas le syst&egrave;me peut pr&eacute;senter &agrave;l'apprenant les incompatibilit&eacute;s entre les diff&eacute;rentesunit&eacute;s. Soit la <b>production est correcte</b>, c'est &agrave; dire quela phrase est syntaxiquement correcte, l'apprenant a alors lapossibilit&eacute; de consulter l'arbre d&eacute;riv&eacute;, l'arbre ded&eacute;rivation et les arbres &eacute;l&eacute;mentaires. Soit la<b>production est incorrecte</b>, et l'on peut encore distinguer deux cas :l'erreur est d&eacute;tect&eacute;e au cours de l'unification, ce qui signifieque c'est une erreur d'accord<a name="fnB6" href="#fn6">[7]</a>, et l'on peutdans certains cas proposer une correction et une explication. Ou bien l'erreurest syntaxique et dans ce cas on peut pr&eacute;senter &agrave; l'apprenant lesplus grandes sous-parties d'arbres correctes.<h1><A NAME="Heading17">Bibliographie</A></h1><p><p>A. Abeill&eacute; (1990) : <i>Quand l'arbre ne cache pas la for&ecirc;t,analyse du fran&ccedil;ais &agrave; l'aide d'une grammaire d'arbresadjoints</i>. In TA informations, Vol 31, ndeg.2, pp 51-70.<p>J. Aitchison (1987) : <i>Words in the mind</i>, Blackwell.<p>P. Bogaards (1994) : <i>Le vocabulaire dans l'apprentissage des langues&eacute;trang&egrave;res</i>, LAL, Credif, Hatier/Didier.<p>T. Chanier, C. Fouquer&eacute;, F. Issac (1995) : AlexiA <i>: Un environnementd'aide &agrave; l'apprentissage lexical du fran&ccedil;ais langue seconde</i>.EIAO 95, pp 79-90, Eyrolles Ed.<p>Collins (1994) : <i>Collins Cobuild, English Dictionary : Helping learners withreal english</i>. Collins, 1984-1994.<p>R. Goodfellow (1994) : <i>A computer-based strategy for foreign-languagevocabulary-learning</i>, Th&egrave;se de Doctorat, Open University, 234pages.<p>F. Issac (1994) : <i>Un algorithme d'analyse pour les grammaires d'arbresadjoints. </i>Colloque<i> </i>international sur les TAGs (TAG+3), pp. 53-56,Paris.<p>I. Mel'cuk (1992) : <i>Dictionnaire Explicatif et Combinatoire dufran&ccedil;ais contemporain. Recherche lexico-s&eacute;mantique III</i>. Lespresses de l'universit&eacute; de Montr&eacute;al.<p><p><BR><BR><BR><a name="fn0" href="#fnB0">[1]</a> Nous appellerons cooccurrence un groupe demots apparaissant fr&eacute;quemment ensemble ("verser un salaire").<p>De plus, on peut faire varier au moins un des mots sur l'axe paradigmatique("toucher", "percevoir", "recevoir un salaire" ; "toucher un salaire", "uneallocation", "des revenus").<p>Une collocation est une cooccurrence qui n'admet pas cette variation ("petitboulot" est une collocation car ni "boulot" ni "petit" ne peuvent varier;"petit travail", "petit job" ne sont pas des cooccurrences). Dans lescollocations, nous englobons les expressions semi-fig&eacute;es ("bosser commeun fou", "travailler au noir") dont le sens  ne peut &ecirc;tre d&eacute;duit&agrave; partir des mots les constituant.<p><a name="fn1" href="#fnB1">[2]</a> De 2 &agrave; 5 mots par seconde avec untaux d'erreur inf&eacute;rieur &agrave; 1 pour 1000<p><a name="fn2" href="#fnB2">[3]</a> On consid&egrave;re d'une part lafr&eacute;quence par rapport au domaine("ch&ocirc;mage" tr&egrave;sfr&eacute;quent dans notre corpus) et d'autre part la fr&eacute;quence dans lefran&ccedil;ais en g&eacute;n&eacute;ral.<p>Par ailleurs, ces indications de fr&eacute;quence ne figurent dans aucundictionnaire de fran&ccedil;ais.<p><a name="fn3" href="#fnB3">[4]</a> Lorsque l'on compte les occurrences d'uneentr&eacute;e dans un texte de mani&egrave;re automatique, on ne peut pasmalheureusement trancher entre les diff&eacute;rents sens.<p><a name="fn4" href="#fnB4">[5]</a> Un concordanceur est un programme qui, pourun mot donn&eacute;, recherche dans un texte toutes ses concordances,c'est-&agrave;-dire les phrases ou les groupes de mots dans lesquels ilappara&icirc;t.<p><a name="fn5" href="#fnB5">[6]</a>A noter que "petit boulot", en tant quecollocation, a aussi son entr&eacute;e propre. Il a le m&ecirc;me statut queles mots "simples" et poss&egrave;de les m&ecirc;mes informations (comme parexemple sa construction syntaxique)<p><a name="fn6" href="#fnB6">[7]</a>Au sens large puisque les arbres&eacute;l&eacute;mentaires poss&egrave;dent, par exemple, des traits de type<tt>humain.</tt></body></html> 
