<html>  <head> <meta http-equiv="Content-Type" content="text/html; charset=windows-1252"> <meta name="GENERATOR" content="Microsoft FrontPage 4.0"> <meta name="ProgId" content="FrontPage.Editor.Document"> <title>TALN</title> </head>  <body bgcolor="#FFCC99"> <a name = "tp1" /a> <p align="center"><font color="#800000"><u><b>TALN/Traitement automatique des langues</b></u></font></a></p>  <p align="center">&nbsp;</p> <p align="left"><b><font color="#800000">TP1</font></b> </p> <p align="left"><font color="#800000"><b>Objectifs :</b></font></p> <blockquote>   <p align="left">Developper un programme qui lit un texte (<a href="http://www.latl.unige.ch/info3/tp1.txt"> telecharger ici</a>   -<font color="#FF0000">fichier encod</font>-) et   constitue une table de frquences de tous les mots de ce texte. Le programme   doit produire :&nbsp;&nbsp;&nbsp; </p>   <p align="left">- une liste alphabetique des mots avec indication du nombre   d'occurrences.</p>   <p align="left">- une liste des mots classs par nombre d'occurrences, en   ordre croissant</p>   <p align="left">- pour un mot donn, indiquer son nombre d'occurences.</p>   <p align="left">Facultativement, on calculera </p>   <p align="left">- le nombre total de mots</p>   <p align="left">- le nombre de mot orthographiquement distincts</p>   <p align="left">- une table illustrant la distribution des mots par nombre   d'occurrences (combien de mots ont un nombre <b>n </b>d'occurrences, pour   toutes les valeurs de <b>n</b> entre 1 et le nombre maximum d'occurrences pour   le texte donn.</p> </blockquote>  <p align="left"><font color="#800000"><b>Methode :</b></font></p> <p align="left">&nbsp;&nbsp; &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Lire le texte, mot  mot, &quot;nettoyer&quot; les mots en eliminant les eventuels signes de ponctuations aux deux extremits, insrer les mots dans un arbre binaire alphabetiquement avec compteur d'occurences. Etablir un deuxieme arbre en utilisant le nombre d'occurrences des mots comme critre d'organisation.&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; </p>  </body>  </html> 
