<HTML> <!-- <!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.0 Transitional//EN" "http://www.w3.org/TR/REC-html40/loose.dtd"> --> <HEAD>  <!-- Coder: Tania Costanzo --> <!-- Document owner: IFLA HQ --> <!-- Creation date:  1999-07-27  --> <!-- Submitted by:  IFLA HQ --> <!-- Last revision date: 1999-07-27 -->  <TITLE>Approches structurelles et multilingues de l'acc&egrave;s mati&egrave;re sur le Web - 65th IFLA Council and General Conference - Conference Programme and Proceedings</TITLE> </HEAD>  <BODY BGCOLOR="#FFFFFF"> <CENTER> <TABLE BORDER="0" WIDTH="610" CELLSPACING="0"> <TR> <TD COLSPAN="3">  <!--  TOOLBAR BEGINS --> <A HREF="/index.htm"><IMG SRC="/images/ifla1.gif" WIDTH="210" HEIGHT="64" BORDER="0" ALT="IFLANET home - International Federation of Library Associations and Institutions"></A><A HREF="/IV/index.htm"><IMG SRC="/images/2levac.gif" WIDTH="187" HEIGHT="64" BORDER="0" ALT="Annual Conference"></A><A HREF="/search/search.htm"><IMG SRC="/images/search.gif" WIDTH="112" HEIGHT="64" BORDER="0" ALT="Search"></A><A HREF="/contacts.htm"><IMG SRC="/images/contacts.gif" WIDTH="82" HEIGHT="64" BORDER="0" ALT="Contacts"></A><BR> <!--  TOOLBAR ENDS -->  </TD></TR>  <TR> <TD WIDTH="195"><IMG SRC="/images/spacer.gif" WIDTH="195" HEIGHT="1" ALT="*"></TD> <TD WIDTH="10">&nbsp;</TD> <TD WIDTH="395" VALIGN="TOP">&nbsp;</TD> </TR> <TR> <TD COLSPAN="3">  <!-- DOCUMENT TITLE BEGINS  --> <a href="/IV/ifla65/65cp.htm"><IMG ALIGN=left alt="To Bangkok Conference programme" BORDER="0" SRC ="/images/banpapers.gif" hspace=5 width="116" height="150"></a><center><h1><FONT FACE=ARIAL COLOR="#007B00" SIZE="+2">65th IFLA Council and General <br>Conference</font></h1></center> <center><h1><FONT FACE=ARIAL COLOR="#007B00" SIZE="+2">Bangkok, Thailand, <br>August 20 - August 28, 1999 </FONT></h1></CENTER> <!-- DOCUMENT TITLE ENDS  -->   <!-- CONFERENCE PAPER BIBLIO DATA BEGINS --> <p> <hr size="3"> <P> <font size=-1> <b>Code Number:</b> 012-117_F <br> <b>Division Number:</b> IV <br> <b>Professional Group:</b> Classification and Indexing <br> <b>Joint Meeting with:</b> - <br> <b>Meeting Number: </b> 117 <br> <b>Simultaneous Interpretation: </b>&nbsp;  <i>No</i> <br> </font>  <h2>Approches structurelles et multilingues de l'acc&egrave;s mati&egrave;re sur le Web</h2>  <b>Lois Mai Chan</b><br><address> School of Library and Information Science, University of Kentucky<br> Lexington, Kentucky, USA </address> <p>  <b>Xia Lin</b><br><address> College of Information Science and Technology, Drexel University,<br> Philadelphia, Pennsylvania, USA </address> <p>  <b>Marcia Zeng </b><br><address> School of Library and Information Science, Kent State University<br> Kent, Ohio, USA </address> <p> <HR>  <h3>Paper</h3>  <!-- CONFERENCE PAPER BIBLIO DATA ENDS -->   <!-- DOCUMENT BEGINS  -->  <p> <H3>Introduction</H3> <p> Parmi les nombreux d&eacute;fis pos&eacute;s par la recherche et l'exploitation des ressources utiles du Web figurent le volume m&ecirc;me de ce qui est disponible, ainsi que les barri&egrave;res linguistiques. <p> Il y a un besoin pressant de m&eacute;canismes capables d'organiser les ressources du Web pour une r&eacute;cup&eacute;ration plus efficace et plus pertinente, et un besoin aussi &eacute;vident et pressant de programmes qui acceptent plusieurs langues.  <p> Dans cette pr&eacute;sentation en trois parties, nous traiterons des efforts en cours sur ces deux fronts. <p> <H3>Partie I : Approches structurelles de l'organisation des ressources du Web (Lois Mai Chan)</H3> <p> De nombreux plans de classement mati&egrave;re ont &eacute;t&eacute; mis au point pour organiser et g&eacute;rer les ressources du Web. Ils sont connus sous divers noms tels que guides par sujets, guides du Web, cat&eacute;gories de sujets, r&eacute;pertoires par sujets, hi&eacute;rarchies de sujets, etc. Beaucoup de ces syst&egrave;mes ont en commun de manifester les principes traditionnels de structure hi&eacute;rarchique, de r&eacute;partition par domaines, de subordination du sp&eacute;cifique au g&eacute;n&eacute;ral et de r&eacute;seaux de sujets associ&eacute;s. Une &eacute;tude des structures hi&eacute;rarchiques qui fonctionnent actuellement comme "organisateurs" du Web montre des variations consid&eacute;rables en ce qui concerne aussi bien la complexit&eacute; que le raffinement, en largeur aussi bien qu'en profondeur de couverture, et dans le nombres de sujets qu'ils couvrent. Ils varient &eacute;galement par le syst&egrave;me de classification sur lequel ils sont bas&eacute;s. Dans quelques cas, des essais ont &eacute;t&eacute; faits pour adapter des syst&egrave;mes existants comme la CDD, la classification de la LC, et la CDU &agrave; l'environnement Web. Diane Vizine-Goetz, dans son &eacute;tude, a montr&eacute; comment, avec les am&eacute;lioration convenables, ces syst&egrave;mes pouvaient &ecirc;tre utilis&eacute;s pour am&eacute;liorer la recherche mati&egrave;ret sur le Web (Vizine-Goetz). <p> Parmi les syst&egrave;mes qui utilisent une structure hi&eacute;rarchique pour organiser les ressources du Web figurent &nbsp;:  <p> <ol> <li>les guides par sujets con&ccedil;us par des services de recherche sur le Web bien connus comme <b><i>Yahoo!</b></i>, <b><i>Lycos</b></i>, <b><i>InfoSeek</b></i>, <b><i>Excite</b></i>, etc.<p> <li>des plans de classement con&ccedil;us par des biblioth&egrave;ques particuli&egrave;res pour faciliter l'acc&egrave;s aux ressources du Web qu'elles s&eacute;lectionnent et incluent dans leurs syst&egrave;mes locaux, et<p> <li>des organisateurs et des r&eacute;pertoires du Web bas&eacute;s sur des classifications existantes, par exemple, le Netfirst d'OCLC bas&eacute; sur la CDD, CYberStacks et Scout Report Signpost, bas&eacute;s sur la classification de la LC. </ol> <p> L'utilisation de pr&eacute;sentations hi&eacute;rarchiques ou bas&eacute;es sur des classifications pour organiser les ressources du Web pourrait pr&eacute;senter d'importants avantages, parmi lesquels une am&eacute;lioration de la navigation par sujets (browsing), un acc&egrave;s multilingue potentiel, et une interop&eacute;rabilit&eacute; am&eacute;lior&eacute;e avec d'autres services (Koch et Day). Une structure hi&eacute;rarchique peut &ecirc;tre consid&eacute;r&eacute;e comme une carte conceptuelle - soit de l'univers entier de la connaissance, soit d'un domaine particulier de celui-ci. Une telle carte trie le contenu informationnel en groupes associ&eacute;s (et en leurs sous-groupes) et permet ainsi aux utilisateurs de limiter leur approches &agrave; des zones d&eacute;termin&eacute;es o&ugrave; les documents analogues sont concentr&eacute;s.  <p> La connaissance envisag&eacute;e &agrave; travers une structure organis&eacute;e est plus facile &agrave; percevoir, et, une fois per&ccedil;ue, &agrave; comprendre. Pour l'acc&egrave;s mati&egrave;re, une structure hi&eacute;rarchique offre un chemin logique vers les objets d&eacute;sir&eacute;s. Par dessus tout, elle am&eacute;liore la pr&eacute;cision en commen&ccedil;ant par d&eacute;finir et restreindre le domaine de la recherche. Cet avantage est &eacute;vident m&ecirc;me dans les structures hi&eacute;rarchiques qui n'offrent qu'une classification large. La raison de cet avantage peut &ecirc;tre qu'une hi&eacute;rarchie, m&ecirc;me &agrave; un niveau large, exemplifie deux fonctions de la classification traditionnelle : la collocation (inclusion) et la partition (exclusion). Alors que la collocation est fond&eacute;e sur l'inclusion, propri&eacute;t&eacute; fondamentale de la classification, la partition reprend une autre de ses propri&eacute;t&eacute;s fondamentales, l'exclusion.  <p> C'est la qualit&eacute; avec laquelle une structure hi&eacute;rarchique remplit ces deux fonctions qui d&eacute;termine son utilit&eacute; potentielle dans un environnement de recherche. L'inclusion rapproche les objets et les id&eacute;es semblables. Mais dans un domaine d'information tr&egrave;s vaste, il est tout aussi important d'exclure l'information non d&eacute;sir&eacute;e que d'inclure ce qui est recherch&eacute;. L'exclusion peut &ecirc;tre op&eacute;r&eacute;e en divisant une grande quantit&eacute; d'information en parties plus petites comme moyen d'isoler la partie qui a la plus grande probabilit&eacute; d'&ecirc;tre pertinente (Chan 1995). Plus le domaine d'information est &eacute;tendu, plus il est important de trouver une m&eacute;thode efficace pour d&eacute;finir des domaines de recherche plus &eacute;troits. Une des causes principales du "bruit" est constitu&eacute;e par les homographes, c'est-&agrave;-dire par des mots qui ont la m&ecirc;me &eacute;criture mais des sens diff&eacute;rents. L'avantage de rechercher dans un domaine sp&eacute;cifique est que des termes sont souvent ambigus si l'on consid&egrave;re plusieurs disciplines, mais ont rarement des sens multiples &agrave; l'int&eacute;rieur d'une m&ecirc;me discipline ou d'un domaine particulier. <p> Il y a des avantages &agrave; utiliser la classification dans l'environnement de Web o&ugrave; r&egrave;gnent des conditions diff&eacute;rentes de celles de l'environnement imprim&eacute;. Dans les syst&egrave;mes traditionnels, les donn&eacute;es mati&egrave;re (y compris les indices de classification et les termes d'indexation) sont d'une mani&egrave;re typique <b>attach&eacute;es &agrave;</b> leur sources, soit sur les documents eux-m&ecirc;mes (cotes sur le dos d'un livre) soit sur leurs substituts (notices de catalogage ou autres enregistrements de m&eacute;tadonn&eacute;es comme le Dublin Core). En revanche, dans l'environnement du Web, ces donn&eacute;es sont souvent <b>s&eacute;par&eacute;es des</b> - ou r&eacute;sident hors des - ressources elles-m&ecirc;mes. A la place, une telle information peut &ecirc;tre stock&eacute;e dans des r&eacute;pertoires ou d'autres types d'interfaces qui relient les donn&eacute;es sujet aux ressources, mais ne les affectent pas autrement ; des liens individuels sont faits depuis les sujets pr&eacute;vus dans l'organisateur de Web aux ressources elles-m&ecirc;mes par les URL. L'avantage de " lier &agrave; " plut&ocirc;t que de " stocker avec " est la flexibilit&eacute;. Avec un syst&egrave;me de liens, si une classification ou tout autre organisation mati&egrave;re est mise &agrave; jour, c'est seulement les liens qui peuvent devoir &ecirc;tre chang&eacute;s : les pages et les sites web ne sont affect&eacute;s en aucune fa&ccedil;on. La reclassification n'est pas un probl&egrave;me. En outre, la port&eacute;e et la profondeur de n'importe quel syst&egrave;me peuvent &ecirc;tre facilement ajust&eacute;es sur la base de la garantie documentaire, qu'elle soit populaire, grand public, ou acad&eacute;mique/scientifique. Par exemple, parmi les cat&eacute;gories commun&eacute;ment trouv&eacute;es dans les guides mati&egrave;re destin&eacute;s au public figurent les automobiles, les divertissements, la famille, le sport, et les voyages, alors que les cat&eacute;gories le plus g&eacute;n&eacute;ralement trouv&eacute;es dans les guides Web acad&eacute;mique sont les sciences humaines, les sciences sociales, les sciences, la technologie, et le droit. En outre, les guides Web peuvent &eacute;galement &ecirc;tre facilement adapt&eacute;s aux besoins locaux ou r&eacute;gionaux, ou &ecirc;tre modifi&eacute;s selon les besoins d'une client&egrave;le particuli&egrave;re. <p> L'utilisation de telles structures hi&eacute;rarchiques ou classificatoires sur le Web est encore relativement nouvelle. Au fur et &agrave; mesure que les ressources web continuent &agrave; se d&eacute;velopper, on peut s'attendre &agrave; la croissance et &agrave; l'am&eacute;lioration correspondantes des mani&egrave;res de les organiser. Cependant, il n'est peut-&ecirc;tre pas trop t&ocirc;t pour envisager certaines des exigences fonctionnelles auxquelles doivent satisfaire les organisateurs du Web. <p> Les caract&eacute;ristiques souhaitables peuvent &ecirc;tre r&eacute;capitul&eacute;es comme suit ; un plan de classement con&ccedil;u pour l'organisation des ressources web devrait &ecirc;tre: (a) intuitif, logique, et facile &agrave; utiliser, avec des hi&eacute;rarchies et des renvois d'&eacute;quivalence clairement affich&eacute;s et des intitul&eacute;s usit&eacute;s et expressifs ; b) flexible, r&eacute;glable, et extensible, pour refl&eacute;ter des environnements rapidement changeants et divers ; (c) utile dans une large gamme de configurations, et applicable sur une grande partie des sites qu'il vise ; et, (d) relativement facile &agrave; mettre &agrave; jour et &agrave; r&eacute;viser. <p> La premi&egrave;re question est de savoir s'il convient d'adapter une classification existante ou s'il faut en cr&eacute;er une nouvelle. Il ressort de la situation actuelle que ceux qui con&ccedil;oivent et construisent des organisateurs du Web penchent vers des dispositifs bas&eacute;s sur leur propre compr&eacute;hension des besoins et des habitudes de recherche de leurs utilisateurs. <p> Ce qui est en cause ici est la diff&eacute;rence entre deux m&eacute;thodes pour classer le contenu par cat&eacute;gories. Les sch&eacute;mas de classification familiers repr&eacute;sentent typiquement une approche du haut vers le bas, commen&ccedil;ant par l'univers entier ou un domaine entier de la connaissance, d&eacute;terminant les classes principales sur des bases th&eacute;oriques, et les subdivisant hi&eacute;rarchiquement en niveaux de plus en plus sp&eacute;cifiques. Cette approche a &eacute;t&eacute; g&eacute;n&eacute;ralement utilis&eacute;e lorsque l'arrangement r&eacute;sultant est cr&eacute;&eacute; sur mesure pour des sp&eacute;cialistes ou lorsqu'il est con&ccedil;u avec &agrave; l'esprit une population diverse non homog&egrave;ne. L'autre approche est une op&eacute;ration du bas vers le haut qui commence par les termes ou les &eacute;l&eacute;ments sp&eacute;cifiques (pages de Web dans ce contexte) qui sont alors group&eacute;s et organis&eacute;s, d'abord en un microcosme, et finalement, &agrave; mesure que la couverture s'&eacute;tend, en macrocosme. Dans l'environnement du Web, o&ugrave; la plupart des guides par sujets ont &eacute;t&eacute; &eacute;galement con&ccedil;us avec le grand public &agrave; l'esprit, beaucoup d'efforts r&eacute;cents pour classer les ressources Web semblent utiliser la derni&egrave;re approche, ascendante. <p> La question de savoir quelle approche est susceptible de se r&eacute;v&eacute;ler plus pertinente dans l'environnement Web n'a pas de r&eacute;ponse assur&eacute;e. L'une ou l'autre approche m&egrave;ne &agrave; un syst&egrave;me qui incarne la partition en domaines, la distinction g&eacute;n&eacute;ral/sp&eacute;cifique, et un syst&egrave;me de liens entre sujets - caract&eacute;ristiques consid&eacute;r&eacute;es comme importantes pour une recherche pertinente dans une collection tr&egrave;s vaste de ressources. <p> Ce qui semble tr&egrave;s probable, c'est que le temps prouvera que les syst&egrave;mes descendants sont particuli&egrave;rement appropri&eacute;s aux domaines bien &eacute;tablis et fortement structur&eacute;s ; alors que les syst&egrave;mes ascendants, de leur c&ocirc;t&eacute;, peuvent &ecirc;tre particuli&egrave;rement adapt&eacute;s &agrave; la masse des mat&eacute;riaux divers et flottant qui constitue une si grande partie du Web. <p> Il semble probable, aussi, que l'approche ascendante fonctionne particuli&egrave;rement bien pour les organisateurs personnalis&eacute;s de Web, dont plusieurs ont &eacute;merg&eacute; ces derniers mois. Un exemple est celui des "Dossiers de recherche faits &agrave; la demande" (Custom Search Folders) de Northernlight, un dispositif qui classe en larges cat&eacute;gories les r&eacute;sultats des recherches particuli&egrave;res. <p> La deuxi&egrave;me partie de cette pr&eacute;sentation consiste en un rapport sur un projet de recherche sur le d&eacute;veloppement d'une organisation de la connaissance et d'un m&eacute;canisme d'acc&egrave;s personnalis&eacute;s.  <p> <H3>Partie II KNOWLEDGE CLASS (Xia Lin et Lois Mai Chan)</H3> <p> <b><I>But, objectifs, et caract&eacute;ristiques de Knowledge Class</b></I> <p> Le but de ce projet de recherche est de cr&eacute;er et de tester un dispositif appel&eacute; "Knowledge Class", con&ccedil;u pour personnaliser l'organisation et l'acc&egrave;s &agrave; la connaissance afin de compl&eacute;ter les dispositifs existants pour les utilisateurs du Web. <p> Dans un article largement cit&eacute;, paru dans le <i>Scientific American</i> (mars 1997), Clifford Lynch sugg&egrave;re que "la combinaison des qualifications du biblioth&eacute;caire et de l'informaticien peut aider &agrave; organiser l'anarchie de l'Internet". Dans notre projet, nous avions explor&eacute; la possibilit&eacute; de combiner des m&eacute;thodes existantes d'organisation de la connaissance avec la technologie avanc&eacute;e du Web pour cr&eacute;er un cadre facile &agrave; utiliser pour les utilisateurs individuels. <p> Des r&eacute;sultats pr&eacute;liminaires ont &eacute;t&eacute; rapport&eacute;s dans la litt&eacute;rature r&eacute;cente (Lin et Chan 1997). Dans cette pr&eacute;sentation, nous r&eacute;capitulerons bri&egrave;vement les caract&eacute;ristiques principales et rendrons compte des derniers progr&egrave;s. <p> Knowledge Class contient deux composants de base : un cadre d'organisation et une interface pour l'acc&egrave;s aux ressources du Web et leur r&eacute;cup&eacute;ration. <p> Le cadre d'organisation est un mini-th&eacute;saurus classifi&eacute;, se composant d'une collection de termes hi&eacute;rarchiquement structur&eacute;e sur un sujet ou une discipline sp&eacute;cifique int&eacute;ressant un utilisateur individuel.  L'interface sert de m&eacute;canisme interactif entre l'utilisateur et les termes dans le cadre organis&eacute; ainsi  qu'entre l'utilisateur et les ressources du Web. <p> Par ce dispositif, l'utilisateur peut lancer des recherches en choisissant les termes d'affichage ou en utilisant des strat&eacute;gies de recherche pr&eacute;enregistr&eacute;es, qui souvent contiennent des synonymes et peuvent &eacute;galement connecter aux sites pr&eacute;c&eacute;demment d&eacute;couverts en cliquant sur des liens aux URL pr&eacute;enregistr&eacute;s. <p> Dans Knowledge Class, nous essayons de retrouver certains des avantages des m&eacute;thodes traditionnelles pour une mise en m&eacute;moire et une recherche efficaces et pertinentes de l'information et de les appliquer &agrave; l'environnement du Web. <p> Sp&eacute;cifiquement, trois aspects sont consid&eacute;r&eacute;s :   <p> <ol> <li>Les principes de classification pour l'organisation de l'information et l'affichage des relations entre sujets ; <li>Les caract&eacute;ristiques du vocabulaire contr&ocirc;l&eacute;, en particulier le contr&ocirc;le des synonymes et des homographes afin d'am&eacute;liorer le taux de rappel et la pr&eacute;cision ; et,  <li>Les strat&eacute;gies de recherche formul&eacute;es et pr&eacute;enregistr&eacute;es pour optimiser les r&eacute;sultats de recherche et son actualisation. </ol> <p> Nous avons entrepris de concevoir Knowledge Class de telle mani&egrave;re qu'il : <p> <ul> <li>organise des concepts et des termes sur un sujet sp&eacute;cifique en une structure logique montrant des rapports entre les sujet ;  <li>facilite la navigation entre les termes sujets et leurs relations ;  <li>m&eacute;morise les termes et les strat&eacute;gies de recherche, de sorte qu'ils soient disponibles pour un usage futur ; <li>permette l'ajout de synonymes pour un meilleur taux de rappel et des qualificatifs afin de r&eacute;soudre les ambigu&iuml;t&eacute;s ou de distinguer parmi des homographes ;  <li>lance des recherches en utilisant des termes et des strat&eacute;gies pr&eacute;enregistr&eacute;s dans un moteur de recherche choisi ; et,  <li>m&eacute;morise les URL de sites sp&eacute;cifiques, dans l'optique d'un usage futur. </ul> <p> En d'autres termes, nous esp&eacute;rons faire franchir au service d'information une &eacute;tape de plus, au-del&agrave; de ce qui a &eacute;t&eacute; disponible jusqu'ici. Dans la recherche en ligne, l'accent a surtout &eacute;t&eacute; mis sur les r&eacute;sultats de la recherche, et cela &agrave; juste titre.  Mais, apr&egrave;s recherche, il est &eacute;galement n&eacute;cessaire d'organiser l'information en rapport, et de l'enregistrer dans un certain sens en vue d'une utilisation et d'une r&eacute;utilisation futures. Ceci peut &ecirc;tre fait en fournissant les moyens de revisiter les sites et, &eacute;galement important, en retra&ccedil;ant les &eacute;tapes employ&eacute;es pour trouver les ressources en premier lieu. <p> Am&eacute;liorer la navigation par sujets et la pr&eacute;cision des r&eacute;sultats sont nos deux buts principaux. <p> Dans la premi&egrave;re &eacute;tape de notre travail [ Lin et Chan 1997 ], nous avons pr&eacute;sent&eacute; notre dispositif analogue &agrave; un mini-th&eacute;saurus. Nous avons soulign&eacute; que : (1) une structure de la connaissance peut &ecirc;tre &eacute;tablie selon les principes de la classification et de l'organisation bibliographique ; (2) la structure de la connaissance pourrait  &ecirc;tre int&eacute;gr&eacute;e sans probl&egrave;me &agrave; des moteurs de recherche pour l'acc&egrave;s aux ressources du Web ; et, (3) une interface graphique facile &agrave; utiliser devait &ecirc;tre construite pour supporter des interactions d'utilisateur non seulement avec la structure d'organisation mais avec les ressources appropri&eacute;es d&eacute;couvertes et r&eacute;cup&eacute;r&eacute;es par des moteurs de recherche. <p> <b><I>Conception de syst&egrave;me pour Knowledge Class</b></I>  <p> Un avantage de conduire la recherche sur le Web est que des syst&egrave;mes-prototypes peuvent &ecirc;tre con&ccedil;us et test&eacute;s graduellement dans l'environnement r&eacute;el. Nous avons commenc&eacute; avec un codage HTML simple pour exp&eacute;rimenter l'id&eacute;e de Knowledge Class tel que nous l'avions initiallement envisag&eacute;e. Pendant la mise en place et les tests, nous avons sans cesse mis &agrave; jour les fonctions et lui avons ajout&eacute; de nouvelles caract&eacute;ristiques. <p> A mesure que nous en avons appris et compris davantage de ses performances, nous avons commenc&eacute; &agrave; le mettre en application dans des langages syst&egrave;me plus sophistiqu&eacute;s et plus robustes tels que JavaScript et Java.  C'est ce processus d'apprentissage par l'exp&eacute;rience qui a aid&eacute; l'&eacute;volution de Knowledge Class.  <p> <b><I>Principes de Conception</b></I> <p> D&egrave;s le d&eacute;but, nous nous sommes fix&eacute;s plusieurs buts pour la conception de Knowledge Class. <p> Le projet a commenc&eacute; par la recherche d'un dispositif ou d'un syst&egrave;me qui fournirait un &eacute;quilibre optimal entre indexation automatique et indexation manuelle en &eacute;tablissant le cadre de l'organisation.  Notre premier principe de conception &eacute;tait de maximiser les avantages &agrave; la fois de l'indexation manuelle et de l'indexation automatique. <p> Deuxi&egrave;mement, nous voulions concevoir une interface facile &agrave; utiliser pour Knowledge Class. Le syst&egrave;me devrait &ecirc;tre utilisable par, et utile &agrave; un large gamme d'utilisateurs. <p> Les biblioth&eacute;caires et les sp&eacute;cialistes de l'information peuvent vouloir cr&eacute;er des classes de connaissance pour leurs clients. Les utilisateurs peuvent vouloir employer Knowledge Class &agrave; la place des signets simples des navigateurs. Les enseignants peuvent employer des classes de connaissance pour couvrir des sujets qu'ils enseignent et les &eacute;l&egrave;ves peuvent les employer pour explorer des sujets &eacute;tudi&eacute;s en classe et pour augmenter leurs connaissances en ajoutant des termes de recherche aux classes de connaissance et en les reliant aux ressources du Web. Nous voulons que tous ces utilisateurs puissent utiliser le syst&egrave;me avec une courbe d'apprentissage minimale, <p> Troisi&egrave;mement, nous voulons que les utilisateurs n'aient pas &agrave; apprendre la syntaxe d&eacute;taill&eacute;e de la construction des requ&ecirc;tes, n'aient pas &agrave; m&eacute;moriser la page d'accueil de chaque moteur de recherche, et n'aient pas &agrave; construire des strat&eacute;gies de recherche complexes. <p> Si Knowledge Class fournit un mini-th&eacute;saurus aux utilisateurs, ce qui le rend vraiment utile est sa connexion aux moteurs de recherche. Le syst&egrave;me devait effectuer autant de travail que possible en coulisse. Il devait se connecter directement aux moteurs de recherche, ajouter automatiquement des synonymes aux requ&ecirc;tes de recherche, et fournir des strat&eacute;gies de recherche diff&eacute;rentes pour des termes diff&eacute;rents. Surtout, le syst&egrave;me devait faire tout cela d'une mani&egrave;re transparente aux utilisateurs, de sorte qu'ils puissent se concentrer sur la s&eacute;mantique et la teneur des sujets lorsqu'ils utilisent Knowledge Class.   <p> <b><I>Processus it&eacute;ratif de conception</b></I> <p> La conception de Knowledge Class est pass&eacute;e par trois &eacute;tapes. <p> Premi&egrave;rement, un cadre de base a &eacute;t&eacute; con&ccedil;u en HTML pour inclure quatre fen&ecirc;tres. <p> La premi&egrave;re fen&ecirc;tre affiche toutes les branches dans une classe de la connaissance. La deuxi&egrave;me fen&ecirc;tre est pour chaque branche dans une structure arborescente extensible/contractile, une branche seulement &eacute;tant affich&eacute;e &agrave; la fois. La troisi&egrave;me fen&ecirc;tre est la fen&ecirc;tre principale pour l'affichage des r&eacute;sultats de recherche. La quatri&egrave;me fen&ecirc;tre est pour l'affichage et le changement des moteurs de recherche. Les quatre fen&ecirc;tres sont sur une page HTML et peuvent &ecirc;tre facilement charg&eacute;es sur des navigateurs Web. <p> Dans la deuxi&egrave;me &eacute;tape, nous avons travaill&eacute; avec un groupe d'&eacute;tudiants en biblioth&eacute;conomie de l'universit&eacute; du Kentucky. Chaque &eacute;tudiant a d&eacute;velopp&eacute; une classe de la connaissance en utilisant le cadre de base que nous avions fourni. <p> Pendant cette &eacute;tape, nous avons constat&eacute; que des strat&eacute;gies de recherche diff&eacute;rentes devaient &ecirc;tre d&eacute;velopp&eacute;es pour des types de recherches diff&eacute;rents. Par exemple, certains des termes doivent &ecirc;tre recherch&eacute;s en tant qu'unitermes, d'autres seraient bien mieux recherch&eacute;s en tant qu'expressions, et d'autres encore doivent &ecirc;tre recherch&eacute;s avec des termes contextuels suppl&eacute;mentaires pris dans des niveaux plus &eacute;lev&eacute;s dans la hi&eacute;rarchie de la classe de la connaissance. <p> A travers de nombreux essais, un syst&egrave;me de codage a &eacute;t&eacute; d&eacute;velopp&eacute; pour faciliter l'attribution d'une strat&eacute;gie sp&eacute;cifique de recherche &agrave; chaque terme. <p> Une entr&eacute;e dans une classe de la connaissance ressemble typiquement &agrave; : <p> <i>--, mutual funds, mutual-funds Investment trusts Uni-trusts, http://www.brill.com, 1 (NB. "mutual funds" = aussi bien FCP que SICAV selon la terminologie US)</i> <p> Il y a cinq parties dans cette entr&eacute;e, chacune s&eacute;par&eacute;e par une virgule. Dans la premi&egrave;re, le nombre de tirets indique le niveau hi&eacute;rarchique du terme. La seconde est le terme d'affichage (ce qui appara&icirc;tra sur la structure arborescente). La troisi&egrave;me correspond aux termes de recherche, qui peuvent inclure de nombreux termes synonymes ou connexes au terme d'affichage. La quatri&egrave;me est un lien direct; s' il est pr&eacute;sent, une ic&ocirc;ne de "lien" est affich&eacute;e pour permettre &agrave; l'utilisateur de cliquer dessus pour acc&eacute;der directement &agrave; la page. La cinqui&egrave;me, nombre final dans l'entr&eacute;e, est la strat&eacute;gie de recherche sous forme cod&eacute;e.<p> La liste compl&egrave;te des strat&eacute;gies de recherche cod&eacute;es est discut&eacute;e dans Lin et Chan (1997). <p> Dans la troisi&egrave;me &eacute;tape, nous avons encore am&eacute;lior&eacute; la conception en mettant en application une version Java de Knowledge Class. <p> Dans cette version, les structures des fen&ecirc;tres ont &eacute;t&eacute; remodel&eacute;es pour faciliter le passage d'une branche &agrave; l'autre sans devoir recharger la page enti&egrave;re. Tirant profit de la puissance graphique de Java, nous avons plac&eacute; dans un cadre succinct ce qui &eacute;tait dispers&eacute; dans trois fen&ecirc;tres distinctes : toutes les branches dans une classe de la connaissance, les structures arborescentes pour chaque branche, et les moteurs de recherche de Knowledge Class. Avec l'espace d'&eacute;cran &eacute;conomis&eacute;, nous avons pu ajouter un autre niveau d'affichage - une liste de toutes les classes de la connaissance cr&eacute;&eacute;es jusqu'ici. <p> Une autre am&eacute;lioration importante de cette version est la s&eacute;paration des fichiers-programmes et des fichiers de donn&eacute;es. Dans les versions ant&eacute;rieures, le JavaScript et les entr&eacute;es du mini-th&eacute;saurus devaient &ecirc;tre inclues sur la m&ecirc;me page HTML, ce qui rendait difficile pour l'utilisateur la modification ou le changement du mini-th&eacute;saurus sans une  bonne compr&eacute;hension de JavaScript. Avec Java, la programmation est compl&egrave;tement compil&eacute;e et s&eacute;par&eacute;e des donn&eacute;es du mini-th&eacute;saurus.  L'utilisateur peut ainsi cr&eacute;er, ajouter ou modifier n'importe quels contenu et structure dans le fichier de donn&eacute;es sans aucune connaissance des programmes.  <p> <b><I>Support multilingue</b></I> <p> Tandis que nous concevions la structure de donn&eacute;es, nous avons trouv&eacute; un autre avantage &agrave; s&eacute;parer les termes d'affichage des termes de recherche. Notre id&eacute;e initiale &eacute;tait de rendre la  connexion aux moteurs de recherche plus flexible et de faciliter la construction des requ&ecirc;tes. Nous avons constat&eacute; que ce dispositif s'est av&eacute;r&eacute; particuli&egrave;rement utile pour d&eacute;velopper des classes de la connaissance multilingues. <p> Tandis qu'elle construisait une classe de la connaissance sur le Pays de Galles, une de nos &eacute;tudiantes a d&eacute;velopp&eacute; un mini-th&eacute;saurus classifi&eacute; bilingue avec des termes anglais et gallois. <p> Pour les pages affichant des termes en gallois, elle souhaitait que les recherches pussent &ecirc;tre conduites dans les deux langues. Avec la s&eacute;paration des termes d'affichage et des termes de recherche, ceci est facile &agrave; mettre en application - elle a simplement inclus des termes en anglais et en gallois dans la classe de la connaissance, et les moteurs de recherche pouvaient alors rechercher des pages  web dans les deux langues. Nos essais ont montr&eacute; qu'il s'agissait l&agrave; d'une approche tr&egrave;s pertinente pour fournir le support multilingue. <p> Un exemple d'une classe multilingue de la connaissance est Complementary & Alternative Medicine (CAM),  qui affiche la partie pour la m&eacute;decine chinoise en chinois. Nous avons d&eacute;velopp&eacute; cette branche &agrave; la fois en anglais et en chinois (GB) <i>(NB.  "(GB)"  =  GuoBiao, National Standard of the People's Republic of China)</i> et fourni des liens pour le passage de l'un &agrave; l'autre. Dans la version chinoise, chaque terme de recherche inclut des &eacute;quivalents anglais et chinois. Ainsi, pour les moteurs de recherche qui acceptent le codage chinois GB, les r&eacute;sultats de recherche incluront les pages anglaises et chinoises. <p> Nous avons trouv&eacute; cette classe de la connaissance particuli&egrave;rement utile pour les chercheurs qui ont une connaissance limit&eacute;e d'une langue particuli&egrave;re mais souhaitent pouvoir acc&eacute;der aux mat&eacute;riaux en cette langue. Par exemple, les chercheurs am&eacute;ricains en mati&egrave;re de m&eacute;decine traditionnelle chinoise ont g&eacute;n&eacute;ralement quelque connaissance du chinois, mais peuvent ne pas se sentir assez &agrave; l'aise pour naviguer ou pour &eacute;crire des requ&ecirc;tes de recherche en chinois. <p> En utilisant cette classe de la connaissance, ils peuvent naviguer dans la version anglaise, puis passer &agrave; la version chinoise pour la r&eacute;cup&eacute;ration, ou ils peuvent cliquer sur les termes anglais et cependant pouvoir r&eacute;cup&eacute;rer des ressources pertinentes en chinois. Cette caract&eacute;ristique rend l'acc&egrave;s multilingue aux ressources du Web &agrave; la fois possible et efficace. <p> Knowledge Class est un projet continu, que nous projetons de continuer &agrave; am&eacute;liorer, pour en faire un outil utile pour l'acc&egrave;s mati&egrave;re aux ressources du Web. <p> Nous croyons que, pour la recherche pertinente, les ressources du Web doivent &ecirc;tre organis&eacute;es en "unit&eacute;s d'information", et non en pages physiques individuelles. Ce qui est analogue au catalogage dans les biblioth&egrave;ques  : pour la maniabilit&eacute; et l'efficacit&eacute;, on catalogue au niveau des monographies ou des p&eacute;riodiques, pas au niveau des chapitres ou des articles. Nous construisins Knowledge Class pour faire de telles unit&eacute;s d'information. <p> A l'avenir, un "m&eacute;ga" moteur de recherche devra seulement indexer au niveau de ces "unit&eacute;s d'information". Avec ce dispositif, les utilisateurs trouveront d'abord les unit&eacute;s d'information appropri&eacute;es et acc&eacute;deront ensuite aux pages web individuelles.  <p> <b>Les plans pour le futur proche incluent :</b> <p> 1. Nous esp&eacute;rons recruter davantage de personnes pour cr&eacute;er des classes de la connaissance sur une grande vari&eacute;t&eacute; de sujets. Nous fournirons le logiciel gratuitement pour encourager la coop&eacute;ration. Nous esp&eacute;rons particuli&egrave;rement impliquer davantage de professionnels de l'information, et faire participer &agrave; leur cr&eacute;ation des biblioth&eacute;caires, des sp&eacute;cialistes en information, des &eacute;tudiants en biblioth&eacute;conomie et des membres du corps enseignant. Quand plus de personnes auront &eacute;t&eacute; impliqu&eacute;es, un Comit&eacute; consultatif pourrait &ecirc;tre form&eacute; pour conduire et r&eacute;viser le processus et pour assurer la qualit&eacute; des classes de la connaissance dans l'ensemble cr&eacute;&eacute;. <p> 2. Nous projetons de d&eacute;velopper des directives &eacute;crites &agrave; la fois pour les professionnels de l'information et pour les utilisateurs int&eacute;ress&eacute;s par ces classes de la connaissance.<p> Pour les professionnels de l'information, l'accent sera mis sur la fa&ccedil;on d'appliquer les principes et les techniques de la classification et de la recherche documentaire pour la cr&eacute;ation des classes de la connaissance, et sur la fa&ccedil;on d'adapter des strat&eacute;gies de recherche diff&eacute;rentes pour des entr&eacute;es diff&eacute;rentes. Pour les utilisateurs, l'accent sera mis sur la fa&ccedil;on de modifier une classe existante de la connaissance pour satisfaire leurs objectifs personnels. <p> 3. Nous comptons am&eacute;liorer encore plus le logiciel. Actuellement, les donn&eacute;es doivent &ecirc;tre &eacute;dit&eacute;es dans un &eacute;diteur de texte et les utilisateurs ne peuvent pas changer les strat&eacute;gies de recherche en ligne. Dans la prochaine version, l'utilisateur sera &eacute;quip&eacute; d'outils pour ajouter des termes aux entr&eacute;es dans la structure hi&eacute;rarchique, pour ajouter des synonymes &agrave; la liste de termes de recherche, et pour changer les strat&eacute;gies de recherche, etc. Un outil "auteurs" sera &eacute;galement d&eacute;velopp&eacute; de sorte que la classe compl&egrave;te de la connaissance puisse &ecirc;tre d&eacute;velopp&eacute;e et test&eacute;e dans un environnement graphique.   <p> <H3>Partie III : L'approche mati&egrave;re multilingue (Marcia Lei Zeng)</H3> <p> Le ph&eacute;nom&egrave;ne des langues multiples utilis&eacute;es pour la repr&eacute;sentation des donn&eacute;es sur le Web r&eacute;clame des moyens pour r&eacute;soudre le probl&egrave;me des utilisateurs confront&eacute;s en m&ecirc;me temps &agrave; des langages connus et inconnus d'eux. Dans le pass&eacute;, la plupart des moteurs de recherche &eacute;taient orient&eacute;s vers l'indexation des pages dans les langues d'Europe occidentale. Presque toutes les interfaces de recherche &eacute;taient en anglais et privil&eacute;giaient souvent les nouvelles ou autres &eacute;v&eacute;nements int&eacute;ressant un public am&eacute;ricain. Maintenant que les connexions Internet prolif&egrave;rent et que les Intranets envahissent les r&eacute;seaux d'entreprise, le champ des donn&eacute;es disponibles augmente radicalement. Depuis 1998, les moteurs de recherche du Web sont entr&eacute;s en concurrence &agrave; l'&eacute;chelle mondiale et locale. Le traitement multilingue a &eacute;merg&eacute; comme une question cl&eacute; dans l'&eacute;volution des technologies de ces moteurs de recherche.   <p> <b><I>Services Multilingues des principaux moteurs de recherche </b></I> <p> Pour servir les populations multilingues et multi-culturelles partout dans le monde, les principaux moteurs de recherche, tels qu'<b><i>AltaVista</b></i>, <b><i>Excite</b></i>, <b><i>HotBot</b></i>, <b><i>InfoSeek</b></i>, et <b><i>Yahoo!</b></i> ont d&eacute;velopp&eacute; de nouveaux services fonctionnant comme des guides r&eacute;gionaux de recherche, qui sont ici r&eacute;capitul&eacute;s : <p> <b>Filtrage par domaine.  </b> Habituellement chaque pays a son propre code domaine sur l'Internet, par exemple, .uk pour le Royaume-Uni. Le moyen le plus simple pour cr&eacute;er un guide &agrave; contenu r&eacute;gional est de filtrer par domaine. Les r&eacute;sultats sont g&eacute;n&eacute;ralement obtenus &agrave; partir des listes principales mais filtr&eacute;s par domaine. Les services typiques de ce genre sont <b><i>Global Excite</b></i> (qui inclut l'Australie, la Chine, la France, l'Allemagne, l'Italie, le Japon, les Pays-Bas, la Su&egrave;de et le Royaume-Uni), <b><i>InfoSeek International </b></i> (couvrant Br&eacute;sil, Danemark, Allemagne, Espagne, France, Italie, Japon, Mexique, Pays-Bas, Su&egrave;de et Royaume-Uni), et <b><i>Lycos in </b></i> (Allemagne, Royaume-Uni, France, Pays-Bas, Italie, Suisse, Belgique, Su&egrave;de, Espagne, Japon et Cor&eacute;e). <p> <b>D&eacute;tection de domaine. </b>Dans ce cas, le moteur de recherche d&eacute;tecte le pays d'origine du visiteur et pr&eacute;sente une page d'accueil personnalis&eacute;e qui est habituellement confectionn&eacute;e avec des informations sp&eacute;cifiques.  <p> <b>Sites miroir.</b> Ce sont les sites de moteurs de recherche physiquement situ&eacute;s en dehors des Etats-Unis. Ils peuvent apporter de meilleures r&eacute;ponses, puisqu'ils sont isol&eacute;s du trafic intense des Etats-Unis et des probl&egrave;mes li&eacute;s &agrave; la travers&eacute;e des oc&eacute;ans et aux longues distances. <p> <b>Recherche Sp&eacute;cifique par langue. </b> Quelques services d&eacute;passent les fronti&egrave;res nationales et visent plut&ocirc;t ceux qui parlent une m&ecirc;me langue. <b><i>AltaVista</b></i> et <b><i>Northern Light</b></i> offrent tous deux des services tels que la recherche de documents dans des langues en particulier, ce qui est diff&eacute;rent du filtrage par domaine (o&ugrave; les recherches sont limit&eacute;es &agrave; un code domaine de pays, tel que .uk) puisque l'approche est alors compl&egrave;tement bas&eacute;e sur le contenu. <b><i>AltaVista</b></i> stocke ainsi l'information des pages dans les diff&eacute;rentes langues dans un index unique, ind&eacute;pendamment des jeux de caract&egrave;res dans lesquels cette information est &eacute;crite. <p> <b>Recherche multilingue. </b> <b><i>AltaVista</b></i> propose &eacute;galement une recherche multilingue &agrave; travers sa technologie "One World" qui vise particuli&egrave;rement ceux qui parlent des langues asiatiques. Fondamentalement, <b><i>AltaVista</b></i> traduit toute page trouv&eacute;e en Unicode, code capable de stocker les caract&egrave;res de toutes les langues. Et le chercheur peut demander la traduction d'une requ&ecirc;te, ou d'une page web enti&egrave;re, &agrave; partir de la langue ou vers la langue qu'il souhaite utiliser pour la recherche ou la lecture.  <p> <b>Interfaces r&eacute;gionales.</b> Cr&eacute;er une interface r&eacute;gionale peut revenir simplement &agrave; pr&eacute;senter le m&ecirc;me moteur de recherche dans la langue appropri&eacute;e pour un pays particulier. Il y a plusieurs fa&ccedil;ons de fournir ce service. Dans le cas des r&eacute;pertoires mati&egrave;re, les utilisateurs peuvent parfois voir une page compl&egrave;tement traduite de l'anglais, sans le moindre changement dans le contenu ou l'ordre des cat&eacute;gories. Dans d'autres cas, les utilisateurs peuvent voir un affichage bilingue du r&eacute;pertoire, par exemple un r&eacute;pertoire mati&egrave;re &agrave; la fois en anglais et en japonais. Afficher un r&eacute;pertoire bas&eacute; sur le texte japonais exigerait qu'un jeu de codes des caract&egrave;res locaux soit charg&eacute; dans une machine de site client. Afin d'&eacute;viter une telle contrainte, certains r&eacute;pertoires fournissent un affichage bas&eacute; sur l'image graphique. Les interfaces r&eacute;gionales peuvent aussi avoir diff&eacute;rents contenus et affichages. <p> <b>R&eacute;pertoires mati&egrave;re localis&eacute;s. </b>  Au lieu d'&ecirc;tre un ensemble d'interfaces r&eacute;gionales simples produits de versions translitt&eacute;r&eacute;es ou traduites d'un r&eacute;pertoire global ou d'une version am&eacute;ricaine d'un r&eacute;pertoire mati&egrave;re, les r&eacute;pertoires localis&eacute;s sont des versions adapt&eacute;es qui refl&egrave;tent les int&eacute;r&ecirc;ts locaux. Ces r&eacute;pertoires sont r&eacute;alis&eacute;s en utilisant les langues locales pour le r&eacute;pertoire entier, en d&eacute;finissant et en nommant les cat&eacute;gories sur la base d'une convention locale, en pr&eacute;sentant ces cat&eacute;gories selon les int&eacute;r&ecirc;ts locaux et en incluant les cat&eacute;gories qui rassemblent les centres d'int&eacute;r&ecirc;t locaux. <b><i> World Yahoo!</b></i> propose ainsi 19 versions de son r&eacute;pertoire, couvrant les Am&eacute;riques, le Pacifique, et l'Europe. <p> <b><I>Les r&eacute;pertoires mati&egrave;re du Web dans un environnement multilingue</b></I> <p> En introduction &agrave; cet article, Prof. Chan a fait l'inventaire des principaux points &agrave; consid&eacute;rer pour concevoir un organisateur de Web utile : &eacute;tendue des th&egrave;mes et profondeur de la hi&eacute;rarchie, d&eacute;finition et appellation des cat&eacute;gories, structure logique, facettes clairement d&eacute;finies, ordre des citations, classification inverse, index alphab&eacute;tique, terminologie des intitul&eacute;s, et indices. <p> Parmi les moteurs de recherche bien connus et les r&eacute;pertoires mati&egrave;re du Web, <b><i>Yahoo!</b></i> a &eacute;t&eacute; le premier des organisateurs du Web, et a appliqu&eacute; avec succ&egrave;s la structure de classification &agrave; son service tout entier. Il y a un an environ, d'autres grands moteurs de recherche ont aussi adopt&eacute; la m&eacute;thodologie du r&eacute;pertoire mati&egrave;re en utilisant leur structure de " classification populaire". <p> Une analyse de ces services sur les bases des points soulign&eacute;s par Lois Chan a montr&eacute; qu'ils utilisent des approches diverses. Cette partie de l'article discutera certaines caract&eacute;ristiques <b>li&eacute;es</b> aux services multilingues de quelques moteurs de recherche. La plupart des exemples proviennent du r&eacute;pertoire mati&egrave;re World <b><i>Yahoo!</b></i> et ont &eacute;t&eacute; recherch&eacute;s le 12 f&eacute;vrier 1999. En fait, plusieurs des ph&eacute;nom&egrave;nes trouv&eacute;s et ici discut&eacute;s existent &eacute;galement dans les services d'autres moteurs de recherche, tel le r&eacute;pertoire par sujets de <b><i>Northern Light </b></i>et les les cat&eacute;gories principales d'<b><i>InfoSeek</b></i>. <p> <b>1. Agencement alphab&eacute;tique des cat&eacute;gories </b> <p> <b><i>World Yahoo!</b></i> propose pr&egrave;s de 20 versions de son r&eacute;pertoire unique pour diff&eacute;rents pays et r&eacute;gions partout dans le monde. Le r&eacute;pertoire divise toutes les ressources du Web en 14 cat&eacute; gories principales et a pratiquement inclus tous les th&egrave;mes. Certain noms/intitul&eacute;s et traitements des r&eacute;pertoires principaux dans les versions non anglaises (par exemple <b><i>Yahoo! France</b></i>) peuvent diff&eacute;rer de ceux de la version globale (&eacute;galement connue sous le nom de version US). Parce que la classification <b><i>Yahoo!</b></i> n'utilise aucun indice, l'ordre alphab&eacute;tique devient l'organisation naturelle et unique de toutes les cat&eacute;gories et de leurs sous-cat&eacute;gories. Aucun ordre syst&eacute;matique ou logique des cat&eacute;gories n'est appliqu&eacute; Un processus complet de navigation est toujours n&eacute;cessaire pour localiser un sujet particulier sur <b><i>Yahoo!</b></i>  <p> Cela cause in&eacute;vitablement une incoh&eacute;rence de l'ordre des cat&eacute;gories &agrave; travers les diff&eacute;rentes versions du r&eacute;pertoire qui ne sont pas en anglais. En d'autres termes, bien que tous les r&eacute;pertoires r&eacute;gionaux aient les m&ecirc;mes 14 cat&eacute;gories principales, les versions espagnole, fran&ccedil;aise, italienne et allemande auront un ordre diff&eacute;rent pour ces cat&eacute;gories, selon leurs propres alphabets. Pour les langues en caract&egrave;res non romain, tel le chinois par exemple, il semble y avoir des syst&egrave;mes diff&eacute;rents d'organisation : non alphab&eacute;tiques, mais pas syst&eacute;matiques non plus.    <p> <b>2. Mise en oeuvre du principe de garantie documentaire </b>  <p> Fondamentalement, les r&eacute;pertoires mati&egrave;re du Web suivent le principe de garantie documentaire. La profondeur des hi&eacute;rarchies y d&eacute;pend de la quantit&eacute; des sources d'information web dans un domaine particulier. <b><i>Yahoo!</b></i> peut ainsi subdiviser des sous-cat&eacute;gories en trois niveaux hi&eacute;rarchiques (par ex : "Arts : Design Arts : Color Theory" <i>(NB.  sur <b><i>Yahoo! France</b></i> =  "Arts et culture : Arts graphiques : Th&eacute;orie de la couleur")</i> ou en neuf niveaux (par ex. : "Business and Economy : Companies : Computers : Software : Internet: World Wide Web : HTML Editors : MS Windows : HTML Assistant" <i>(sur <b><i>Yahoo! France</b></i> = "Commerce et &eacute;conomie : Soci&eacute;t&eacute;s : Informatique : Logiciels : Internet : World Wide Web : Editeurs HTML ",  la hi&eacute;rarchie n'allant pas plus loin.)</i> <p> La garantie documentaire conduit aussi aux d&eacute;cisions concernant l'inclusion et l'exclusion des sous-cat&eacute;gories dans un domaine. Quand il utilise les r&eacute;pertoires r&eacute;gionaux de <b><i>Yahoo!</b></i>, l'utilisateur peut limiter les r&eacute;sultats &agrave; une seule r&eacute;gion s&eacute;lectionn&eacute;e. Par exemple, en utilisant <b><i>Yahoo! UK&Ireland </b></i>, on peut demander qu'une recherche soit limit&eacute;e au Royaume-Uni seulement. Il est courant, &agrave; ce stade, de constater une diff&eacute;rence dans la profondeur des hi&eacute;rarchies et un nombre diff&eacute;rent de sous-cat&eacute;gories dans le r&eacute;sultat final, parce que c'est la situation pratique des sites web dans cette r&eacute;gion qui en d&eacute;cide. (Cf. les affichages sous "Religions : Faiths and Practices" dans les diff&eacute;rents r&eacute;pertoires r&eacute;gionaux de <b><i>Yahoo!</b></i>) Les domaines concernant la culture, la soci&eacute;t&eacute;, les syst&egrave;mes politiques et juridiques, les affaires, la sant&eacute;, etc. repr&eacute;sentent le traitement le plus dynamique guid&eacute; par le principe de garantie documentaire.   <p> <b>3. Flexibilit&eacute; dans la prise en compte des int&eacute;r&ecirc;ts locaux</b> <p> Tout en essayant de conserver une structure de classification unique et normalis&eacute;e, les r&eacute;pertoires mati&egrave;re du Web ont aussi montr&eacute; beaucoup de moyens possibles pour refl&eacute;ter les int&eacute;r&ecirc;ts locaux. Tout d'abord, des cat&eacute;gories principales particuli&egrave;res peuvent &ecirc;tre pr&eacute;sent&eacute;es en position significative si n&eacute;cessaire. Habituellement, toutes les cat&eacute;gories principales sont en effet affich&eacute;es selon l'ordre alphab&eacute;tique et non selon un ordre logique. Mais c'est cependant sans surprise que, pendant la p&eacute;riode de la Coupe du monde de football (&eacute;t&eacute; 1998), <b><i>Yahoo! France</b></i> a d&eacute;plac&eacute; la cat&eacute;gorie "Sport" vers le premier rang, accordant ainsi &agrave; l'&eacute;v&eacute;nement un emplacement tr&egrave;s significatif. <p> En second lieu, les sous-cat&eacute;gories affich&eacute;es sous chaque cat&eacute;gorie principale changent d'un pays &agrave; l'autre et de temps en temps. (Voyez les diff&eacute;rences dans l'affichage des sous-cat&eacute;gories de "Arts & Humanities" selon les r&eacute;pertoires r&eacute;gionaux de <b><i>Yahoo!</b></i>) Par exemple, sous la cat&eacute;gorie "Arts et sciences humaines", les r&eacute;pertoires r&eacute;gionaux ont donn&eacute; la priorit&eacute; &agrave; des sous-cat&eacute;gories &agrave; afficher &agrave; des endroits significatifs. Ces sous-cat&eacute;gories ont &eacute;t&eacute; choisies parmi des douzaines dans la classification. Les choix changent en fonction des services r&eacute;gionaux. Il est important de noter que les sous-cat&eacute;gories &eacute;num&eacute;r&eacute;es sous les cat&eacute;gories principales peuvent ne pas &ecirc;tre leurs subordonn&eacute;s imm&eacute;diats. (Voyez les exemples de "Mode", "Litt&eacute;rature", "Photographie" dans les diff&eacute;rents r&eacute;pertoires r&eacute;gionaux de <b><i>Yahoo!</b></i>) La priorit&eacute; accord&eacute;e &agrave; ces "petits-enfants", subordonn&eacute;s du dernier niveau, refl&egrave;te l'importance des int&eacute;r&ecirc;ts locaux et indique la flexibilit&eacute; avec laquelle des niveaux hi&eacute;rarchiques et rapports d'appartenance peuvent &ecirc;tre cass&eacute;s quand un sujet est plus important que sa position logique dans une structure de classification.  <p> Un autre ph&eacute;nom&egrave;ne int&eacute;ressant &agrave; noter est le traitement des noms/intitul&eacute;s d'une cat&eacute;gorie. (Voyez les sous-cat&eacute;gories affich&eacute;es sous "Business & Economy" dans les diff&eacute;rents r&eacute;pertoires r&eacute;gionaux de <b><i>Yahoo!</b></i>) Il serait &eacute;galement tr&egrave;s int&eacute;ressant d'observer comment les intitul&eacute;s sont trait&eacute;s. Dans la pr&eacute;sentation formelle de la cat&eacute;gorie sous "Business & Economy", "Employment" est pr&eacute;f&eacute;r&eacute; &agrave; "Jobs", et on utilise "Finance and Investment" au lieu de "Finance" ou de "Investment". Un examen du r&eacute;pertoire pr&eacute;sente beaucoup d'exemples semblables. Ceci signifie que la liste des sous-cat&eacute;gories choisies pour la page principale ne suit pas une r&egrave;gle stricte pour les afficher selon leur nom ou intitul&eacute; "officiel". <p> Troisi&egrave;mement, dans les r&eacute;pertoires mati&egrave;re du Web, il y a beaucoup de traitements de classification inverse. Par exemple, "Taxes" est list&eacute; sous 93 cat&eacute;gories dans <b><i>Yahoo!</b></i>, 122 cat&eacute;gorie si l'on cherche dans les sites "Canada seulement", 5 dans "UK seulement", 2 dans "Australie seulement", un dans "Singapour", et z&eacute;ro dans "HongKong seulement". Savoir si les imp&ocirc;ts sont un sujet d'un int&eacute;r&ecirc;t local important peut &ecirc;tre d&eacute;termin&eacute; &agrave; partir de sa liste sous les cat&eacute;gories principales. Dans l'exemple ci-dessus, "Taxes" appara&icirc;t &agrave; un endroit significatif sous la rubrique "Business & Economy" du r&eacute;pertoire <b><i>Yahoo! UK&Ireland</b></i>. Il est &eacute;galement list&eacute; sous la cat&eacute;gorie "Government" dans le r&eacute;pertoire "USA-oriented <b><i>Yahoo!</b></i>", au m&ecirc;me titre que "Military", "Politics" et "Law", ce qui indique l'importance de cette question au sein des activit&eacute;s courantes du gouvernement des Etats-Unis.  <p> <i>NB.  En guise de test multilingue, la fin de cette traduction a directement &eacute;t&eacute; faite gr&acirc;ce au service de traduction en ligne offert par <b><i>AltaVista</b></i>. Bonne lecture et vive le multilinguisme</i> <p> <a href="http://babelfish.AltaVista.com/cgi-bin/translate?">http://babelfish.AltaVista.com/cgi-bin/translate?</a>   <p> <b>4. Limitations des dispositifs de recherche d&eacute;pendants du langage</b> <p> Except&eacute; <b><i>Yahoo!</b></i>, ce qui re&ccedil;oit des soumissions par des cr&eacute;ateurs de webpage et ce qui a son personnel pour &eacute;valuer les descriptions des websites manuellement, la plupart des moteurs de recherche utilisent un traitement automatique d&eacute;pendant du langage des websites pour ranger ou grouper des ressources bas&eacute;es sur des &eacute;tiquettes de m&eacute;ta (telles que  des limites soumises, les mots-cl&eacute;s, r&eacute;sum&eacute;s &eacute;tiquette dans l'&eacute;l&eacute;ment), des titres de page et des fr&eacute;quences de mot. <p> La limitation de telles peser automatique et approches groupantes dans un environnement de non-English est &eacute;vidente. Les webpages de Non-English peuvent fournir le metadata et le titre en anglais, mais la recherche et l'affichage bas&eacute; sur ces &eacute;l&eacute;ments auront comme cons&eacute;quence des documents de non-English &eacute;tant m&eacute;lang&eacute;s aux documents anglais.  Dans la plupart des cas, sans installer les codes de caract&egrave;re, un web browser ne permettra pas lire par exemple les caract&egrave;res asiatiques est. Par cons&eacute;quent, un tel affichage des langages m&eacute;lang&eacute;s perd seulement le temps d'un utilisateur puisqu'aucune teneur de ces liens ne pourrait &ecirc;tre lue ou comprise.  <p> En outre, beaucoup de moteurs de recherche utilisent la fr&eacute;quence de mot comme param&egrave;tre important dans l'identification et classifier automatiques du contenu de webpage.  <p> <b><i>AltaVista</b></i> " raffinent " la th&eacute;orie groupante automatique d'utilisations de dispositif bas&eacute;e sur l'Co-occurrence de mot. En analysant les mots qui Co-se produisent avec les mots recherch&eacute;s dans un document, des documents sont automatiquement group&eacute;s. Les r&eacute;sultats sont affich&eacute;s par une liste montrant des limites group&eacute;es selon le compte d'Co-occurrence, ou comme carte montrant des limites et leurs rapports. Un utilisateur peut plus loin raffiner une strat&eacute;gie de recherche en incluant ou en excluant les groupes particuliers de mots de sorte qu'une pr&eacute;cision plus &eacute;lev&eacute;e de recherche puisse &ecirc;tre r&eacute;alis&eacute;e. Cependant, ce dispositif est imit&eacute; aux documents dans langages anglais et quelques occidentaux; par exemple pour le chinois, bien qu'<b><i>AltaVista</b></i> permette la recherche sp&eacute;cifique &agrave; une langue, il s'applique seulement aux requ&ecirc;tes simples de base de forme, pas au prochain ' raffinent ' l'&eacute;tape.  <p> La <b><i>lumi&egrave;re nordique</i></b> fournit un dispositif connu sous le nom de " chemises faites sur commande de recherche " pour des strat&eacute;gies de recherche de raffinage. Le service r&eacute;clame que ses chemises ne sont pas pr&eacute;-&eacute;tablies, un-taille-adapter-tout, comme d'autres r&eacute;pertoires de Web. <p> Plut&ocirc;t, chaque fois une recherche a ex&eacute;cut&eacute; sur la <b><i>lumi&egrave;re nordique</i></b>, il cr&eacute;e une s&eacute;rie de chemises faites sur commande de recherche bas&eacute;es sur la recherche individuelle. Un utilisateur peut choisir les sujets, les types, les sources, et les langages qu'il veut l'explorer. Bas&eacute; sur le nombre de documents dans chaque chemise et leur pertinence avec une requ&ecirc;te, le Search Engine d&eacute;termine et sugg&egrave;re quelles chemises faites sur commande de recherche seront les plus utiles &agrave; un utilisateur. N&eacute;anmoins, seulement cinq langages occidentaux sont servis actuellement.   <p> <H3>Conclusion</H3> <p> La route vers un acc&egrave;s soumis interlinguistique enti&egrave;rement fonctionnel est optimiste et sophistiqu&eacute;e. Beaucoup d'autres questions techniques aussi bien que les issues sociales et culturelles doivent &eacute;galement &ecirc;tre abord&eacute;es; celles-ci incluent le support de codage de caract&egrave;re, la traduction linguistique d'interface utilisateur, support des formats de donn&eacute;es culture-sp&eacute;cifiques (date, devise, etc.), modification graphique d'interface utilisateur (couleur, images), support &eacute;tranger de produits (par exemple bases de donn&eacute;es), et compatibilit&eacute; de syst&egrave;me d'exploitation. En r&eacute;sum&eacute;, il y a eu un besoin croissant des m&eacute;canismes pertinents d'organiser des ressources de Web pour l'exploration, la d&eacute;couverte, et la recherche. L'approche multilingue pour soumettre l'acc&egrave;s, comme d&eacute;montr&eacute; par les moteurs principaux de recherche de Web et les r&eacute;pertoires soumis, a explor&eacute; de diverses voies de mettre en application la structure hi&eacute;rarchique ou classificatory. Ces nouveaux services ont &eacute;galement autre progress&eacute; au del&agrave; des conventions de la classification traditionnelle. Ayant l'avantage d'enregistrer une classification en dehors des ressources ou de leurs substituts, ces services Web-web-based peuvent &ecirc;tre tr&egrave;s flexibles en arrangeant et en affichant des cat&eacute;gories et leurs int&eacute;r&ecirc;ts locaux de rapports, et de se refl&eacute;ter dans un r&eacute;pertoire soumis. Le principe de la garantie litt&eacute;raire est enti&egrave;rement fonctionnel dans les pratiques des r&eacute;pertoires de sujet de Web. Il restent beaucoup de limites quand la structure soumise de classification et les m&eacute;thodologies groupantes automatiques sont utilis&eacute;es dans le traitement multilingue. Comment assurer le globalization et la localisation dans un environnement de croix-langage et de croix-culture en m&ecirc;me temps? La question demeure sans r&eacute;ponse par les technologies et les th&eacute;ories disponibles."" <p> <H3>R&eacute;f&eacute;rences</H3> <p> Batty, David.  (1998)  WWW -- wealth, weariness or waste: controlled vocabulary and thesauri in support                                                                                                    <p> of online information access. D-Lib Magazine (<a href="http://www.dlib.org/dlib/november98/11batty.html">http://www.dlib.org/dlib/november98/11batty.html</a>).<p> Chan, Lois Mai. (1995). Classification, present and future.  Cataloging & Classification Quarterly, 21(2),  5-17.<p> Koch, Traugott, Michael Day, and others. The role of classification schemes in Internet resource 	description and discovery.  ({hyperlink <a href="http://www.ukoln.ac.uk/metadata/desire/classification/">http://www.ukoln.ac.uk/metadata/desire/classification/</a>)} <p> Lester, Dan. (December 1995). Profile of a Web database," Database 46-50 <p> Lin, X. & Chan, L. M. (1997).  Knowledge Class - A dynamic structure for subject access on the web.  Proceedings of the 8th ASIS SIG/CR Classification Research Workshop. (November 1,  Washington, D.C.).  pp. 31-40. <p> Lynch, Clifford Lynch.  (1997).  Searching the Internet.  Scientific American 276(3), 52-56.	<p> Search engine watch.  Compiled by Danny Sullivan.  Retrieved February 12, 1999 from the World Wide Web: {hyperlink <a href="http://searchenginewatch.com/">http://searchenginewatch.com/</a> } <p> Vizine-Goetz, Diane.  Using library classification schemes for Internet resources<p> (<a href="http://www.oclc.org/oclc/man/colloq/v-g.htm">http://www.oclc.org/oclc/man/colloq/v-g.htm</a>) <p>   <!-- DOCUMENT ENDS  --> <P> </TD></TR>  <TR> <TD WIDTH="195"><IMG SRC="/images/spacer.gif" WIDTH="195" HEIGHT="1" ALT="*"></TD> <TD WIDTH="10">&nbsp;</TD> <TD WIDTH="395" VALIGN="TOP">&nbsp;</TD> </TR>  <TR> <TD COLSPAN="3"> <HR> </TD></TR> <TR> <TD VALIGN="TOP"> <!-- FOOTER BEGINS  --> <FONT SIZE="-1"><b>Latest&nbsp;Revision:&nbsp;</b><i>July&nbsp;27,&nbsp;1999</i></FONT> </TD> <TD COLSPAN="2" VALIGN="TOP" ALIGN="RIGHT"> <font size="-1"> Copyright &#169; 1995-2000 <BR>International&nbsp;Federation&nbsp;of&nbsp;Library&nbsp;Associations&nbsp;and&nbsp;Institutions<BR> www.ifla.org</font> <!-- FOOTER ENDS  --> </TD></TR></TABLE>  </CENTER> </BODY> </HTML> 
