<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.0 Transitional//EN"             "http://www.w3.org/TR/REC-html40/loose.dtd"> <HTML> <HEAD> <META http-equiv="Content-Type" content="text/html; charset=ISO-8859-1"> <META name="GENERATOR" content="hevea 1.05"> <TITLE>  Tests d'interface homme--ordinateur avec le BioNetbook </TITLE> </HEAD> <BODY > <A HREF="html-b6n13002.html"><IMG SRC ="previous_motif.gif" ALT="Prcdent"></A> <A HREF="index.html"><IMG SRC ="contents_motif.gif" ALT="Index"></A> <A HREF="html-b6n13004.html"><IMG SRC ="next_motif.gif" ALT="Suivant"></A> <HR>  <H2><FONT SIZE=5><FONT COLOR=purple>Tests d'interface homme--ordinateur avec le </FONT></FONT><FONT SIZE=5><FONT COLOR=purple><EM>BioNetbook</EM></FONT></FONT></H2><UL> <LI><A HREF="html-b6n13003.html#toc8"> Description du BioNetbook</A> <LI><A HREF="html-b6n13003.html#toc9"> Sances de tests</A> <LI><A HREF="html-b6n13003.html#toc10"> Rsultats</A> <LI><A HREF="html-b6n13003.html#toc11"> Manipulation des rsultats, affinement de la recherche</A> <LI><A HREF="html-b6n13003.html#toc12"> Terme de recherche, troncature, langue d'interrogation</A> <LI><A HREF="html-b6n13003.html#toc13"> lments obscurs dans l'interface, termes techniques mal compris, suggestions d'amliorations diverses</A> <LI><A HREF="html-b6n13003.html#toc14"> Remarques diverses</A> <LI><A HREF="html-b6n13003.html#toc15"> Rsultats des amliorations de l'interface Web</A> <LI><A HREF="html-b6n13003.html#toc16"> Conclusion</A> </UL> <A NAME="art:bnb"></A>[RE,LO]<I>BioNetbook</I> [RO,LE]<BR> <BR> Cet article dcrit les les rsultats de tests effectus sur l'interface Web du <EM>BioNetbook</EM> au cours du mois de  janvier 2000. Ces tests ont t raliss avec 6 biologistes sur  les terminaux X du Service d'Informatique  Scientifique<A NAME="text1" HREF="html-b6n13008.html#note1"><SUP><FONT SIZE=2>1</FONT></SUP></A>.<BR> <BR> <A NAME="toc8"></A> <H3>Description du BioNetbook</H3> Le BioNetbook est une base d'adresses de pages Web concernant  la biologie (le nom vient de <EM>notebook</EM> qui veut dire carnet  d'adresses, <EM>net</EM> pour Internet et <EM>bio</EM> pour biologie). Sa  premire version consistait en une dizaine de pages HTML  accessibles  partir d'une page de menu intitule <EM>Biologie  Molculaire sur le Web</EM>. Cette version a t compltement  remanie voici deux ans (Irne Wang, Catherine Letondal) pour  transformer ces pages en base de donnes relationnelle. Cette base d'adresses contient  l'heure actuelle plus de  3&nbsp;800 rfrences classes selon diffrents critres (type de  ressource, espce ou organisme et domaine biologique).  Elle est galement interrogeable par mot. <BR> <BR> La base est rgulirement mise  jour et les nouvelles entres sont  consultables par le bouton <EM>Ajouts rcents</EM> de l'interface Web. <BR> <BR> Une notice d'aide  <A HREF="http://www.pasteur.fr/recherche/BNB/francais/guide.html"><TT>http://www.pasteur.fr/recherche/BNB/francais/guide.html</TT></A>  explique comment utiliser l'interface Web et donne de  nombreux exemples d'interrogations.<BR> <BR> <A HREF="http://www.pasteur.fr/recherche/BNB/"><TT>http://www.pasteur.fr/recherche/BNB/</TT></A> <BR> <BR> <A NAME="toc9"></A> <H3>Sances de tests</H3> Ces sances avaient pour but d'amliorer la lisibilit de l'interface Web (et non de refaire toute la conception), c'est--dire de faire en sorte que des biologistes, censs connatre les bases de Netscape, de l'Internet et ce qu'est un outil de recherche de mots, puissent comprendre le fonctionnement du formulaire. Il ne s'agit pas du tout de faire croire  quiconque que la recherche d'informations constitue une tche facile, mais simplement de supprimer ce qu'on appelle la complexit accidentelle, due  des erreurs de conception de l'interface (exemple bien connu ici : depuis qu'il y a des formulaires pour lancer les programmes de biologie, comme ces formulaires suppriment pour une grande part la complexit sans intrt de leurs interfaces originales, la complexit intressante des logiciels devient plus accessible).<BR> <BR> Plus concrtement, l'objectif est de mesurer la distance qu'il y a entre ce qu'est l'application et la manire dont elle est perue par l'utilisateur. Pour le savoir, la mthode consiste   faire parler  des personnes devant l'interface, et pour cela, le mieux est de les mettre  deux, chaque personne ayant une consigne  --- non absolue --- comme par exemple : l'un donne des indications d'actions  suivre, tandis que l'autre raconte ce qu'il voit. Il y a des variantes en fonction du fait qu'une des personnes connat dj ou non l'application, etc... L'utilisation de l'interface commence en gnral avec une requte qui correspond au thme de travail d'une des deux personnes. Un court entretien pralable permet de dterminer des thmes qu'on peut suggrer comme exemple pour dmarrer.  Exemples : <UL> <LI>  recherche d'outils de calcul du point isolectrique d'une 	protine ;  <LI> recherche de pages sur la vido-microscopie ;  <LI> donnes sur les structures transmembranaires ;  <LI> recherche d'informations sur traitement de la leucmie chez  	l'homme ;  <LI> pages sur Listeria. </UL><A NAME="toc10"></A> <H3>Rsultats</H3> <H4>Quelles donnes contient cette base,  quelles recherches peut-on faire ?</H4>La dcouverte la plus surprenante a t qu'en arrivant devant le formulaire, on pouvait croire qu'il s'agissait d'une base de donnes d'<EM>informations scientifiques</EM> : motifs de protines, squences d'ADN, articles scientifiques, etc... C'est ce qui explique des requtes trs spcifiques comme :  osmotic ,  DT40 ,  gallus-gallus ,  TmHR3 tenebrio ,  Cre/lox , ... Cela est d en partie certainement  une mconnaissance des moteurs de recherche --- bien que ces mots donnent des rsultats sur le moteur d'<EM>Expasy</EM> (voir par exemple, <EM>BioHunt</EM>, un excellent moteur de recherche pour la biologie : <A HREF="http://www.expasy.ch/BioHunt/"><TT>http://www.expasy.ch/BioHunt/</TT></A> ) --- ou bien  la confusion entre base d'informations scientifiques et <EM>rpertoire d'adresses</EM>. Mais surtout au fait que rien dans la page du BioNetbook n'indiquait de quoi il s'agissait : une base de donnes de pages Web. Un titre a donc t ajout pour l'indiquer.<BR> <BR>  <H4>Le formulaire n'est pas toujours celui qu'on croit</H4>La deuxime dcouverte un peu surprenante a t que la notice d'aide tait perue et donc utilise comme un formulaire. Premire remarque donc, la notice d'aide est vue ! Mais l'explication est que les biologistes sont habitus aux formulaires de recherche bibliographique et aux interfaces de recherche dans les banques de SRS, du NCBI et que dans ces formulaires, on accde souvent  la liste des valeurs, ou termes valides, en cliquant sur le nom du champ. Donc cliquer sur <EM>Types de ressources</EM> dans le formulaire du BioNetbook aurait d conduire  la liste des termes possibles. C'tait le cas dans la notice, d'autant plus que les termes taient cliquables... mais pas tous ! J'ai donc eu cette rflexion :  ah l ce n'est pas un lien (par exemple la ligne "mdecine" dans "domaine biologique"), donc a veut dire qu'il n'y a rien dans la base sur ce sujet . Deux types de solutions : soit supprimer tous les liens de la notice, soit faire en sorte qu'elle constitue un vrai formulaire. C'et t dommage  tout de mme d'enlever les exemples cliquables de la page d'aide : on en a simplement mis plus, en mettant souvent le mot <EM>exemple</EM> et en mentionnant comment retourner au formulaire. <BR> <BR>  <H4>Des requtes surcharges, trop prcises</H4>Le troisime gros problme --- qui tait en ralit dj connu --- est celui des recherches trop complexes : les requtes sont souvent composes d'un mot, voire plusieurs, plus des critres de classification. On peut se dire que c'est parce que les gens se sentent obligs de cliquer partout, soit parce qu'ils pensent que plus ils mettent d'lments de choix plus ils facilitent la tche du moteur de recherche, soit parce qu'ils pensent intuitivement un OU plutt qu'un ET (ils augmentent les rsultats au lieu de les restreindre). Les sances de tests n'ont pas apport d'informations supplmentaires  ce sujet  ceci prs que les deux dernires sances ont t faites avec un nouveau formulaire qui spare 3 types d'accs : <UL> <LI>  (seulement) recherche de mot ;  <LI> (seulement) consultation des rubriques ;  <LI> recherche combine. </UL>Cette approche s'est rvle plus claire (on voit qu'elle ne supprime aucunement la complexit mais qu'elle aide  la comprendre) et a donc t adopte dans le nouveau formulaire. Par ailleurs, comme les recherches sont moins restrictives, l'utilisateur se retrouve moins souvent avec un rsultat nul (et dcourageant).<BR> <BR> <A NAME="toc11"></A> <H3>Manipulation des rsultats, affinement de la recherche</H3>  <H4>Ordre des rponses</H4>Il y a eu systmatiquement des ractions concernant l'ordre d'affichage des rponses. Est-il alphabtique, ou, comme dans <EM>Blast</EM> ou <EM>Medline</EM>, selon un score ? Il tait lexical par rapport aux URL's, ce qui a un intrt limit, d'autant plus que l'URL n'tait pas affich (il l'est maintenant d'ailleurs, une suggestion de l'enqute en ligne) ; il est maintenant sur le titre associ  l'URL.<BR> <BR>  <H4>Voisinage</H4>La classification des URL's faisant partie de la rponse est signale en vert dans les rponses : tout le monde a voulu cliquer, mais... ce n'tait pas cliquable. Encore une fois, on peut y voir le syndrome du cliquodrome plantaire. Ceci tant dit, c'est vrai qu'il n'est pas inintressant de pouvoir parcourir des ensembles de rsultats de proches en proches. Exemple, j'ai demand les rubriques :  <EM>Homo Sapiens</EM> + gnomique. Parmi les rponses, celle-ci :<BR> <BR> Banque du DOE des sujets et mthodes de recherche sur l'homme<BR> <BR> classification : bibliographie, <EM>Homo sapiens</EM>, gnomique<BR> <BR>  <A HREF="http://www.gdb.org/HTB/htb.html"><TT>http://www.gdb.org/HTB/htb.html</TT></A>  <BR> <BR> est classe : <EM>Homo Sapiens</EM> + gnomique + bibliographie ;  j'aimerais maintenant lister tous les URL's qui ont la mme  classification (c'est analogue  la notion de voisinage dans Entrez ---  <A HREF="http://www3.ncbi.nlm.nih.gov/Entrez/index.html"><TT>http://www3.ncbi.nlm.nih.gov/Entrez/index.html</TT></A> ).<BR> <BR>  <H4>0.0.1&nbsp;&nbsp; Des solutions alternatives quand on ne trouve rien ?</H4>Puisque il arrive parfois qu'on ne trouve pas ce qu'on cherche (c'est actuellement le cas pour 33% des questions), un pointeur vers d'<EM>autres moteurs de recherche</EM> tait systmatiquement propos. En cliquant sur ce lien, on trouvait tout ce qui tait rpertori dans le BioNetbook comme  liste de ressources  et comportant l'expression  moteur de recherche  dans sa description. Malheureusement, ce pointeur a t compris par tous les testeurs --- et c'est donc probablement vrai pour d'autres utilisateurs invisibles --- comme voulant dire <EM>continuation de la recherche</EM> par d'autres moteurs.<BR> <BR> Il est vrai que la possibilit d'affiner une recherche est assez habituelle dans les interfaces Web des banques bibliographiques, et tait attendue ici aussi. Mais cette fonction n'existe pas dans le BioNetbook, car, comme tous les rsultats sont disponibles en une seule fois dans la page, il suffit tout simplement d'utiliser la fonction de recherche de texte du navigateur, comme la fonction <EM>Find</EM> de Netscape (qui a t explique aux testeurs).<BR> <BR>  <H4>Surprises agrables</H4>Les ractions des biologistes par rapport au contenu de la base on t souvent positifs car les tests leur ont permis de dcouvrir des sites parfois proches de leur thmatique de recherche, qu'ils ne connaissaient pas, ainsi que de prendre un peu de temps pour aller rapidement jeter un oeil sur des serveurs qui n'avaient rien  voir avec la requte mais qui leur seraient utiles. C'est aussi une des fonctions d'une base de signets <EM>(bookmarks)</EM>.  Dans l'ensemble ils ignoraient qu'autant d'informations taient   leur disposition.<BR> <BR> <A NAME="toc12"></A> <H3>Terme de recherche, troncature, langue d'interrogation</H3> Types de problmes rencontrs :  <UL> <LI>  les termes composs  <LI> quelle troncature est effectue par le serveur ?  <LI> quelle est donc la langue d'interrogation ? </UL> <H4>Termes composs</H4>Les requtes sont assez souvent composes de plusieurs mots, ce qui, comme le langage de requte propos pour l'instant n'inclut pas les expressions boolennes, rduit beaucoup les rsultats. L'interface propose dj depuis un moment une dcomposition des mots de la requte dans la page des rsultats. Exemple, si on a demand  primer design  et qu'on n'a rien trouv, le serveur propose une recherche sur  primer  et sur  design  : il suffit de cliquer sur l'un des deux.  Un langage boolen pourrait tre envisag assez rapidement, je ne sais pas trop ce que a implique comme complications... (c'est du SQL derrire aprs tout, a devrait tre trs faisable).<BR> <BR>  <H4>Troncature</H4>Jusque-l, la troncature  gauche et  droite tait automatique : pour des recherche comme "pI" (point isolectrique), ou "NK" <EM>(natural killer cells)</EM>, le rsultat tait mauvais, puisque on obtenait tous les mots contenant "pi" ou "nk". SQL, le langage de requtes utilis, ne permet pas des recherches avec des contraintes sur les frontires de mots, mais un post-traitement des rsultats est possible. <BR> <BR> La vraie question, c'est le type d'interaction propos : faut-il fournir une case  cocher <EM>mot exact</EM> (suggestion d'une des testeuses, par comparaison  Word), et si cela n'est pas demand effectuer une troncature des deux cots ? Faut-il supposer une troncature explicite  droite : <EM>protoco*</EM> mais implicite  gauche ? (dans SRS, c'est un vrai problme, les gens ne comprennent rien  cette option, on le voit nettement dans les cours d'informatique). Une modification a t effectue, qui semble tre bien comprise : une case  cocher propose de choisir une recherche du mot exact : dans ce cas, aucune troncature n'est effectue sur le mot. Par ailleurs, la page des rsultats affiche le terme recherch en gras.<BR> <BR>  <H4>Langue d'interrogation</H4>La langue d'interrogation, depuis l'interface en franais, parat tre le franais, et cela est trompeur. Mais, mme si le travail gigantesque de traduction complte et correcte du BioNetbook pouvait tre fait, les questions portent aussi sur les mots composant les URL's qui, eux, sont quasi systmatiquement en anglais. Il n'y a pas vraiment de solutions,  part supprimer la version franaise. Pour l'instant, le serveur affiche un message en cas d'chec (0 rponses) : essayez le terme en anglais. Le serveur propose aussi d'essayer un mot plus court et d'essayer un mot plus gnral, ou bien de changer la troncature.<BR> <BR> <A NAME="toc13"></A> <H3>lments obscurs dans l'interface, termes techniques mal compris, suggestions d'amliorations diverses</H3>  <H4>lments de l'interface non utiliss, non perus :</H4>Bouton ET/OU : le connecteur boolen tait en boutons de radio :  on ne le voyait pas bien (c'est remplac un petit menu).<BR> <BR> Bouton RESET : pas vu du tout, en tous cas pas utilis. J'ai mis "EFFACER" en majuscules  ct de "CHERCHER" (et ``SEARCH/CLEAR''). <BR> <BR>  <H4>Termes incomprhensibles :</H4>-  liste de ressources  : ce terme n'a t compris par aucun  des testeurs ; alternatives proposes :  <UL> <LI>  sites de connexion (argument : ces sites-l permettent de se 		 connecter  ailleurs) ; 	 <LI> autres listes de sites ; 	 <LI> rpertoires de sites ; 	 <LI> autres rpertoires de pages Web. </UL> <H4>lments de l'interface mal compris :</H4>Une certaine confusion avec le style d'interaction Macintosh  pouvait tre remarque, ainsi qu'une mconnaissance relative  du navigateur (Netscape). Notamment, les listes  slection multiple posent des problmes ennuyeux : <UL> <LI>  on pense qu'un clic dedans va  activer  tout de suite 	la recherche ; 	 <LI> on ne voit pas toujours qu'on peut cliquer dedans ; 	 <LI> on ne voit pas forcment qu'on peut slectionner 	plusieurs choses dedans. </UL>Ou bien encore, certains testeurs supposaient que, comme sur un Macintosh, une nouvelle slection efface les prcdentes - ce qui n'est pas le cas l puisque que la liste de rubriques proposes par le formulaire est une liste  choix multiple.<BR> <BR> <A NAME="toc14"></A> <H3>Remarques diverses</H3> Bien que cela nous avait sembl - depuis la refonte du BioNetbook il y a deux ans avec Irne Wang, constituter un des problmes dlicats de cette base de donnes, il y a eu assez peu de rflexions et de remarques sur les critres de classification choisis.  part la rubrique  biologie cellulaire  qui semble manquer vraiment, il y a eu aussi une remarque sur le fait que le moiti des bookmarks classs en  immunologie  concernait HIV.<BR> <BR> Enfin, dernier point de dtail, la mention :  pour ajouter un URL au BioNetbook contacter : <TT>help@pasteur.fr</TT> , qui s'adresse  des personnes qui sont plutt  l'aide avec le Web, apparaissait inopinment et trop prmaturment en haut de la page des rsultats (c'est maintenant en pied de page).<BR> <BR> <A NAME="toc15"></A> <H3>Rsultats des amliorations de l'interface Web</H3> Les chiffres sont calculs sur une priode de deux mois s'tendant de mi-fvrier  mi-avril 2000. Le nombre de requtes par jour a quadrupl par rapport  la priode prcdant les tests ; il est actuellement de 360 par jour. Cela peut s'expliquer par d'autres facteurs, notamment par le fait que la base de donnes est aujourd'hui rfrence sur plus de 250 sites spcialiss en biologie. Une optimisation du temps de rponse (modification indpendante des tests dont il est question ici, mais effectue  la mme poque) peut galement expliquer une utilisation plus enthousiaste : en moyenne, le temps de rponse de la base de donnes est de : 4.5 secondes (ce qui ne comprend pas le temps de formattage des rsultats et d'affichage par le navigateur).<BR> <BR> L'augmentation du nombre de requtes peut encore s'expliquer par deux autres facteurs : la notice d'aide comporte beaucoup plus de liens hypertextes qui sont autant de requtes effectues sur la base de bookmarks d'une part et la classification des URL's de rponses est devenue cliquable (recherche des rponses voisines).<BR> <BR> L'effet des changements dans l'interface effectus d'aprs les informations recueillies lors des tests se voit probablement plus  la proportion de questions sans rponses qui a diminu (33% au lieu de 42%). En particulier, la mdiane a chang : alors que 50% des questions obtenaient auparavant de 0  2 rponses, 50% des questions obtiennent actuellement de 0  10 rponses.<BR> <BR> Le changement le plus visible pour l'utilisateur tait la sparation des types de recherche en recherche par mot ou bien recherche par rubriques.<BR> <BR> <DL COMPACT=compact> <DT><DD>   <TABLE BORDER=1 CELLSPACING=0 CELLPADDING=1> <TR><TD ALIGN=left NOWRAP>Nombre total de questions</TD> <TD ALIGN=right NOWRAP>21188</TD> </TR> <TR><TD ALIGN=left NOWRAP>Nombre total de recherches de mots</TD> <TD ALIGN=right NOWRAP>10421</TD> </TR> <TR><TD ALIGN=left NOWRAP>Nombre total de recherches par rubriques</TD> <TD ALIGN=right NOWRAP>7806</TD> </TR> <TR><TD ALIGN=left NOWRAP>Nombre total de recherches combines</TD> <TD ALIGN=right NOWRAP>1411</TD> </TR> <TR><TD ALIGN=left NOWRAP>[pour la priode mi-fvrier mi-avril]</TD> <TD ALIGN=right NOWRAP>&nbsp;</TD> </TR></TABLE>  </DL>On voit d'aprs le tableau que la majorit des requtes effectues sont des recherches de mots. Les recherches combines, qui constituaient avant la grande majorit des cas de par une mauvaise lisibilit de l'interface Web, sont maintenant trs minoritaires.<BR> <BR> <A NAME="toc16"></A> <H3>Conclusion</H3> Notre objectif est de faire de cette base de bookmarks un outil pratique pour les biologistes du campus. Nous esprons donc que les amliorations apportes en fonction des tests ergonomiques auront t utiles. Un suivi rgulier des journaux d'utilisation permet d'orienter le contenu de ce carnet d'adresses du Net en fonction des thmes intressant les chercheurs. Pour cette raison, n'hsitez pas  nous communiquer vos suggestions, soit en termes de nouvelles adresses, soit concernant l'interface d'interrogation.<BR> <BR> <BR><BR><DIV ALIGN=right>Catherine Letondal</DIV>  <BR><BR> <TABLE BORDER=1 CELLSPACING=0 CELLPADDING=1> <TR><TD ALIGN=left NOWRAP><IMG SRC="../Images/petit-cartouche-B6.gif"></TD> <TD ALIGN=left NOWRAP>  	 <BR> 	 <B>dit par :</B><BR>	 Service Informatique Scientifique<BR>	 <B>Institut Pasteur</B><BR>	 28 rue du Docteur Roux<BR>	 75724 Paris CEDEX 15<BR>	 Tl. : +33 (1) 45 68 85 10<BR>	 Fax. : +33 (1) 40 61 30 80<BR>	 Cble : <TT>mcb@pasteur.fr</TT><BR></TD> <TD ALIGN=left NOWRAP>  	 <BR> 	 Les contributions et suggestions<BR>	 sont  adresser  :<BR>	 Laurent Bloch &nbsp; <TT>bloch@pasteur.fr</TT><BR>	 Directeur de la publication :<BR>	 Philippe Kourilsky<BR>	 ISSBN : 1244-524 X<BR><BR>	 Copyright &nbsp;Institut Pasteur 2000</TD> </TR></TABLE> <BR>  <HR SIZE=2> <BR><BR><BR><HR> <A HREF="html-b6n13002.html"><IMG SRC ="previous_motif.gif" ALT="Prcdent"></A> <A HREF="index.html"><IMG SRC ="contents_motif.gif" ALT="Index"></A> <A HREF="html-b6n13004.html"><IMG SRC ="next_motif.gif" ALT="Suivant"></A> </BODY> </HTML> 
