<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Strict//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-strict.dtd">  <html xmlns="http://www.w3.org/1999/xhtml"> <head> <title>[ ADOC - LA DOCUMENTATION DYNAMIQUE ] - Qu'est ce que Google&nbsp;?</title> <meta http-equiv="Content-Type" content="text/html; charset=iso-8859-1"> 		<meta name="subjects" content="[ ADOC - LA DOCUMENTATION DYNAMIQUE ] - Version 1.0"> 		<meta name="robots" content="ALL"> 		<meta name="distribution" content="GLOBAL"> 		<meta name="rating" content="GENERAL"> 		<meta http-equiv="Reply-to" content="kbelkacem@wanadoo.fr"> 		<meta name="ROBOTS" content="INDEX,FOLLOW"> 		<meta name="author" content="Karim BELKACEM - kbelkacem@wanadoo.fr"> 		<meta name="copyright" content=" [ ADOC - LA DOCUMENTATION DYNAMIQUE ]"> 		<meta name="revisit-after" content="15 days">  <style type="text/css" media="all">@import url(css/baseadoc.css);</style> <link rel="alternate stylesheet" type="text/css" media="screen" title="friendly fonts" href="css/baseadocami.css" /> <link rel="stylesheet" type="text/css" media="print" href="css/print.css" />  <!-- Ceci est la feuille de style du calendrier --> <link rel="stylesheet" href="css/calendrier.css" type="text/css">  <!-- Ceci est la feuille de style par defaut pour les types internes a SPIP --> <link rel="stylesheet" href="css/spip_style.css" type="text/css">  <!-- Les feuilles de style specifiques aux presents squelettes --> <link rel="stylesheet" href="css/typographie.css" type="text/css">  <!-- media="..." permet de ne pas utiliser ce style sous Netscape 4 (sinon plantage) --> <link rel="stylesheet" href="css/habillage.css" type="text/css" media="print, projection, screen, tv">  </head>  <body> <!-- No browser nag here. Who am I to tell you what user agent to use? --> <!-- Thank you, Paul Freeman, Dave Elfving, and Matt McIrvin. -->  <div id="Header">   <h1 id="headerLogo"><strong><a  title="Retour au sommaire" href="http://www.glums.com/serveur/adoc">ADOC - LA DOCUMENTATION DYNAMIQUE</a></strong>      <font color="#000000" size="1"><br><br>Squelette inspir de <a href="http://www.bluerobot.com/">www.bluerobot.com</a><br>     Disponible ici <a href="http://www.glums.com/serveur/spip/squelette/article.php3?id_article=82">/spip/squelette/</a><br><br></font></h1> </div>  <!-- The extra DIV is needed to overcome a shortcoming in Opera/Win. Please forgive me. --> <div id="Main">   <div id="Content">      <!-- Begin the log proper -->     <br />     <div class="cartouche">  <a href="rubrique.php3?id_rubrique=8">En pratique</a> > <a href="rubrique.php3?id_rubrique=10">World Wide Web</a><br /><br />    <h2 class="titre-extrait"><a href="imprimer.php3?id_article=13"><img src="images/gif/print.gif" alt="imprimer cet article" border="0"></a>&nbsp;&nbsp;Qu'est ce que Google&nbsp;?</h2>  <b>Le lundi 18 novembre 2002, par</b> <a href="mailto:kbelkacem@wanadoo.fr">Karim Belkacem</a> </div>   <div class="chapo">Google est un cluster Beowulf, plus de 5 000 PC tournant sous Linux en parallle. Admirable, et surtout gratuit&nbsp;: les logiciels sont des logiciels GNU&nbsp;: open source et dont l'utilisation est gratuite. Une belle russite pour les logiciels libres.  Google connait plus de 2 miliards de pages web.</div> <div class="texte"><p class="spip"><b class="spip">Pages similaires</b> </p> <p class="spip">Je suis assez bluff par cette <a href="http://www.google.com/search?client=googlet&q=related:http://www.liberation.fr/" class="spip_out">recherche sur Google</a> </p> <p class="spip">Google trouve tout seul les pages similaires  www.liberation.fr et la rponse est remarquablement exacte&nbsp;: on tombe sur le Monde, le Monde Diplo, les Echos, le Figaro, TF1, Nouvel Obs,... </p> <p class="spip">Bien sur, Google ne "comprend" pas (encore&nbsp;:-) les sites qu'il lit, donc il se base sur l'information incluse dans le web (ou plus certainement les liens du web). Comme tous ces sites sont plutot en concurrence, j'imagine qu'ils ne pointent pas trop les uns vers les autres. Pour Google, un site similaire  un site A n'est donc pas un site qui a des liens avec le site A. </p> <p class="spip">J'imagine que la fonction "similarit" de Google, c'est&nbsp;: </p> <p class="spip">Ensemble B&nbsp;: Je prends l'ensemble des pages qui pointent vers A. Ensemble C&nbsp;: Maintenant je prends l'ensemble des pages cibles des pages de l'ensemble B.  Il suffit de classer les pages de C par nombre de liens depuis l'ensemble B et hop, l'affaire est faite (enfin, c'est mon hypothse  2 euros).  Moralit&nbsp;: la structure mme du web permet de SAVOIR que les sites similaires  Libration sont Le Monde, etc ... l'information qui permet de trouver la similarit de deux sites n'est pas une information crite dans les pages, mais inscrite dans la structure hypertexte (les liens) mme du rseau.  Ainsi, le web est un systme d'informations. Ces informations sont d'une part constitues des mots / images / vidos constituant les pages web, mais aussi des liens entre pages eux mme. Lorsque vous crez un lien hyper-texte, vous structurez le web, vous y ajoutez une information non ngligeable. </p> <p class="spip"><b class="spip">Date de changement de l'index de Google</b> </p> <p class="spip">Google scanne le web en permanence, il consulte vos sites, se promne de liens en liens, pour emmagasiner la croissance et les volutions du web. Pendant des semaines, il accumule de nouvelles informations et recre un nouvel index. Cependant, son changement d'index n'est pas immdiat. Google ne le mets  jour qu'une fois par mois environ, ce qui signifie que pendant plusieurs semaines, votre site peut avoir t scann par Google, sans qu'il apparaisse encore dans le moteur de recherche. Et puis tout d'un coup, Google change son index, et se met  utiliser les nouvelles donnes qu'il a compiles depuis son dernier changement d'index.</p></div> <div class="ps"><p class="spip"><b class="spip">Autres liens sur Google</b> </p> <p class="spip"><a href="http://www.google-watch.org/pagerank.html" class="spip_out">PageRank&nbsp;: the original sin</a>&nbsp;: un article mi-figue mi-raisin qui condamne le pageranking de Google, comme tant anti-dmocratique. Assez faut.</p></div>  <br>   <!-- Forums -->  <div class="forum-repondre"><B><A  HREF="forum.php3?id_article=13&amp;retour=article.php3%3Fid_article%3D13">R&eacute;pondre &agrave; cet  article</A></B></div> <br>  <h1 class="structure">Forum de l'article</h1>     <!-- End said log -->  </div><!-- End Content --> </div><!-- End Main -->  <div id="Menu">  		<!-- Menu de navigation general -->  		<div class="menu"> 		 		<!-- Formulaire de recherche -->  		<div> <a name='formulaire_recherche'></a>  <form action='recherche.php3' method='get'> <label for='formulaire_recherche' style='display: none'>Rechercher dans le site&nbsp;: </label> <input type='text' id='formulaire_recherche' name='recherche' value='Rechercher' size='20' class='formrecherche'> </form></div> 		 		<h2>Navigation</h2> 			<ul class="rubriques"> 			<li class="menu-item"> 	<a href="ecrire" title="Acc&eacute;der &agrave; l'espace r&eacute;serv&eacute; aux r&eacute;dacteurs">Administration</a> 			</li> 			<li class="menu-item"> 			<a href="plan.php3" title="Tout le site sur une page">Plan du site</a> 			</li> 			</ul> 		</div> 		 		<div id="calendrier"><!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN"> <html> <head> <title></title> <meta http-equiv="Content-Type" content="text/html; charset=iso-8859-1"> </head> <body> <table border='0' cellspacing='1' cellpadding='3' width='100%' id='calendrier'> <tr><td class='calendrier-mois' colspan=7></td></tr> <tr><td class='calendrier-semaine'>L</td><td class='calendrier-semaine'>M</td><td class='calendrier-semaine'>M</td><td class='calendrier-semaine'>J</td><td class='calendrier-semaine'>V</td><td class='calendrier-semaine'>S</td><td class='calendrier-semaine'>D</td></tr> <td  class='outday'><br></td><td  class='weekday'>1</td><td  class='weekday'>2</td><td  class='weekday'>3</td><td  class='weekday'>4</td><td  class='weekendday'>5</td><td  class='weekendday'>6</td></tr> <td  class='weekday'>7</td><td  class='weekday'>8</td><td  class='weekday'>9</td><td  class='weekday'>10</td><td  class='weekday'>11</td><td  class='weekendday'>12</td><td  class='weekendday'>13</td></tr> <td  class='weekday'>14</td><td  class='weekday'>15</td><td  class='weekday'>16</td><td  class='weekday'>17</td><td  class='weekday'>18</td><td  class='weekendday'>19</td><td  class='weekendday'>20</td></tr> <td  class='weekday'>21</td><td  class='weekday'>22</td><td  class='weekday'>23</td><td  class='weekday'>24</td><td  class='today'><b>25</b></td><td  class='weekendday'>26</td><td  class='weekendday'>27</td></tr> <td  class='weekday'>28</td><td  class='weekday'>29</td><td  class='weekday'>30</td><td  class='outday'><br></td><td  class='outday'><br></td><td  class='outday'><br></td><td  class='outday'><br></td></tr> </table> </body> </html> </div>  		<!-- Menu de navigation rubriques -->  		 		<div class="menu"> 		<ul class="rubriques"> 		 		<li> 		<h2><a href="rubrique.php3?id_rubrique=6" title="Rfrences d'articles parus sur SPIP">Bibliographie</a></h2> 		<B_sous_rubriques> 		<ul class="menu-liste"> 		 		</ul> 		</B_sous_rubriques> 		</li> 		 		<li> 		<h2><a href="rubrique.php3?id_rubrique=8" title="Divers tutoriaux et conseils pratiques pour bien utiliser et connatre internet">En pratique</a></h2> 		<B_sous_rubriques> 		<ul class="menu-liste"> 		 		<li class="menu-item"><a href="rubrique.php3?id_rubrique=10" title="L'volution du web, les nouveaux sites, volution des techniques, livres, mthodologie...">World Wide Web</a></li> 		 		<li class="menu-item"><a href="rubrique.php3?id_rubrique=17" title="Spip donne au moment de son installation, la possibilit de se connecter  des annuaires LDAP, ne sachant pas exactement  quoi cela correspond, nous avons dcid d'ouvrir une rubrique entire consacre aux annuaires LDAP.">Annuaires LDAP</a></li> 		 		<li class="menu-item"><a href="rubrique.php3?id_rubrique=11" title="On crit pas forcment un texte pour le web comme on crirait le mme texte destin  tre imprim. Quelques liens concernant les stratgies rdactionnelles  adopter sur le web.">Ecrire pour le web</a></li> 		 		</ul> 		</B_sous_rubriques> 		</li> 		 		<li> 		<h2><a href="rubrique.php3?id_rubrique=7" title="Diverses utilisations pratiques de sites Internet, Intranet, Webzine sous CMS">Expriences CMS</a></h2> 		<B_sous_rubriques> 		<ul class="menu-liste"> 		 		<li class="menu-item"><a href="rubrique.php3?id_rubrique=15" title="CMS (Content Management System) - Systme de Mangement de Contenu. Numero 1 en France actuellement.">SPIP</a></li> 		 		</ul> 		</B_sous_rubriques> 		</li> 		 		</ul> 		</div> 		 		  		<h2>Contact</h2> 			<ul class="rubriques"> 			<li class="menu-item"> 			<a href="mailto:cguelfucci@bldavocats.com" title="Contacter Carole Guelfucci">Envoyez un Email</a> 			</li> 			</ul> 		</div>  </div>  <div id="Copyright"> <img src="images/small_leaf.gif" width="87" height="53" alt="" />    <span id="copyrightText">&copy;2002&nbsp;ADOC - LA DOCUMENTATION DYNAMIQUE</span> </div>  <!-- Just some window dressing here. --> <div id="headerOverlap"></div>   <br> <div align="center"> <!--WEBBOT bot="HTMLMarkup" startspan ALT="Site Meter" --> <a href="http://s13.sitemeter.com/stats.asp?site=s13glums" target="_top">    <img src="http://s13.sitemeter.com/meter.asp?site=s13glums" alt="Site Meter" border=0></a>  <!--WEBBOT bot="HTMLMarkup" Endspan --> </div> </body> </html>  
