<!doctype html public "-//w3c//dtd html 4.0 transitional//en"> <html> <head>    <meta http-equiv="Content-Type" content="text/html; charset=iso-8859-1">    <meta http-equiv="CONTENT-TYPE" content="text/html; charset=iso-8859-1">    <meta name="GENERATOR" content="Mozilla/4.72 [en] (X11; I; SunOS 5.6 sun4u) [Netscape]">    <meta name="CREATED" content="20000809;15301000">    <meta name="CHANGED" content="20000817;9372900">    <title>Phylog&eacute;nie </title> <style> 	<!-- 		A:visited { color: #4b0082 } 		A:link { color: #0000ee } 	--> 	</style> </head> <body link="#0000EE" vlink="#4B0082" background="fondgris.jpg">  <center><font size=+4>La Phylog&eacute;nie</font></center>  <p><br> <h1> <font size=+4>I.<a href="#INTRODUCTION"> INTRODUCTION</a></font></h1> <b>1</b>.<a href="#Lamark"> L'&eacute;volution selon Lamark</a> <br><b>2</b>.<a href="#Darwin"> L'&eacute;volution selon Darwin</a> <br><b>3.</b><a href="#Modernes"> Les concepts modernes</a> <br><b>4</b>.<a href="#Convergente"> Evolution convergente vs &eacute;volution divergente</a> <br>&nbsp; <h1> II. <a href="#MOLECULAIRE">LA PHYLOGENIE MOLECULAIRE</a></h1> <b>1.</b><a href="#Horloge">L'horloge mol&eacute;culaire</a> <br>&nbsp;&nbsp;&nbsp; <a href="#Definition">D&eacute;finition</a> <br>&nbsp;&nbsp;&nbsp; <a href="#Contre">Arguments contre l'horloge mol&eacute;culaire</a> <br>&nbsp;&nbsp;&nbsp; <a href="#Conclusion">Conclusion</a> <br><b>2.</b><a href="#Methodes"> M&eacute;thodes de reconstruction</a> <br>&nbsp;&nbsp;&nbsp; <b>2.1</b> <a href="#Distances">Fond&eacute;es sur les distances</a> <br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; <a href="#UPGMA">UPGMA</a> <br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; <a href="#NJ">NJ</a> <br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; <a href="#Derivees">M&eacute;thodes d&eacute;riv&eacute;es</a> <br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; <a href="#Derivees">Corrections</a> <br>&nbsp;&nbsp;&nbsp; <b>2.2</b> <a href="#Caracteres">Fond&eacute;es sur les caract&egrave;res</a> <br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; <a href="#Parcimonie">Parcimonie</a> <br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; <a href="#ML">Maximum de vraissemblance</a> <br>&nbsp;&nbsp; <b>2.3</b>&nbsp;<a href="#Bootstrap"> Le boostrap</a> <br>&nbsp;&nbsp; <b>2.4</b> <a href="#Racine">Enraciner un arbre</a> <br><b>3</b>. <a href="#Recap">Recapitulatif</a> <h1> III.<a href="#CONCLUSION"> CONCLUSION</a></h1>  <h1> IV.<a href="#BIBLIO"> BIBLIOGRAPHIE</a></h1>  <hr WIDTH="100%"> <h1> <a NAME="INTRODUCTION"></a>I. INTRODUCTION</h1> Depuis Darwin, il est commun&eacute;ment admis que les &ecirc;tres vivants descendent tous les uns des autres. Jusqu'aux ann&eacute;es 1960, les comparaisons entre des morphologies, des comportements et des r&eacute;partions g&eacute;ographiques des esp&egrave;ces &eacute;taient les seuls moyens disponibles pour contruire des classifications d'esp&egrave;ces. La d&eacute;couverte que des prot&eacute;ines homologues (ou acides nucl&eacute;iques) avaient des s&eacute;quences en acides amin&eacute;s (ou en bases) qui variaient d'une esp&egrave;ce &agrave; l'autre a fourni un nouveau moyen d'&eacute;tude : la phylog&eacute;nie. <h2> <a NAME="Lamark"></a>1. L'&eacute;volution selon LAMARK (1744-1829)</h2> Pour Lamark, l'&eacute;volution &eacute;tait due &agrave; une adaptation continue au milieu ambiant : un environnement changeant alt&egrave;re les besoins de l'organisme vivant qui s'adapte en modifiant son comportement et en utilisant certains organes plus que d'autres. <center> <p><img SRC="girafe_lamark.jpg" NAME="Image1" BORDER=0 height=357 width=500 align=BOTTOM> <br><b><i><font size=-1>Figure 1 : l'&eacute;volution selon Lamark</font></i></b></center>  <h2> <a NAME="Darwin"></a>2. L'&eacute;volution selon Darwin (1809-1882)</h2> La th&eacute;orie d&eacute;fendue par Darwin est l'&eacute;volution par s&eacute;lection naturelle. Au sein d'une m&ecirc;me lign&eacute;e, tous les individus sont diff&eacute;rents et la nature favorise la multiplication de ceux qui jouissent d'un quelconque avantage. <center> <p><img SRC="Darwin_girage.jpg" NAME="Image2" BORDER=0 height=275 width=500 align=BOTTOM> <br><b><i><font size=-1>Figure 2 : l'&eacute;volution selon Darwin</font></i></b></center>  <h2> <a NAME="Modernes"></a>3. Les concepts modernes : la th&eacute;orie neutraliste vs la th&eacute;orie s&eacute;lectionniste</h2> Quand les lois de la g&eacute;n&eacute;tique ont &eacute;t&eacute; connues, il est n&eacute; un paradoxe entre la s&eacute;lection (disparition de certains carat&egrave;res) et le polymorphisme g&eacute;n&eacute;tique (variabilit&eacute;). Il faut cependant rappeler que ce sont les phenotypes qui se heurtent &agrave; la pression de s&eacute;lection et non les g&eacute;notypes (avec le jeu des dominances et r&eacute;cessivit&eacute;s, &agrave; un phenotype correspond plusieurs g&eacute;notypes). <br>Pour l'expliquer, 2 th&eacute;ories s'opposent : la th&eacute;orie neutraliste et la th&eacute;orie s&eacute;lectionniste. <br><img SRC="ball.blue.gif" height=14 width=14> <u>La th&eacute;orie neutraliste</u> (Kimura) <br>La plupart des mutations restent neutres, se fixent au hasard (seules les mutations tr&egrave;s d&eacute;favorisantes ou l&eacute;tales pour l'individu sont &eacute;limin&eacute;es) et le milieu n'a pas de r&ocirc;le s&eacute;lectif. <br><img SRC="ball.blue.gif" height=14 width=14> <u>La th&eacute;orie s&eacute;lectionniste</u> <br>la plupart des nouveaux all&egrave;les apparus par mutations se fixent dans les populations parce qu'ils&nbsp; sont avantageux pour les porteurs dans le milieu o&ugrave; ils vivent (s&eacute;lection darwinienne). <br>&nbsp; <h2> <a NAME="Convergente"></a>4. Evolution convergente et &eacute;volution divergente</h2> <img SRC="ball.blue.gif" height=14 width=14> <u>L'&eacute;volution convergente</u> correspond &agrave; des solutions trouv&eacute;es de mani&egrave;re ind&eacute;pendante chez des organismes diff&eacute;rents pour r&eacute;soudre le m&ecirc;me probl&egrave;me. <br><img SRC="ball.blue.gif" height=14 width=14> <u>L'&eacute;volution divergente</u> correspond au contraire &agrave; des prot&egrave;ines ayant le m&ecirc;me anc&ecirc;tre commun mais qui se sont sp&eacute;cialis&eacute;es dans des fonctions diff&eacute;rentes. <br>&nbsp; <h1> <a NAME="MOLECULAIRE"></a>II. LA PHYLOGENIE MOLECULAIRE</h1> Cela correspond &agrave; de la phylog&eacute;nie par comparaison de g&egrave;nes [les g&egrave;nes utilis&eacute;s doivent &ecirc;tre choisis avec soin : il faut que cela soit des g&egrave;nes subissant de fortes contraintes fonctionnelles donc ayant un taux de mutation faible. Un bon exemple est le cytochrome B intervenant dans les chaines d'oxydation cellulaire de tous les &ecirc;tres vivants (les &ecirc;tres vivants actuels l'ont sans doute h&eacute;rit&eacute; d'un anc&ecirc;tre commun il y a trois milliards d'ann&eacute;es)]. <br>Il y a cependant une accumulation des mutations au cours du temps et pour rendre compte de ce ph&eacute;nom&egrave;ne, Zuckerland et Pauling (1962) ont d&eacute;velopp&eacute; la th&eacute;orie de l'horloge mol&eacute;culaire. <h2> <a NAME="Horloge"></a>1. L'horloge mol&eacute;culaire</h2>  <h3> <a NAME="Definition"></a><b>1.1 <u>D&eacute;finition</u></b></h3> En r&eacute;sum&eacute;, on constate que le taux d'accumulation des mutations dans le g&eacute;nome d'organismes diff&eacute;rents est du m&ecirc;me ordre de grandeur dans des r&eacute;gions homologues (r&eacute;gions soumises &agrave; la m&ecirc;me pression de s&eacute;lection). <br>L'accumulation sera maximale pour des r&eacute;gions qui ne sont pas soumises &agrave; la pression de s&eacute;lection naturelle (ne codant pas pour des g&egrave;nes) et minimale dans les parties du g&eacute;nome soumises &agrave; une forte pression (c'est &agrave; dire les r&eacute;gions codant pour des fonctions essentielles &agrave; la survie de l'organisme). <br>Chaque s&eacute;quence accumule les mutations &agrave; un rythme qui lui est propre et qui est dict&eacute; par l'intensit&eacute; de la pression de s&eacute;lection &agrave; laquelle elle est soumise. Pour reconstituer des phylog&eacute;nies (dater la divergence entre deux esp&egrave;ces), on peut utiliser diff&eacute;rentes mol&eacute;cules comme on utilise les aiguilles d'une montre pour calibrer l'horloge : <br>- la trotteuse des secondes (taux de mutation important, par exemple un pseudog&egrave;ne) pour des &eacute;v&egrave;nements r&eacute;cents (&eacute;tudes des sous populations au sein d'une esp&egrave;ce). <br>- l'aiguille des minutes (taux de mutation moyen, par exemple le cytochrome C) pour l'analyse d'un pass&eacute; proche. <br>- l'aiguille des heures (taux de mutations faible : les histones) pour l'&eacute;tude d'un pass&eacute; lointain. <br>La vitesse d'&eacute;volution de la s&eacute;quence est du m&ecirc;me ordre de grandeur au sein d'une m&ecirc;me classe fonctionnelle de prot&eacute;ines et elle est diff&eacute;rente pour des prot&eacute;ines qui ont des fonctions diff&eacute;rentes : la vitesse d'&eacute;volution de la s&eacute;rum albumine est toujours plus importante que celle du cytochrome C. Ces diff&eacute;rences de vitesse d&eacute;pendent &agrave; la fois de la probabilit&eacute; qu'une substitution apparaisse et de sa compatibilit&eacute; avec la survie de l'organisme. <br>Si l'on admet cette th&eacute;orie, et que l'on conna&icirc;t le taux d'accumulation des mutations, il est possible d'estimer le temps de divergences d'esp&egrave;ces en comparant leur diversit&eacute; mol&eacute;culaire. <br>&nbsp; <h3> <a NAME="Contre"></a><b>1.2 <u>Arguments contre l'horloge mol&eacute;culaire</u></b></h3> La th&eacute;orie de l'horloge mol&eacute;culaire est remise en cause et plusieurs arguments ont &eacute;t&eacute; d&eacute;velopp&eacute;s : <br>- L'horloge mol&eacute;culaire ne serait pas constante (Goodman): les mutations avantageuses se fixeraient plus rapidement lors de la formation de nouvelles esp&egrave;ces. <br>- L'horloge mol&eacute;culaire serait &eacute;pisodique&nbsp; (Gillepsie) et les mutations ne se produiraient pas de fa&ccedil;on ind&eacute;pendante au cours de l'&eacute;volution: il y aurait des &eacute;pisodes d'accumulation suivis d'arr&ecirc;ts &eacute;volutifs. <br>&nbsp; <h3> <a NAME="Conclusion"></a><b>1.3 <u>Conclusion</u></b></h3> Bien que le d&eacute;bat persiste, il semble que l'horloge mol&eacute;culaire fonctionne assez bien sur de longues p&eacute;riodes &eacute;volutives, pour des g&egrave;nes ayant un taux de mutation relativement faible o&ugrave; m&ecirc;me si l'horloge ne bat pas tr&egrave;s r&eacute;guli&egrave;rement, les ralentissements et les acc&eacute;l&eacute;rations se compensent. <br>Il faut &eacute;galement se m&eacute;fier des estimations de temps de divergence bas&eacute;es sur un petit nombre de g&egrave;nes. <br>&nbsp; <h2> <a NAME="Methodes"></a>2.M&eacute;thodes de reconstruction</h2> Il existe deux grands types de m&eacute;thodes permettant la reconstruction d'arbres phylog&eacute;n&eacute;tiques : <br>- les m&eacute;thodes bas&eacute;es sur les mesures de distances entre s&eacute;quences prises deux &agrave; deux, c'est &agrave; dire le nombre de substitutions de nucl&eacute;otides ou d'acides amin&eacute;s entre ces deux s&eacute;quences. <br>- les m&eacute;thodes bas&eacute;es sur les caract&egrave;res qui s'int&eacute;ressent au nombre de mutations (substitutions / insertions /d&eacute;l&eacute;tions) qui affectent chacun des sites (positions) de la s&eacute;quence. <br>&nbsp; <h3> <a NAME="Distances"></a>2.1. M&eacute;thodes fond&eacute;es sur les distances</h3> Ce sont des m&eacute;thodes de reconstruction d'arbre phylog&eacute;n&eacute;tique sans racine bas&eacute;e sur la recherche d'OTU (operationnal taxonomic units, le plus souvent &eacute;quivalent &agrave; une s&eacute;quence) les plus proches et ceci &agrave; chaque &eacute;tape de regroupement. <br>Ces m&eacute;thodes sont rapides et donnent de bons r&eacute;sultats pour des s&eacute;quences ayant une forte similarit&eacute;. <br>Programmes <a href="http://www.infobiogen.fr/docs/PHYLIPdoc/dnadist.html">DNADIST</a> et <a href="http://www.infobiogen.fr/docs/PHYLIPdoc/protdist.html">PROTDIST</a> de Phylip <h4> <img SRC="ball.blue.gif" height=14 width=14><a NAME="UPGMA"></a> <b><u>UPGMA</u></b> (Unweight Pair Group Method with Arithmetic mean)</h4> Cette m&eacute;thode est utilis&eacute;e pour reconstruire des arbres phylog&eacute;n&eacute;tiques si les s&eacute;quences ne sont pas trop divergentes. <br>UPGMA utilise un algorithme de clusterisation s&eacute;quentiel dans lequel les relations sont identifi&eacute;es dans l'ordre de leur similarit&eacute; et la reconstruction de l'arbre se fait pas &agrave; pas gr&acirc;ce &agrave; cet ordre. <br>Il y a d'abord identification des deux s&eacute;quences les plus proches et ce groupe est ensuite trait&eacute; comme un tout, puis on recherche la s&eacute;quence la plus proche et ainsi de suite jusqu'&agrave; ce qu'il n'y ait plus que deux groupes. <br><b><i><u>Exemple</u></i></b> <br>Si on consid&egrave;re la matrice de distances associ&eacute; &agrave; un groupe de 6 OTUs et que l'on veuille obtenir l'arbre associ&eacute;: <br>&nbsp; <table WIDTH="60%" NOSAVE > <tr NOSAVE> <td NOSAVE> <table COLS=6 WIDTH="70%" NOSAVE > <tr NOSAVE> <td NOSAVE></td>  <td NOSAVE><b>A</b></td>  <td><b>B</b></td>  <td><b>C</b></td>  <td><b>D</b></td>  <td><b>E</b></td> </tr>  <tr NOSAVE> <td><b>B</b></td>  <td>2</td>  <td NOSAVE></td>  <td></td>  <td></td>  <td></td> </tr>  <tr> <td><b>C</b></td>  <td>4</td>  <td>4</td>  <td></td>  <td></td>  <td></td> </tr>  <tr NOSAVE> <td><b>D</b></td>  <td NOSAVE>6</td>  <td>6</td>  <td>6</td>  <td></td>  <td></td> </tr>  <tr> <td><b>E</b></td>  <td>6</td>  <td>6</td>  <td>6</td>  <td>4</td>  <td></td> </tr>  <tr> <td><b>F</b></td>  <td>8</td>  <td>8</td>  <td>8</td>  <td>8</td>  <td>8</td> </tr> </table> </td>  <td><img SRC="UPGMA00.gif" height=164 width=178></td> </tr> </table>  <p>On clusterise tout d'abord les deux OTUs avec la distance la plus faible (A et B). Le point de branchement est positionn&eacute; &agrave; la distance 2/2=1. <br>On peut alors construire le sous arbre suivant : <br><img SRC="UPGMA02.gif" NAME="Image4" BORDER=0 height=57 width=70 align=BOTTOM>  <p STYLE="margin-bottom: 0in">Dans la suite, le cluster (A,B) est consid&eacute;r&eacute; comme un tout et on peut calculer une nouvelle matrice de distance : <br>dist(A,B),C = (distAC + distBC) / 2&nbsp; = 4 <br>dist(A,B),D = (distAD + distBD) / 2 = 6 <br>dist(A,B),E = (distAE + distBE) / 2&nbsp; = 6 <br>dist(A,B),F = (distAF + distBF) / 2&nbsp; = 8 <table BORDER CELLSPACING=3 CELLPADDING=2 WIDTH="613" NOSAVE > <caption>&nbsp;</caption>  <tr NOSAVE> <td WIDTH="59" NOSAVE>&nbsp;</td>  <td WIDTH="256"> <center><b>MATRICE</b></center> </td>  <td WIDTH="272"> <center><b>ARBRE</b></center> </td> </tr>  <tr> <td WIDTH="59"><b>Cycle 1</b></td>  <td WIDTH="256"> <table WIDTH="100%" NOSAVE > <tr NOSAVE> <td NOSAVE></td>  <td> <center><b>A</b></center> </td>  <td> <center><b>B</b></center> </td>  <td> <center><b>C</b></center> </td>  <td> <center><b>D</b></center> </td>  <td> <center><b>E</b></center> </td> </tr>  <tr> <td> <center><b>B</b></center> </td>  <td> <center>2</center> </td>  <td>&nbsp;</td>  <td>&nbsp;</td>  <td>&nbsp;</td>  <td>&nbsp;</td> </tr>  <tr> <td> <center><b>C</b></center> </td>  <td> <center>4</center> </td>  <td> <center>4</center> </td>  <td>&nbsp;</td>  <td>&nbsp;</td>  <td>&nbsp;</td> </tr>  <tr> <td> <center><b>D</b></center> </td>  <td> <center>6</center> </td>  <td> <center>6</center> </td>  <td> <center>6</center> </td>  <td>&nbsp;</td>  <td>&nbsp;</td> </tr>  <tr> <td> <center><b>E</b></center> </td>  <td> <center>6</center> </td>  <td> <center>6</center> </td>  <td> <center>6</center> </td>  <td> <center>4</center> </td>  <td>&nbsp;</td> </tr>  <tr> <td> <center><b>F</b></center> </td>  <td> <center>8</center> </td>  <td> <center>8</center> </td>  <td> <center>8</center> </td>  <td> <center>8</center> </td>  <td> <center>8</center> </td> </tr> </table> </td>  <td WIDTH="272"> <center><img SRC="UPGMA02.gif" NAME="Image5" BORDER=0 height=57 width=70 align=BOTTOM></center> </td> </tr>  <tr NOSAVE> <td WIDTH="59"><b>Cycle 2</b></td>  <td WIDTH="256"> <table COLS=5 WIDTH="100%" NOSAVE > <tr NOSAVE> <td NOSAVE></td>  <td> <center><b>A,B</b></center> </td>  <td> <center><b>C</b></center> </td>  <td> <center><b>D</b></center> </td>  <td> <center><b>E</b></center> </td> </tr>  <tr> <td> <center><b>C</b></center> </td>  <td> <center>4</center> </td>  <td>&nbsp;</td>  <td>&nbsp;</td>  <td>&nbsp;</td> </tr>  <tr> <td> <center><b>D</b></center> </td>  <td> <center>6</center> </td>  <td> <center>6</center> </td>  <td>&nbsp;</td>  <td>&nbsp;</td> </tr>  <tr> <td> <center><b>E</b></center> </td>  <td> <center>6</center> </td>  <td> <center>6</center> </td>  <td> <center>4</center> </td>  <td>&nbsp;</td> </tr>  <tr> <td> <center><b>F</b></center> </td>  <td> <center>8</center> </td>  <td> <center>8</center> </td>  <td> <center>8</center> </td>  <td> <center>8</center> </td> </tr> </table> </td>  <td WIDTH="272" NOSAVE> <center><img SRC="UPGMA03.gif" NAME="Image6" BORDER=0 height=56 width=106 align=BOTTOM></center> </td> </tr>  <tr NOSAVE> <td WIDTH="59"><b>Cycle 3</b></td>  <td WIDTH="256"> <table COLS=4 WIDTH="100%" NOSAVE > <tr NOSAVE> <td NOSAVE></td>  <td> <center><b>A,B</b></center> </td>  <td> <center><b>C</b></center> </td>  <td> <center><b>D,E</b></center> </td> </tr>  <tr> <td> <center><b>C</b></center> </td>  <td> <center>4</center> </td>  <td>&nbsp;</td>  <td>&nbsp;</td> </tr>  <tr> <td> <center><b>D,E</b></center> </td>  <td> <center>6</center> </td>  <td> <center>6</center> </td>  <td>&nbsp;</td> </tr>  <tr> <td> <center><b>F</b></center> </td>  <td> <center>8</center> </td>  <td> <center>8</center> </td>  <td> <center>8</center> </td> </tr> </table> </td>  <td WIDTH="272" NOSAVE> <center><img SRC="UPGMA04.gif" NAME="Image7" BORDER=0 height=83 width=106 align=BOTTOM></center> </td> </tr>  <tr NOSAVE> <td WIDTH="59"><b>Cycle 4</b></td>  <td WIDTH="256"> <table COLS=3 WIDTH="100%" NOSAVE > <tr NOSAVE> <td NOSAVE></td>  <td> <center><b>AB,C</b></center> </td>  <td> <center><b>D,E</b></center> </td> </tr>  <tr> <td> <center><b>D,E</b></center> </td>  <td> <center>6</center> </td>  <td>&nbsp;</td> </tr>  <tr> <td> <center><b>F</b></center> </td>  <td> <center>8</center> </td>  <td> <center>8</center> </td> </tr> </table> </td>  <td WIDTH="272" NOSAVE> <center><img SRC="UPGMA05.gif" height=137 width=142></center> </td> </tr>  <tr> <td WIDTH="59"><b>Cycle 5</b></td>  <td WIDTH="256"> <table WIDTH="100%" NOSAVE > <tr NOSAVE> <td NOSAVE>&nbsp;</td>  <td><b>ABC,DE</b></td> </tr>  <tr> <td> <div align=right><b>F</b></div> </td>  <td>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 8</td> </tr> </table> </td>  <td WIDTH="272"> <center><img SRC="UPGMA06.gif" NAME="Image9" BORDER=0 height=164 width=217 align=BOTTOM></center> </td> </tr> </table>  <p>Cette m&eacute;thode conduit essentiellement &agrave; unn arbre non enracin&eacute;. Si on veut enraciner l'arbre, on peut appliquer la m&eacute;thode du "mid-point rooting" : la racine de l'arbre est &agrave; &eacute;quidistance de tous les OTUs soit (ABCDE),F / 2 = 4 <p><b><u>Les inconv&eacute;nients de la m&eacute;thode UPGMA</u></b> <br>L'inconv&eacute;nient majeur est la sensibilit&eacute; de la m&eacute;thode &agrave; des taux de mutations diff&eacute;rents sur les diff&eacute;rentes branches <br>Supposons que l'on&nbsp; veuille reconstruire l'arbre suivant &agrave; partir de la matrice de distances associ&eacute;e aux s&eacute;quences : <br><img SRC="UPGMA07.gif" NAME="Image10" BORDER=0 height=164 width=286 align=BOTTOM>  <p STYLE="margin-bottom: 0in">Depuis que A et B ont diverg&eacute;, B a accumul&eacute; beaucoup plus de mutations que A <table BORDER CELLSPACING=3 CELLPADDING=2 WIDTH="615" NOSAVE RULES="GROUPS" > <caption>&nbsp;</caption>  <tr VALIGN=TOP NOSAVE> <th WIDTH="61" NOSAVE></th>  <th WIDTH="256">MATRICE</th>  <th WIDTH="272">ARBRE</th> </tr>  <tr NOSAVE> <td WIDTH="61"> <center><b>Cycle 1</b></center> </td>  <td WIDTH="256"> <table COLS=6 WIDTH="100%" NOSAVE > <tr NOSAVE> <td NOSAVE></td>  <td> <center><b>A</b></center> </td>  <td> <center><b>B</b></center> </td>  <td> <center><b>C</b></center> </td>  <td> <center><b>D</b></center> </td>  <td> <center><b>E</b></center> </td> </tr>  <tr> <td> <center><b>B</b></center> </td>  <td> <center>5</center> </td>  <td>&nbsp;</td>  <td>&nbsp;</td>  <td>&nbsp;</td>  <td>&nbsp;</td> </tr>  <tr> <td> <center><b>C</b></center> </td>  <td> <center>4</center> </td>  <td> <center>7</center> </td>  <td>&nbsp;</td>  <td>&nbsp;</td>  <td>&nbsp;</td> </tr>  <tr> <td> <center><b>D</b></center> </td>  <td> <center>7</center> </td>  <td> <center>10</center> </td>  <td> <center>7</center> </td>  <td>&nbsp;</td>  <td>&nbsp;</td> </tr>  <tr> <td> <center><b>E</b></center> </td>  <td> <center>6</center> </td>  <td> <center>9</center> </td>  <td> <center>6</center> </td>  <td> <center>5</center> </td>  <td>&nbsp;</td> </tr>  <tr> <td> <center><b>F</b></center> </td>  <td> <center>8</center> </td>  <td> <center>11</center> </td>  <td> <center>8</center> </td>  <td> <center>9</center> </td>  <td> <center>8</center> </td> </tr> </table> </td>  <td WIDTH="272" NOSAVE> <center><img SRC="UPGMA09.gif" NAME="Image11" BORDER=0 height=55 width=99 align=BOTTOM></center> </td> </tr>  <tr> <td WIDTH="61"> <center><b>Cycle 2</b></center> </td>  <td WIDTH="256"> <table COLS=5 WIDTH="100%" NOSAVE > <tr NOSAVE> <td NOSAVE></td>  <td NOSAVE> <center><b>A,C</b></center> </td>  <td> <center><b>B</b></center> </td>  <td> <center><b>D</b></center> </td>  <td> <center><b>E</b></center> </td> </tr>  <tr> <td> <center><b>B</b></center> </td>  <td> <center>4</center> </td>  <td>&nbsp;</td>  <td>&nbsp;</td>  <td>&nbsp;</td> </tr>  <tr> <td> <center><b>D</b></center> </td>  <td> <center>7</center> </td>  <td> <center>10</center> </td>  <td>&nbsp;</td>  <td>&nbsp;</td> </tr>  <tr> <td> <center><b>E</b></center> </td>  <td> <center>6</center> </td>  <td> <center>9</center> </td>  <td> <center>5</center> </td>  <td>&nbsp;</td> </tr>  <tr> <td> <center><b>F</b></center> </td>  <td> <center>8</center> </td>  <td> <center>11</center> </td>  <td> <center>8</center> </td>  <td> <center>9</center> </td> </tr> </table> </td>  <td WIDTH="272"> <center><img SRC="UPGMA10.gif" NAME="Image12" BORDER=0 height=55 width=124 align=BOTTOM></center> </td> </tr>  <tr> <td WIDTH="61"> <center><b>Cycle 3</b></center> </td>  <td WIDTH="256"> <table WIDTH="100%" NOSAVE > <tr NOSAVE> <td NOSAVE></td>  <td> <center><b>A,C</b></center> </td>  <td> <center><b>B</b></center> </td>  <td> <center><b>D,E</b></center> </td> </tr>  <tr> <td> <center><b>B</b></center> </td>  <td> <center>6</center> </td>  <td>&nbsp;</td>  <td>&nbsp;</td> </tr>  <tr> <td> <center><b>D,E</b></center> </td>  <td> <center>6.5</center> </td>  <td> <center>9.5</center> </td>  <td>&nbsp;</td> </tr>  <tr> <td> <center><b>F</b></center> </td>  <td> <center>8</center> </td>  <td> <center>11</center> </td>  <td> <center>8.5</center> </td> </tr> </table> </td>  <td WIDTH="272"> <center><img SRC="UPGMA11.gif" NAME="Image13" BORDER=0 height=80 width=144 align=BOTTOM></center> </td> </tr>  <tr> <td WIDTH="61"> <center><b>Cycle 4</b></center> </td>  <td WIDTH="256"> <table WIDTH="100%" NOSAVE > <tr NOSAVE> <td NOSAVE></td>  <td> <center><b>AC,B</b></center> </td>  <td> <center><b>D,E</b></center> </td> </tr>  <tr> <td> <center><b>D,E</b></center> </td>  <td> <center>8</center> </td>  <td>&nbsp;</td> </tr>  <tr> <td> <center><b>F</b></center> </td>  <td> <center>9.5</center> </td>  <td> <center>9.5</center> </td> </tr> </table> </td>  <td WIDTH="272"> <center><img SRC="UPGMA12.gif" NAME="Image14" BORDER=0 height=135 width=168 align=BOTTOM></center> </td> </tr>  <tr> <td WIDTH="61"> <center><b>Cycle 5</b></center> </td>  <td WIDTH="256"> <table WIDTH="100%" NOSAVE > <tr NOSAVE> <td NOSAVE>&nbsp;</td>  <td><b>ABC,DE</b></td> </tr>  <tr> <td> <div align=right><b>F</b></div> </td>  <td>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 9</td> </tr> </table> </td>  <td WIDTH="272"> <center><img SRC="UPGMA08.gif" NAME="Image15" BORDER=0 height=150 width=219 align=BOTTOM> <p><b>Topologie Fausse !!</b></center> </td> </tr> </table>  <h4> <img SRC="ball.blue.gif" height=14 width=14><a NAME="NJ"></a><b><u>NJ</u></b>(Neighbor-Joining)</h4> Cette m&eacute;thode d&eacute;velopp&eacute;e par Saitou et Nei (1987) tente de corriger la m&eacute;thode UPGMA afin d'autoriser un taux de mutation diff&eacute;rent sur les branches. <br>Les donn&eacute;es initiales permettent de construire une matrice qui donne un arbre en &eacute;toile. Cette matrice de distances est ensuite corrig&eacute;e afin de prendre en compte la divergence moyenne de chacunes des s&eacute;quences avec les autres. <br>L'arbre est alors reconstruit en reliant les s&eacute;quences les plus proches dans cette nouvelle matrice. Lorsque deux s&eacute;quences sont li&eacute;es, le noeud repr&eacute;sentant leur anc&ecirc;tre commun est ajout&eacute; &agrave; l'arbre tandis que les deux feuilles sont enlev&eacute;es. Ce processus convertit l'anc&ecirc;tre commun en un noeud terminal dans un arbre de taille r&eacute;duite. <br>Programme <a href="http://www.infobiogen.fr/docs/PHYLIPdoc/neighbor.html">NEIGHBOR</a> de Phylip <br><b><i><u>Exemple</u></i></b> <br><img SRC="NJ1.gif" height=164 width=286> <br>La matrice de distance associ&eacute;e &agrave; cet arbre est la suivante : <br>&nbsp; <table WIDTH="30%" NOSAVE > <tr NOSAVE> <td NOSAVE>&nbsp;</td>  <td> <center><b>A</b></center> </td>  <td> <center><b>B</b></center> </td>  <td> <center><b>C</b></center> </td>  <td> <center><b>D</b></center> </td>  <td> <center><b>E</b></center> </td> </tr>  <tr> <td> <center><b>B</b></center> </td>  <td> <center>5</center> </td>  <td>&nbsp;</td>  <td>&nbsp;</td>  <td>&nbsp;</td>  <td>&nbsp;</td> </tr>  <tr> <td> <center><b>C</b></center> </td>  <td> <center>4</center> </td>  <td> <center>7</center> </td>  <td>&nbsp;</td>  <td>&nbsp;</td>  <td>&nbsp;</td> </tr>  <tr> <td> <center><b>D</b></center> </td>  <td> <center>7</center> </td>  <td> <center>10</center> </td>  <td> <center>7</center> </td>  <td>&nbsp;</td>  <td>&nbsp;</td> </tr>  <tr> <td> <center><b>E</b></center> </td>  <td> <center>6</center> </td>  <td> <center>9</center> </td>  <td> <center>6</center> </td>  <td> <center>5</center> </td>  <td>&nbsp;</td> </tr>  <tr> <td> <center><b>F</b></center> </td>  <td> <center>8</center> </td>  <td> <center>11</center> </td>  <td> <center>8</center> </td>  <td> <center>9</center> </td>  <td> <center>8</center> </td> </tr> </table>  <p><b><u>Etape 1</u></b> : calcul de la divergence de chacun des N OTUs par rapport aux autres (N= 6) <br>r (A) = 5+4+7+6+8 = 30 <br>r(B) = 42 <br>r(C) = 32 <br>r(D) = 38 <br>r (E) =34 <br>r(F) = 44 <p><b><u>Etape 2</u></b> : cacul de la nouvelle matrice en utilisant la formule <br><b>M(i,j) = d(ij) -[r(i) + r(j)] / (N-2)</b> <br>ce qui donne pour la paire AB : M(AB) = 5 - [30 + 42] / 4 = -13 <table COLS=6 WIDTH="30%" NOSAVE > <tr NOSAVE> <td NOSAVE>&nbsp;</td>  <td> <center><b>A</b></center> </td>  <td> <center><b>B</b></center> </td>  <td> <center><b>C</b></center> </td>  <td> <center><b>D</b></center> </td>  <td> <center><b>E</b></center> </td> </tr>  <tr> <td> <center><b>B</b></center> </td>  <td> <center>-13</center> </td>  <td>&nbsp;</td>  <td>&nbsp;</td>  <td>&nbsp;</td>  <td>&nbsp;</td> </tr>  <tr> <td> <center><b>C</b></center> </td>  <td> <center>-11.5</center> </td>  <td> <center>-11.5</center> </td>  <td>&nbsp;</td>  <td>&nbsp;</td>  <td>&nbsp;</td> </tr>  <tr> <td> <center><b>D</b></center> </td>  <td> <center>-10</center> </td>  <td> <center>-10</center> </td>  <td> <center>-10.5</center> </td>  <td>&nbsp;</td>  <td>&nbsp;</td> </tr>  <tr> <td> <center><b>E</b></center> </td>  <td> <center>-10</center> </td>  <td> <center>-10</center> </td>  <td> <center>-10.5</center> </td>  <td> <center>-13</center> </td>  <td>&nbsp;</td> </tr>  <tr> <td> <center><b>F</b></center> </td>  <td> <center>-10.5</center> </td>  <td> <center>-10.5</center> </td>  <td> <center>-11</center> </td>  <td> <center>-11.5</center> </td>  <td> <center>-11.5</center> </td> </tr> </table> &nbsp;Ceci permet de construire l'arbre en &eacute;toile suivant : <p>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; A <br>F&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; |&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;  B <br>&nbsp; \&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; |&nbsp;&nbsp;&nbsp;&nbsp; / <br>&nbsp;&nbsp;&nbsp;&nbsp; \&nbsp;&nbsp;&nbsp; |&nbsp;&nbsp; / <br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; \&nbsp; | / <br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; / | \ <br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; /&nbsp;&nbsp; |&nbsp;&nbsp; \ <br>&nbsp;&nbsp;&nbsp; /&nbsp;&nbsp;&nbsp;&nbsp; |&nbsp;&nbsp;&nbsp;&nbsp; \ <br>E&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; |&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; C <br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; D <p><b><u>Etape 3</u></b> : Choix des plus proches voisins, c'est &agrave; dire des deux OTUs ayant le M(i,j) le plus petit, donc soit A et B soit D et E. <br>On prend A et B et on forme un nouveau noeud U et on calcule la longueur de la branche entre U et A ainsi qu'entre U et B : <p>S (AU) = d (AB) / 2 + [r(A) - r(B)] / 2 (N-2) = 5/2 + [30-42] /2(6-4) = 1 <br>S(BU) = d (AB) - S(AU) = 5 - 1 = 4 <p><b><u>Etape 4 </u></b>: on d&eacute;finit les nouvelles distances entre U et les autres OTUs <br>d (CU) = d(AC) + d (BC) - d(AB) / 2 = 3 <br>d (DU) = d(AD) + d(BD) -d(AB) /2 = 6 <br>d (EU) = d(AE) + d (BE) - d(AB) / 2 = 5 <br>d (DU) = d(AF) + d(BF) -d(AB) /2 = 7 <p>cr&eacute;ation d'une nouvelle matrice : <br>&nbsp; <table COLS=5 WIDTH="30%" NOSAVE > <tr NOSAVE> <td NOSAVE>&nbsp;</td>  <td> <center><b>U</b></center> </td>  <td> <center><b>C</b></center> </td>  <td> <center><b>D</b></center> </td>  <td> <center><b>E</b></center> </td> </tr>  <tr> <td> <center><b>C</b></center> </td>  <td> <center>3</center> </td>  <td>&nbsp;</td>  <td>&nbsp;</td>  <td>&nbsp;</td> </tr>  <tr> <td> <center><b>D</b></center> </td>  <td> <center>6</center> </td>  <td> <center>7</center> </td>  <td>&nbsp;</td>  <td>&nbsp;</td> </tr>  <tr> <td> <center><b>E</b></center> </td>  <td> <center>5</center> </td>  <td> <center>6</center> </td>  <td> <center>5</center> </td>  <td>&nbsp;</td> </tr>  <tr> <td> <center><b>F</b></center> </td>  <td> <center>7</center> </td>  <td> <center>8</center> </td>  <td> <center>9</center> </td>  <td> <center>8</center> </td> </tr> </table>  <p>Et d'un arbre en &eacute;toile : <br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; C <br>D&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; | <br>&nbsp;&nbsp; \&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; |&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; A <br>&nbsp;&nbsp;&nbsp;&nbsp; \__| ____1/ <br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; /&nbsp;&nbsp; |&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; \ <br>&nbsp;&nbsp;&nbsp; /&nbsp;&nbsp;&nbsp;&nbsp; |&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; \ 4 <br>&nbsp;E&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; F&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; \ <br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; B <p>La proc&eacute;dure compl&egrave;te repart de l'&eacute;tape 1 avec N = N-1 = 5. <br>&nbsp; <h4> <a NAME="Derivees"></a><img SRC="ball.blue.gif" height=14 width=14> <b><u>M&eacute;thodes d&eacute;riv&eacute;es des m&eacute;thodes bas&eacute;es sur les distances</u></b></h4> Dans ces m&eacute;thodes, l'arbre s&eacute;lectionn&eacute; est celui pr&eacute;sentant la somme des carr&eacute;s des &eacute;carts entre les distances observ&eacute;es et les distances calcul&eacute;es la plus faible. <br>Il existe, dans Phylip, deux programmes utilisant ces m&eacute;thodes : <br><a href="http://www.infobiogen.fr/docs/PHYLIPdoc/fitch.html">FITCH</a> : la longueur des branches n'est pas proportionnelle au temps &eacute;coul&eacute; et la racine n'est pas localis&eacute;e dans l'arbre. <br><a href="http://www.infobiogen.fr/docs/PHYLIPdoc/kitsch.html">KITSCH</a> : on fait l'hypoth&egrave;se que toutes les esp&egrave;ces sont contemporaines et qu'il y a une horloge mol&eacute;culaire. Cela signifie que les branches de l'arbre ne peuvent pas avoir une longueur arbitraire mais sont proportionnelles au temps &eacute;coul&eacute;. Les arbres g&eacute;n&eacute;r&eacute;s par cette m&eacute;thode pr&eacute;sente une racine. <h4> <a NAME="Corrections"></a><img SRC="ball.blue.gif" height=14 width=14><u>Les corrections</u></h4> Si le temps de divergence entre deux s&eacute;quences augmente, la probabilit&eacute; d'avoir une seconde mutation a un site augmente &eacute;galement. Ceci fait que le simple comptage des diff&eacute;rences entre deux s&eacute;quences n'est pas le reflet exact de la r&eacute;alit&eacute; mais sous-estime le nombre d'&eacute;v&egrave;nements mutationnels. On tente de corriger ce biais en faisant des hypoth&egrave;ses sur la fa&ccedil;on dont les bases ou acides amin&eacute;s se sont subsitu&eacute;s &agrave; un locus donn&eacute;. Les premiers &agrave; avoir propos&eacute;s une solution &agrave; ce probl&egrave;me sont Jukes et Cantor en 1969. <p><u>Types de substitutions</u> <br>On distingue diff&eacute;rents types de substitution suivant les bases impliqu&eacute;es. <br>&nbsp; <table WIDTH="50%" NOSAVE > <tr ALIGN=CENTER VALIGN=CENTER NOSAVE> <td NOSAVE><img SRC="corrections2.gif" height=104 width=207 align=ABSCENTER></td>  <td><b>Transitions</b> :&nbsp; <br>A &lt;-> G, C &lt;-> T <br><b>Transversions</b> :&nbsp; <br>A &lt;-> C, A &lt;-> T,&nbsp; <br>G &lt;-> C, G &lt;-> T</td> </tr> </table>  <p>Lorsque l'on compare deux s&eacute;quences, on diff&eacute;rencie aussi les substitutions selon leur ordre et leurs cons&eacute;quences. <br>&nbsp; <table BORDER WIDTH="80%" NOSAVE > <tr NOSAVE> <td NOSAVE>&nbsp;</td>  <td> <center><b>S&eacute;quence 1</b></center> </td>  <td> <center><b>S&eacute;quence 2</b></center> </td>  <td> <center><b>Nb de&nbsp;</b> <br><b>substitutions observ&eacute;es</b></center> </td>  <td> <center><b>Nb r&eacute;el de substitutions&nbsp;</b></center> </td> </tr>  <tr> <td> <center><b>Substitution unique</b></center> </td>  <td> <center>C</center> </td>  <td> <center>C -> A</center> </td>  <td> <center>1</center> </td>  <td> <center>1</center> </td> </tr>  <tr> <td> <center><b>Substitutions multiples</b></center> </td>  <td> <center>A</center> </td>  <td> <center>A -> C -> T</center> </td>  <td> <center>1</center> </td>  <td> <center>2</center> </td> </tr>  <tr> <td> <center><b>Substitutions coincidentes au m&ecirc;me site</b></center> </td>  <td> <center>C -> A</center> </td>  <td> <center>C-> G</center> </td>  <td> <center>1</center> </td>  <td> <center>2</center> </td> </tr>  <tr> <td> <center><b>Substitutions parall&egrave;les</b></center> </td>  <td> <center>T -> A</center> </td>  <td> <center>T -> A</center> </td>  <td> <center>0</center> </td>  <td> <center>1</center> </td> </tr>  <tr> <td> <center><b>Substitutions convergentes</b></center> </td>  <td> <center>C -> T -> A</center> </td>  <td> <center>C -> A</center> </td>  <td> <center>0</center> </td>  <td> <center>3</center> </td> </tr>  <tr> <td> <center><b>Substitutions reverses</b></center> </td>  <td> <center>C -> T -> C</center> </td>  <td> <center>C</center> </td>  <td> <center>0</center> </td>  <td> <center>1</center> </td> </tr> </table>  <p><b><i><u>Exemples de corrections pour les substitutions multiples</u></i></b> <p>- <i>Correction de Jukes et Cantor (1969) </i>: On fait l'hypoth&egrave;se que tous les sites sont &eacute;quivalents (tous les changements ont une probabillit&eacute;&nbsp; &eacute;gale mais elle varie au cours du temps), qu'il n'y a pas de biais dans la direction du changement et qu'il n'y a eu ni insertions ni d&eacute;l&eacute;tions. C'est l'hypoth&egrave;se la plus simple,mais pas forc&eacute;ment la plus correcte. <p><img SRC="JC1.gif" height=39 width=351> <br><img SRC="JC2.gif" height=40 width=350> <p><img SRC="JC3b.gif" height=317 width=425> <p>- <i>Correction de Kimura&nbsp; ou 2 param&egrave;tres (1980) </i>: ce mod&egrave;le est similaire au mod&egrave;le de Jukes-Cantor mais on fait l'hypoth&egrave;se que le taux de transition est diff&eacute;rent du taux de transversion. Ce mod&egrave;le a &eacute;t&eacute; d&eacute;velopp&eacute; suite &agrave; l'obsevation que les transitions &eacute;taient souvent beaucoup plus fr&eacute;quentes que les transversions. <br>Si <b>P</b> est la fr&eacute;quence des transitions et <b>Q</b> la fr&eacute;quence des transversions : <p><img SRC="K1.gif" height=33 width=410> <br><img SRC="K2.gif" height=19 width=407> <p>avec <br><img SRC="K3.gif" height=24 width=142 align=TEXTTOP>&nbsp; et&nbsp;<img SRC="K4.gif" height=27 width=104 align=TEXTTOP> <h3> <a NAME="Caracteres"></a>2.2. M&eacute;thodes fond&eacute;es sur les carat&egrave;res</h3> Ces m&eacute;thodes sont tr&egrave;s lentes mais elles sont pr&eacute;cises. <br><img SRC="ball.blue.gif" height=14 width=14><a NAME="Parcimonie"></a><b><u>Parcimonie</u></b> <br>La parcimonie&nbsp; consiste a minimiser le nombre de "pas" (mutations / substitutions) n&eacute;cessaires pour passer d'une s&eacute;quence &agrave; une autre dans une topologie de l'arbre. <br>Pour cela, cette m&eacute;thode s'appuie sur les hypoth&egrave;ses suivantes : <br>- les sites &eacute;voluent ind&eacute;pendemment les uns des autres (la s&eacute;quence peut &ecirc;tre consid&eacute;r&eacute;e comme une suite de caract&egrave;res non ordonn&eacute;s) <br>- la vitesse d'&eacute;volution est lente et constante au cours du temps. <br>Cette m&eacute;thode, quand elle est appliqu&eacute;e &agrave; des s&eacute;quences prot&eacute;iques, utilise le code g&eacute;n&eacute;tique pour comptabiliser le nombre de substitutions n&eacute;cessaires (changements de bases) pour passer d'un site &agrave; l'autre d'une s&eacute;quence &agrave; l'autre. <br>La m&eacute;thode de maximum de parcimonie recherche toutes les topologies possibles afin de trouver l'arbre optimal (mimimum) et le temps n&eacute;cessaire pour cette exploration croit rapidement avec le nombre de s&eacute;quences : <br>le nombre d'arbres enracin&eacute;s possibles pour n OTUs : Nr = (2n - 3)! / (2exp(n-2))(n-2)! <br>le nombre d'arbres non enracin&eacute;s possibles pour n OTUs : Nu = (2n -5)! / (2exp(n-3))(n-3)! <br>Programme <a href="http://www.infobiogen.fr/docs/PHYLIPdoc/dnapars.html">DNAPARS</a>&nbsp; et <a href="http://www.infobiogen.fr/docs/PHYLIPdoc/protpars.html">PROTPARS</a>&nbsp; de Phylip <br>&nbsp; <table BORDER WIDTH="40%" NOSAVE > <tr> <td> <center><b>Nombre d'OTUs</b></center> </td>  <td> <center><b>Nb d'arbres non enracin&eacute;s</b></center> </td>  <td> <center><b>Nb d'arbres enracin&eacute;s possibles</b></center> </td> </tr>  <tr> <td> <center><b>2</b></center> </td>  <td> <center>1</center> </td>  <td> <center>1</center> </td> </tr>  <tr> <td> <center><b>3</b></center> </td>  <td> <center>1</center> </td>  <td> <center>3</center> </td> </tr>  <tr> <td> <center><b>4</b></center> </td>  <td> <center>3</center> </td>  <td> <center>15</center> </td> </tr>  <tr> <td> <center><b>5</b></center> </td>  <td> <center>15</center> </td>  <td> <center>105</center> </td> </tr>  <tr> <td> <center><b>6</b></center> </td>  <td> <center>105</center> </td>  <td> <center>945</center> </td> </tr>  <tr> <td> <center><b>7</b></center> </td>  <td> <center>954</center> </td>  <td> <center>10 395</center> </td> </tr>  <tr> <td> <center><b>8</b></center> </td>  <td> <center>10 395</center> </td>  <td> <center>135 135</center> </td> </tr>  <tr> <td> <center><b>9</b></center> </td>  <td> <center>135 135</center> </td>  <td> <center>34 459 425</center> </td> </tr>  <tr> <td> <center><b>10</b></center> </td>  <td> <center>34 459 425</center> </td>  <td> <center>2.13 E15</center> </td> </tr>  <tr> <td> <center><b>15</b></center> </td>  <td> <center>2.13 E15</center> </td>  <td> <center>8E21</center> </td> </tr> </table>  <p><b><i><u>&nbsp;Exemple</u></i></b> <table WIDTH="30%" NOSAVE > <tr NOSAVE> <td NOSAVE> <center><b>Sequence</b></center> </td>  <td> <center><b>1</b></center> </td>  <td> <center><b>2</b></center> </td>  <td> <center><b>3</b></center> </td>  <td> <center><b>4</b></center> </td>  <td> <center><b>5</b></center> </td>  <td> <center><b>6</b></center> </td>  <td> <center><b>7</b></center> </td>  <td> <center><b>8</b></center> </td>  <td> <center><b>9</b></center> </td> </tr>  <tr> <td> <center><b>1</b></center> </td>  <td> <center>A</center> </td>  <td> <center>A</center> </td>  <td> <center>G</center> </td>  <td> <center>A</center> </td>  <td> <center>G</center> </td>  <td> <center>T</center> </td>  <td> <center>G</center> </td>  <td> <center>C</center> </td>  <td> <center>A</center> </td> </tr>  <tr> <td> <center><b>2</b></center> </td>  <td> <center>A</center> </td>  <td> <center>G</center> </td>  <td> <center>C</center> </td>  <td> <center>C</center> </td>  <td> <center>G</center> </td>  <td> <center>T</center> </td>  <td> <center>G</center> </td>  <td> <center>C</center> </td>  <td> <center>G</center> </td> </tr>  <tr> <td> <center><b>3</b></center> </td>  <td> <center>A</center> </td>  <td> <center>G</center> </td>  <td> <center>A</center> </td>  <td> <center>T</center> </td>  <td> <center>A</center> </td>  <td> <center>T</center> </td>  <td> <center>C</center> </td>  <td> <center>C</center> </td>  <td> <center>A</center> </td> </tr>  <tr> <td> <center><b>4</b></center> </td>  <td> <center>A</center> </td>  <td> <center>G</center> </td>  <td> <center>A</center> </td>  <td> <center>G</center> </td>  <td> <center>A</center> </td>  <td> <center>T</center> </td>  <td> <center>C</center> </td>  <td> <center>C</center> </td>  <td> <center>G</center> </td> </tr> </table>  <p>Pour 4 s&eacute;quences, il y a 3 arbres non enracin&eacute;s possibles. Ces trois arbres sont analys&eacute;s (recherche de la s&eacute;quence ancestrale et comptage du nombre de mutations) <p>(1)&nbsp; AAGAGTGCA&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; AGATATCCA (3) <br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; \&nbsp;&nbsp; 4&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; /&nbsp; 2 <br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; \&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 4&nbsp;&nbsp;&nbsp; / <br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; AGCCGTGCG --- AGAGATCCG&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Nombre de mutations : 10 <br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; /&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; \ <br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; /&nbsp; 0&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; \&nbsp; 0 <br>(2)&nbsp; AGCCGTGCG&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; AGAGATCCG (4) <br>&nbsp; <br>&nbsp; <p>(1)&nbsp; AAGAGTGCA&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; AGCCGTGCG (2) <br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; \&nbsp; 1&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; / 3 <br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; \&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 5&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; / <br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; AGGAGTGCA --- AGAGGTCCG&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Nombre de mutations : 14 <br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; /&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; \ <br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; /&nbsp; 4&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; \ 1 <br>(3)&nbsp; AGATATCCA&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; AGAGATCCG (4) <br>&nbsp; <p>(1)&nbsp; AAGAGTGCA&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; AGCCGTGCG (2) <br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; \&nbsp; 1&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; / 3 <br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; \&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 5&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; / <br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; AGGAGTGCA --- AGATGTCCG&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Nombre de mutations : 16 <br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; /&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; \ <br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; /&nbsp; 5&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; \ 2 <br>(4)&nbsp; AGAGATCCG&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; AGATATCCA (3) <p>L'arbre I est celui n&eacute;cessitant le moins de mutations, c'est donc le plus parcimonieux. <br>Cette analyse prend en compte tous les sites des s&eacute;quences mais l'analyse peut &eacute;galement se faire uniquement sur les sites informatifs, c'est &agrave; dire quand &agrave; cette position il y a au moins 2 nucl&eacute;otides diff&eacute;rents, repr&eacute;sent&eacute;s chacun dans au moins deux s&eacute;quences. <br>&nbsp; <table WIDTH="30%" NOSAVE > <tr NOSAVE> <td NOSAVE> <center><b>S&eacute;quence</b></center> </td>  <td> <center><b>1</b></center> </td>  <td> <center><b>2</b></center> </td>  <td> <center><b>3</b></center> </td>  <td> <center><b>4</b></center> </td>  <td> <center><b>5</b></center> </td>  <td> <center><b>6</b></center> </td>  <td> <center><b>7</b></center> </td>  <td> <center><b>8</b></center> </td>  <td> <center><b>9</b></center> </td> </tr>  <tr> <td> <center><b>1</b></center> </td>  <td> <center>A</center> </td>  <td> <center>A</center> </td>  <td> <center>G</center> </td>  <td> <center>A</center> </td>  <td> <center>G</center> </td>  <td> <center>T</center> </td>  <td> <center>G</center> </td>  <td> <center>C</center> </td>  <td> <center>A</center> </td> </tr>  <tr> <td> <center><b>2</b></center> </td>  <td> <center>A</center> </td>  <td> <center>G</center> </td>  <td> <center>C</center> </td>  <td> <center>C</center> </td>  <td> <center>G</center> </td>  <td> <center>T</center> </td>  <td> <center>G</center> </td>  <td> <center>C</center> </td>  <td> <center>G</center> </td> </tr>  <tr> <td> <center><b>3</b></center> </td>  <td> <center>A</center> </td>  <td> <center>G</center> </td>  <td> <center>A</center> </td>  <td> <center>T</center> </td>  <td> <center>A</center> </td>  <td> <center>T</center> </td>  <td> <center>C</center> </td>  <td> <center>C</center> </td>  <td> <center>A</center> </td> </tr>  <tr> <td> <center><b>4</b></center> </td>  <td> <center>A</center> </td>  <td> <center>G</center> </td>  <td> <center>A</center> </td>  <td> <center>G</center> </td>  <td> <center>A</center> </td>  <td> <center>T</center> </td>  <td> <center>C</center> </td>  <td> <center>C</center> </td>  <td> <center>G</center> </td> </tr>  <tr> <td>&nbsp;</td>  <td>&nbsp;</td>  <td>&nbsp;</td>  <td>&nbsp;</td>  <td>&nbsp;</td>  <td> <center>*</center> </td>  <td>&nbsp;</td>  <td> <center>*</center> </td>  <td>&nbsp;</td>  <td> <center>*</center> </td> </tr> </table> On peut donc "r&eacute;duire" les s&eacute;quences aux seuls sites informatifs : <br>&nbsp; <table COLS=4 WIDTH="20%" NOSAVE > <tr NOSAVE> <td NOSAVE> <center><b>1</b></center> </td>  <td> <center>G</center> </td>  <td> <center>G</center> </td>  <td> <center>A</center> </td> </tr>  <tr> <td> <center><b>2</b></center> </td>  <td> <center>G</center> </td>  <td> <center>G</center> </td>  <td> <center>G</center> </td> </tr>  <tr> <td> <center><b>3</b></center> </td>  <td> <center>A</center> </td>  <td> <center>C</center> </td>  <td> <center>A</center> </td> </tr>  <tr> <td> <center><b>4</b></center> </td>  <td> <center>A</center> </td>  <td> <center>C</center> </td>  <td> <center>G</center> </td> </tr>  <tr> <td>&nbsp;</td>  <td> <center><b>*</b></center> </td>  <td> <center><b>*</b></center> </td>  <td> <center><b>*</b></center> </td> </tr> </table> (1) GGA&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; ACA&nbsp; (3) <br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; \ 1&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; / 1 <br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; \&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 2&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; / <br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; GGG - - - ACG&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Nombre de mutations : 4 <br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; / 0&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; \ 0 <br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; /&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; \ <br>&nbsp;(2) GGG&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; ACG&nbsp; (4) <br>&nbsp; <p>(1) GGA&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; GGG&nbsp; (2) <br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; \ 1&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; / 1 <br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; \&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 1&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; / <br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; GGG - - - ACG&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Nombre de mutations : 5 <br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; / 1&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; \ 1 <br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; /&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; \ <br>&nbsp;(3) ACA&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; ACG&nbsp; (4) <br>&nbsp; <p>(1) GGA&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; ACA&nbsp; (2) <br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; \ 2&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; / 1 <br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; \&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 0&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; / <br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; GGG - - - ACG&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Nombre de mutations : 6 <br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; / 1&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; \ 2 <br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; /&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; \ <br>&nbsp;(4) ACG&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; ACA&nbsp; (3) <p>Dans le cas de 4 s&eacute;quences, un site informatif favorise seulement un arbre : le site 5 favorise l'arbre I plus que les arbres II et III (il supporte l'arbre I). L'arbre le plus parcimonieux est celui qui est support&eacute; par le plus grand nombre de sites informatifs. <br>Le maximum de parcimonie recherche l'arbre optimal et dans ce processus, il est possible de trouver plusieurs arbres optimaux (= arbres ex-aequo = configuration comptabilisant le m&ecirc;me nombre minimal de substitutions n&eacute;cessaires pour passeer d'une s&eacute;quence &agrave; l'autre dans l'ensemble de l'arbre). <br>Afin de garantir de trouver l'arbre le meilleur possible, il faut faire une &eacute;valuation de toutes les topologies possibles mais cela devient impossible lorsque l'on a plus de 12 s&eacute;quences. <p><b>Branch and Bound</b> : cette m&eacute;thode est d&eacute;riv&eacute;e du maximum de parcimonie, elle garantit de trouver le meilleur arbre mais sans &eacute;valuer tous les arbres possibles. Elle permet de traiter un plus grand nombre de s&eacute;quences mais reste limit&eacute;e. <p><b>Recherche heuristique</b> : il y a un r&eacute;arrangement des branches &agrave; chaque &eacute;tape, cette m&eacute;thode ne garantit pas de trouver l'arbre optimal. <p><b>Arbre consensus</b> : comme la m&eacute;thode du maximum de parcimonie peut conduire &agrave; trouver plusieurs arbres &eacute;quivalents, on peut cr&eacute;er un arbre consensus (avec utilisation du bootstraping). Cet arbre consensus est construit &agrave; partir des noeuds les plus fr&eacute;quemment rencontr&eacute;s sur l'ensemble des arbres possibles. <p><img SRC="parcimonie01.gif" height=371 width=436> <p><b><u>Avantages et inconv&eacute;nients de la parcimonie</u></b> <br><b>Avantages&nbsp;</b> <b>:</b> <br>- M&eacute;thode bas&eacute;e sur les caract&egrave;res : m&eacute;thode cladistique plut&ocirc;t que ph&eacute;n&eacute;tique. <br>- M&eacute;thode ne r&eacute;duisant pas la s&eacute;quence &agrave; un simple nombre. <br>- M&eacute;thode essayant de donner une information sur les s&eacute;quences ancestrales. <br>- M&eacute;thode &eacute;valuant diff&eacute;rents arbres. <br><b>Inconv&eacute;nients :</b> <br>- M&eacute;thode tr&egrave;s lente par rapport aux m&eacute;thodes bas&eacute;es sur les distances. <br>- M&eacute;thode n'utilisant pas toute l'information disponible (seuls les sites informatifs sont pris en compte) <br>- M&eacute;thode ne faisant pas de corrections pour les substitutions multiples <br>- M&eacute;thode ne donnant aucune information sur la longueur des branches <br>- M&eacute;thode connue pour &ecirc;tre tr&egrave;s sensible au biais des codons <p><img SRC="ball.blue.gif" height=14 width=14><a NAME="ML"></a> <b><u>Maximum de vraissemblance</u></b> <br>Cette m&eacute;thode de reconstruction phylog&eacute;n&eacute;tique &eacute;value, en terme de probabilit&eacute;s, l'ordre des branchements et la longueur des branches d'un arbre sous un mod&egrave;le &eacute;volutif donn&eacute;. <br>Programme <a href="http://www.infobiogen.fr/docs/PHYLIPdoc/dnaml.html">DNAML</a> de Phylip <br><b><i><u>Exemple</u></i></b> <br>&nbsp; <table COLS=6 WIDTH="25%" NOSAVE > <tr NOSAVE> <td NOSAVE> <center>1</center> </td>  <td>&nbsp;</td>  <td NOSAVE>&nbsp;</td>  <td>&nbsp;</td>  <td>&nbsp;</td>  <td> <center>j</center> </td> </tr>  <tr> <td> <center>C</center> </td>  <td> <center>G</center> </td>  <td> <center>A</center> </td>  <td> <center>G</center> </td>  <td> <center>A</center> </td>  <td> <center><b>C</b></center> </td> </tr>  <tr> <td> <center>A</center> </td>  <td> <center>G</center> </td>  <td> <center>C</center> </td>  <td> <center>G</center> </td>  <td> <center>A</center> </td>  <td> <center><b>C</b></center> </td> </tr>  <tr> <td> <center>A</center> </td>  <td> <center>G</center> </td>  <td> <center>A</center> </td>  <td> <center>T</center> </td>  <td> <center>T</center> </td>  <td> <center><b>A</b></center> </td> </tr>  <tr> <td> <center>G</center> </td>  <td> <center>G</center> </td>  <td> <center>A</center> </td>  <td> <center>T</center> </td>  <td> <center>A</center> </td>  <td> <center><b>G</b></center> </td> </tr> </table>  <p>A partir des 4 s&eacute;quences ci-dessus, on veut estimer la probabilit&eacute; que l'arbre A&nbsp; soit le bon, sous le mod&eacute;le choisi. <br>&nbsp;(1)&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; (2) <br>&nbsp;&nbsp;&nbsp;&nbsp; \&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; / <br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; \&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; / <br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; ----------&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Arbre A <br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; /&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; \ <br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; /&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; \ <br>&nbsp;&nbsp;&nbsp; (3)&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; (4) <br>La vraissemblance de l'arbre est en g&eacute;n&eacute;ral ind&eacute;pendante de la position de la racine, on peut donc l'enraciner de mani&egrave;re arbitraire : <br>1&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 2&nbsp;&nbsp;&nbsp; 3&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 4 <br>&nbsp; \&nbsp;&nbsp;&nbsp;&nbsp; /&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; |&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; / <br>&nbsp;&nbsp;&nbsp; \ /&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; |&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; / <br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; \&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; |&nbsp;&nbsp;&nbsp;&nbsp; / <br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; \&nbsp;&nbsp;&nbsp;&nbsp; |&nbsp;&nbsp; / <br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; \&nbsp; | / <br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; ACGT ? <p><u>La vraissemblance au site j</u> : <br>C&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; C&nbsp;&nbsp; A&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; G <br>&nbsp; \&nbsp;&nbsp;&nbsp;&nbsp; /&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; |&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; / <br>&nbsp;&nbsp;&nbsp; \ /&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; |&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; / <br>ACGT?&nbsp; |&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; / <br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; \&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; |&nbsp;&nbsp;&nbsp;&nbsp; / <br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; \&nbsp;&nbsp;&nbsp;&nbsp; |&nbsp;&nbsp; / <br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; \&nbsp; | / <br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; ACGT ? <br>La vraissemblance pour un site j est la somme des probabilit&eacute;s de toutes les possiblit&eacute;s de reconstruction de l'&eacute;tat ancestral sous le mod&egrave;le choisi. <br>La vraissemblance de l'arbre A&nbsp; est en g&eacute;n&eacute;ral &eacute;valu&eacute;e en sommant les logs des vraissemblances pour chaque site (la somme des probabibilit&eacute;s est trop faible). <br>L'arbre du maximum de vraissemblance est celui avec la vraissemblance la plus &eacute;lev&eacute;e. <p>&nbsp;<b><u>Les mod&egrave;les &eacute;volutifs</u></b> <br>Les probabilit&eacute;s obtenues &agrave; chaque site d&eacute;pendent du mod&egrave;le choisi et dans le mod&egrave;le le plus simple <br>- on suppose que la probabilit&eacute; de chaque changement est ind&eacute;pendante des changements pr&eacute;c&eacute;dents (Mod&egrave;le de Markov). <br>- on suppose que les probabilit&eacute;s de substitution ne changent pas au cours du temps (le long de l'arbre). <br>- on suppose les changements r&eacute;versibles : P(A -> T) = P(T -> A). <br>On peut introduire d'autres param&egrave;tres dans le mod&egrave;le afin d'accro&icirc;tre son r&eacute;alisme : <br>- des taux de substitutions diff&eacute;rents pour chaque remplacement (matrice 4*4 pour l'ADN ou matrice de substitution) <br>- une correction pour le nombre de sites suceptibles de muter et des taux de substitutions variables pour ces sites. <br>- un taux de variation diff&eacute;rents pour chaque site : on peut par exemple utiliser une distribution statistique (distribution gamma) <br><img SRC="ML2.gif" height=400 width=525> <p>Il faut savoir que plus on introduit de param&egrave;tres, plus le calcul sera long et plus il y aura une accumulation de petites erreurs : il vaut mieux utiliser un mod&egrave;le simple. <p>Le maximum de vraissemblance est une bonne m&eacute;thode de reconstruction phylog&eacute;n&eacute;tique mais il faut que le mod&egrave;le de d&eacute;part corresponde bien aux donn&eacute;es. Pour estimer les param&egrave;tres, on peut utiliser une m&eacute;thode plus rapide et utiliser l'arbre obtenu pour fixer les param&egrave;tres de d&eacute;part. <br>Cette m&eacute;thode n'est utilisable que si on a un petit nombre de s&eacute;quences. <br>&nbsp; <br>&nbsp; <h3> <a NAME="Bootstrap"></a>2.3. Le bootstrap (et autres m&eacute;thodes d'&eacute;valuation)</h3> Quand on a obtenu un arbre, il faut ensuite &eacute;valuer la confiance que l'on peut avoir dans cet arbre. Pour cela plusieurs m&eacute;thodes sont disponibles. <br><img SRC="ball.blue.gif" height=14 width=14> <b><u>Le bootstrap</u></b> <br>Cette m&eacute;thode, partant du postulat que les caract&egrave;res &eacute;voluent de mani&egrave;re ind&eacute;pendante, est sans doute la plus utilis&eacute;e en phylog&eacute;nie. Elle a &eacute;t&eacute; invent&eacute;e par Bradley Efron en 1979 et introduite en phylog&eacute;nie par Felsenstein en 1985 dans le package Phylip. <br>Cette m&eacute;thode peut &ecirc;tre divis&eacute;e en 3 &eacute;tapes r&eacute;alis&eacute;es chacune au moins 100 fois: <br>- R&eacute;alisation d'un pseudo-alignement A' &agrave; partir des s&eacute;quences d'origine en prenant arbitrairement n colonnes (avec remplacements) de l'alignement d'origine. <br>- Estimation de l'arbre obtenu : T'. <br>- Comparaison des arbres T et T' : pour chaque sous-arbre de T, on regarde s'il est pr&eacute;sent dans T'. <br>On compte ensuite pour chaque sous-arbre le nombre de fois o&ugrave; il est pr&eacute;sent dans les T'. Cette fr&eacute;quence avec laquelle on retrouve un sous-arbre est la valeur de bootstrap (plus elle est &eacute;lev&eacute;e plus la fiabilit&eacute; de la branche est importante). <p><img SRC="bootstrap2.gif" height=365 width=594> <p><img SRC="ball.blue.gif" height=14 width=14> <b><u>Delete-half-Jackknifing</u></b> : <br>Cette m&eacute;thode, pr&ocirc;n&eacute;e par Wu (1986) r&eacute;-&eacute;chantillonne la moiti&eacute; des sites des s&eacute;quences et &eacute;limine le reste. Cette m&eacute;thode donne des r&eacute;sultats tr&egrave;s similaire &agrave; ceux obtenus par bootstrap. <br><img SRC="ball.blue.gif" height=14 width=14><b><u> Permutation</u></b> : <br>Cette m&eacute;thode introduite par Archie (1989) et Faith (1990, Faith et Cranston 1991)est bas&eacute;e sur la permutation des colonnes de la matrice. Ce la produit des matrices ayant le m&ecirc;me nombre de colonnes, les m&ecirc;mes caract&egrave;res mais qui n'ont plus de structure taxonomique. Cette m&eacute;thode est utilis&eacute;e dans un but diff&eacute;rent par rapport au bootstrap : elle teste l'hypoth&egrave;se qu'il y a bien une taxonomie dans les donn&eacute;es actuelles. <br>&nbsp; <h3> <a NAME="Racine"></a><b>2.4. Enraciner un arbre</b></h3> Le plus souvent, les m&eacute;thodes de reconstruction phylog&eacute;n&eacute;tiques aboutissent &agrave; des arbres non enracin&eacute;s. Pour enraciner un arbre, on peut ajouter une s&eacute;quence dont on sait qu'elle est beaucoup plus ancienne que toutes les autres s&eacute;quences. <br>Cependant , il ne faut pas que la s&eacute;quence choisie pour enraciner l'arbre soit <br>- trop &eacute;loign&eacute;e des autres donn&eacute;es. En effet, cela peut conduire &agrave; des erreurs dans la topoolgie de l'arbre. <br>- soit trop proche des s&eacute;quences car dans ce cas, cela n'est peut-&ecirc;tre pas un vrai "outgroup". <br>L'utilisation de plus d'un "outgroup" am&eacute;liore en g&eacute;n&eacute;ral l'&eacute;valuation de l'arbre. <br>Enfin, en l'absence d'un bon "outgroup", la racine peut &ecirc;tre positionn&eacute;e approximativement &agrave; &eacute;gale distance de toutes les s&eacute;quences : on parle alors de <b>mid-point rooting.</b> <br>La topologie des arbres est soumise &agrave; de nombreuses variations et d&eacute;pendent : <br>- de la nature des s&eacute;quences utilis&eacute;es (acides nucl&eacute;iques ou prot&eacute;ines) <br>- de la m&eacute;thode utilis&eacute;e (m&eacute;thodes de distances ou parcimonie) <br>- de la qualit&eacute; de l'alignement <br>- du nombre de s&eacute;quences incluses dans l'alignement <br>- de l'ordre des s&eacute;quences dans l'alignement <br>- du choix de la racine. <br><a NAME="Recap"></a> <h2> 3.R&eacute;capitulatif</h2>  <table BORDER CELLSPACING=3 CELLPADDING=4 COLS=6 WIDTH="80%" NOSAVE STYLE="page-break-before: always; page-break-inside: avoid" > <caption>&nbsp;</caption>  <tr VALIGN=TOP> <th WIDTH="17%">METHODES</th>  <th WIDTH="17%">SEQUENCES</th>  <th WIDTH="17%">AVANTAGES</th>  <th WIDTH="17%">INCONVENIENTS</th>  <th WIDTH="17%">PROGRAMMES</th>  <th WIDTH="17%">REMARQUES</th> </tr>  <tr ALIGN=CENTER VALIGN=CENTER NOSAVE> <td WIDTH="17%"><b>Distances</b></td>  <td WIDTH="17%">Tr&egrave;s proches</td>  <td ALIGN=CENTER VALIGN=CENTER WIDTH="17%" NOSAVE>Rapides <p>Faciles &agrave; mettre en oeuvre</td>  <td WIDTH="17%">Tous les sites sont trait&eacute;s de mani&egrave;re &eacute;quivalente d'o&ugrave; un perte d'informations <p>Non applicables &agrave; des s&eacute;quences &eacute;loign&eacute;es</td>  <td ALIGN=CENTER VALIGN=CENTER WIDTH="17%" NOSAVE><a href="http://www.infobiogen.fr/services/analyseq/cgi-bin/phylomat_in.pl">DNAdist</a> <p><a href="http://www.infobiogen.fr/services/analyseq/cgi-bin/phylomat_in.pl">Protdist</a> <p><a href="http://www.infobiogen.fr/services/analyseq/cgi-bin/phylomat_in.pl">FITCH</a> <p><a href="http://www.infobiogen.fr/services/analyseq/cgi-bin/phylomat_in.pl">KITSCH</a></td>  <td WIDTH="17%">Il vaut mieux utiliser le Neigbor-joining plut&ocirc;t qu'UPGMA car Nj autorise des taux de mutations diff&eacute;rents le long des branches <p>Possibilit&eacute; d'introduire des corrections</td> </tr>  <tr ALIGN=CENTER VALIGN=CENTER NOSAVE> <td ALIGN=CENTER VALIGN=CENTER WIDTH="17%" NOSAVE><b>Parcimonie</b></td>  <td WIDTH="17%">Relativement &eacute;loign&eacute;es</td>  <td WIDTH="17%" NOSAVE>Evaluation de diff&eacute;rents arbres <p>Essaie de donner des informations sur les s&eacute;quences ancestrales</td>  <td WIDTH="17%">Lente <p>Inutilisable lorsque l'on a un grand nombre de s&eacute;quences</td>  <td WIDTH="17%"><a href="http://www.infobiogen.fr/services/analyseq/cgi-bin/phylomat_in.pl">DNApars</a> <p><a href="http://www.infobiogen.fr/services/analyseq/cgi-bin/phylomat_in.pl">PROTpars</a></td>  <td WIDTH="17%">On peut obtenir plusieurs arbres &eacute;quivalents et dans ce cas le choix de l'un par rapport aux autres peut &ecirc;tre difficile &agrave; justifier</td> </tr>  <tr ALIGN=CENTER VALIGN=CENTER NOSAVE> <td WIDTH="17%"><b>ML</b></td>  <td WIDTH="17%">&eacute;loign&eacute;es</td>  <td WIDTH="17%" NOSAVE>Robuste <p>taux de transisitions/transversions diff&eacute;rents <p>Estimation de la longueur des branches de l'arbre final</td>  <td WIDTH="17%">Lente <p>Inutilisable lorsque l'on a un grand nombre de s&eacute;quences</td>  <td ALIGN=CENTER VALIGN=CENTER WIDTH="17%" NOSAVE><a href="http://www.infobiogen.fr/services/analyseq/cgi-bin/phylofdnaml_in.pl">FastDnaml</a></td>  <td WIDTH="17%">&nbsp;</td> </tr> </table>  <br>&nbsp; <h1> <a NAME="CONCLUSION"></a>III. CONCLUSION</h1> L'&eacute;tude de la phylog&eacute;nie est un vaste domaine et quelque soit la m&eacute;thode utilis&eacute;e, des hypoth&egrave;ses tr&egrave;s simplificatrices sont faites sur l'&eacute;volution biologique des s&eacute;quences. Actuellement, pour reconstruire une bonne phylog&egrave;nie, la qualit&eacute; et le nombre des donn&eacute;es provoquent plus de variations au sein d'un arbre qu'un changement de m&eacute;thode. <br>Pour construire de bons arbres, il faut : <br>- Avoir le plus grand nombre de g&egrave;nes homologues possibles <br>- Aligner les s&eacute;quences tr&egrave;s soigneusement <br>- Eliminer les r&eacute;gions ambigues, les r&eacute;gions hypervariables, les gaps&nbsp; des alignements <br>- Utiliser si possibles plusieurs m&eacute;thodes de reconstruction, prendre NJ plut&ocirc;t que UPGMA (le neighbor-joining autorise des taux de mutations diff&eacute;rents sur les branches) et incorporer des biais dans les taux de mutations / substitutions. <br>- Evaluer l'arbre statistiquement : bootstrapping. <br>Souvent les arbres obtenus sont diff&eacute;rents selon le g&egrave;ne consid&eacute;r&eacute;. Cela est du &agrave; plusieurs causes : <br>- Tous les g&egrave;nes n'ont pas la m&ecirc;me vitesse d'&eacute;volution <br>- L'&eacute;volution convergente <br>- Les ph&eacute;nom&egrave;nes de recombinaison <br>- Les transferts de g&egrave;nes <br>- La confusion g&egrave;nes paralogues (duplication au sein d'une esp&egrave;ce) / g&egrave;nes orthologues (m&ecirc;me g&egrave;ne dans des esp&egrave;ces diff&eacute;rentes): <br><img SRC="para-ortho1.gif" height=350 width=541> <br>&nbsp; <h1> <a NAME="BIBLIO"></a>IV. BIBLIOGRAPHIE</h1> <a href="http://www.icp.ucl.ac.be/~opperd/private/">Divers documents html sur l'analyse de s&eacute;quences</a> (Fred Opperdoes) <br><a href="http://igs-server.cnrs-mrs.fr/%7Egauthere/Cours/">Cours d'analyse de s&eacute;quences</a> (Daniel Gautheret) <br><a href="http://anthropologie.unige.ch/evolution/">Site sur l'&eacute;volution</a> <br><a href="http://www.ii.uib.no/~inge/kb207/slides-tree/">Estimating Phylogenetic Trees</a> <br><a href="http://www.may.ie/academic/biology/james/lecture5/ppframe.htm">Maximum Likelihood</a> <br><a href="http://evolution.genetics.washington.edu/phylip.html">Phylip Home Page</a> <br>&nbsp; <br>&nbsp; </body> </html> 
