<HTML> <HEAD> <TITLE> Cours sur les coefficients d'association: Le&ccedil;on 3</TITLE> <script language=JavaScript>  function ouvrir (coeff) {  win = window.open("", "Resultats", "width=320,height=500,status=1,resizable=1");   win.document.open();   win.document.writeln ("<h2>Formule du Coefficient</h2><HR SIZE=2></HR>");  if (coeff=="10")  {  win.document.writeln ("<IMG SRC='../images/formule-chisquare.gif'></IMG><HR></HR><P ALIGN=LEFT><P>o&ugrave;:</P>Vr = Valeur r&eacute;elle</P><P>Va = Valeur attendue</P>"); }   if (coeff=="11")  {  win.document.writeln ("<IMG SRC='../images/formule-phi.gif'></IMG><HR></HR><P ALIGN=LEFT><P>o&ugrave;:</P><FONT FACE='Symbol'><P>c</FONT> = Chi</P><P>N = nombre de cas</P>"); }    else if (coeff=="12")  {  win.document.writeln ("<IMG SRC='../images/formule-cc.gif'></IMG><HR></HR><P ALIGN=LEFT><P>o&ugrave;:</P><FONT FACE='Symbol'><P>c</FONT> = Chi</P><P>N = nombre de cas</P>"); }   else if (coeff=="13")  {  win.document.writeln ("<IMG SRC='../images/formule-vcramer.gif'></IMG><HR></HR><P ALIGN=LEFT><P>o&ugrave;:</P><FONT FACE='Symbol'><P>c</FONT> = Chi</P><P>N = nombre de cas</P><P>k = nombre le plus petit entre le nombre de lignes et celui de colonnes</P>"); }   else if (coeff=="14")  {  win.document.writeln ("<IMG SRC='../images/formule-lambda.gif'><HR></HR><P ALIGN=LEFT><P>o&ugrave;:</P></IMG><P>NEP = nombre d'erreurs de pr&eacute;diction</P>"); }   else if (coeff=="15")  {  win.document.writeln ("<IMG SRC='../images/formule-lambdas.gif'><HR></HR><P ALIGN=LEFT><P>o&ugrave;:</P></IMG><P>NEP = nombre d'erreurs de pr&eacute;diction</P><P>A  = mod&egrave;le o&ugrave; A est la variable ind&eacute;pendante et B la d&eacute;pendante <P>B = mod&egrave;le o&ugrave; B est la variable ind&eacute;pendante et A la d&eacute;pendante<P>1 = situations de pr&eacute;diction 1<P>2 = situations de pr&eacute;diction 2 "); }   else if (coeff=="16")  {  win.document.writeln ("<IMG SRC='../images/formule-gamma.gif'><HR></HR><P ALIGN=LEFT><P>o&ugrave;:</P></IMG><P>C = paires concordantes</P><P>D  = paires discordantes <P>N = nombre de cas"); }   else if (coeff=="17")  {  win.document.writeln ("<IMG SRC='../images/formule-taub.gif'><HR></HR><P ALIGN=LEFT><P>o&ugrave;:</P></IMG><P>C = paires concordantes</P><P>D  = paires discordantes<P>T<SUB>x</SUB> = Ties impliquant la premi&egrave;re variable</P><P>T<SUB>y</SUB> = Ties impliquant la seconde variable</P>"); }   else if (coeff=="18")  {  win.document.writeln ("<IMG SRC='../images/formule-tauc.gif'><HR></HR><P ALIGN=LEFT><P>o&ugrave;:</P></IMG><P>C = paires concordantes</P><P>D  = paires discordantes <P>N = nombre de cas<P>k = nombre le plus petit entre le nombre de lignes et celui de colonnes"); }    else if (coeff=="19")  {  win.document.writeln ("<IMG SRC='../images/formule-dsomer.gif'><HR></HR><P ALIGN=LEFT><P>o&ugrave;:</P></IMG><P>C = paires concordantes</P><P>D  = paires discordantes<P>T<SUB>y</SUB> = Ties impliquant la seconde variable</P>"); }   else {     win.document.writeln (""); }    win.document.writeln ("<hr SIZE=2></HR><center><form><input type='button' value='FERMER' onClick='window.close()'></FORM></CENTER>");   win.document.close(); } </SCRIPT> </HEAD> <BODY BGCOLOR="#FFCC68"> <TABLE WIDTH="100%" HEIGHT="100%" ALIGN="LEFT" CELLPADDING="5" CELLSPACING="0" BORDER="0%"> 	<TR> 		<TD BGCOLOR="#9898FF" ALIGN=CENTER WIDTH="10%">&nbsp;					 		</TD> 		<TD BGCOLOR="#9898FF" ALIGN=CENTER WIDTH="10%"><A HREF="../" TITLE="Retour au centre de ressources"><IMG SRC="../images/home.gif" WIDTH="120" HEIGHT="50" BORDER="0" ALT="Retour au centre de ressources"></A>	 		</TD> 		<TD BGCOLOR="#9898FF" WIDTH="50%" ALIGN="CENTER"><H1>Les coefficients d'association: Le&ccedil;on 3</H1> 		</TD> 		<TD BGCOLOR="#9898FF" WIDTH="5%" ALIGN="CENTER"><A HREF="coef0304.htm" TITLE="Voir le quatrime chapitre"><IMG SRC="../images/courdown.gif" WIDTH="50" HEIGHT="50" BORDER="0" ALT="Voir le quatrime chapitre"></A> 		</TD> 		<TD BGCOLOR="#9898FF" WIDTH="5%" ALIGN="CENTER"><A HREF="coef0302.htm" TITLE="Retour au deuxime chapitre"><IMG SRC="../images/courup.gif" WIDTH="50" HEIGHT="50" BORDER="0" ALT="Retour au deuxime chapitre"></A> 		</TD> 		<TD BGCOLOR="#9898FF" WIDTH="10%" ALIGN="CENTER"><A HREF="welcome.htm" TITLE="Retour  l'accueil"><IMG SRC="../images/homecour.gif" WIDTH="50" HEIGHT="50" BORDER="0" ALT="Retour  l'accueil"></A> 		</TD> 		<TD BGCOLOR="#9898FF" ALIGN=CENTER WIDTH="10%">&nbsp; 		</TD> 	</TR> 	<TR> 		<TD BGCOLOR="#98CCFF" COLSPAN="2" VALIGN="TOP" ALIGN="LEFT"> 						<CENTER><H4>3. Troisi&egrave;me Le&ccedil;on::</H4></CENTER> 						<OL TYPE="1"> 					                                <LI><A HREF="coef0301.htm">Pr&eacute;cisions techniques</A></LI> 					                                <LI><A HREF="coef0302.htm">Variables Nominales: bas&eacute;s sur le Chi<SUP>2</SUP></A></LI> 					                                <LI><B><I>Variables Nominales: bas&eacute;s sur la PRE</I></B></LI> 					                                <LI><A HREF="coef0304.htm">Variables Ordinales: les paires concordantes</A></LI> 					                                <LI><A HREF="coef0305.htm">Synthse</A></LI> 						</OL> 			<TABLE WIDTH="100%" CELLPADDING="2"> 				<TR> 					<TD> 						<A HREF="coef0303.htm" ONCLICK="window.open('http://www.unige.ch/forum/cgi-bin/agnes?ForumudoAgnes+ForumudoAgnesHTML','Resultats','scrollbars=yes,width=600,height=400,screenX=50,screenY=50,status=0,resizable=1')" ><IMG SRC="../images/forum.gif"  WIDTH="50" HEIGHT="55" BORDER="0" ALT="Rejoindre le forum"></A> 					</TD> 					<TD> 						<A HREF="coef0303.htm" ONCLICK="window.open('../infos/info0200.htm','Resultats','scrollbars=yes,width=600,height=400,screenX=50,screenY=50,status=0,resizable=1')" ><IMG SRC="../images/plan.gif" WIDTH="100" HEIGHT="55" BORDER="0" ALT="Voir plan du site"></A> 					</TD> 				</TR> 			</TABLE>                    <P><img src="/cgi-bin/Count.cgi?dd=A|tr=T|md=5|ft=0|trgb=0;255;0&df=coef0303.dat"></P>  		</TD> 		<TD BGCOLOR="#FFFFD0" COLSPAN="5" WIDTH="80%" VALIGN="TOP" ALIGN="JUSTIFY" HEIGHT="70%"> 			<H3><A NAME="chap03"><BLOCKQUOTE>Variables nominales: coefficients bas&eacute;s sur la r&eacute;duction proportionnelle de l'erreur (PRE)</BLOCKQUOTE></A></H3> 				<P> 				Quoi qu'il en soit, m&ecirc;me avec le V de Cramer, les coefficients 				d'association bas&eacute;s sur le test du Chi carr&eacute; ne permettent 				gu&egrave;re de se prononcer sur la force de l'association dans l'absolu; 				tout au plus permettent-ils d'identifier l'association la plus forte en mode 				comparatoire. Pour cette raison, on tend &agrave; leur pr&eacute;f&eacute;rer 				des coefficients qui se basent sur une autre m&eacute;thode que l'on appelle 				"r&eacute;duction proportionnelle de l'erreur de pr&eacute;diction" (Proportional 				Reduction in Error ou PRE). 				<P> 				Cette m&eacute;thode diff&egrave;re passablement de ce que tu as vu jusqu'&agrave; 				pr&eacute;sent; pour autant elle n'est pas particuli&egrave;rement 				compliqu&eacute;e, mais demande un minimum de concentration. L'id&eacute;e 				g&eacute;n&eacute;rale, qui est d&eacute;j&agrave; sugg&eacute;r&eacute;e 				dans le nom, est la suivante: dans une premi&egrave;re situation, par rapport 				&agrave; une variable Y, on te demande quelle valeur devrait prendre&nbsp;un 				individu tir&eacute; au hasard (Pr&eacute;diction 1); dans un deuxi&egrave;me 				temps, on te donne une information suppl&eacute;mentaire quant &agrave; cet 				individu et on te redemande de pr&eacute;dire sa valeur sur Y (Pr&eacute;diction 				2). Ensuite on mesure simplement ce que l'information suppl&eacute;mentaire 				t'a apport&eacute; en termes de pr&eacute;diction. 				<P> 				Pour prendre un premier exemple: lors des votations du 18 mars 1994 sur 				l'assurance maladie (LAMal), on te pr&eacute;sente un individu qui a vot&eacute; 				et on te demande de pr&eacute;dire son vote. Sachant que 51.8% des votants 				ont accept&eacute; le projet, il y a plus de chances que l'inconnu ait vot&eacute; 				oui (Pr&eacute;diction 1= oui, avec 51,8 chances sur 100), m&ecirc;me si 				la probabilit&eacute; que ta pr&eacute;diction soit bonne est assez proche 				de la probabilit&eacute; al&eacute;atoire, &agrave; savoir une chance sur 				deux. Dans un deuxi&egrave;me temps, tu apprends que l'inconnu en question 				est romand; comme tu sais que les cantons latins ont accept&eacute; le projet 				par 66.7% des voix, tu peux alors affiner ta pr&eacute;diction (Pr&eacute;diction 				2= oui, avec 66,7 chances sur 100), ta probabilit&eacute; de deviner juste 				passant alors d'environ 1 chance sur 2 &agrave; 2 chances sur trois. C'est 				cette derni&egrave;re "am&eacute;lioration" que cherchent justement &agrave; 				mesurer les coefficients bas&eacute;s sur la r&eacute;duction proportionnelle 				de l'erreur de pr&eacute;diction. 				<P> 				Le coefficient Lambda (<FONT FACE='Symbol'>l</FONT>) est certainement le plus connu au sein de cette 				famille de coefficients. Une raison en est probablement qu'il est d'une 				op&eacute;rationnalisation relativement simple, comme en atteste la formule 				ci-dessous. 				<FORM> 				  <INPUT TYPE="BUTTON" VALUE=" X " ONCLICK="ouvrir(&quot;14&quot;)"><IMG SRC="../images/formule.gif" 				      ALIGN="ABSBOTTOM" BORDER="1" ALT="Cliquer sur le bouton pour voir la formule"> 				</FORM> 				<P> 				Cependant, pour bien comprendre ce que le coefficient Lambda implique il 				peut &ecirc;tre int&eacute;ressant de reprendre notre exemple. Partons de 				l'information compl&egrave;te, c'est-&agrave;-dire un tableau crois&eacute; 				entre le type de cantons (variable ind&eacute;pendante) et le niveau de soutien 				au projet de loi (variable d&eacute;pendante), qui indique le nombre de cas 				pour chaque cellule ainsi que le pourcentage en colonnes. 				<P> 				<CENTER> 				  <TABLE BORDER=1 CELLPADDING="5" width="60%" BGCOLOR="#FFFFFF"BORDERCOLOR="#006868" BORDERCOLORDARK="#989898" BORDERCOLORLIGHT="#D0CCD0"> 				    <TR> 				      <TD colspan=5><P ALIGN=Center> 					Votation sur la LAMal selon type de cantons</TD> 				    </TR> 				    <TR> 				      <TD rowspan=4><P ALIGN=Center> 					V<BR> 					o<BR> 					t<BR> 					e<BR> 					<BR> 					L<BR> 					A<BR> 					M<BR> 					a<BR> 					l</TD> 				      <TD>&nbsp;</TD> 				      <TD width="30%"><P ALIGN=Center> 					cantons<BR> 					latins</TD> 				      <TD width="30%"><P ALIGN=Center> 					cantons al&eacute;maniques</TD> 				      <TD width="30%"><P ALIGN=Center> 					total</TD> 				    </TR> 				    <TR> 				      <TD>oui</TD> 				      <TD><P ALIGN=Left> 					325.506 					<P ALIGN=Right> 					<I>66.7%</I></TD> 				      <TD><P ALIGN=Left> 					695.669 					<P ALIGN=Right> 					<I>46.9%</I></TD> 				      <TD>1.021.175 					<P ALIGN=Right> 					<I>51.8%</I></TD> 				    </TR> 				    <TR> 				      <TD>non</TD> 				      <TD><P ALIGN=Left> 					162.146 					<P ALIGN=Right> 					<I>33.3%</I></TD> 				      <TD><P ALIGN=Left> 					788.214 					<P ALIGN=Right> 					<I>53.1%</I></TD> 				      <TD>950.360 					<P ALIGN=Right> 					<I>48.2%</I></TD> 				    </TR> 				    <TR> 				      <TD>total</TD> 				      <TD><P ALIGN=Left> 					487.652 					<P ALIGN=Right> 					<I>24.7%</I></TD> 				      <TD>1.483.883 					<P ALIGN=Right> 					<I>75.3%</I></TD> 				      <TD>1.971.535 					<P ALIGN=Right> 					<I>100.0%</I></TD> 				    </TR> 				  </TABLE> 				</CENTER> 				<P> 				<P> 				Maintenant, mettons nous dans la premi&egrave;re situation: nous ne connaissons 				que le pourcentage d'acceptation (51.8%), donc notre pr&eacute;diction est 				n&eacute;cessairement "oui", avec environ un chance sur deux d'&ecirc;tre 				juste. Lorsque l'on prend en compte la population dans son ensemble, nous 				voyons que notre 				<A HREF="../illustrations/illustration1CAL3nominalb.html" ONCLICK="window.open('','popup','scrollbars=yes,width=800,height=600,screenX=50,screenY=50,status=0,resizable=1')" Target="popup">premi&egrave;re 				pr&eacute;diction</A> (qui est "oui" pour tout inconnu)&nbsp;aurait permis 				de classer correctement 1.021.175 de personnes (le nombre de personnes ayant 				effectivement vot&eacute; "oui"), mais laiss&eacute; 950.360 personnes dans 				l'erreur. 				<P> 				Si maintenant (situation 2), nous prenons en compte le type de cantons, nous 				pouvons pr&eacute;ciser nos pr&eacute;dictions: en effet s'il s'agit d'un 				al&eacute;manique, il ne faut plus le classer comme ayant vot&eacute; "oui" 				mais comme ayant vot&eacute; "non" (probabilit&eacute; plus &eacute;lev&eacute;e, 				de 53.1% contre 46.9%), alors que pour un latin, notre chance de pr&eacute;dire 				correctement son vote positif augment sensiblement (de 51.8% &agrave; 66.7%). 				De telle sorte que notre 				<A HREF="../illustrations/illustration2CAL3nominalb.html" ONCLICK="window.open('','popup','scrollbars=yes,width=800,height=600,screenX=50,screenY=50,status=0,resizable=1')" Target="popup">pr&eacute;diction 				2</A> ("oui" pour les latins, "non" pour les al&eacute;maniques) permet 				maintenant de classer ad&eacute;quatement 1.113.720 personnes (325.506 + 				788.214), et de &nbsp;n'en laiss&eacute; plus que 857.815 (162.146 + 695.669) 				dans l'erreur. 				<P> 				 				Si on applique d&eacute;sormais la formule apprise ci-dessus, nous pouvons 				calculer le Lambda comme suit: 				<BR> 				<UL> 				<LI>(erreurs de pr&eacute;diction en situation 1 ( 950.360 ) - erreurs de 				pr&eacute;diction en situation 2 ( 857.815) ) divis&eacute; par (erreurs 				de pr&eacute;diction en situation 1 ( 950.360 )<BR></LI><BR> 				<LI>soit: 				( &nbsp; 950.360 - 857.815 ) / 950.360 = 92.545 / 950.360 =<B> 0.097.</B></LI> 				</UL> 				<P>	Nous obtenons donc un Lambda d'environ un dixi&egrave;me, qui nous indique 					qu'il y a bien une association entre le type de cantons et le pourcentage 					de votes en faveur de l'assurance maladie. En des termes plus statistiques, 					le coefficient de 0.097 nous indique que l'introduction de la variable 					ind&eacute;pendante nous a permis de r&eacute;duire l'erreur de pr&eacute;diction 					de pr&egrave;s de 10%. Par ailleurs, &nbsp;si ce r&eacute;sultat para&icirc;t 					assez faible, il faut quand m&ecirc;me avoir en t&ecirc;te que le Lambda 					est le plus souvent tr&egrave;s petit en comparaison d'autres coefficients 					(pour ce m&ecirc;me tableau le C aurait &eacute;t&eacute; d'environ 0.47 					et le Phi de 0.52). 					<P> 					Hormis d'&ecirc;tre le plus souvent tr&egrave;s faible, le Lambda a aussi 					la particularit&eacute; d'&ecirc;tre assym&eacute;trique; c'est-&agrave;-dire 					qu'au niveau du calcul, on consid&egrave;re r&eacute;ellement une variable 					ind&eacute;pendante et une variable d&eacute;pendante. En effet, dans les 					autres cas la distinction entre les deux types de variables rel&egrave;ve 					d'une exigence th&eacute;orique et conventionnelle (lisibilit&eacute; de 					l'information), mais s'arr&ecirc;te au niveau des coefficients d'association, 					qui sont eux compl&eacute;tement indiff&eacute;rents &agrave; l'ordre des 					variables. Ainsi, dans notre cas, le fait de chercher &agrave; am&eacute;liorer 					la pr&eacute;diction "type de cantons" par le "vote sur la LAMal" aurait 					donn&eacute; un r&eacute;sultat diff&eacute;rent. 					<P> 					L'assym&eacute;trie du coefficient a l'avantage de mieux prendre en compte 					la sp&eacute;cificit&eacute; de la relation. En ce sens, il s'agit 					d&eacute;j&agrave; d'une "modellisation", puisque l'on postule de fait une 					causalit&eacute;. Cependant, il se trouve des cas o&ugrave; il n'y a pas 					forc&eacute;ment ce genre de rapport, o&ugrave; l'on veut simplement observer 					la cooccurence de deux ph&eacute;nom&egrave;nes; dans ces cas, l'assym&eacute;trie 					se &nbsp;convertit en inconv&eacute;nient. Pour cette raison, il existe une 					version sym&eacute;trique du Lambda, qui consiste &agrave; m&eacute;langer 					les deux Lambdas que l'on obtiendrait en effectuant la relation une fois 					dans un sens, une fois dans l'autre. 					<FORM> 					  <INPUT TYPE="BUTTON" VALUE=" X " ONCLICK="ouvrir(&quot;15&quot;)"><IMG SRC="../images/formule.gif" 					      ALIGN="ABSBOTTOM" BORDER="1" ALT="Cliquer sur le bouton pour voir la formule"> 					</FORM> 					  <P> 					  En conclusion, avec ces deux m&eacute;thodes et ces cinq coefficients, nous 					  avons d&eacute;j&agrave; effectu&eacute; un survol partiel des fa&ccedil;ons 					  tr&egrave;s diff&eacute;rentes de mesurer une association. Comment choisir 					  laquelle appliquer? De nombreux facteurs entrent ici en jeu qui vont de 					  l'ad&eacute;quation conceptuelle au feeling personnel. La meilleure solution 					  restant peut-&ecirc;tre de syst&eacute;matiquement utiliser plusieurs 					  coefficients &agrave; la fois, seule mani&egrave;re de vraiment se rendre 					  compte de ce qui distingue ces coefficients.  		</TD> 	</TR> 	<TR> 		<TD BGCOLOR="#9898FF" ALIGN=CENTER WIDTH="10%">&nbsp;					 		</TD> 		<TD BGCOLOR="#9898FF" ALIGN=CENTER WIDTH="10%"><A HREF="../" TITLE="Retour au centre de ressources"><IMG SRC="../images/home.gif" WIDTH="120" HEIGHT="50" BORDER="0" ALT="Retour au centre de ressources"></A>	 		</TD> 		<TD BGCOLOR="#9898FF" WIDTH="50%" ALIGN="CENTER"><H1>Les coefficients d'association: Le&ccedil;on 3</H1> 		</TD> 		<TD BGCOLOR="#9898FF" WIDTH="5%" ALIGN="CENTER"><A HREF="coef0304.htm" TITLE="Voir le quatrime chapitre"><IMG SRC="../images/courdown.gif" WIDTH="50" HEIGHT="50" BORDER="0" ALT="Voir le quatrime chapitre"></A> 		</TD> 		<TD BGCOLOR="#9898FF" WIDTH="5%" ALIGN="CENTER"><A HREF="coef0302.htm" TITLE="Retour au deuxime chapitre"><IMG SRC="../images/courup.gif" WIDTH="50" HEIGHT="50" BORDER="0" ALT="Retour au deuxime chapitre"></A> 		</TD> 		<TD BGCOLOR="#9898FF" WIDTH="10%" ALIGN="CENTER"><A HREF="welcome.htm" TITLE="Retour  l'accueil"><IMG SRC="../images/homecour.gif" WIDTH="50" HEIGHT="50" BORDER="0" ALT="Retour  l'accueil"></A> 		</TD> 		<TD BGCOLOR="#9898FF" ALIGN=CENTER WIDTH="10%">&nbsp; 		</TD> 	</TR> </TABLE> </BODY> </HTML> 
