next up previous
suivant: Bibliographie monter: $FILE précédent: Classification supervisée


Classification non supervisée

On distingue deux types de problèmes : le clustering d'expériences et le clustering de gènes. Une application du clustering d'expériences est par exemple la recherche des sous types potentiels d'un cancer. Pour le clustering de gènes, l'application classique est la recherche des gènes co-régulés.

Algorithmes

Les algorithmes les plus utilisés dans le contexte des biopuces sont :
Hierarchical clustering :
Logiciels CLUSTER et TREEVIEW [Eisen et al., 1998] disponible sur http://rana.lbl.gov/EisenSoftware.htm.
SOM :
Introduit par [Kohonen, 1997]. Logiciel GENECLUSTER [Tamayo et al., 1999] disponible sur http://www-genome.wi.mit.edu/cancer/software/software.html.
CLICK :
Introduit par [Sharan and Shamir, 2000]. Logiciel disponible sur http://www.cs.tau.ac.il/~rshamir/expander/expander.html.
CAST :
Introduit par [Ben-Dor et al., 1999]. Logiciel BIOCLUST. Disponible ?
K-MEANS :
Une version du k-means [Herwig et al., 1999]. Disponible ?

Jeux de test

Ici sont répertoriés quelques jeux de données pouvant servir au test de méthodes de classification non supervisées. Pour chaque jeu de données sont mentionnés des clusters biologiques potentiels qui peuvent servir à évaluer les résultats obtenus. Sont également référencés un ou plusieurs papiers ayant déjà utilisé ces données dans ce contexte.

Clustering d'expériences

Colon Cancer
Évaluation biologique des clusters par la séparation tumeur vs. normal. [Sharan et al., 2002] comparent résultats CLICK et CAST.
Leukemia 1
Évaluation biologique des clusters par la séparation AML vs. ALL. [Sharan et al., 2002] comparent résultats CLICK et CAST. [Golub et al., 1999] utilisent SOM. Également utilisé par [Ben-Dor et al., 2001].
Leukemia 2
Évaluation biologique des clusters par la séparation B-cell vs. T-cell. [Sharan et al., 2002] comparent les résultats obtenus par CLICK et CAST, ainsi que l'effet d'une procédure de sélection des 50 meilleurs gènes.
Lymphoma 1
Évaluation biologique des clusters par la séparation des classes originales. [Alizadeh et al., 2000] utilisent le clustering hiérarchique. Données également utilisées dans [Ben-Dor et al., 2001].

Clustering de gènes

Yeast Cell-Cycle 1
Clusters biologiques potentiels : les gènes mis en jeu lors des différentes phases du cycle cellulaire : M, G1, S, et G2. [Tamayo et al., 1999] utilisent la méthode SOM. [Sharan et al., 2002] utilisent la méthode CLICK.
Yeast Cell-Cycle 2
Même clusters biologiques potentiels que Yeast Cell-Cycle 1. Comparaison des méthodes SOM, CLICK, CAST, K-Means sur un sous-ensemble des données dans [Sharan et al., 2002].
Yeast Regulatory motif
Évaluation biologique des clusters par recherche des motifs de régulation communs aux gènes d'un même cluster via le logiciel ALIGNACE http://atlas.med.harvard.edu/. [Sharan et al., 2002] comparent les résultats obtenus par CLICK et SOM.




Sous-sections


next up previous
suivant: Bibliographie monter: $FILE précédent: Classification supervisée
2003-04-22