next up previous
suivant: Classification non supervisée monter: $FILE précédent: Jeux de données publics


Classification supervisée

Les applications de la classification supervisée peuvent être l'annotation de tissus (e.g. normal vs. cancéreux), le diagnostic de maladies, la prédiction de l'issue d'une maladie (guérison vs. mort), etc.

Algorithmes

Les algorithmes les plus utilisés dans le contexte des biopuces sont :
Méthodes probabilistes
Les grands classiques linéaires et quadratiques sont passés en revue dans [Dudoit et al., 2002].
Weighted Voting
Un classifieur par votes pondérés introduit dans [Golub et al., 1999].
KNN
On peut voir par exemple [Dudoit et al., 2002].
Arbres de décision
Voir [Dudoit et al., 2002].
Support Vector Machine
On peut voir [Brown et al., 2000].

Jeux de test

Ici sont listés quelques jeux de données pouvant servir au test de méthodes de classification supervisées, ainsi que les références d'un ou plusieurs papiers ayant déjà utilisé ces données dans ce contexte.

Leukemia 1
[Dudoit et al., 2002] comparent KNN, CART, diverses approches paramétriques probabilistes (e.g. Naives Bayes classifier), ainsi que l'ajout de Bagging et Boosting. [Ben-Dor et al., 2000] comparent KNN, SVM et Boosting.
Lymphoma 1
[Dudoit et al., 2002] comparent KNN, CART, diverses approches paramétriques probabilistes (e.g. Naives Bayes classifier), ainsi que l'ajout de Bagging et Boosting, sur un sous-ensemble des données limité à 3 classes.
Colon cancer
[Ben-Dor et al., 2000] comparent KNN, SVM et Boosting.
Lymphoma 2
[Shipp et al., 2002] comparent KNN, Weighted Voting, et SVM.
NCI 60
[Dudoit et al., 2002] comparent KNN, CART, diverses approches paramétriques probabilistes (e.g. Naives Bayes classifier), ainsi que l'ajout de Bagging et Boosting sur un sous-ensemble limité à 8 classes.
Breast cancer
[van 't Veer et al., 2002] rapportent les résultats de leur méthode de classification (construction d'un profil moyen pour chaque classe et recherche du profil moyen le plus proche pour classer un nouvel exemple).




Sous-sections


next up previous
suivant: Classification non supervisée monter: $FILE précédent: Jeux de données publics
2003-04-22