suivant: Classification non supervisée
monter: $FILE
précédent: Jeux de données publics
Classification supervisée
Les applications de la classification supervisée peuvent être l'annotation de tissus (e.g. normal vs. cancéreux), le diagnostic de maladies, la prédiction de l'issue d'une maladie (guérison vs. mort), etc.
Les algorithmes les plus utilisés dans le contexte des biopuces sont :
- Méthodes probabilistes
- Les grands classiques linéaires et quadratiques sont passés en revue dans [Dudoit et al., 2002].
- Weighted Voting
- Un classifieur par votes pondérés introduit dans [Golub et al., 1999].
- KNN
- On peut voir par exemple [Dudoit et al., 2002].
- Arbres de décision
- Voir [Dudoit et al., 2002].
- Support Vector Machine
- On peut voir [Brown et al., 2000].
Ici sont listés quelques jeux de données pouvant servir au test de méthodes de classification supervisées, ainsi que les références d'un ou plusieurs papiers ayant déjà utilisé ces données dans ce contexte.
- Leukemia 1
- [Dudoit et al., 2002] comparent KNN, CART, diverses approches paramétriques probabilistes (e.g. Naives Bayes classifier), ainsi que l'ajout de Bagging et Boosting. [Ben-Dor et al., 2000] comparent KNN, SVM et Boosting.
- Lymphoma 1
- [Dudoit et al., 2002] comparent KNN, CART, diverses approches paramétriques probabilistes (e.g. Naives Bayes classifier), ainsi que l'ajout de Bagging et Boosting, sur un sous-ensemble des données limité à 3 classes.
- Colon cancer
- [Ben-Dor et al., 2000] comparent KNN, SVM et Boosting.
- Lymphoma 2
- [Shipp et al., 2002] comparent KNN, Weighted Voting, et SVM.
- NCI 60
- [Dudoit et al., 2002] comparent KNN, CART, diverses approches paramétriques probabilistes (e.g. Naives Bayes classifier), ainsi que l'ajout de Bagging et Boosting sur un sous-ensemble limité à 8 classes.
- Breast cancer
- [van 't Veer et al., 2002] rapportent les résultats de leur méthode de classification (construction d'un profil moyen pour chaque classe et recherche du profil moyen le plus proche pour classer un nouvel exemple).
Sous-sections
suivant: Classification non supervisée
monter: $FILE
précédent: Jeux de données publics
2003-04-22