Titre : | Détection d’anomalies sur des données biologiques par SVM | Type de document : | theses et memoires | Auteurs : | Karima Mahdjane ; Zohra Mazouzi, Directeur de thèse | Editeur : | Tizi Ouzou : UMMTO.FGEI | Année de publication : | 2012 | Importance : | 66 p. | Présentation : | ill. | Format : | 30 cm. | Note générale : | Bibliogr. | Langues : | Français | Mots-clés : | Apprentissage statistique Classification supervisé Support Vector Machines Sélection automatique d’attributs SVM-RFE T-test Entropie UCI. | Résumé : | L’objectif de ce travail est de détecter des anomalies sur des données biologiques en effectuant une classification de ces dernières en deux catégories : normales et pathologiques.
Pour ce faire, nous avons choisi d’utiliser un algorithme nommé « Séparateurs à vaste marge (SVM) ». Les données utilisées dans cette étude sont issues de la base de données internationale UCI «University of California Irvin ». Ces données sont caractérisées par N exemples d’apprentissages (patients). Chaque exemple est représenté par un vecteur de caractéristiques (attributs) et associé à une classe label. Dans un premier temps, nous avons estimé les performances des SVM en calculant le taux de bonne classification, la sensitivité et la spécificité sur chaque base. Ensuite, une procédure de sélection automatique d’attributs a été effectuée afin de réduire le volume de l’information à traiter et par conséquent de réduire le temps de calcul et la complexité du classificateur. Les algorithmes utilisés pour cette tâche sont « Support Vector Machines Recursive Feature Elimination (SVM-RFE) », le «test du Students (t-test)» et « entropie ». Ces algorithmes attribuent à chaque attribut un score de pertinence puis les ordonnent dans un ordre décroissant. La sélection d’un sous ensemble d’attributs se fait par validation croisée, le sous ensemble choisi est celui pour lequel le taux de bonne classification est max. Les résultats obtenus montrent que les SVM sont des techniques très efficaces et que leur performance en généralisation s’améliore toujours en sélectionnant un sous ensemble d’attributs pertinents. | En ligne : | https://dl.ummto.dz/bitstream/handle/ummto/576/Mahdjane%20Karima.pdf?sequence=1& [...] | Format de la ressource électronique : | PDF | Permalink : | ./index.php?lvl=notice_display&id=24761 |
Détection d’anomalies sur des données biologiques par SVM [theses et memoires] / Karima Mahdjane ; Zohra Mazouzi, Directeur de thèse . - Tizi Ouzou (Tizi Ouzou) : UMMTO.FGEI, 2012 . - 66 p. : ill. ; 30 cm. Bibliogr. Langues : Français Mots-clés : | Apprentissage statistique Classification supervisé Support Vector Machines Sélection automatique d’attributs SVM-RFE T-test Entropie UCI. | Résumé : | L’objectif de ce travail est de détecter des anomalies sur des données biologiques en effectuant une classification de ces dernières en deux catégories : normales et pathologiques.
Pour ce faire, nous avons choisi d’utiliser un algorithme nommé « Séparateurs à vaste marge (SVM) ». Les données utilisées dans cette étude sont issues de la base de données internationale UCI «University of California Irvin ». Ces données sont caractérisées par N exemples d’apprentissages (patients). Chaque exemple est représenté par un vecteur de caractéristiques (attributs) et associé à une classe label. Dans un premier temps, nous avons estimé les performances des SVM en calculant le taux de bonne classification, la sensitivité et la spécificité sur chaque base. Ensuite, une procédure de sélection automatique d’attributs a été effectuée afin de réduire le volume de l’information à traiter et par conséquent de réduire le temps de calcul et la complexité du classificateur. Les algorithmes utilisés pour cette tâche sont « Support Vector Machines Recursive Feature Elimination (SVM-RFE) », le «test du Students (t-test)» et « entropie ». Ces algorithmes attribuent à chaque attribut un score de pertinence puis les ordonnent dans un ordre décroissant. La sélection d’un sous ensemble d’attributs se fait par validation croisée, le sous ensemble choisi est celui pour lequel le taux de bonne classification est max. Les résultats obtenus montrent que les SVM sont des techniques très efficaces et que leur performance en généralisation s’améliore toujours en sélectionnant un sous ensemble d’attributs pertinents. | En ligne : | https://dl.ummto.dz/bitstream/handle/ummto/576/Mahdjane%20Karima.pdf?sequence=1& [...] | Format de la ressource électronique : | PDF | Permalink : | ./index.php?lvl=notice_display&id=24761 |
|