Comme promis voici une version de mon rapport d'épreuve test du cnam soutenu avec succès en janvier 2010 à Grenoble.
Introduction
L’objectif de ce rapport est de présenter les machines à vecteurs support (SVM1 ) et les diffé-
rentes approches d’optimisation qui leur sont associées. Dans un premier chapitre, nous rappellons
la notion d’apprentissage et de classification et nous présentons les SVM. Dans un second chapitre,
nous décrivons le fonctionnement des SVM et certaines approches d’optimisation. Le troisième
chapitre traitera des méthodes pour sélectionner les paramètres optimaux. Enfin, dans le dernier
chapitre nous discuterons de leurs mises en œuvre dans le cadre de l’imagerie hyperspectrale.
Imagerie hyperspectrale
L’imagerie hyperspectrale est une technique permettant la représentation d’une même scène
suivant de nombreuses bandes spectrales étroites dans des gammes de longueurs d’ondes variées
(visible, infrarouge, etc.). C’est une technologie en plein développement qui permet d’accéder à
de nombreuses informations sur les propriétés physiques des objets observés comparativement à
l’imagerie couleur classique. L’imagerie hyperspectrale est utilisée dans de multiples domaines
comme la géologie, l’écologie, l’urbanisme, la foresterie, l’agriculture, dans le domaine militaire
ou encore en planétologie.
Les données issues de la télédétection hyperspectrale sont agencées en cube. Un cube est
constitué de deux dimensions spatiales w et h et d’une dimension spectrale λ . Le nombre de
pixels dans la direction w, respectivement h, est noté Nw , respectivement Nh . Le nombre de bandes
spectrales ou spectels† dans la direction λ est noté Nλ . Un exemple d’image hyperspectrale et le
principe de sa composition sont présentés à la figure 1. On notera qu’il existe une imagerie dite
« multi-spectrale » qui se contente d’une dizaine de canaux alors que l’imagerie « hyperspectrale »
dépasse la centaine de canaux (Nλ > 100).
Les images hyperspectrales sont acquises par des spectro-imageurs associés à des microscopes,
à des satellites (études de la surface terrestre) ou encore à des sondes spatiales (études planétolo-
giques de mars).
Dans le domaine multi-spectral on trouvera par exemple, les satellites PLEIADES (CNES2 )
qui permettront l’acquisition d’images multi-spectrales de 70 cm à 250 cm de résolution spatiale
[CNES, 2009]. Chaque image aura un volume compris entre 1,8 et 3,6 Go pour seulement 5 canaux
spectraux. Ce type d’instrument est développé pour avoir un bon rendu spatial.
Par comparaison dans le domaine hyperspectral nous avons comme exemple les images four-
nies par le spectro-imageur OMEGA3 (ESA4 ) [ESA, 2009]. Chaque image de résolution spatiale
comprise entre 350 m à 4000 m. Leur taille varie de 50 à 100 Mo pour environ 100000 spectres composés
eux même de 184 spectels.

" Décomposition d'une image hyperspectrale "
Ces exemples montrent que la taille et la complexité des données générées font apparaître de
nouveaux défis méthodologiques pour l’analyse à la fois mathématique et informatique. Un des
problèmes à résoudre est d’automatiser l’extraction d’informations pertinentes de ces images : dé-
tection de zone d’intérêt, quantification des matériaux etc. De récents travaux cités notamment
dans [Bazi et Melgani, 2006] montrent que les méthodes de machine à vecteurs support surpassent
les méthodes statistiques classiques dans les problématiques de classification en imagerie hyper-
spectrale. Elles se distinguent par une meilleure précision de reconnaissance et une faculté de
généralisation qui permet d’obtenir une bonne classification des nouveaux exemples.
Machine à vecteurs support comme méthode de classification
Les machines à vecteurs support ou SVM, constituent une méthode de classification supervi-
sée particulièrement bien adaptée pour traiter des données de grande dimension. Par rapport aux
techniques classiques d’apprentissage, les SVM ne dépendent pas de la dimension de l’espace de
représentation des données. Grâce à l’usage d’une fonction noyau, elles permettent une classifica-
tion non linéaire comme nous le verrons au paragraphe 2.4 . L’ inconvénient des SVM est le choix
empirique de la fonction noyau adaptée au problème. Un deuxième inconvénient est le temps de
calcul qui croît de façon cubique en fonction du nombre de données à traiter. La complexité d’un
algorithme SVM est cubique par rapport au nombre de données et linéaire par rapport au nombre
de variables. Si le nombre de données d’apprentissage est n la dimension des données à classer est
d, la complexité est alors en O(dn3 ) [Bousquet, 2001].
L'intégralité du rapport est disponible en libre téléchargement (rapport_final.pdf) sous licence
créative commons