Niveau d'étude
BAC +4
Composante
UFR Sciences et Techniques
Description
Ce cours permet de maîtriser les techniques d’analyse de données non supervisées classiques et avancées à des fins de visualisation des données ou de réduction de la dimension. Il comporte des séances de travaux pratiques au cours desquelles les méthodes sont programmées en langage python.
Objectifs
Mettre en œuvre des techniques modernes d’analyse de données.
Comprendre les hypothèses qui sous-tendent les différents modèles d ‘analyse de données.
Pré-requis obligatoires
- Apprentissage supervisé
- Probabilités et statistiques
- Algèbre matriciel
Contrôle des connaissances
Examen écrit
Compétences visées
- Généralité sur les modes de visualisation de données
- Analys en composantes principales (ACP)
- ACP à noyau (Kernel PCA), ACP en grande dimension
- Analyse linéaire discriminante
- K-moyennes
- Tests d’hypothèse (paramétrique vs non-paramétrique, test de Student, test des rangs, test du khi2, test d’adéquation à une loi…)
- Classification Ascendante Hiérarchique (CAH)
- Density-based spatial clustering (DBscan)
- Evidence-based clustering
- Analyse en composantes principales
- Positionnement multi-dimensionnel (MDS)
- Apprentissage de variété : représentation linéaire locale (LLE)
- Algorithme ISOMAP
- Cartes propres Laplaciennes
- Représentation stochastique du voisinage (SNE et t-SNE)