Apprentissage automatique
API0010
Apprentissage automatique statistique et introduction à la recherche
Porteurs et intervenants
Responsable : Sébastien Desterck
Intervenants : Yonatan Carlos Alarcon
Résumé
Durant cette API, les étudiants devront comprendre un algorithme d'apprentissage type SVM (SVMrank), en lisant les publications scientifiques associées. Ils devront ensuite l'appliquée à des jeux de données spécifiques, ce qui requerra d'appliquer du code existant (C++) à des jeux de données ayant un format structuré.
Durant cette API, les étudiants acquerront des connaissances sur un problème d'apprentissage complexe (rangement d'étiquettes), et auront une première approche de la recherche au travers de la compréhension d'un article et son application à un problème spécifique.
Cette API s'adresse avant tout :
Aux étudiants prêts à entrer dans les détails d'une méthode et d'une problématique scientifique (une bonne capacité à comprendre des mathématiques est donc nécessaire)
Aux étudiants intéressés par l'apprentissage automatique/statistique
Typologie Api
Modalité : #Autonomie
Format : #Projet
Complément : #Recherche
Suivi lors de réunions quotidienne d'une heure.
Domaine
Informatique (apprentissage automatique)
Public visé
Plutôt GI avec un réel intérêt pour les aspects mathématiques/théoriques de l'informatique, et une première expérience de l'apprentissage machine (cours UTC, cours en ligne, codage, stage, ...). Fin de cursus conseillé mais pas obligatoire.
Objectifs pédagogiques
Objectif de l’Api : Première expérience d'un aspect de la recherche sur un problème plutôt appliqué (compréhension et application d'un article)
Objectifs spécifiques :
Capacité à comprendre un article
Capacité à adapter un code et une méthode à une problématique/des jeux de données spécifiques
Objectifs transversaux :
Organisation d'un travail de recherche expérimental en apprentissage automatique
Compréhension de la problématique générale, et du rôle des expériences dans cette dernière
Programme
1. Prise de connaissance du problème de rangement d'étiquettes
2. Compréhension de l'article sur le ranking SVM et du code associée
3. Application du ranking SVM aux jeux de données d'intérêt
Évaluation
Code finalisé (commenté, tutorialisé) pour appliquer la méthode prévue.
Inter-semestre
H19
Période
28/01-01/02
Capacité d'accueil
6
Lieu de déroulement
Laboratoire Heudiasyc
Durée
5 jours
ECTS
2
Temps de travail étudiant
Travail demandé pendant l'inter-semestre : Compréhension de la problématique (trois jours), codage de la méthode (deux jours, sachant qu'un code C++ existe déjà) – Travail d'environ 8H attendu chaque jour.
Travail demandé avant la semaine Api : Aucun nécessaire (possible sur demande)
Travail demandé après la semaine Api : Finalisation du rapport/code/tutoriel (sous forme notebook), prévoir 3 ou 4 heure pour finaliser.