Apprentissage automatique

API0010

Apprentissage automatique statistique et introduction à la recherche

Porteurs et intervenants

Responsable : Sébastien Desterck

Intervenants : Yonatan Carlos Alarcon

Résumé

Durant cette API, les étudiants devront comprendre un algorithme d'apprentissage type SVM (SVMrank), en lisant les publications scientifiques associées. Ils devront ensuite l'appliquée à des jeux de données spécifiques, ce qui requerra d'appliquer du code existant (C++) à des jeux de données ayant un format structuré.

Durant cette API, les étudiants acquerront des connaissances sur un problème d'apprentissage complexe (rangement d'étiquettes), et auront une première approche de la recherche au travers de la compréhension d'un article et son application à un problème spécifique.

Cette API s'adresse avant tout :

  • Aux étudiants prêts à entrer dans les détails d'une méthode et d'une problématique scientifique (une bonne capacité à comprendre des mathématiques est donc nécessaire)

  • Aux étudiants intéressés par l'apprentissage automatique/statistique

Typologie Api

Modalité : #Autonomie

Format : #Projet

Complément : #Recherche

Suivi lors de réunions quotidienne d'une heure.

Domaine

Informatique (apprentissage automatique)

Public visé

Plutôt GI avec un réel intérêt pour les aspects mathématiques/théoriques de l'informatique, et une première expérience de l'apprentissage machine (cours UTC, cours en ligne, codage, stage, ...). Fin de cursus conseillé mais pas obligatoire.

Objectifs pédagogiques

Objectif de l’Api : Première expérience d'un aspect de la recherche sur un problème plutôt appliqué (compréhension et application d'un article)

Objectifs spécifiques :

  • Capacité à comprendre un article

  • Capacité à adapter un code et une méthode à une problématique/des jeux de données spécifiques

Objectifs transversaux :

  • Organisation d'un travail de recherche expérimental en apprentissage automatique

  • Compréhension de la problématique générale, et du rôle des expériences dans cette dernière

Programme

1. Prise de connaissance du problème de rangement d'étiquettes

2. Compréhension de l'article sur le ranking SVM et du code associée

3. Application du ranking SVM aux jeux de données d'intérêt

Évaluation

Code finalisé (commenté, tutorialisé) pour appliquer la méthode prévue.

Inter-semestre

H19

Période

28/01-01/02

Capacité d'accueil

6

Lieu de déroulement

Laboratoire Heudiasyc

Durée

5 jours

ECTS

2

Temps de travail étudiant

Travail demandé pendant l'inter-semestre : Compréhension de la problématique (trois jours), codage de la méthode (deux jours, sachant qu'un code C++ existe déjà) – Travail d'environ 8H attendu chaque jour.

Travail demandé avant la semaine Api : Aucun nécessaire (possible sur demande)

Travail demandé après la semaine Api : Finalisation du rapport/code/tutoriel (sous forme notebook), prévoir 3 ou 4 heure pour finaliser.