La Data Science pour tous

API0016

La Data Science pour tous : comprendre et pratiquer

Responsable de l'Api

Jean-Benoist Léger

Intervenants asso

Alexandre BERTOLOTTO

Waël HAMDAN

Baptiste AMATO

Mathis CHENUET

Elias HARIZ

Autres intervenants

Sylvain ROUSSEAU

Sébastien DESTERCKE

Data Scientists de la Société Générale

Intervenants d'entreprises extérieures

Résumé

La formation a pour objectif de donner une première expérience dans la science des données à travers des cours introductifs théoriques, des travaux pratiques, des conférences (entreprises, chercheurs, enseignants) et par la réalisation d'un projet concret.

Elle s'adresse :

  • aux futurs ingénieurs en informatique (toutes filières confondues)

  • et aux étudiants d'autres branches, en guise de formation ou d'exercice. Cela constitue ainsi une base pour accompagner des tâches d'analyse de données en lien avec leur domaine d'études (biologie, urbanisme, procédés, signaux, mécanique...).

La formation, qui propose des pendants théoriques, souhaite s'axer sur la pratique (par l'usage d'outils et de librairies utilisés dans le domaine), notamment lors d'un projet concret en groupes hétérogènes pour répondre à une problématique.

Typologie Api

Modalité : #Stage

Format : #Enseignant #Asso

Complément : #Cours #Atelier #Projet

Domaine

Science des données, statistiques

Public visé

GX ou fin de TC. SY02 et des bases de programmation, en particulier Python, permettront d'être à l'aise dans le déroulement de l'API. Néanmoins aucun prérequis en science des données n'est exigé.

Objectifs pédagogiques

Objectifs techniques : Comprendre les principes théoriques de base (les types de données, l'apprentissage automatique) et certains outils (langage Python, frameworks comme scikit-learn), connaître toutes les étapes d'un projet de science des données du début à la fin.

Objectifs liés à la culture informatique : Comprendre ce qu'il est possible de faire avec la science des données, comment ça marche, quels sont les problèmes que ça peut résoudre, les règles en vigueur (RGPD), les problèmes éthiques que cela pose.

​ Objectifs spécifiques :

  • Comprendre les différents flux de travail (workflow) d'un projet de Data Science

  • Comprendre et savoir choisir parmi les différents algorithmes de Machine Learning

  • Choisir le modèle le plus adapté au problème et prendre en compte les compromis complexité / précision et biais / variance

  • Appréhender le travail de data scientist “full stack” : de la donnée brute à la valeur ajoutée

​​ Objectifs transversaux :

  • Développer un esprit critique sur l'intérêt ou non d'une approche orientée data pour résoudre un problème.

  • Savoir analyser et modéliser un problème.

  • Savoir présenter un projet de Data Science en suscitant l'intérêt d'un public non nécessairement initié.

Programme

  • Une première journée de cours de base et TP pour s'approprier les notions et outils de Data Science et de Machine Learning.

  • Une journée de conférences avec des enseignants et invités extérieurs (entreprises, etc) pour enrichir sa culture générale en Data Science. Qu'est-il possible de faire avec la Data ? Comment ça marche ? Jusqu'où on peut aller ? Y a-t-il des règles ?

  • Un projet à plusieurs sur les jours restants avec des sources de données intéressantes pour chaque groupe à disposition et une question : y a-t-il de la valeur à en tirer ?

    Des tuteurs de l'association seront à disposition pour donner des conseils. Des ressources et une plateforme de discussion seront mises à disposition pour échanger.

  • La dernière demie journée de la semaine consacrée aux soutenances de présentation de projet par groupe devant les autres étudiants de l'api et un jury de professeurs et autres intervenants.

Évaluation

  • QCM individuel des notions de base, 30%

  • Projet en groupe, 70%

Inter-semestre

E19

Période

01/07-05/07

Capacité d'accueil

30

Lieu de déroulement

Au bâtiment GI et au centre d’innovation.

ECTS

2

Temps de travail étudiant

Travail demandé pendant l'inter-semestre : 40 h