La Data Science pour tous
API0016
La Data Science pour tous : comprendre et pratiquer
Responsable de l'Api
Jean-Benoist Léger
Intervenants asso
Alexandre BERTOLOTTO
Waël HAMDAN
Baptiste AMATO
Mathis CHENUET
Elias HARIZ
Autres intervenants
Sylvain ROUSSEAU
Sébastien DESTERCKE
Data Scientists de la Société Générale
Intervenants d'entreprises extérieures
Résumé
La formation a pour objectif de donner une première expérience dans la science des données à travers des cours introductifs théoriques, des travaux pratiques, des conférences (entreprises, chercheurs, enseignants) et par la réalisation d'un projet concret.
Elle s'adresse :
aux futurs ingénieurs en informatique (toutes filières confondues)
et aux étudiants d'autres branches, en guise de formation ou d'exercice. Cela constitue ainsi une base pour accompagner des tâches d'analyse de données en lien avec leur domaine d'études (biologie, urbanisme, procédés, signaux, mécanique...).
La formation, qui propose des pendants théoriques, souhaite s'axer sur la pratique (par l'usage d'outils et de librairies utilisés dans le domaine), notamment lors d'un projet concret en groupes hétérogènes pour répondre à une problématique.
Typologie Api
Modalité : #Stage
Format : #Enseignant #Asso
Complément : #Cours #Atelier #Projet
Domaine
Science des données, statistiques
Public visé
GX ou fin de TC. SY02 et des bases de programmation, en particulier Python, permettront d'être à l'aise dans le déroulement de l'API. Néanmoins aucun prérequis en science des données n'est exigé.
Objectifs pédagogiques
Objectifs techniques : Comprendre les principes théoriques de base (les types de données, l'apprentissage automatique) et certains outils (langage Python, frameworks comme scikit-learn), connaître toutes les étapes d'un projet de science des données du début à la fin.
Objectifs liés à la culture informatique : Comprendre ce qu'il est possible de faire avec la science des données, comment ça marche, quels sont les problèmes que ça peut résoudre, les règles en vigueur (RGPD), les problèmes éthiques que cela pose.
Objectifs spécifiques :
Comprendre les différents flux de travail (workflow) d'un projet de Data Science
Comprendre et savoir choisir parmi les différents algorithmes de Machine Learning
Choisir le modèle le plus adapté au problème et prendre en compte les compromis complexité / précision et biais / variance
Appréhender le travail de data scientist “full stack” : de la donnée brute à la valeur ajoutée
Objectifs transversaux :
Développer un esprit critique sur l'intérêt ou non d'une approche orientée data pour résoudre un problème.
Savoir analyser et modéliser un problème.
Savoir présenter un projet de Data Science en suscitant l'intérêt d'un public non nécessairement initié.
Programme
Une première journée de cours de base et TP pour s'approprier les notions et outils de Data Science et de Machine Learning.
Une journée de conférences avec des enseignants et invités extérieurs (entreprises, etc) pour enrichir sa culture générale en Data Science. Qu'est-il possible de faire avec la Data ? Comment ça marche ? Jusqu'où on peut aller ? Y a-t-il des règles ?
Un projet à plusieurs sur les jours restants avec des sources de données intéressantes pour chaque groupe à disposition et une question : y a-t-il de la valeur à en tirer ?
Des tuteurs de l'association seront à disposition pour donner des conseils. Des ressources et une plateforme de discussion seront mises à disposition pour échanger.
La dernière demie journée de la semaine consacrée aux soutenances de présentation de projet par groupe devant les autres étudiants de l'api et un jury de professeurs et autres intervenants.
Évaluation
QCM individuel des notions de base, 30%
Projet en groupe, 70%
Inter-semestre
E19
Période
01/07-05/07
Capacité d'accueil
30
Lieu de déroulement
Au bâtiment GI et au centre d’innovation.
ECTS
2
Temps de travail étudiant
Travail demandé pendant l'inter-semestre : 40 h