Default title header
Renforcement IA & Data Science Probayes

Machine Learning Tronc - Commun 2

Cette formation est la quatrième d’une série de formations autour de la Data Science et du langage Python. La précédente formation présentait l’analyse exploratoire et la préparation des données, ainsi que la modélisation et le déploiement. Cette formation, quant à elle, présente les principales tâches d'apprentissage supervisé, les estimateurs scikit-learn, les modèles linéaires, les implémentation d’un modèle linéaire dédié et l’utilisation de bibliothèque scipy.optimize.

Objectifs de la formation :

  • Approfondir la compréhension théorique des principaux modèles utilisés en apprentissage automatique
  • Savoir implémenter des modèles dédiés
  • Acquérir la connaissance des principaux outils de calcul numérique en Python (numpy/scipy)
  • Reconnaître le modèle objet de scikit-learn pour intégrer ses propres modèles  

Publics :

Les data scientists voulant approfondir leur compréhension des algorithmes courants et apprendre les outils permettant de mettre en œuvre des algorithmes dédiés de manière réutilisable.

Atouts - bénéfices de la formation :

  • Une mise en perspective des algorithmes courants d’apprentissage automatique.
  • La mise en évidence des propriétés de ces algorithmes et des opportunités d’adaptation.
  • Une formation articulée autour de cas d'études réalistes
  • Un support de cours exploitable et personnalisé

Programme détaillé :

  • Calcul scientifique avec numpy / scipy
  • Les principales tâches d'apprentissage supervisé (classification / régression)
  • Les estimateurs scikit-learn (classifieurs / régresseurs)
  • Les modèles linéaires (moindres carrés, classification, modèles robustes, régularisation)
  • Implémentation d’un modèle linéaire dédié
  • Utilisation de bibliothèque scipy.optimize
  • En fonction du temps disponible et de l’appétence des stagiaires :
    • Les arbres de décision
    • Les méthodes ensemblistes (Bagging, Gradient Boosting, Stacking, etc.)
    • Implémentation d’un model gradient boosting dédié
    • Les méthodes à noyaux (astuce du noyau, Kernel Ridge, SVR, SVC, Processus gaussiens, etc.)
    • Les réseaux de neurones (perceptron multicouche)
    • Implémentation d’un algorithme dédié par réseau de neurones

Moyens pédagogiques :

  • Présentation théorique des principaux algorithmes
  • Exercices pratiques pour en comprendre les principales propriétés
  • Utilisation des notebooks Jupyter pour intégrer explications théoriques et applications pratiques
  • Exercices d’implémentation de variantes des algorithmes présentés

Modalité - Présentiel :

  • Exposé : 60%
  • Exercices : 40%

Validation des acquis :

  • Exercices d’auto-évaluation.
  • Mise en situation

Dispositif de suivi et d'évaluation de la formation :

  • Feuille de présence
  • Formulaire d’évaluation de la formation

Intervenants :

Alexis est docteur en informatique spécialisé en vision par ordinateur et apprentissage automatique. Il travaille depuis 2013 chez Probayes en tant que Directeur Scientifique et chef de projet sur des sujets d’apprentissage automatique. Il utilise Python dans le cadre de son travail et de ses projets personnels depuis plus de 20 ans.

David est Data Scientist et travaille à Probayes depuis 2004. En tant que Tech Lead, il gère de nombreux projets de R&D et d’industrialisation. Il utilise quotidiennement Python pour l’analyse de données, l’apprentissage automatique ainsi que la mise en production des solutions développées. 

Témoignages :

Il faut s'attendre à du code "high level" mais c'est aussi la clé de réussite de ce format qui est complet, enrichissant et donc motivant. Le support et les livrables sont de qualités. L'animateur est très bon, un groupe de formés très moteur, un vrai plaisir - Yvan

N° SIRET : 45053883000073 - Code NAF : 6202A - TVA : FR72 450 538 830
Déclaration d’activité enregistrée sous le numéro 84 38 06761 38 auprès du préfet de la région Auvergne-Rhône-Alpes.
Cet enregistrement ne vaut pas agrément.

Réservez votre place dès à présent

Formation ouverte en inter et intra

Présentiel / distanciel :
3 jours 21 heures
De 6 à 12 pers.
Tarifs
Inter : 2 990€HT / stagiaire
Intra : Sur devis

Accessible à toutes les personnes porteuses d’un handicap

À voir également

Acculturation & Accompagnement

Acculturation à l’Intelligence artificielle

Nous vous présentons un tour d’horizon des notions clés liées à l’Intelligence Artificielle, de ses différentes approches et des avancées récentes dans le domaine. Nous abordons les aspects pratiques de l’utilisation de solutions d’IA, depuis la...

Présentiel / distanciel : 1 jour 7 heures
10 pers. maximum
Acculturation & Accompagnement

Initiation à la Recherche Opérationnelle et à l'Optimisation Combinatoire

Découvrez les fondements de cette discipline et comment, elle peut s’appliquer à de multiples cas d’usages quotidiens comme l’optimisation des itinéraires, des transports de colis, la recherche du billet d’avion au meilleur prix, la planification des...

Présentiel / distanciel : 1 jour 7 heures
De 6 à 15 pers.
Initiation IA & Data Science

Python pour la data science : Le langage Python

Cette formation est la première d’une série de formations autour de la Data Science et du langage Python. Elle a pour objectif de présenter les bases du langage Python.

Présentiel / distanciel : 3 jours 21 heures
De 6 à 12 pers.
Initiation IA & Data Science

Python pour la data science : Exploration de données

Cette formation est la deuxième d’une série de formations autour de la Data Science et du langage Python. Alors que la précédente formation présentait les bases du langage Python, cette formation présente les principaux outils utilisés pour la...

Présentiel / distanciel : 3 jours 21 heures
De 6 à 12 pers.
Initiation IA & Data Science

Python pour la data science Initiation au Big Data avec PySpark

Spark est un des principaux frameworks d’analyse de données Big Data. Il est massivement déployé sur les infrastructures de type Data Lake, soit directement, soit au travers d’autres outils tels que Dataiku DSS. PySpark est une bibliothèque...

Présentiel / distanciel : 1 jour 7 heures
De 5 à 15 pers.
Renforcement IA & Data Science

Natural Language Processing et IA Générative

Cette formation, vous permettra de maîtriser les techniques modernes de NLP pour extraire des informations précieuses, d’automatiser des tâches complexes et de développer des applications intelligentes à partir des textes.

Présentiel / distanciel : 3 jours 21 heures
De 6 à 15 pers.
Renforcement IA & Data Science

Machine Learning Tronc - Commun 1

Cette formation est la troisième d’une série de formations autour de la Data Science et du langage Python. Alors que la précédente formation présentait la manipulation de données en Python, cette formation présente les principaux outils et concepts...

Présentiel / distanciel : 3 jours 21 heures
De 6 à 12 pers.
Renforcement IA & Data Science

Approche technique à la Recherche Opérationnelle et à l'Optimisation Combinatoire

Présentiel / distanciel : 2 jours 14 heures
De 6 à 15 pers.