Default title header
Initiation IA & Data Science Probayes

Python pour la data science : Le langage Python

Cette formation est la première d’une série de formations autour de la Data Science et du langage Python. Elle a pour objectif de présenter les bases du langage Python.

Objectifs de la formation :

  • Acquérir les bases du langage Python (variables, fonctions, boucles, conditions)
  • Acquérir la connaissance des principales structures de données en Python (listes, dictionnaires, tuples, ensembles)
  • Distinguer les étapes d’un projet d’analyse de données
  • Distinguer les principes d’organisation du code dans un projet data science :
    • Notebooks
    • Fonctions / classes
    • Bibliothèques (modules / package)
  • Expliquer les modalités de déploiement d’une bibliothèque dans différents types d’applications (exécutable en ligne de commande, application web, service web, etc.)

Publics :

La formation s’adresse aux personnes ayant déjà une expérience de programmation et souhaitant s’initier au langage Python. Il ne s’agit pas d’une initiation à la programmation.

Atouts - bénéfices de la formation :

  • Découverte des notebooks Jupyter qui sont couramment utilisés par les personnes utilisant du code
  • Formation articulée autour d’un fil rouge et permettant une montée en compétence progressive
  • Un support de cours exploitable et personnalisé

Programme détaillé :

  • Découvertes des notebooks Jupyter
  • Les types de données de bases
  • Les structures de base du langage (conditions, fonctions, collections, itérations)
  • Découverte du projet fil rouge de détection de Spam (manipulation du jeu de données)
  • Manipulations des chaînes de caractères
  • Organisation du code (modules et package)
  • Gestion des erreurs (exceptions et journalisation)
  • Implémentation de l’algorithme de détection (Modèle Bayésien Naïf)
  • Approfondissement des bases du langage (objets, décorateurs, annotations de type scripts exécutables)
  • En fonction du temps disponible et des préférences des participants :
    • Création d’un outil en ligne de commande
    • Création d’un service Web avec FastAPI
    • Création d’une application Web interactive

Moyens pédagogiques :

  • Exposé théorique et exercices pratiques
  • Fil rouge autour d’un projet concret
  • Utilisation des cahiers (notebooks) Jupyter pour rassembler support de cours et exercices pratiques dans un même document

Modalité - Présentiel :

  • Exposé : 60%
  • Exercices : 40%

Validation des acquis :

  • Exercices d’auto-évaluation.

Dispositif de suivi et d'évaluation de la formation :

  • Formulaire d’évaluation de la formation
  • Mise en situation
  • Feuille de présence

Intervenants :

Alexis est docteur en informatique spécialisé en vision par ordinateur et apprentissage automatique. Il travaille depuis 2013 chez Probayes en tant que Directeur Scientifique et chef de projet sur des sujets d’apprentissage automatique. Il utilise Python dans le cadre de son travail et de ses projets personnels depuis plus de 20 ans.

Camille est Data Scientist à Probayes depuis 2021, spécialisée dans le Traitement Naturel du Langage (NLP) et la vision par ordinateur. Elle travaille sur des projets variés, notamment la classification de documents, la détection de thématiques, l'identification de sujets et la détection d'anomalies en vision. Son expertise s'étend également aux modèles génératifs. Dans son travail quotidien, Camille utilise principalement Python pour l'analyse de données et l'implémentation de modèles d'apprentissage automatique. Elle maîtrise aussi d'autres langages de programmation tels que C, JavaScript et HTML, ce qui lui permet de développer des solutions complètes.

David est Data Scientist et travaille à Probayes depuis 2004. En tant que Tech Lead, il gère de nombreux projets de R&D et d’industrialisation. Il utilise quotidiennement Python pour l’analyse de données, l’apprentissage automatique ainsi que la mise en production des solutions développées. 

Maël est ingénieur spécialisé en modélisation de séries temporelles et traitements du langage naturel. Depuis 2021, en tant que Data Scientist chez Probayes, il réalise des projets R&D autour de la détection d’anomalies, modélisation de séries temporelles et la construction de méthodes pour comprendre le langage à base de modèles génératifs. Il utilise quotidiennement Python pour l’analyse de données, l’implémentation de modèles de prévision, ainsi que l’implémentation des RAG pour le traitement du langage.

Témoignages :

Le Langage Python » : « Formation très riche, et qui va bien au-delà d'une simple introduction ! Je n'imaginais pas pouvoir aller aussi loin en si peu de temps ! - Guillaume

N° SIRET : 45053883000073 - Code NAF : 6202A - TVA : FR72 450 538 830
Déclaration d’activité enregistrée sous le numéro 84 38 06761 38 auprès du préfet de la région Auvergne-Rhône-Alpes.
Cet enregistrement ne vaut pas agrément.

Réservez votre place dès à présent

Formation ouverte en inter et intra

Présentiel / distanciel :
3 jours 21 heures
De 6 à 12 pers.
Tarifs
Inter : 2 990€ HT / stagiaire
Intra : Sur devis

Accessible à toutes les personnes porteuses d’un handicap

À voir également

Acculturation & Accompagnement

Acculturation à l’Intelligence artificielle

Nous vous présentons un tour d’horizon des notions clés liées à l’Intelligence Artificielle, de ses différentes approches et des avancées récentes dans le domaine. Nous abordons les aspects pratiques de l’utilisation de solutions d’IA, depuis la...

Présentiel / distanciel : 1 jour 7 heures
10 pers. maximum
Acculturation & Accompagnement

Initiation à la Recherche Opérationnelle et à l'Optimisation Combinatoire

Découvrez les fondements de cette discipline et comment, elle peut s’appliquer à de multiples cas d’usages quotidiens comme l’optimisation des itinéraires, des transports de colis, la recherche du billet d’avion au meilleur prix, la planification des...

Présentiel / distanciel : 1 jour 7 heures
De 6 à 15 pers.
Initiation IA & Data Science

Python pour la data science : Exploration de données

Cette formation est la deuxième d’une série de formations autour de la Data Science et du langage Python. Alors que la précédente formation présentait les bases du langage Python, cette formation présente les principaux outils utilisés pour la...

Présentiel / distanciel : 3 jours 21 heures
De 6 à 12 pers.
Initiation IA & Data Science

Python pour la data science Initiation au Big Data avec PySpark

Spark est un des principaux frameworks d’analyse de données Big Data. Il est massivement déployé sur les infrastructures de type Data Lake, soit directement, soit au travers d’autres outils tels que Dataiku DSS. PySpark est une bibliothèque...

Présentiel / distanciel : 1 jour 7 heures
De 5 à 15 pers.
Renforcement IA & Data Science

Machine Learning Tronc - Commun 2

Cette formation est la quatrième d’une série de formations autour de la Data Science et du langage Python. La précédente formation présentait l’analyse exploratoire et la préparation des données, ainsi que la modélisation et le déploiement. Cette...

Présentiel / distanciel : 3 jours 21 heures
De 6 à 12 pers.
Renforcement IA & Data Science

Natural Language Processing et IA Générative

Cette formation, vous permettra de maîtriser les techniques modernes de NLP pour extraire des informations précieuses, d’automatiser des tâches complexes et de développer des applications intelligentes à partir des textes.

Présentiel / distanciel : 3 jours 21 heures
De 6 à 15 pers.
Renforcement IA & Data Science

Machine Learning Tronc - Commun 1

Cette formation est la troisième d’une série de formations autour de la Data Science et du langage Python. Alors que la précédente formation présentait la manipulation de données en Python, cette formation présente les principaux outils et concepts...

Présentiel / distanciel : 3 jours 21 heures
De 6 à 12 pers.
Renforcement IA & Data Science

Approche technique à la Recherche Opérationnelle et à l'Optimisation Combinatoire

Présentiel / distanciel : 2 jours 14 heures
De 6 à 15 pers.