Default title header
Initiation IA & Data Science Probayes

Python pour la data science : Exploration de données

Cette formation est la deuxième d’une série de formations autour de la Data Science et du langage Python. Alors que la précédente formation présentait les bases du langage Python, cette formation présente les principaux outils utilisés pour la manipulation et la visualisation de données en Python.

Objectifs de la formation :

  • Identifier les étapes de l’exploration de données :
    • Lecture/écriture des données dans différents formats
    • Mise en forme, transformation et manipulation des données
    • Analyse descriptive des données (univariée, multivariée, statistiques, etc.)
    • Présentation/visualisation des données
  • Acquérir la connaissance de la principale bibliothèque de manipulation de données en Python (Pandas)
  • Distinguer les principaux types de graphiques (histogrammes, etc.) et leur utilisation en analyse descriptive
  • Reconnaitre l’influence de la nature des variables (catégorielles, continues, etc.) sur les représentations utilisées.
  • Acquérir la connaissance d’outils de générations de graphiques interactifs
  • S’initier à la représentation de données cartographiques

Publics :

Toute personne ayant un profil technique et souhaitant s’initier à la manipulation et à l’exploration de données et ayant une expérience avec le langage Python et l’utilisation des Notebooks Jupyter.

Atouts - bénéfices de la formation :

  • Formation articulée autour de jeux de données réalistes
  • Un parcours complet pour pouvoir mener des analyses et en présenter les résultats
  • Un support de cours exploitable et personnalisé

Programme détaillé :

  • Lecture / écriture de données dans les formats de données courants (csv, excel, etc.)
  • Sélections et transformations de colonnes
  • Analyses univariées (descriptions statistiques et visualisations avec matplotlib, pandas, seaborn, plotly)
  • Groupements, agrégations, jointures, tableaux croisés
  • Analyses multivariées (mesures d’association des variables, visualisation, projections)
  • Cartographie (visualisation de données géographiques)
  • Visualisation interactive dans le notebook (utilisation de ipywidgets)
  • Création de Dashboards (Voilà)

Moyens pédagogiques :

  • Alternances entre exposés théoriques et mises en pratique
  • Etude de plusieurs jeux de données fils rouges
  • Utilisation des notebooks Jupyter pour rassembler explications et exercices pratiques dans un même document

Modalité - Présentiel :

  • Exposé : 70%
  • Exercices : 30%

Validation des acquis :

  • Exercices d’auto-évaluation.

Dispositif de suivi et d'évaluation de la formation :

  • Feuille de présence
  • Formulaire d’évaluation de la formation

Intervenants :

Alexis est docteur en informatique spécialisé en vision par ordinateur et apprentissage automatique. Il travaille depuis 2013 chez Probayes en tant que Directeur Scientifique et chef de projet sur des sujets d’apprentissage automatique. Il utilise Python dans le cadre de son travail et de ses projets personnels depuis plus de 20 ans.

Ann’Sophie est docteur en physique atmosphérique. Depuis 2019, elle travaille en tant que Data Scientist et chef de projet à Probayes. Elle travaille sur des projets variés principalement sur des sujets d’apprentissage automatique, comme la maintenance prédictive, la modélisation de séries temporelles, l’analyse sémantique de conversations. Elle utilise quotidiennement Python pour l’analyse de données, l’apprentissage automatique et la mise en production des solutions.

Camille est Data Scientist à Probayes depuis 2021, spécialisée dans le Traitement Naturel du Langage (NLP) et la vision par ordinateur. Elle travaille sur des projets variés, notamment la classification de documents, la détection de thématiques, l'identification de sujets et la détection d'anomalies en vision. Son expertise s'étend également aux modèles génératifs. Dans son travail quotidien, Camille utilise principalement Python pour l'analyse de données et l'implémentation de modèles d'apprentissage automatique. Elle maîtrise aussi d'autres langages de programmation tels que C, JavaScript et HTML, ce qui lui permet de développer des solutions complètes.

David est Data Scientist et travaille à Probayes depuis 2004. En tant que Tech Lead, il gère de nombreux projets de R&D et d’industrialisation. Il utilise quotidiennement Python pour l’analyse de données, l’apprentissage automatique ainsi que la mise en production des solutions développées. 

Gaétan est ingénieur spécialisé en vision par ordinateur et Deep Learning. Depuis 2020, en tant que Data Scientist chez Probayes, il réalise des projets R&D innovants autour de sujets comme la voiture autonome ou la maintenance prédictive. Il utilise quotidiennement Python pour l’analyse de données, l’apprentissage automatique ainsi que la mise en production des solutions développées.

Jessica est Data Scientist à Probayes depuis 2017, dans le domaine du Machine Learning. En tant que Tech Lead, elle gère des projets dans des thématiques variées, comme la maintenance prédictive pour l'industrie, la prédiction de séries temporelles pour la logistique, la finance, ou encore l’ontologie dans la défense. Dans son travail, elle utilise quotidiennement Python et ses diverses librairies de machine learning. 

Témoignages :

Les travaux pratiques sont intéressants et sont proches de ce que je pourrais utiliser dans le cadre de mon travail - Bernard

N° SIRET : 45053883000073 - Code NAF : 6202A - TVA : FR72 450 538 830
Déclaration d’activité enregistrée sous le numéro 84 38 06761 38 auprès du préfet de la région Auvergne-Rhône-Alpes.
Cet enregistrement ne vaut pas agrément.

Réservez votre place dès à présent

Formation ouverte en inter et intra

Présentiel / distanciel :
3 jours 21 heures
De 6 à 12 pers.
Tarifs
Inter : 2 990€ HT / stagiaire
Intra : Sur devis

Accessible à toutes les personnes porteuses d’un handicap

À voir également

Acculturation & Accompagnement

Acculturation à l’Intelligence artificielle

Nous vous présentons un tour d’horizon des notions clés liées à l’Intelligence Artificielle, de ses différentes approches et des avancées récentes dans le domaine. Nous abordons les aspects pratiques de l’utilisation de solutions d’IA, depuis la...

Présentiel / distanciel : 1 jour 7 heures
10 pers. maximum
Acculturation & Accompagnement

Initiation à la Recherche Opérationnelle et à l'Optimisation Combinatoire

Découvrez les fondements de cette discipline et comment, elle peut s’appliquer à de multiples cas d’usages quotidiens comme l’optimisation des itinéraires, des transports de colis, la recherche du billet d’avion au meilleur prix, la planification des...

Présentiel / distanciel : 1 jour 7 heures
De 6 à 15 pers.
Initiation IA & Data Science

Python pour la data science : Le langage Python

Cette formation est la première d’une série de formations autour de la Data Science et du langage Python. Elle a pour objectif de présenter les bases du langage Python.

Présentiel / distanciel : 3 jours 21 heures
De 6 à 12 pers.
Initiation IA & Data Science

Python pour la data science Initiation au Big Data avec PySpark

Spark est un des principaux frameworks d’analyse de données Big Data. Il est massivement déployé sur les infrastructures de type Data Lake, soit directement, soit au travers d’autres outils tels que Dataiku DSS. PySpark est une bibliothèque...

Présentiel / distanciel : 1 jour 7 heures
De 5 à 15 pers.
Renforcement IA & Data Science

Machine Learning Tronc - Commun 2

Cette formation est la quatrième d’une série de formations autour de la Data Science et du langage Python. La précédente formation présentait l’analyse exploratoire et la préparation des données, ainsi que la modélisation et le déploiement. Cette...

Présentiel / distanciel : 3 jours 21 heures
De 6 à 12 pers.
Renforcement IA & Data Science

Natural Language Processing et IA Générative

Cette formation, vous permettra de maîtriser les techniques modernes de NLP pour extraire des informations précieuses, d’automatiser des tâches complexes et de développer des applications intelligentes à partir des textes.

Présentiel / distanciel : 3 jours 21 heures
De 6 à 15 pers.
Renforcement IA & Data Science

Machine Learning Tronc - Commun 1

Cette formation est la troisième d’une série de formations autour de la Data Science et du langage Python. Alors que la précédente formation présentait la manipulation de données en Python, cette formation présente les principaux outils et concepts...

Présentiel / distanciel : 3 jours 21 heures
De 6 à 12 pers.
Renforcement IA & Data Science

Approche technique à la Recherche Opérationnelle et à l'Optimisation Combinatoire

Présentiel / distanciel : 2 jours 14 heures
De 6 à 15 pers.