Formation Spark Python

Name: Formation Spark Python
Brand: Human Coders
SKU: 1919
Price: 2200 EUR
Availability: InStock
Rating: 5 (1 reviews)

Manipulez et exploitez facilement des centaines de Go de données grâce à Spark et Python !

Lors de cette formation Spark avec python, vous apprendrez à traiter d'énormes volumes de données, de l’ordre de centaines de Go et plus, là où les outils classiques (Excel, Pandas, python) montrent leurs limites. Vous serez en mesure de nettoyer, transformer, et agréger ces données pour les rendre utiles à des fins de business intelligence.

Vous découvrirez les concepts fondamentaux de Spark :
- exploiter les dataframes,
- gérer le parallélisme,
- traiter les données en batch et en temps réel,
- exploiter les meilleures pratiques et les anti-patterns dans un paradigme big data,
- déployer de telles applications sur le cloud.

Vous apprendrez notamment à utiliser ces connaissances dans un contexte de machine learning.

Tout au long de la formation, vous mettrez en pratique les notions étudiées dans des cas concrets :
- lecture et analyse de données batch depuis un cloud,
- data analyse sur des gros volumes,
- traitement de données en temps réel.

Arthur BLIN Ubisoft Montpellier 10.12.2024

Formation très claire. L'échange était facilité par le formateur.

Les objectifs

Comprendre les concepts fondamentaux de Spark et du calcul distribué
Manipuler et analyser des dataframes
Effectuer de l’analyse temps réel avec Spark Streaming
Effectuer du machine learning avec Spark MLlib
Déployer une application Spark

Pré-requis

niveau intermédiaire en Python
Ordinateur portable à apporter

Le programme de la formation Spark Python

Jour 1 : Découverte de Spark, premières opérations

Comprendre dans quels cas utiliser et ne pas utiliser Spark
Appréhender le fonctionnement global de Spark et du calcul distribué
Découvrir le principe de lazy evaluation
Utiliser les transformations de base : map, flatmap, filter, groupby, join
Connaître les actions de base : save, collect, count, show
Lire, transformer et sauvegarder des dataframes en mode batch

Mises en pratique :
- Configurer un environnement de développement big data
- Analyser des données de transport aérien avec les fonctions de base Spark

Jour 2 : Spark streaming

Découvrir les cas d’application de traitements temps réel
Transposer les principes des opération batch au traitement de données en temps réel (streaming)
Transformer des données avec une latence faible (~1 seconde)
Gérer les cas spécifiques aux cas d’usage en temps réel :
- Late data
- Triggers
- Agrégation par fenêtre

Mises en pratique :
- Créer un flux de données streaming
- Traiter des données IoT (internet of things) d’un capteur d’ouverture/fermeture de porte, et des données financières d’achat et vente d’action en temps réel
- Sauvegarder des données dans AWS

Jour 3 : Optimisation, déploiement et Spark ML

Optimisation, déploiement et Spark ML
Optimiser des jobs Spark grâce à des bonnes pratiques
Économiser des coûts de ressources en évitant les anti-patterns
Comprendre l’utilité de Spark dans l’intelligence artificielle
Utiliser les fonctions machine learning de Spark (Spark MLlib) :
- Estimator
- Transformer
- Pipeline
Les différentes approches pour déployer une application Spark

Mises en pratique :
- Développer une pipeline de machine learning pour prédire la survie des passagers du Titanic
- Prédire le churn de clients d’une entreprise
- Déployer une application Spark sur AWS

Télécharger le programme

Formations associées

Python Pandas et dataframes
4 jours
Big data
3 jours

Formateur

Quentin VILLOTTA

Quentin Villotta est un professionnel de la data et de l’humanitaire, alliant expertise technique et engagement social.

Après huit ans d’expérience en tant que Data Engineer et Data Scientist dans le conseil auprès de grands groupes français, il se tourne en 2020 vers l’humanitaire ainsi que l’enseignement et la formation.

Depuis, il met ses compétences au service d’ONG pour renforcer l’efficacité des réponses aux crises grâce à l’analyse et à la gestion des données.

En parallèle, il enseigne et forme au Big Data, intervenant auprès d’étudiants en master et de professionnels afin de les accompagner dans leur montée en compétences dans les métiers de la data.

Grâce à une approche pédagogique centrée sur l’humain, favorisant l’interaction et l’équilibre entre concepts théoriques et applications pratiques, Quentin vous accompagnera efficacement dans votre montée en compétences.

Témoignage

Arthur B.

Ubisoft Montpellier 10.12.2024

Formation très claire. L'échange était facilité par le formateur.

FAQ

Nos formations sont éligibles à plusieurs dispositifs de financement, selon votre situation. Human Coders est certifié Qualiopi, ce qui permet la prise en charge par des organismes comme Pôle emploi, votre OPCO ou encore le CPF (Compte Personnel de Formation) pour certaines formations.

Pour en savoir plus, veuillez consulter notre page : Comment financer votre formation ?

Oui, la formation peut être proposée en présentiel ou en distanciel. Pour les inter-entreprises, les modalités (présentiel ou à distance) sont fonction de la session.

Nous pouvons organiser des sessions à d'autres dates ou dans d'autres villes (Bordeaux, Lille, Lyon, Marseille, Montpellier, Nantes, Nice, Paris, Strasbourg, Toulouse...)

Les formations se déroulent toujours en petit groupe de 3 à 6 stagiaires. Nous souhaitons que les formateurs et formatrices puissent passer un maximum de temps avec chacun·e.

Voici une journée type :

9h : vous êtes accueillis par votre formateur·rice autour d'un petit déjeuner (croissants, pains au chocolat, jus de fruit, thé ou café...)
9h30 : la formation commence
12h30 : pause de midi. Le·a formateur·rice mangera avec vous. C'est l'occasion d'avoir des discussions plus informelles.
14h : reprise de la formation
18h : fin de la journée

8 raisons de participer à une formation Human Coders

Satisfaction client élevée : Un taux de statisfaction de 4,6/5 depuis 2012 (sur 1649 sessions réalisées). 99% des participants se disent satisfaits de nos formations
Approche pédagogique unique : Des formations en petit groupe, des formateurs passionnés et expérimentés, de véritables workshops... (Plus d'infos sur notre manifeste)
Catalogue de formations complet : 172 formations au catalogue, de quoi vous accompagner sur tout vos projets
Écosystème dynamique : Nous accompagnons les dev depuis 13 ans avec des initiatives comme Human Coders News, les Human Talks, le podcast ou encore notre serveur Discord
Financement facilité : Organisme certifié Qualiopi, indispensable pour que vous puissiez obtenir des aides au financement via votre OPCO
Références clients prestigieuses : De nombreux clients qui nous font confiance depuis des années
Accompagnement sur mesure : Nous vous proposons un accompagnement personnalisé par nos consultants pour vous aider dans vos projets au-delà de la formation
Valorisation professionnelle : Remise d'un diplôme, d'une attestation et d'une certification, suivant les formations effectuées, que vous pourrez afficher sur vos CV et réseaux sociaux