Formation Big data

Découvrez les concepts, technologies et outils fondamentaux du Big Data pour transformer vos données en valeur ajoutée.

Formation Big data

Cette formation au Big Data vous permettra d'acquérir une maîtrise des concepts fondamentaux, des méthodologies, et des technologies utilisées dans les projets Big Data.

Vous explorerez les enjeux liés à la gestion de grandes volumétries de données et apprendrez à :
- mettre en place une infrastructure adaptée
- à exécuter des ETL, et
- à utiliser des frameworks de calcul distribué pour analyser des données en mode batch ou temps réel.

Au cours de cette formation Big Data, vous manipulerez des outils comme Hadoop, Spark, et Hive. Vous serez capable de comprendre les architectures modernes telles que les Data Lakes et d'utiliser Kafka pour le traitement temps réel.

Cette formation s’adresse aux développeur·se·s, data Scientists, analystes de données et administrateur·rice·s système souhaitant acquérir des compétences sur les outils et frameworks Big Data pour traiter des données volumineuses.


Vous connaissez déjà les principes du Big Data ?

Voici quelques formations qui pourraient vous intéresser :
- formation Spark
- formation Kafka
- formation Python - Data Science

Les objectifs

  • Identifier les enjeux et bénéfices du Big Data pour les organisations
  • Installer et configurer une infrastructure Big Data distribuée
  • Réaliser des ETL sur des données volumineuses et complexes
  • Manipuler des frameworks de calcul distribué comme Hadoop et Spark
  • Comprendre et appliquer les principes d'architecture Big Data, incluant Lambda, Kappa et Data Lakes

Pré-requis

  • Connaissance des bases en programmation
  • Familiarité avec les concepts de base des bases de données
  • Une expérience préalable en administration système est un plus
  • Ordinateur portable à apporter

Le programme de la formation Big data

Jour 1 Enjeux et technologies du Big Data

  • La réalité économique et l’histoire du Big Data
    • Les enjeux du Big Data
    • Les 3 V du Big Data
    • Les chiffres clés
  • Les concepts fondamentaux du Big Data
    • Diviser (et distribuer) pour régner
    • Le paradigme Map Reduce
  • Le Framework Hadoop
    • Architecture et composants
      • Hadoop MapReduce
      • HDFS
      • YARN
  • Les principales distributions Hadoop du marché
    • Cloudera
    • MapR
    • Hortonworks
    • AWS
  • EMR: Le cluster Big Data d’AWS
  • L’écosystème Hadoop
    • HUE
    • Oozie

Mises en pratique :
- Multiplication d’une matrice par un vecteur et jointure de tables (BDD) en MapReduce
- Installation d'une plateforme Big Data Hadoop et réalisation d’un WordCount en Map Reduce

Jour 2 : NoSQL et architecture Big Data

  • Le NoSQL
    • Les familles NoSQL
  • Le théorème de CAP
  • Architectures Big Data
    • La Stack ELK
    • Les différents types d’architecture
      • Lambda
      • Data Lake
      • Kappa
    • Présentation d’un cas pratique d’architecture Lambda
  • Temp réel : Introduction à Kafka

Mises en pratique :
- Implémentation d’une architecture Kafka - Spark Streaming

Jour 3 : Analyse Avancée avec Spark et Hive

  • Spark
    • Introduction à la Data Science
    • Qu’est-ce que Spark ?
    • Les modules de Spark
    • Les grands concepts
      • RDD (Resilient Distributed Dataset)
      • DataFrame
      • DAG (Directed Acyclic Graph)
    • Spark UI
  • Manipuler et analyser des données (semi)structurées avec Hive
    • Créer des bases de données structurées dans Hive
    • Manipuler des données en SQL avec Hive
    • Guide des bonnes pratiques en Hive

Mises en pratique :
- Réalisation d’un ETL en Hive à partir de données stockées dans HDFS
- Réalisation d’un ETL et d’un modèle de Machine Learning en
Spark (API python)

Télécharger le programme

Le(s) formateur(s)

Quentin VILLOTTA

Quentin VILLOTTA

Quentin Villotta est un professionnel de la data et de l’humanitaire, alliant expertise technique et engagement social.

Après huit ans d’expérience en tant que Data Engineer et Data Scientist dans le conseil auprès de grands groupes français, il se tourne en 2020 vers l’humanitaire ainsi que l’enseignement et la formation.

Depuis, il met ses compétences au service d’ONG pour renforcer l’efficacité des réponses aux crises grâce à l’analyse et à la gestion des données.

En parallèle, il enseigne et forme au Big Data, intervenant auprès d’étudiants en master et de professionnels afin de les accompagner dans leur montée en compétences dans les métiers de la data.

Grâce à une approche pédagogique centrée sur l’humain, favorisant l’interaction et l’équilibre entre concepts théoriques et applications pratiques, Quentin vous accompagnera efficacement dans votre montée en compétences.

Voir son profil détaillé

FAQ

Nos formations sont éligibles à plusieurs dispositifs de financement, selon votre situation. Human Coders est certifié Qualiopi, ce qui permet la prise en charge par des organismes comme Pôle emploi, votre OPCO ou encore le CPF (Compte Personnel de Formation) pour certaines formations.

Pour en savoir plus, veuillez consulter notre page : Comment financer votre formation ?

Oui, la formation peut être proposée en présentiel ou en distanciel. Pour les inter-entreprises, les modalités (présentiel ou à distance) sont fonction de la session.

Nous pouvons organiser des sessions à d'autres dates ou dans d'autres villes (Bordeaux, Lille, Lyon, Marseille, Montpellier, Nantes, Nice, Paris, Strasbourg, Toulouse...)

Les formations se déroulent toujours en petit groupe de 3 à 6 stagiaires. Nous souhaitons que les formateurs et formatrices puissent passer un maximum de temps avec chacun·e.

Voici une journée type :

  • 9h : vous êtes accueillis par votre formateur·rice autour d'un petit déjeuner (croissants, pains au chocolat, jus de fruit, thé ou café...)
  • 9h30 : la formation commence
  • 12h30 : pause de midi. Le·a formateur·rice mangera avec vous. C'est l'occasion d'avoir des discussions plus informelles.
  • 14h : reprise de la formation
  • 18h : fin de la journée

8 raisons de participer à une formation Human Coders

  • Satisfaction client élevée : Un taux de statisfaction de 4,6/5 depuis 2012 (sur 1646 sessions réalisées). 99% des participants se disent satisfaits de nos formations
  • Approche pédagogique unique : Des formations en petit groupe, des formateurs passionnés et expérimentés, de véritables workshops... (Plus d'infos sur notre manifeste)
  • Catalogue de formations complet : 170 formations au catalogue, de quoi vous accompagner sur tout vos projets
  • Écosystème dynamique : Nous accompagnons les dev depuis 13 ans avec des initiatives comme Human Coders News, les Human Talks, le podcast ou encore notre serveur Discord
  • Financement facilité : Organisme certifié Qualiopi, indispensable pour que vous puissiez obtenir des aides au financement via votre OPCO
  • Références clients prestigieuses : De nombreux clients qui nous font confiance depuis des années
  • Accompagnement sur mesure : Nous vous proposons un accompagnement personnalisé par nos consultants pour vous aider dans vos projets au-delà de la formation
  • Valorisation professionnelle : Remise d'un diplôme, d'une attestation et d'une certification, suivant les formations effectuées, que vous pourrez afficher sur vos CV et réseaux sociaux

* Nombre de personnes ayant répondu au questionnaire de satisfaction sur cette formation depuis 2012