Objectifs pédagogiques de la formation

Cette formation Certification Spark avec Hadoop pour Développeurs de Cloudera vous permettra de :
  • Comment les données sont distribuées, stockées et enregistrées dans un cluster Hadoop ?
  • Comment utiliser Sqoop et Flume pour intégrer les données ?
  • Comment enregistrer des données distribuées avec Apache Spark ?
  • Comment modéliser des données structurées en tant que tableau dans Impala et Hive ?
  • Comment choisir le meilleur format de stockage de données pour différents patterns d’utilisation de données ?
  • Les meilleures pratiques pour le stockage de données.
  •  

    Programme de la formation

    • Introduction
    • Présentation de Hadoop et de son écosystème
    • L’architecture Hadoop et HDFS
    • Importer des données relationnelles avec Apache Sqoop
    • Introduction à Impala et Hive
    • Les formats de données
    • La partition des données
    • Les données Apache Flume
    • Les bases de Spark
    • Rédiger et déployer des applications Spark
    • La programmation parallèle avec Spark
    • Spark : mise en cache et persistence
    • Le traitement de données avec Spark et « Common patterns »
    • Spark SQL et DataFrames
    • Conclusion
    •  

      Profil du formateur

      Formateur consultant expert en BIG DATA

       

      Modalités d’évaluation

      Auto-évaluation des acquis par le stagiaire via un questionnaire en ligne Attestation de fin de stage remise au stagiaire

       

      Méthode pédagogique

      1 poste et 1 support par stagiaire 8 à 10 stagiaires par salle Remise d’une documentation pédagogique papier ou numérique pendant le stage La formation est constituée d’apports théoriques, d’exercices pratiques, de réflexions et de retours d’expérience