Objectifs pédagogiques de la formation

Cette formation Certification Spark avec Hadoop pour Développeurs de Cloudera vous permettra de :

  • Comment les données sont distribuées, stockées et enregistrées dans un cluster Hadoop ?
  • Comment utiliser Sqoop et Flume pour intégrer les données ?
  • Comment enregistrer des données distribuées avec Apache Spark ?
  • Comment modéliser des données structurées en tant que tableau dans Impala et Hive ?
  • Comment choisir le meilleur format de stockage de données pour différents patterns d’utilisation de données ?
  • Les meilleures pratiques pour le stockage de données.

 

Programme de la formation

  • Introduction 
  • Présentation de Hadoop et de son écosystème
  • L’architecture Hadoop et HDFS 
  • Importer des données relationnelles avec Apache Sqoop
  • Introduction à Impala et Hive 
  • Les formats de données
  • La partition des données 
  • Les données Apache Flume
  • Les bases de Spark 
  • Rédiger et déployer des applications Spark
  • La programmation parallèle avec Spark 
  • Spark : mise en cache et persistence
  • Le traitement de données avec Spark et « Common patterns » 
  • Spark SQL et DataFrames
  • Conclusion 

 

Profil du formateur

Formateur consultant expert en BIG DATA

 

Modalités d’évaluation

Auto-évaluation des acquis par le stagiaire via un questionnaire en ligne Attestation de fin de stage remise au stagiaire

 

Méthode pédagogique

1 poste et 1 support par stagiaire 8 à 10 stagiaires par salle Remise d’une documentation pédagogique papier ou numérique pendant le stage La formation est constituée d’apports théoriques, d’exercices pratiques, de réflexions et de retours d’expérience