Hadoop

Apache Hadoop à quoi ça sert ?

Ses capacités de stockage et ses capacités de traitement et de combinaison de données à moindre coût permettent au Framework Hadoop de servir de :

  • Bac à sable : stockage massif + capacités de traitement = bac à sable pour découvrir et mettre en place des patterns pour l’instruction prescriptive
  • Data lake :  pour stocker des données brutes à destination des data scientistes et analystes
  • Complément des data Warehouses : certains ensembles de données sont déchargés directement depuis les Data Warehouses vers Hadoop, et certains nouveaux types de données vont directement sur Hadoop.
  • Data store : pour gérer les objets connectés (IOT) qui doivent savoir ce qu’ils doivent communiquer et quand agir.
  • Créateur de recommandations : Ses outils analytiques analysent de grandes quantités de données en temps réel pour prédire rapidement les préférences des consommateurs avant qu’ils n’aient le temps de quitter la page web.

Et Cloudera dans tout ça

Cloudera c’est la distribution Hadoop la plus populaire (elle a même racheté Hortonworks). Elle bénéficie de fonctionnalités personnalisables :

  • Sécurité
  • Gouvernance
  • SQL
  • Langages de script (Java …)
  • Consoles de gestion/administration

Pour Aller plus loin

Au-delà d’Hadoop formez-vous aux modules phare Spark, Elasticsearch et Kafka pour tirer le meilleur parti de vos données 

Envoyer à un ami

Valider
Le lien a été envoyé au destinataire avec succès.