Apache Spark

Le moteur de traitement de données Apache Spark est le Framework Big Data le plus populaire auprès des entreprises, et probablement aussi après de la vôtre !

Vous êtes développeur informatique ? Chef de projet Big Data ? Data Scientist ? Consultant Business Intelligence ? Responsable Système d’informations ? Apprenez à l’utiliser en ligne de commande et en développement et constituez vos data lake.

Apache Spark est intégré par les distributeurs Hadoop Cloudera et MapR, à l’issue de notre atelier vous pourrez ainsi l’interfacer avec d’autres composants Big Data tel que Kafka ou Cassandra

Pour aller plus loin

Spark peut être utilisé aussi bien par les data ingénieurs que par les data scientists ! C’est donc un framework de choix si vous travaillez dans en mode DevOps ! Créé en Scala, Spark supporte aussi Python et R, n’hésitez donc pas à mettre à jour vos connaissances dans ces deux langages de programmation. Découvrez nos formations data science sur R et Python !

Envoyer à un ami

Valider
Le lien a été envoyé au destinataire avec succès.