Objectifs pédagogiques de la formation

Cette formation Data Science, les fondamentaux vous permettra de :

  • Savoir reconnaitre une problématique business qui profiterait de l’apport de la data science
  • Mettre en place une gouvernance projet dédié
  • Choisir les bons outils en fonction de la problématique

 

Programme de la formation

Data science et data mining
  • Introduction au data mining
  • Différence entre data science, data mining, machine learning
  • Les principales méthodes en data science :
  • Le machine learning : réseau de neurone, boosting et bagging, gradient boosting, random forest
  • Le data mining : régression, k-meeans, techniques d’association Introduction au deep learnin
Principe du big data
  • L’architecture distribuée
  • Principes d’un cluster Hadoop : Le map reduce et Yarn Le HDFS Les daemon
Les étapes d’un projet de data science
Overview des principaux outils de la data science
  • Les distributions Hadoop
  • Les solutions open source : les solutions Apache (hive, pig), Python, R Les solutions payantes : SAS, IBM (Modeler, DSX), Dataiku, Datameer, les PaaS (AWS, Microsoft Azure, Bluemix) …

 

Profil du formateur

Formateur consultant expert en DATA SCIENCE

 

Modalités d’évaluation

Auto-évaluation des acquis par le stagiaire via un questionnaire en ligne Attestation de fin de stage remise au stagiaire

 

Méthode pédagogique

1 poste et 1 support par stagiaire 8 à 10 stagiaires par salle Remise d’une documentation pédagogique papier ou numérique pendant le stage La formation est constituée d’apports théoriques, d’exercices pratiques, de réflexions et de retours d’expérience