M2i Formation - BIG-SPK - Spark Scala - Traitement Des Données
M2i Formation - BIG-SPK - Spark Scala - Traitement Des Données
M2i Formation - BIG-SPK - Spark Scala - Traitement Des Données
Objectifs de formation
A l'issue de cette formation, vous serez capable de :
Le formateur alterne entre méthode** démonstrative, interrogative et active (via des travaux
pratiques et/ou des mises en situation).
Variables suivant les formations, les moyens pédagogiques mis en oeuvre sont :
– Ordinateurs Mac ou PC (sauf pour certains cours de l'offre Management), connexion internet
ibre, tableau blanc ou paperboard, vidéoprojecteur ou écran tactile interactif (pour
le distanciel)
– Environnements de formation installés sur les postes de travail ou en ligne
– Supports de cours et exercices
En cas de formation intra sur site externe à M2i, le client s'assure et s'engage également à avoir
toutes les ressources matérielles pédagogiques nécessaires (équipements informatiques...)
au bon déroulement de l'action de formation visée conformément aux prérequis indiqués
dans le programme de formation communiqué.
Prérequis
Connaître la programmation fonctionnelle et avoir des connaissances sur la gestion des bases
de données.
Public concerné
Statisticiens, consultants Big Data, data analysts, data scientists.
Programme
Jour 1
Introduction à Scala pour Apache Spark
– Présentation de Scala
– Pourquoi Scala avec Spark ?
– Scala dans les autres framework
– Introduction à Scala REPL
– Les opérations basiques sur Scala
– Les types de variables dans Scala
– Les structures de contrôles dans Scala
– Les boucles
– Les fonctions
– Les procédures
– Les collections dans Scala (Array, ArrayBuffer, Map, Tuples, Lists...)
Jour 2
Les opérations communes sur Spark
– Utilisation de Spark Shell
– Création d'un contexte Spark
– Chargement d'un ichier en Shell
– Réalisation d'opérations basiques sur un ichier avec Spark Shell
– Présentation du l'environnement de développement SBT
– Créer un projet Spark avec SBT
– Exécuter un projet Spark avec SBT
– Le mode local
Jour 3
Spark Streaming et MLlib
– Architecture de Spark Streaming
– Premier programme avec Spark Streaming
– Les transformations dans Spark Streaming
– La "fault tolerance" dans Spark Streaming
– Checkpointing
– Niveaux de parallélismes
– Machine Learning avec Spark
– Types de données
– Algorithmes et statistiques
– Classiication et régression
– Clustering
– Filtrage collaboratif
Le contenu de ce programme peut faire l'objet d'adaptation selon les niveaux, prérequis et besoins des apprenants.