Traiter les Big Data avec Spark

Apache Spark est un outil permettant de faire le traitement de grands volumes de données en mémoire, et ce, de manière distribuée (cluster computing). Spark offre un modèle de programmation plus simple que celui de Hadoop et permet des temps d’exécution jusqu’à 100 fois plus rapides.

Apache Spark est né en 2009 dans le laboratoire AMPLab de l’université de Berkeley en partant du principe que :

  • d’une part, la RAM coûte de moins en moins cher et les serveurs en ont donc de plus en plus à disposition
  • de plus en plus de jeux de données ont une taille qui tient en mémoire RAM.

Le projet a intégré l’incubateur Apache en juin 2013 et est devenu un “Top-Level Project” en février 2014.

Détails du Module
  • Comprendre Spark et son écosystème
  • Appréhender l'architecture de Spark
  • Utiliser Les RDDs Spark
  • Introduire les langages Scala et PySpark
  • Architectes
  • Consultants
  • Administrateurs de bases de données
  • Développeurs d'applications
  • Data Scientists
  • Connaissances des commandes Shell de base de Linux
  • Avoir des connaissances générales sur le Big Data
  • Avoir les connaissances de base de Apache Hadoop est un grand atout
  • Aucune connaissance sur Spark n’est requise.
  • Connaitre le langage Java ou Python. Sacal est un grand atout.
  • Connaissances en SQL utiles mais non obligatoire.
Classe Virtuelle
Inclus tous les Modules Connexes
149.00 CAD$

Inscription au module   'Stockage et Traitement des données'  avec Hadoop (HDFS et MapReduce)

Inscription au module   'Traitement des données avec Spark'  

Durée totale de 9 heures (3 classes de 3h chacune)

Exercices pratiques

Accès aux matériels des modules (slides du cours et solutions des exercices)

Support individuel par email

Vous recevrez tous les liens pour accéder à la classe virtuelle en temps et en heure

Détails du Module
Technologies
Réservez Votre Place


    Réservez votre place pour le prochain cours. Vous recevrez un email pour vous informer de la date.

    Nom*
    Prénom*
    Email*
    Gestion et Analyse des Big Data (cours complet)Big Data – Une journée pour comprendreIntroduction aux Big DataP1 - Stocker et Traiter les Big DataP2 - Analyser les Big DataP3 - Ingestion des Big DataAtelier Big Data


    * Requis