Traiter les Big Data avec Spark

Apache Spark est un outil permettant de faire le traitement de grands volumes de données en mémoire, et ce, de manière distribuée (cluster computing). Spark offre un modèle de programmation plus simple que celui de Hadoop et permet des temps d’exécution jusqu’à 100 fois plus rapides.

Apache Spark est né en 2009 dans le laboratoire AMPLab de l’université de Berkeley en partant du principe que :

d’une part, la RAM coûte de moins en moins cher et les serveurs en ont donc de plus en plus à disposition
de plus en plus de jeux de données ont une taille qui tient en mémoire RAM.

Le projet a intégré l’incubateur Apache en juin 2013 et est devenu un “Top-Level Project” en février 2014.

Stocker et Traiter les Big Data

Classe Virtuelle

Inclus tous les Modules Connexes

149.00 CAD$

Inscription au module 'Stockage et Traitement des données' avec Hadoop (HDFS et MapReduce)

Inscription au module 'Traitement des données avec Spark'

Durée totale de 9 heures (3 classes de 3h chacune)

Exercices pratiques

Accès aux matériels des modules (slides du cours et solutions des exercices)

Support individuel par email

Vous recevrez tous les liens pour accéder à la classe virtuelle en temps et en heure