Gestion et Analyse des Données Massives

Ce cours familiarise les participants avec différents aspects des grands ensembles de données et la façon dont ils sont gérés à la fois sur site et dans le cloud.

L’accent est mis sur la fourniture aux participants d’une expérience pratique de l’ingestion de données à l’analyse de grands ensembles de données, à la fois des données au repos ou des données en mouvement (données en continu), y compris la définition du Big Data et de ses 5 V: volume, vitesse , Variété, véracité et valeur.

Les architectures de bases de données distribuées et de stockage, les écosystèmes tels que Hadoop et Spark sont abordés, suivis d’une introduction à Scala, Spark-Shell et PySpark.

Le cours comprends un ensemble de travaux pratiques basés sur des cas réels qui permettent aux étudiants de valider les compétences acquises dans un contexte presque équivalent à celui en entreprise.

  • Définir les concepts et identifier l’apport du Big Data.
  • Déterminer l’écosystème technologique.
  • Organiser la collecte des données.
  • Choisir une technologie de stockage de données.
  • Connaître les technologies pour traiter les gros volumes de données.
  • Architecte SI
  • Chef de projet
  • Développeur
  • Data Miner
  • Data Scientist

Il est important d'avoir une expérience orientée technologie. Ce cours couvre une multitude de technologies et de langages de programmation.

Avoir une connaissance et une certaine expérience des outils de stockage et de gestion des données est recommandé pour être confortable dans l'accomplissement des exercices.

La formation se passe en ligne, et se compose de 80% de travaux pratiques (Mises en situation, débats, exercices). Le formateur alterne entre théorie et pratique ; chaque participant dispose d’un environnement virtuel sur lequel il réalisera les exercices proposés.

Une évaluation de l’acquisition des connaissances de la classe de la veille est effectuée.

Une synthèse est proposée en fin de formation. Un projet sera proposé au élèves à la fin du cours.

Les slides du cours seront remis à chaque participant comprenant les sujets couverts par la théorie, les exercices et les corrigés de ces derniers.
Une attestation de fin de formation sera remise si l'élève a bien assisté à la totalité de la session (ou au moins à 80%) et a réussi le projet final.

Le formateur est un expert du domaine qui intervient sur le sujet depuis plusieurs années en formation mais aussi en conseil.

Doté d’une grande qualité d’écoute, sa pédagogie et sa compétence technique vous permettront d’acquérir les compétences sur les architectures Big Data.

Les modules composants cette formation apparaissent plus bas dans cette page. Merci de défiler vers le bas pour les consulter.
Aussi vous pouvez les consulter dans la section Modules.

A l'issue de la formation et sous conditions d'avoir respecté les règles de présences (80% au moins) et d'avoir réussi la réalisation du projet final, nous vous remettons un certificat d'achèvement. Ce certificat vous aidera à avoir une longueur d'avance sur vos concurrents: avec les certificats en ligne de Big Data Facile, vous serez en mesure de prouver votre croissance professionnelle à tout le monde.

Tarifs
Inclus Tous les modules
799.00 CAD$

Inscription au module  'Stockage et Traitement des données'

Inscription au module  'Traitement des données avec Spark'

Inscription au module  'Analyser des Données Massives Struturées'

Inscription au module  'Analyser des Données Massives Non-Struturées'

Inscription au module  'Analyser des Données Massives avec Spark SQL' 

Inscription au module  'Format des Fichiers des Données Massives'

Inscription au module  'Ingérer des Données Relationnelles'

Inscription au module  'Ingérer des Données en Continue'

Inscription au module  'Ingérer des Données à Haute Vitesse'

Inscription au module  'Ingérer des données avec Spark Streaming'

Inscription au module  'Travaux Pratiques Big Data'

Durée totale de 30 heures (10 sessions de 3 heures chacune).

Livrée en ligne.

Plusieurs travaux pratiques et exercices inspirés de cas d'usage réels.

Accès aux slides du cours, solutions des exercices, scripts et codes des projets de l'atelier.

Support individuel par email.

Vous recevrez tous les liens pour accéder à la classe virtuelle en temps et en heure.

Détails du Cours
Horaires du cours
  • Samedi
    07:00 - 09:30
  • Dimanche
    07:00 - 09:30
Détails du Cours
Horaires du cours
  • Samedi
    07:00 - 09:30
  • Dimanche
    07:00 - 09:30
Prochaine Session

Prévue le : 2022/11/05 07:00

Jours
Heures
Minutes
Secondes

Module du Cours
Stockage, Traitement, Analyse et Ingestion.
Gratuit
mars 12, 2022
7:00 am
Introduction aux caractéristiques des Big Data et aux technologies de Stockage et Traitement distribués tels que Hadoop.
Planification en cours
mars 12, 2022
7:00 am
Explorez en détail dans ce module les concepts du système de stockage distribué et de traitement de Hadoop (HDFS et MapReduce).
Planification en cours
mars 12, 2022
7:00 am
Apprenez les concepts de base de Spark et comment il charge des données volumineuses en mémoire distribuée pour les traiter à grande vitesse.
Planification en cours
mars 12, 2022
7:00 am
Apprenez les techniques d'analyse et d'organisation des données massives structurées et comment les partitionner pour des performances optimales.
Planification en cours
mars 12, 2022
7:00 am
Maîtriser les techniques et les outils pour analyser et transformer des données massives non-structurées avec le langage Pig Latin.
Planification en cours
mars 12, 2022
7:00 am
Spark SQL est le module le plus utilisé de Spark. Il apporte une prise en charge native de SQL à Spark et permet de manipuler de gros volumes de données.
Planification en cours
mars 12, 2022
7:00 am
Découvrez les formats de fichiers qui sont optimisés pour un stockage et un traitement de données à grande échelle.
Planification en cours
mars 12, 2022
7:00 am
Apprenez comment Importer et/ou Exporter des données relationnelles vers l’écosystème Hadoop de façon optimale.
Planification en cours
mars 12, 2022
7:00 am
Apprenez les techniques d'ingestion des données structurées ou non en Continue avec Apache Flume et Apache Nifi.
Planification en cours
mars 12, 2022
7:00 am
Découvrez les challenges et les outils incontournables pour collecter des données massives qui arrivent à toute vitesse.
Planification en cours
mars 12, 2022
7:00 am
Spark Streaming est le module de Spark destiné à ingérer et traiter des données qui arrivent en continu dans une fenêtre de temps donnée.
Planification en cours
mars 12, 2022
7:00 am
Un atelier de travaux pratiques qui regroupe quatre projets inspirés de plusieurs cas d'usage réels de collecte de données en mouvement et au repos et de l'analyse de ces données.
Planification en cours