Introduction aux Big Data

Gratuit

Littéralement, les termes ‘Big Data‘ signifient Méga-Données, Grosses Données ou encore Données Massives. Ils désignent un ensemble très volumineux de données et d’autres caractéristiques qu’aucun outil classique de gestion de base de données ou de gestion de l’information ne peut vraiment manipuler.

En effet, nous procréons environ 2,5 trillions (1 trillion = 10ˆ18 =>  2 milliards 500 millions milliards) d’octets de données tous les jours. Ce sont les informations provenant de partout : des messages que nous nous envoyons, des vidéos que nous publions, des informations climatiques, des signaux GPS, des enregistrements transactionnels d’achats en ligne et bien d’autres encore.

Ces données sont baptisées Big Data ou volumes massifs de données. Les géants du Web, au premier rang desquels Yahoo (mais aussi Facebook et Google), ont été les tous premiers à déployer ce type de technologie et les outils nécessaires pour les manipuler et les analyser.

Détails du Module
  • Présenter les enjeux de l’analyse des données numériques à grande échelle.
  • Comprendre pourquoi tout le monde parle du Big Data et son impact dans l’entreprise.
  • Comment faire du Big Data ? Sur quelle plateforme technologique s’appuyer ?
  • Comprendre les caractéristiques principales des Big Data
  • Identifier et s’approprier les outils de l’écosystème Hadoop pour chaque cas d’usage.
  • Développeurs, Architecte
  • Administrateurs réseaux / infrastructure
  • Consultant (BI, BA)
  • Chefs de projet
  • Ingénieurs d’études
  • Chef de projet
  • Responsable technique
  • Aucune connaissance sur du Big Data n’est requise, Néanmoins il est conseillé de disposer d’une culture d’informatique d’entreprise et quelques bases techniques.

1 - Introduction

  • Définition du BIG Data
  • Evolutions des technologies du stockage
  • Unitées de mesures du Big Data

 

2 - Les métiers du Big Data

  • Quel profil pour quel poste ?
  • Les différents métiers du Big Data
  • Evaluation des salaires des professionnels du Big Data

 

3 - Les cas d'usage du Big Data

  • Big data en entreprise
  • Eléments de gouvernance des données

 

4 - Les Sources de données

  • Les différentes sources de données
  • La classification des données
  • Les différents formats des données

 

5 - Les Caractéristiques du Big Data

  • Présentation des 5 Vs du Big Data
  • Volume
  • Vélocité
  • Variété
  • Véracité
  • Valeur (Visualilsation)

 

6 - Big Data vs Business Intelligence

  • Rappel du l’architecture décisionnelle
  • Les limites de la BI
  • Définition du Data Lake
  • Comparaison des deux approches ( BI vs Big Data )
  • Avantages et points de vigilance

7 - Traitement et Stockage du Big Data

  • Concepts de base du Stockage distribué
  • Traitement parallèle vs traitements distribué
  • Stockage des données non-structurées
  • Mise à l’échelle Verticale vs Horizontale

8 - Panorama des outils Big Data

  • Présentation de Apche Hadoop
  • Historique, Performances, Composents princpaux
  • Classification des outils de l’écosystème Hadoop
  • Modes de fonctionnement de Hadoop
  • Les outils de la ligne de commande Hadoop
  • Les fichiers de configuration de Hadoop

9 - Les dirtibutions commerciales de Hadoop

  • Présentation des différents type des distributions 
  • Exploration et comparaison des principales disctributions Cloudera / Hortonworks / MapR
  • Les solutions Hadoop dans le cloud (Amazon, Microsoft, Google)
  • Comment choisir sa distribition

Si vous avez suffisement de ressources sur votre machine, vous pouvez choisir d'installer l'environnement Hadoop préconfiguré sur votre machine. Dans le cas contraire vous pouvez le lancer à partir du cloud Amazon lequel nécessite un inscription. 

 

1 - Installation de Hadoop en local

  • Installation et configuration de Virtualbox
  • Importation et paramétrage de l'image virtuelle
  • Lancement et test de l'environnement virtuel

 

2 - Installation de Hadoop dans le cloud Amazon

  • Création d'un compte Amazon AWS
  • Création d'une instance EC2
  • Paramétrage du groupe de sécurité de l'instance EC2
  • Lancement et arrêt de l'instance EC2
  • Accéder à l'instance à partir de son ordinateur local
Architecte et Formateur Big Data
dataXper
Khaled TANNIR, Architecte et Enseignant Big Data avec une expérience riche de plus de 20 années dans plusieurs domaines tels que la Banque, les Finances et les Assurances.
Classe Virtuelle
Inscription Gratuite
GRATUIT

Présentation du cours et de ses modules

Introduction aux Big Data: Les unités de mesures, les caractéristiques, les sources de données

Classe virtuelle d'une durée de 3h (livrée en ligne)

Accès au matériel de la classe (slides)

Support individuel par email

Détails du Module
Technologies
Réservez votre place


    Réservez votre place pour le prochain cours. Vous recevrez un email pour vous informer de la date.

    Nom*
    Prénom*
    Email*
    Gestion et Analyse des Big Data (cours complet)Big Data – Une journée pour comprendreIntroduction aux Big DataP1 - Stocker et Traiter les Big DataP2 - Analyser les Big DataP3 - Ingestion des Big DataAtelier Big Data


    * Requis