Apprenez les techniques d'analyse et d'organisation des données massives structurées et comment les partitionner pour des performances optimales.
Maîtriser les techniques et les outils pour analyser et transformer des données massives non-structurées avec le langage Pig Latin.
Spark SQL est le module le plus utilisé de Spark. Il apporte une prise en charge native de SQL à Spark et permet de manipuler de gros volumes de données.