Formation Big Data on AWS (Amazon Web Services)

Réf. CY4509   |   3 Jours

Cette formation Big Data on AWS (Amazon Web Services) vous permettra de

  • Comprendre les applications d'Apache Hadoop dans le contexte d'Amazon EMR
  • Comprendre l'architecture d'un cluster Amazon EMR
  • Lancer un cluster Amazon EMR en utilisant une image machine Amazon (AMI) et des types d'instances Amazon EC2 adaptés
  • Sélectionner les options de stockage de données sur AWS les plus adaptées dans le cadre de l'utilisation d'Amazon EMR
  • Connaître les différentes options d'importation, de transfert et de compression des données destinées à Amazon EMR
  • Utiliser les frameworks de programmation courants compatibles avec Amazon EMR, notamment Hive, Pig et Streaming
  • Utiliser Amazon Redshift pour déployer une solution de Big Data
  • Utiliser un logiciel de visualisation des Big Data
  • Sélectionner les options de sécurité les plus adaptées à Amazon EMR et à vos données
  • Effectuer des analyses de données en mémoire avec Spark et Shark sur Amazon EMR
  • Sélectionner les options adaptées pour gérer votre environnement Amazon EMR de façon rentable
  • Comprendre les avantages d'Amazon Kinesis pour les applications de Big Data

Description de cette formation Big Data on AWS (Amazon Web Services)

La formation Big Data sur AWS présente des solutions de Big Data basées sur le cloud ainsi qu'Amazon Elastic MapReduce (EMR), la plate-forme de Big Data d'AWS. Dans le cadre de ce cours, vous découvrirez comment utiliser Amazon EMR afin de traiter des données grâce au vaste écosystème d'outils Hadoop tels que Pig et Hive. Vous apprendrez également à créer des environnements de Big Data, à utiliser Amazon DynamoDB, Amazon Redshift et Amazon Kinesis, et à appliquer au mieux les bonnes pratiques afin de concevoir des environnements de Big Data sécurisés et économiques.
Ce cours vous permet de tester de nouvelles compétences et d'appliquer vos connaissances à votre environnement de travail grâce à différents exercices pratiques.

Programme de cette formation Big Data on AWS (Amazon Web Services)

Journée 1
Présentation générale des technologies Big Data et Apache Hadoop, et des avantages liés à l'utilisation d'Amazon EMR
Architecture d'Amazon EMR
Utilisation d'Amazon EMR
Lancement et utilisation d'un cluster Amazon EMR
Frameworks de programmation Hadoop
Journée 2
Utilisation de Hive pour les analyses de données publicitaires
Utilisation de la diffusion en continu pour les analyses de données du domaine des sciences de la vie
Présentation : Spark et Shark pour les analyses en mémoire
Utilisation de Spark et Shark pour les analyses en mémoire
Gestion des frais liés à Amazon EMR
Présentation générale des options de sécurité d'Amazon EMR
Importation, transfert et compression de données
Utilisation d'Amazon Kinesis pour le traitement en temps réel de Big Data
Journée 3
Utilisation d'Amazon Kinesis et d'Amazon EMR pour la diffusion en continu et le traitement de Big Data
Options de stockage de données sur AWS
Utilisation de DynamoDB avec Amazon EMR
Présentation : Amazon Redshift et les technologies Big Data
Utilisation d'Amazon Redshift pour les applications de Big Data
Visualisation et orchestration de Big Data
Utilisation de Tableau Desktop ou de Jaspersoft BI pour visualiser des Big Data