AWS-BDA

AWS-BDA - Big Data on AWS

Vous allez découvrir des solutions de Big Data basées sur le cloud comme Amazon EMR, Amazon Redshift, Amazon Kinesis et le reste de la plateforme AWS Big Data. Nous vous montrerons comment utiliser Amazon EMR afin de traiter des données grâce au vaste écosystème d'outils Hadoop tels que Hive et Hue. Vous apprendrez également à créer des environnements de Big Data, à utiliser Amazon DynamoDB, Amazon Redshift, Amazon QuickSight, Amazon Athena et Amazon Kinesis, ainsi qu'à appliquer au mieux les bonnes pratiques afin de concevoir des environnements de Big Data sécurisés et économiques.

Durée: 3 Jours

PROGRAMME DE LA FORMATION

Vous allez découvrir des solutions de Big Data basées sur le cloud comme Amazon EMR, Amazon Redshift, Amazon Kinesis et le reste de la plateforme AWS Big Data. Nous vous montrerons comment utiliser Amazon EMR afin de traiter des données grâce au vaste écosystème d'outils Hadoop tels que Hive et Hue. Vous apprendrez également à créer des environnements de Big Data, à utiliser Amazon DynamoDB, Amazon Redshift, Amazon QuickSight, Amazon Athena et Amazon Kinesis, ainsi qu'à appliquer au mieux les bonnes pratiques afin de concevoir des environnements de Big Data sécurisés et économiques.

Dans ce cours, vous apprendrez :

  • Intégrer une solution AWS dans un écosystème de Big Data
  • à utiliser Apache Hadoop dans le cadre d'Amazon EMR
  • à identifier les composants d'un cluster Amazon EMR puis à lancer et configurer un cluster Amazon EMR
  • à utiliser les frameworks de programmation courants compatibles avec Amazon EMR, notamment Hive, Pig et Streaming
  • à optimiser la facilité d'utilisation d'Amazon EMR avec Hadoop User Experience (Hue)
  • à utiliser les analyses en mémoire avec Apache Spark sur Amazon EMR
  • à choisir les options de stockage de données AWS appropriées
  • à identifier les avantages de l'utilisation d'Amazon Kinesis pour le traitement de Big Data en temps quasi réel
  • à utiliser Amazon Redshift pour stocker et analyser des données de manière efficace
  • à comprendre et gérer les coûts et la sécurité pour une solution de Big Data
  • Identifier les options pour l'importation, le transfert et la compression de données
  • Exploiter Amazon Athena pour les analyses par requêtes ad hoc
  • à utiliser AWS Glue pour automatiser l'extraction, la transformation et le chargement (ETL) de charges de travail
  • à utiliser un logiciel de visualisation pour représenter les données et les requêtes à l'aide d'Amazon QuickSight

Ce cours s'adresse aux personnes suivantes :

  • Architectes de solutions
  • Administrateurs SysOps
  • Experts en science des données
  • Analystes de données
  • Avoir des connaissances de base sur les technologies Big Data, notamment Apache Hadoop et HDFS Pig, Hive et MapReduce.
  • Savoir utiliser les principaux services AWS et l'implémentation de cloud public.
  • Les participants doivent avoir suivi le cours Notions de base AWS ou posséder un niveau d'expérience équivalent.
  • La compréhension des concepts d'entrepôt de données, de système de base de données relationnelle et de conception de base données est recommandée.

Jour 1

  • Vue d’ensemble de la Big data
  • Récupérer et transférer la Big Data
  • Streaming Big Data et Amazon Kinesis
  • Solutions de stockage Big Data
  • Process Big Data et Analyse

Jour 2

  • Apache Hadoop et Amazon EMR
  • Utiliser Amazon EMR
  • Frameworks de programmation Hadoop
  • Inetrfaces Web sur Amazon EMR
  • Apache Spark sur Amazon EMR

Jour 3

  • Amazon Redshift et Big Data
  • Visualiser et Orchestrer la Big Data
  • Gérer les coûts de la Big Data
  • Sécuriser les déploiements de votre Amazon
  • Modèles de conception Big Data

Les prochaines sessions

Actuellement aucunne session n'a été planifiée pour ce cour.