Formation Big Data - Technologies Hadoop, Spark et Écosystème Data
- Durée
- 2j
- Formation
- 14h
- Participants
- 1-10
- Par personne
- 1 590 €
Programme complet
Tout ce que vous devez savoir
Découvrez le contenu détaillé de cette formation, les prérequis nécessaires et les débouchés professionnels.
Certifications & Documents
Public visé
Profils concernés :
Analystes, contrôleurs de gestion, responsables financiers, chefs de projet, responsables marketing, data analysts, toute personne amenée à analyser des données et produire des tableaux de bord.
Cette formation s'adresse à vous si :
Analystes, contrôleurs de gestion, responsables financiers, chefs de projet, responsables marketing, data analysts, toute personne amenée à analyser des données et produire des tableaux de bord.
Cette formation s'adresse à vous si :
- Vous devez produire des reportings réguliers
- Vous souhaitez automatiser vos analyses de données
- Vous voulez créer des tableaux de bord interactifs
- Vous cherchez à valoriser les données de votre organisation
Prérequis
Connaître les fonctions de base d'Excel (saisie, formules simples, mise en forme).
Programme
Module 1 : Comprendre le Big Data et ses enjeux (3h30)
Objectif opérationnel : Maîtriser les concepts fondamentaux pour dialoguer avec les experts
- Définition du Big Data : les 5V (Volume, Vélocité, Variété, Véracité, Valeur)
- Évolution historique : du data warehouse traditionnel au data lakehouse moderne
- Sources de données : données structurées, semi-structurées (JSON, XML), non structurées (texte, images, vidéos)
- Cas d'usage par secteur : retail, banque, industrie, santé, secteur public
- Enjeux stratégiques : avantage concurrentiel, optimisation opérationnelle, nouveaux modèles économiques
- Mise en pratique : Cartographie des sources de données et des cas d'usage dans son organisation
Module 2 : L'écosystème technologique du Big Data (3h30)
Objectif opérationnel : Connaître les principales technologies pour orienter ses choix
- Stockage distribué : Hadoop HDFS, data lakes (S3, Azure Data Lake, GCS)
- Traitement batch et streaming : Spark, Flink, Kafka pour le temps réel
- Bases de données NoSQL : MongoDB (documents), Cassandra (colonnes), Neo4j (graphes), Redis (clé-valeur)
- Orchestration et workflow : Airflow, Dagster, Prefect pour automatiser les pipelines
- Solutions cloud : AWS (Redshift, Glue), Azure (Synapse, Databricks), GCP (BigQuery, Dataflow)
- Mise en pratique : Mapping des technologies selon les besoins identifiés en module 1
Module 3 : Organisation et métiers de la data (3h30)
Objectif opérationnel : Structurer son équipe data et définir les compétences nécessaires
- Les métiers de la data : Data Engineer, Data Scientist, Data Analyst, ML Engineer, DataOps
- Organisation des équipes : modèle centralisé, décentralisé, hub-and-spoke, data mesh
- Compétences techniques et soft skills recherchées pour chaque profil
- Parcours de formation et certifications : comment développer les talents en interne
- Collaboration data/métier : DataOps et culture data-driven
- Mise en pratique : Définition d'une organisation data cible pour son entreprise
Module 4 : Construire sa stratégie Big Data (3h30)
Objectif opérationnel : Élaborer une feuille de route réaliste et priorisée
- Évaluer sa maturité data : grille d'auto-diagnostic sur 5 axes
- Définir sa vision et ses objectifs : alignement avec la stratégie d'entreprise
- Architecture de référence : data platform moderne, principes de gouvernance
- Estimation des coûts et ROI : TCO cloud vs on-premise, valeur générée par les cas d'usage
- Gestion du changement : accompagner les équipes vers une culture data-driven
- Livrable : Ébauche de feuille de route Big Data à 12-24 mois pour son organisation
Formation professionnelle
Prêt à démarrer votre formation ?
Nos conseillers vous accompagnent dans vos démarches et vous aident à trouver le financement adapté à votre situation.
