Plan du cours
Introduction aux Big Data Écosystèmes
- Aperçu des technologies et architectures de big data
- Traitement par lots vs. traitement en temps réel
- Stratégies de stockage de données pour l'évolutivité
Traitement avancé des données avec Apache Spark
- Optimisation des tâches Spark pour les performances
- Transformations et actions avancées
- Travail avec le streaming structuré
Machine Learning à l'échelle
- Techniques de formation modèles distribués
- Ajustement des hyperparamètres sur les grands ensembles de données
- Déploiement du modèle dans les environnements big data
Deep Learning pour Big Data
- Intégration de TensorFlow et PyTorch avec Spark
- Pipelines d'apprentissage profond distribués
- Cas d'utilisation dans l'analyse d'image, de texte et de séries temporelles
Analytique en temps réel et flux de données
- Apache Kafka pour la ingestion des données en streaming
- Frameworks de traitement de flux
- Suivi et alertes dans les systèmes en temps réel
Data Governance, sécurité et éthique
- Confidentialité des données et exigences de conformité
- Contrôle Access et chiffrement dans les systèmes big data
- Considérations éthiques dans l'analytique à grande échelle
Intégration des Big Data avec Business Intelligence
- Visualisation de données et tableau de bord pour le big data
- Connexion des pipelines de big data aux outils BI
- Pilotage des résultats d'entreprise avec l'analytique avancée
Récapitulation et prochaines étapes
Pré requis
- Compréhension approfondie des concepts d'analyse de données et de modélisation statistique
- Expérience avec des outils de traitement des données et des langages de programmation tels que Python, R ou Scala
- Familiarité avec les cadres de calcul distribué tels que Hadoop ou Spark
Public cible
- Scientifiques des données visant à maîtriser le traitement en grande échelle et l'analyse prédictive des données
- Analystes seniors cherchant à concevoir et mettre en œuvre des flux de travail analytiques avancés
- Professionnels R&D axés sur les solutions innovantes basées sur les données
Nos clients témoignent (5)
Les exemples pratiques nous ont permis de ressentir réellement comment le programme fonctionne. Des explications détaillées et une intégration des concepts théoriques et leur relation avec les applications pratiques.
Ian - Archeoworks Inc.
Formation - ArcGIS Fundamentals
Traduction automatique
Tous les sujets qu'il a abordés, y compris des exemples. Et également expliqué comment ils sont utiles dans notre travail quotidien.
madduri madduri - Boskalis Singapore Pte Ltd
Formation - QGIS for Geographic Information System
Traduction automatique
J'ai aimé le style de Pablo, le fait qu'il couvre beaucoup de sujets, de la conception de rapports, la personnalisation avec html à l'implémentation d'algortithmes ML simples. [L'équilibre entre les informations théoriques et les exercices. Pablo a vraiment couvert tous les sujets qui m'intéressaient et a donné des réponses complètes à mes questions.
Cristian Tudose - SC Automobile Dacia SA
Formation - Advanced Data Analysis with TIBCO Spotfire
Traduction automatique
Application pratique de Spotfire et toutes les fonctions de base.
Michael Capili - STMicroelectronics, Inc.
Formation - Introduction to Spotfire
Traduction automatique
La chose que j'ai le plus aimée dans la formation était l'organisation et l'emplacement
Hamid Tuama - Ability with Innovation General Contracting (DMCC Branch)
Formation - ArcGIS for Spatial Analysis
Traduction automatique