Merci d'avoir envoyé votre demande ! Un membre de notre équipe vous contactera sous peu.
Merci d'avoir envoyé votre réservation ! Un membre de notre équipe vous contactera sous peu.
Plan du cours
Plan détaillé de la formation
- Introduction au TLN
- Comprendre le TLN
- Cadre de travail pour le TLN
- Applications commerciales du TLN
- Collecte de données sur le web
- Travail avec divers API pour récupérer des données textuelles
- Travail et stockage de corpus textuels sauvegardant le contenu et les métadonnées pertinentes
- Avantages de l'utilisation de Python et introduction au module NLTK
- Compréhension pratique d'un corpus et d'un jeu de données
- Pourquoi avons-nous besoin d'un corpus ?
- Analyse de corpus
- Types d'attributs de données
- Différents formats de fichiers pour les corpus
- Préparation d'un jeu de données pour les applications TLN
- Compréhension de la structure des phrases
- Composantes du TLN
- Compréhension du langage naturel
- Analyse morphologique - racine, mot, token, balises de parole
- Analyse syntaxique
- Analyse sémantique
- Gestion de l'ambiguïté
- Prétraitement des données textuelles
- Corpus - texte brut
- Tokenisation de phrases
- Racinement pour texte brut
- Lemmatisation de texte brut
- Suppression des mots vides
- Corpus - phrases brutes
- Tokenisation de mots
- Lemmatisation de mots
- Travail avec des matrices Terme-Document / Document-Terme
- Tokenisation de texte en n-grammes et phrases
- Prétraitement pratique et personnalisé
- Corpus - texte brut
- Analyse des données textuelles
- Caractéristiques de base du TLN
- Analyseurs et analyse
- Étiquetage POS et étiqueteurs
- Reconnaissance d'entités nommées
- N-grammes
- Sac de mots
- Caractéristiques statistiques du TLN
- Concepts d'algèbre linéaire pour le TLN
- Théorie probabiliste pour le TLN
- TF-IDF
- Vectorisation
- Encodeurs et décodeurs
- Normalisation
- Modèles probabilistes
- Ingénierie avancée des caractéristiques et TLN
- Bases de word2vec
- Composantes du modèle word2vec
- Logique du modèle word2vec
- Extension du concept de word2vec
- Application du modèle word2vec
- Étude de cas : Application du sac de mots : résumé automatique de texte utilisant les algorithmes simplifiés et véritables de Luhn
- Caractéristiques de base du TLN
- Regroupement de documents, classification et modélisation des sujets
- Agrégation de documents et extraction de motifs (agrégation hiérarchique, k-moyennes, agrégation, etc.)
- Comparaison et classification de documents en utilisant TFIDF, la distance Jaccard et la distance cosinus
- Classification de documents en utilisant Naïve Bayes et Maximum Entropy
- Identification des éléments importants du texte
- Réduction de la dimensionnalité : Analyse en composantes principales, décomposition en valeurs singulières, factorisation matricielle non-négative
- Modélisation des sujets et récupération d'informations en utilisant l'analyse sémantique latente
- Extraction d'entités, analyse des sentiments et modélisation avancée des sujets
- Positif vs. négatif : degré de sentiment
- Théorie de la réponse aux items
- Étiquetage POS et son application : trouver les personnes, lieux et organisations mentionnés dans le texte
- Modélisation avancée des sujets : Allocation Dirichlet Latente
- Études de cas
- Extraction de reviews utilisateurs non structurées
- Classification et visualisation des sentiments des données de reviews de produits
- Extraction de logs de recherche pour les motifs d'utilisation
- Classification de texte
- Modélisation des sujets
Pré requis
Connaissance et compréhension des principes du TLN et appréciation de l'application de l'IA dans les entreprises
21 Heures
Nos clients témoignent (1)
Soutien individuel
Simon the 2nd - Cboost
Formation - ROS: Programming for Robotics
Traduction automatique