Formation Formation Data Mining et Machine Learning

Cette formation Formation Data Mining et Machine Learning vous permettra de

Comprendre les différences entre apprentissage automatique supervisé, non supervisé et meta-apprentissage?
Savoir transformer un gros volumes de données à priori hétérogène en information utile
Maîtriser l’utilisation d’algorithmes d'auto-apprentissage adaptés à une solution d'analyse
Comprendre comment exploiter de gros volumes de données textuelles
Être capable d'appliquer ces différentes techniques aux projets Big Data

Description de cette formation Formation Data Mining et Machine Learning

La maitrise du Data Mining et du Machine Learning est devenu une compétence nécessaire, voire même indispensable à toute personne souhaitant développer une expertise Big Data puisqu’elle permet d’explorer ou de fouiller de très importants volumes de données pour construire des modèles et répondre aux problèmes très variés des entreprises lorsque les méthodes statistiques traditionnelles deviennent inopérantes. Pour cela, les experts en Big Data doivent maitriser l’élaboration et l’étude des algorithmes permettant à des machines d’apprendre automatiquement à partir des données et à effectuer des tâches de façon performante.

Programme de cette formation Formation Data Mining et Machine Learning

INTRODUCTION

Data Mining vs Big Data
Data Mining vs Machine Learning vs Deep Learning
Apprentissage supervisé vs Apprentissage non supervisé et méta-apprentissage

INGÉNIERIE DE LA DÉCISION

Analyse procédurale hiérarchique
Problème d’association stable (algorithme de Lloy Shaply)
Chaîne de Markov discrète (DTMC)
Jeu d’entraînement et jeu de test
SÉLECTION D’INSTANCES
Échantillonnage balancé
Échantillonnage stratifié (probabilité non égales)

DATA MINING (FOUILLE DE DONNÉES)

Analyse en composantes principales
Analyse d'affinité
Agglomération hiérarchique et dendrogrammes
Bagging de dendrogrammes (bootstrop aggregating)
Positionnement multidimensionnel
K-means
SVM (Support Vector Machines)

MACHINE LEARNING

Régression logistique binaire
GLM
One-R (technique de règle unique de regroupement)
Regroupement ID-3
Liste de décision
Regroupement par régression d’arbres (CRT)
Arbres aléatoires (CRT bootstrap)
K plus proches voisins (K-NN)
Classification bayésienne naïve
Détections automatiques d’interactions par le chi-2 (CHAID)
Analyse discriminante linéaire et quadratique (LDA/QDA)
Réseaux de neurones

TEXT MINING

Analyse statistique de corpus
Détection automatique de langues
Noms/Prénoms et détection automatique de genres
Nuage de mots
Table de contingence de mots
Matrice d’adjacence de mots dans un corpus
Exploration dynamique d’un graphe connexe de mots
Analyse de sentiments
Analyse Sémantique Latente (LSA)

BIG DATA

Gestion de gros volumes de données