Analyse des données - La révolution du prédictif

Date

Analyse des données - La révolution du prédictif

Catégorie

  • Gestion des data
Prix HT :
900,00 € / Par personne
Durée en heures :
Non renseigné
Localisation :
75009
PARIS 09
France
Niveau de la formation :
Débutant
Diplôme requis :
Bac
Éligible au CIF :
Non
Éligible au CPF :
Non
Formation diplômante :
Non
Type de formation :
Inter-Entreprise
Organisation :
Groupe et individuel
Places disponibles :
Non renseigné
Type de public visé :
Tout public

Introduction :

  • Compréhension des différentes méthodes, de leurs pré-requis et de leurs atouts
  • Savoir dialoguer avec un statisticien / data scientist / dataminer pour cadrer et engager un projet d'analyse prédictive

                                                                                                                                                                  

Apports théoriques et méthodologiques 65%
Mise en pratique (à l'aide de codes déjà préparés) sur le logiciel Rstudio. 35%

Objectifs :

Analyser les données n'est pas une activité nouvelle. Cependant, la discipline vit une révolution sous l'effet de l'arrivée à maturité de méthodes à fort pouvoir prédictif et du développement massif des approches d'optimisation "par la donnée" qui démultiplient les usages recommandation automatique, scoring micro-segmenté, maintenance prédictive, ...).
L'objectif est de comprendre comment ces techniques fonctionnent, ce qu'elles apportent et comment en tirer parti.

 

Détails du programme :

Introduction

 

  • Cas d'usages de l'analyse de données
  • Panorama général des méthodes d'analyse de données

 

Cadre général de l'analyse prédictive

 

  • Notion d'apprentissage supervisé/non-supervisé
  • Le principe des bases d'apprentissage et de test
  • Le risque de sur-apprentissage
  • Les indicateurs de mesure de qualité d'un modèle
  • L'impératif de qualité des données

 

Les principales méthodes de prédiction (et pour chacune, son principe, sa mise en oeuvre, ses avantages et inconvénients)

 

  • Régression linéaire
  • Régression logistique
  • Arbres de décision
  • Forêts d'arbres et arbres boostés
  • Classifieur Bayesien Naïf
  • K-plus proches voisins
  • Les algorithmes de recommandation
  • Content-based
  • Collaborative filtering

 

Session de mise en pratique à l'aide du logiciel RStudio

 

  • Chargement d'un jeu de donnée déjà préparé
  • Utilisation de 3 algorithmes prédictifs: régression logistique, forêts aléatoires, SVM
  • Comparaison des résultats

Prérequis :

Culture scientifique.
L'exposition préalable (même ancienne) à un langage de programmation est un plus mais n'est pas nécessaire.

 

Public concerné :

Développeurs et chefs de projets informatiques, Business Analysts, Praticiens du ciblage et
du scoring, Responsables marketing et CRM.

Commentaires

Il n'y a aucun commentaire pour cette formation.