IA RH · People analytics · machine learning

Prédire le turnover avec Python et l’IA RH

Cas concret de machine learning appliqué aux ressources humaines : analyse des données RH, modèles prédictifs et passage à l’action opérationnelle.

Cas pratique : utilisation du machine learning pour anticiper les départs salariés

Contexte : une PME face à une hausse du turnover

L’entreprise fictive TechFab Solutions, spécialisée dans l’industrie et la digitalisation industrielle, compte 180 salariés.

En deux ans, le turnover est passé de 9 % à 18 %, entraînant des pertes de compétences techniques et une augmentation des coûts de recrutement.

Le DRH pose une question centrale :

“Peut-on prédire quels collaborateurs risquent de quitter l’entreprise dans les prochains mois ?”

Objectif du projet IA RH

Le projet vise à construire un modèle de prédiction capable de :

Étape 1 : hypothèses métier RH

Avant toute modélisation, les hypothèses suivantes sont formulées :

Étape 2 : données RH utilisées

Variable Description
AgeÂge du salarié
AncienneteAncienneté dans l’entreprise
SalaireRémunération
HeuresSupHeures supplémentaires
DistanceDistance domicile-travail
SatisfactionScore d’enquête interne
FormationHeures de formation
PromotionPromotion récente ou non
ManagerScoreQualité du management
DepartCible : départ (0/1)

Étape 3 : problème de machine learning

Il s’agit d’un problème de classification binaire : prédire si un salarié va partir ou non.

Deux approches sont testées :

Dans un contexte RH, l’explicabilité du modèle reste essentielle pour la prise de décision.

Étape 4 : préparation des données

Étape 5 : analyse exploratoire RH

L’analyse des données révèle des tendances fortes :

Étape 6 : modèle de prédiction

La régression logistique permet d’obtenir une probabilité de départ pour chaque salarié.

Poids des facteurs RH

Facteur Impact
Satisfaction faibleTrès fort
Heures supplémentairesFort
Salaire faibleFort
Absence de promotionMoyen
Formation faibleModéré

Étape 7 : amélioration avec Random Forest

Random Forest permet de capturer des interactions complexes entre variables RH.

Exemple : un salaire faible seul n’est pas toujours suffisant pour expliquer un départ, mais combiné à une surcharge de travail et un management faible, le risque augmente fortement.

Résultats des modèles

Modèle Précision
Régression logistique74 %
Random Forest86 %

Traduction opérationnelle RH

Risque Action RH
> 80 %Entretien manager immédiat
60–80 %Revue salariale
40–60 %Suivi RH renforcé
< 40 %Surveillance normale

Exemple de salarié à risque

Probabilité de départ : 87 %

Exemple Python (machine learning RH)


from sklearn.ensemble import RandomForestClassifier
from sklearn.model_selection import train_test_split

X = data[["Salaire","Satisfaction","HeuresSup","Anciennete"]]
y = data["Depart"]

X_train, X_test, y_train, y_test = train_test_split(X, y)

model = RandomForestClassifier()
model.fit(X_train, y_train)

prediction = model.predict(X_test)

Dashboard RH prédictif

Outils : Python, SQL, Power BI, Tableau.

Résultats après 8 mois

KPI Avant Après
Turnover18 %11 %
Profils clés perdusÉlevéRéduit
Coût recrutementÉlevéRéduit
Satisfaction5.8/107.1/10

Limites et vigilance