Scénario Cas Limite : Prédiction de Réadmission Hospitalière avec Données Manquantes
Scénario de test & Cas d'usage
Contexte Métier
Un hôpital cherche à prédire la probabilité de réadmission d'un patient dans les 30 jours suivant sa sortie. Les dossiers des patients sont souvent incomplets, avec des valeurs manquantes pour certains tests médicaux. Ce scénario teste la robustesse de l'action face à des données imparfaites.
À propos du Set : bart
Modèles d'arbres de régression additive bayésienne.
Création d'une table de données patient avec des valeurs manquantes intentionnelles dans les prédicteurs 'indice_bmi' et 'duree_sejour', ainsi qu'une variable de fréquence.
Copié !
data casuser.HospitalReadmission_fr;\n call streaminit(111);\n do patient_id = 1 to 2000;\n age_patient = 40 + floor(rand('Uniform') * 50);\n duree_sejour = 2 + floor(rand('Uniform') * 14);\n indice_bmi = 18 + rand('Uniform') * 22;\n nombre_procedures = 1 + floor(rand('Uniform') * 5);\n poids_observation = 1 + floor(rand('Uniform') * 3); /* Variable de fréquence */\n\n /* Introduction de valeurs manquantes */\n if rand('Uniform') < 0.15 then call missing(duree_sejour);\n if rand('Uniform') < 0.20 then call missing(indice_bmi);\n\n z = -2.0 + (age_patient / 30) + (coalesce(duree_sejour, 5) / 7) - (coalesce(indice_bmi, 25) / 15) + (nombre_procedures / 3);\n prob_readmission = cdf('Normal', z);\n if rand('Uniform') < prob_readmission then readmis_30j = 1;\n else readmis_30j = 0;\n\n output;\n end;\nrun;
Première exécution de bartProbit en utilisant la stratégie par défaut pour les valeurs manquantes ('SEPARATE') et en utilisant la variable de fréquence 'poids_observation'.
Les deux exécutions de l'action se terminent sans erreur. La table de résultats 'ObsInfo_Separate' montre que toutes les observations ont été utilisées ('Observations Used'), car les valeurs manquantes ont été traitées comme une catégorie distincte. En revanche, la table 'ObsInfo_None' montre un nombre inférieur d'observations utilisées, correspondant au nombre de lignes sans aucune valeur manquante. Cela valide le bon fonctionnement des options de gestion des données manquantes et de la pondération par fréquence.
SAS et tous les autres noms de produits ou de services de SAS Institute Inc. sont des marques déposées ou des marques de commerce de SAS Institute Inc. aux États-Unis et dans d'autres pays. ® indique un enregistrement aux États-Unis. WeAreCAS est un site communautaire indépendant et n'est pas affilié à SAS Institute Inc.
Ce site utilise des cookies techniques et analytiques pour améliorer votre expérience.
En savoir plus.