regression

logistic

Description

L'action `logistic` de l'ensemble d'actions `regression` est utilisée pour ajuster des modèles de régression logistique. Elle prend en charge les modèles pour les réponses binaires, binomiales et multinomiales (ordonnées ou non ordonnées). Cette action effectue l'analyse dans SAS Viya et fournit des fonctionnalités pour la sélection de modèles, l'évaluation de l'ajustement du modèle et la notation.

regression.logistic / alpha=double, association=TRUE | FALSE, class={class-statement-1, ...}, fitData=TRUE | FALSE, freq="variable-name", model={logisticModel}, output={logisticOutputStatement}, partByFrac={partByFracStatement}, partByVar={partByVarStatement}, selection={selectionStatement}, table={castable};
Paramètres
ParamètreDescription
alphaSpécifie le niveau de significativité pour la construction de tous les intervalles de confiance.
associationLorsque défini sur True, crée la table d'association.
classNomme les variables de classification à utiliser comme variables explicatives dans l'analyse.
fitDataLorsque défini sur True, spécifie que les données à scorer ont également été utilisées pour ajuster le modèle.
freqNomme la variable numérique qui contient la fréquence d'occurrence de chaque observation.
modelNomme la variable dépendante, les effets explicatifs et les options du modèle.
outputCrée une table sur le serveur qui contient des statistiques par observation, calculées après l'ajustement du modèle.
partByFracSpécifie les fractions des données à utiliser pour la validation et le test.
partByVarNomme la variable et ses valeurs utilisées pour partitionner les données en rôles d'entraînement, de validation et de test.
selectionSpécifie la méthode et les options pour effectuer la sélection de modèle.
tableSpécifie la table de données d'entrée.
Préparation des Données Voir la fiche de ce code dataprep
Création de la table d'exemple

Ce bloc de code n'est pas explicitement fourni dans la documentation mais est reconstitué pour permettre la testabilité des exemples. Il crée une table CAS nommée 'mycas.getstarted' qui est utilisée dans les exemples suivants pour ajuster un modèle de régression logistique.

Copié !
1DATA mycas.getstarted;
2 SET sashelp.class;
3 IF sex='F' THEN female=1; ELSE female=0;
4 IF age > 13 THEN group=1; ELSE group=2;
5RUN;

Exemples

Cet exemple montre comment ajuster un modèle de régression logistique de base. Il utilise la table 'mycas.getstarted' et modélise la variable binaire 'female' en utilisant 'height' et 'weight' comme variables explicatives.

Code SAS® / CAS Code en attente de validation par la communauté
Copié !
1PROC CAS;
2 regression.logistic
3 TABLE={name='getstarted'},
4 class={'group'},
5 model={depvar='female', effects={'height', 'weight', 'group'}}$
6RUN;
Résultat :
Le résultat attendu est un ensemble de tables statistiques décrivant le modèle ajusté. Cela inclut les informations sur le modèle, les statistiques d'ajustement, les estimations de paramètres pour les variables 'height', 'weight', et 'group', et les tests d'effets globaux. Les estimations des paramètres indiqueront la force et la direction de la relation de chaque variable avec la probabilité d'être de sexe féminin.

Cet exemple ajuste un modèle de régression logistique en utilisant une sélection de variables descendante ('backward'). Il spécifie également plusieurs options de sortie pour obtenir des informations détaillées, comme les intervalles de confiance pour les estimations de paramètres (clb=true), une table de classification (ctable=true) et les probabilités prédites dans une table de sortie CAS nommée 'mycas.out'.

Code SAS® / CAS Code en attente de validation par la communauté
Copié !
1PROC CAS;
2 regression.logistic
3 TABLE={name='getstarted'},
4 class={'group'},
5 model={depvar='female', effects={'height', 'weight', 'group'}},
6 selection={method='backward'},
7 clb=true,
8 ctable=true,
9 OUTPUT={casout={name='out', replace=true}, pred='p_female'};
10RUN;
Résultat :
Les résultats incluront le résumé du processus de sélection de variables, montrant les étapes de suppression des variables non significatives. La table 'ParameterEstimates' affichera les estimations finales avec leurs intervalles de confiance. Une table de classification sera générée pour évaluer la performance du modèle. Enfin, une nouvelle table CAS 'mycas.out' sera créée, contenant les observations originales plus une colonne 'p_female' avec les probabilités prédites pour chaque observation.

Cet exemple illustre comment ajuster un modèle pour une variable de réponse avec plusieurs catégories. Il modélise la variable 'group' (qui a deux niveaux) en utilisant 'height' et 'weight'. La distribution est explicitement définie comme 'MULTINOMIAL' et le type de lien comme 'GLOGIT' (logit généralisé).

Code SAS® / CAS Code en attente de validation par la communauté
Copié !
1PROC CAS;
2 regression.logistic
3 TABLE={name='getstarted'},
4 model={depvar='group', effects={'height', 'weight'}, dist='MULTINOMIAL', link='GLOGIT'};
5RUN;
Résultat :
Le résultat affichera des estimations de paramètres pour chaque niveau de la variable de réponse 'group' (sauf le niveau de référence). Les tables montreront les statistiques d'ajustement pour le modèle multinomial, l'analyse des effets de type 3, et les estimations de paramètres pour chaque logit, permettant d'évaluer l'effet de 'height' et 'weight' sur la probabilité de chaque catégorie de 'group'.

FAQ

Quel est l'objectif de l'action 'logistic' dans SAS Viya?
Quels types de modèles de régression logistique peuvent être ajustés avec cette action?
Comment spécifier la variable dépendante dans le modèle?
Est-il possible d'inclure des variables catégorielles dans le modèle?
Quelles sont les méthodes de sélection de modèle disponibles dans l'action 'logistic'?
Comment obtenir les odds ratios pour les variables du modèle?
L'action 'logistic' peut-elle gérer les données partitionnées pour la validation de modèle?
Comment puis-je enregistrer le modèle ajusté pour une utilisation ultérieure?