Publié le :
Statistique CREATION_INTERNE

Analyse de Données Catégorielles avec PROC CATMOD

Ce code est également disponible en : Deutsch English Español Français
En attente de validation
Le script commence par créer un jeu de données 'detergent' à partir de données internes (datalines), représentant les résultats d'un sondage sur la préférence de marque. Ensuite, il utilise PROC CATMOD pour ajuster deux modèles statistiques. Le premier est un modèle saturé incluant toutes les interactions entre les variables explicatives (type d'eau, usage antérieur, température) pour prédire la marque préférée. Le second est un modèle plus simple, ne considérant que les effets principaux de ces mêmes variables, afin de comparer les ajustements.
Analyse des données

Type : CREATION_INTERNE


Les données sont créées directement dans le script via une étape DATA STEP et une instruction DATALINES. Elles représentent un tableau de contingence agrégé où la variable 'Count' sert de poids.

1 Bloc de code
DATA STEP Data
Explication :
Ce bloc DATA STEP lit les données d'enquête directement depuis le code (datalines). Les variables Softness, Brand, Previous, Temperature et Count sont lues. L'option '@@' sur l'instruction INPUT indique que plusieurs observations peuvent se trouver sur la même ligne de données.
Copié !
1DATA detergent;
2 INPUT Softness $ Brand $ Previous $ Temperature $ Count @@;
3 DATALINES;
4soft X yes high 19 soft X yes low 57
5soft X no high 29 soft X no low 63
6soft M yes high 29 soft M yes low 49
7soft M no high 27 soft M no low 53
8med X yes high 23 med X yes low 47
9med X no high 33 med X no low 66
10med M yes high 47 med M yes low 55
11med M no high 23 med M no low 50
12hard X yes high 24 hard X yes low 37
13hard X no high 42 hard X no low 68
14hard M yes high 43 hard M yes low 52
15hard M no high 30 hard M no low 42
16;
2 Bloc de code
PROC CATMOD
Explication :
Cette procédure analyse les données catégorielles. 'WEIGHT Count' spécifie que les données sont agrégées. 'RESPONSE 1 0' définit la fonction de réponse. Un premier modèle saturé (modèle complet avec toutes les interactions : Softness|Previous|Temperature) est ajusté. Ensuite, un second modèle plus simple, avec uniquement les effets principaux, est testé pour comparer les résultats. Les options '/freq prob' demandent l'affichage des fréquences et probabilités, et '/clparm noprofile design' demande les intervalles de confiance pour les paramètres ainsi que la matrice de design du modèle.
Copié !
1title 'Detergent Preference Study';
2PROC CATMOD DATA=detergent;
3 response 1 0;
4 weight Count;
5 model Brand=Softness|Previous|Temperature / freq prob;
6 title2 'Saturated Model';
7RUN;
8 
9 model Brand=Softness Previous Temperature
10 / clparm noprofile design;
11 title2 'Main-Effects Model';
12RUN;
13QUIT;
Ce matériel est fourni "tel quel" par We Are Cas. Il n'y a aucune garantie, expresse ou implicite, quant à la qualité marchande ou à l'adéquation à un usage particulier concernant le matériel ou le code contenu dans les présentes. We Are Cas n'est pas responsable des erreurs dans ce matériel tel qu'il existe maintenant ou existera, et We Are Cas ne fournit pas de support technique pour celui-ci.
Informations de Copyright : S A S S A M P L E L I B R A R Y