Analyse de Données Catégorielles avec PROC CATMOD

Le script commence par créer un jeu de données 'detergent' à partir de données internes (datalines), représentant les résultats d'un sondage sur la préférence de marque. Ensuite, il utilise PROC CATMOD pour ajuster deux modèles statistiques. Le premier est un modèle saturé incluant toutes les interactions entre les variables explicatives (type d'eau, usage antérieur, température) pour prédire la marque préférée. Le second est un modèle plus simple, ne considérant que les effets principaux de ces mêmes variables, afin de comparer les ajustements.

Analyse des données

Type : CREATION_INTERNE

Les données sont créées directement dans le script via une étape DATA STEP et une instruction DATALINES. Elles représentent un tableau de contingence agrégé où la variable 'Count' sert de poids.

1 Bloc de code

DATA STEP Data

Explication :
Ce bloc DATA STEP lit les données d'enquête directement depuis le code (datalines). Les variables Softness, Brand, Previous, Temperature et Count sont lues. L'option '@@' sur l'instruction INPUT indique que plusieurs observations peuvent se trouver sur la même ligne de données.

Copié !

1	DATA detergent;
2	INPUT Softness $ Brand $ Previous $ Temperature $ Count @@;
3	DATALINES;
4	soft X yes high 19 soft X yes low 57
5	soft X no high 29 soft X no low 63
6	soft M yes high 29 soft M yes low 49
7	soft M no high 27 soft M no low 53
8	med X yes high 23 med X yes low 47
9	med X no high 33 med X no low 66
10	med M yes high 47 med M yes low 55
11	med M no high 23 med M no low 50
12	hard X yes high 24 hard X yes low 37
13	hard X no high 42 hard X no low 68
14	hard M yes high 43 hard M yes low 52
15	hard M no high 30 hard M no low 42
16	;

2 Bloc de code

PROC CATMOD

Explication :
Cette procédure analyse les données catégorielles. 'WEIGHT Count' spécifie que les données sont agrégées. 'RESPONSE 1 0' définit la fonction de réponse. Un premier modèle saturé (modèle complet avec toutes les interactions : Softness|Previous|Temperature) est ajusté. Ensuite, un second modèle plus simple, avec uniquement les effets principaux, est testé pour comparer les résultats. Les options '/freq prob' demandent l'affichage des fréquences et probabilités, et '/clparm noprofile design' demande les intervalles de confiance pour les paramètres ainsi que la matrice de design du modèle.

Copié !

1	title 'Detergent Preference Study';
2	PROC CATMOD DATA=detergent;
3	response 1 0;
4	weight Count;
5	model Brand=Softness\|Previous\|Temperature / freq prob;
6	title2 'Saturated Model';
7	RUN;
8
9	model Brand=Softness Previous Temperature
10	/ clparm noprofile design;
11	title2 'Main-Effects Model';
12	RUN;
13	QUIT;

Ce matériel est fourni "tel quel" par We Are Cas. Il n'y a aucune garantie, expresse ou implicite, quant à la qualité marchande ou à l'adéquation à un usage particulier concernant le matériel ou le code contenu dans les présentes. We Are Cas n'est pas responsable des erreurs dans ce matériel tel qu'il existe maintenant ou existera, et We Are Cas ne fournit pas de support technique pour celui-ci.

Informations de Copyright : S A S S A M P L E L I B R A R Y

Retour à la liste