Publié le :

Test du Chi-carré sur données d'enquête

Ce code est également disponible en : Deutsch English Español
Le programme initialise une bibliothèque externe 'class' pour accéder au jeu de données 'classurv15' situé sur un chemin de fichier Windows. Il configure ensuite SAS© pour rechercher les formats dans cette bibliothèque. Le script procède à une première table de fréquences croisées entre 'persdoc' et 'genhealth'. Ensuite, il définit des formats personnalisés ('fpersdoc' et 'fgenhealth') pour regrouper les catégories de ces variables. Ces formats sont appliqués dans les tables de fréquences suivantes pour créer une table 2x2. Enfin, il exécute un test du Chi-carré pour évaluer l'indépendance des deux variables, en affichant les effectifs observés, les effectifs attendus et les statistiques du Chi-carré.
Analyse des données

Type : EXTERNE


Les données proviennent du jeu de données 'classurv15', accessible via la bibliothèque 'class' qui est mappée sur un chemin de fichier système externe spécifié par une instruction LIBNAME.

1 Bloc de code
Configuration
Explication :
Ce bloc configure l'environnement SAS en créant la libname 'class' qui pointe vers un dossier contenant les données. L'option 'fmtsearch' indique à SAS où rechercher les formats personnalisés, notamment dans la bibliothèque 'class'.
Copié !
1LIBNAME class "Z:\Dropbox\UNTHSC Admin and Teaching\Courses\5147-Fall 2014\BACH_EPID 5313\
2DATA\Day one survey\5147\";
3options fmtsearch = (class);
4 
2 Bloc de code
PROC FREQ
Explication :
Cette procédure génère une table de fréquences croisées initiale pour les variables 'persdoc' et 'genhealth' à partir du jeu de données 'class.classurv15', sans appliquer de formats spécifiques, pour afficher les distributions originales.
Copié !
1/*
2Revisit the persdoc by genhealth frequency table.
3*/
4PROC FREQ DATA=class.classurv15;
5 tables persdoc*genhealth;
6RUN;
3 Bloc de code
PROC FORMAT
Explication :
Ce bloc utilise 'PROC FORMAT' pour définir deux formats personnalisés : 'fpersdoc' et 'fgenhealth'. Ces formats regroupent les catégories originales des variables 'persdoc' et 'genhealth' en des groupes plus larges, simplifiant ainsi l'analyse et la création d'une table 2x2.
Copié !
1/*
2Using formats to collapse categories of persdoc and genhealth in order to create a two-by-two
3table
4*/
5PROC FORMAT;
6 value fpersdoc 0 = "No Personal Doctor"
7 1-2 = "At Least One Personal Doctor";
8 value fgenhealth 1-2 = "Excellent, Very Good, or Good"
9 3-high = "Fair or Poor";
10RUN;
4 Bloc de code
PROC FREQ
Explication :
Cette procédure 'PROC FREQ' génère une table de fréquences croisées pour 'persdoc' et 'genhealth', mais cette fois, elle applique les formats personnalisés 'fpersdoc' et 'fgenhealth'. Cela permet de visualiser la distribution des variables avec les catégories regroupées.
Copié !
1PROC FREQ DATA=class.classurv15;
2 tables persdoc*genhealth;
3 FORMAT persdoc fpersdoc. genhealth fgenhealth.;
4RUN;
5 Bloc de code
PROC FREQ
Explication :
Ce dernier bloc 'PROC FREQ' effectue un test du Chi-carré sur la table de fréquences croisées formatée. L'option 'chisq' demande le calcul de la statistique du Chi-carré, 'expected' affiche les effectifs attendus sous l'hypothèse d'indépendance, et 'nocol' supprime l'affichage des pourcentages de colonnes pour une sortie plus ciblée sur le test.
Copié !
1/*
2Chi-square test for the difference between distributions
3*/
4PROC FREQ DATA=class.classurv15;
5 tables persdoc*genhealth / chisq expected nocol;
6 FORMAT persdoc fpersdoc. genhealth fgenhealth.;
7RUN;
Ce matériel est fourni "tel quel" par We Are Cas. Il n'y a aucune garantie, expresse ou implicite, quant à la qualité marchande ou à l'adéquation à un usage particulier concernant le matériel ou le code contenu dans les présentes. We Are Cas n'est pas responsable des erreurs dans ce matériel tel qu'il existe maintenant ou existera, et We Are Cas ne fournit pas de support technique pour celui-ci.