Le script initialise un dataset nommé 'Color' en utilisant une étape DATA et des données directement fournies via des 'datalines'. Les variables 'Region', 'Eyes' (couleur des yeux, caractère), 'Hair' (couleur des cheveux, caractère) et 'Count' (numérique) sont définies. Des libellés descriptifs sont attribués aux variables 'Eyes', 'Hair' et 'Region' pour une meilleure interprétation des sorties. Par la suite, trois blocs PROC FREQ distincts sont exécutés sur le dataset 'Color'. Les deux premiers blocs se concentrent sur l'analyse de la fréquence de la variable 'Region', en appliquant des tests binomial avec des méthodes d'intervalle de confiance spécifiques (Agresti-Coull, Wilson, exact) pour le premier ('level=1') et le deuxième ('level=2') niveau de la variable 'Region', avec un seuil alpha de 0.1. La variable 'Count' est utilisée comme pondération pour ces analyses. Un titre commun est également défini pour les sorties de ces procédures. Le troisième bloc PROC FREQ réalise une analyse de fréquence binomiale standard sur la variable 'Region' sans spécifications avancées. L'objectif global du script est d'examiner la distribution et les proportions des catégories de couleurs des yeux et des cheveux en fonction de la région géographique.
Analyse des données
Type : CREATION_INTERNE
Le dataset 'Color' est créé et peuplé directement dans le script via une étape DATA et l'instruction DATALINES. Toutes les données nécessaires à l'analyse sont fournies de manière interne.
1 Bloc de code
DATA STEP Data
Explication : Ce bloc DATA STEP crée le dataset 'Color' en lisant les données brutes fournies dans les DATALINES. Il définit quatre variables : 'Region' (numérique), 'Eyes' (chaîne de caractères), 'Hair' (chaîne de caractères) et 'Count' (numérique). Des libellés descriptifs sont attribués aux variables 'Eyes', 'Hair' et 'Region' pour améliorer la lisibilité des rapports de sortie.
Copié !
data Color;
input Region Eyes $ Hair $ Count;
label Eyes ='Eye Color'
Hair ='Hair Color'
Region='Geographic Region';
datalines;
1 blue fair 23 1 blue red 7 1 blue medium 24
1 blue dark 11 1 green fair 19 1 green red 7
1 green medium 18 1 green dark 14 1 brown fair 34
1 brown red 5 1 brown medium 41 1 brown dark 40
1 brown black 3 0 blue fair 46 0 blue red 21
0 blue medium 44 0 blue dark 40 0 blue black 6
0 green fair 50 0 green red 31 0 green medium 37
0 green dark 23 0 brown fair 56 0 brown red 42
0 brown medium 53 0 brown dark 54 0 brown black 13
;
run;
1
DATA Color;
2
INPUT Region Eyes $ Hair $ Count;
3
label Eyes ='Eye Color'
4
Hair ='Hair Color'
5
Region='Geographic Region';
6
DATALINES;
7
1 blue fair 231 blue red 71 blue medium 24
8
1 blue dark 111 green fair 191 green red 7
9
1 green medium 181 green dark 141 brown fair 34
10
1 brown red 51 brown medium 411 brown dark 40
11
1 brown black 3 0 blue fair 46 0 blue red 21
12
0 blue medium 44 0 blue dark 40 0 blue black 6
13
0 green fair 50 0 green red 31 0 green medium 37
14
0 green dark 23 0 brown fair 56 0 brown red 42
15
0 brown medium 53 0 brown dark 54 0 brown black 13
16
;
17
RUN;
2 Bloc de code
PROC FREQ
Explication : Ce bloc exécute la PROC FREQ sur le dataset 'Color'. Il génère des tableaux de fréquences pour la variable 'Region'. L'option `binomial(ac wilson exact level=1) alpha=.1` demande le calcul d'intervalles de confiance binomial (Agresti-Coull, Wilson, exact) pour le premier niveau de 'Region', avec un niveau de signification de 0.1. La variable 'Count' est utilisée comme variable de pondération des observations. Un titre est également spécifié pour la sortie.
Copié !
proc freq data=Color order=freq;
tables region / binomial(ac wilson exact level=1) alpha=.1 ;
exact binomial;
weight Count;
title 'Hair and Eye Color of European Children';
run;
1
PROC FREQDATA=Color order=freq;
2
tables region / binomial(ac wilson exact level=1) alpha=.1 ;
3
exact binomial;
4
weight Count;
5
title 'Hair and Eye Color of European Children';
6
RUN;
3 Bloc de code
PROC FREQ
Explication : Similaire au bloc précédent, cette PROC FREQ analyse également la variable 'Region' du dataset 'Color'. La principale différence est l'option `level=2` dans `binomial(ac wilson exact level=2)`, qui indique que les calculs d'intervalles de confiance binomial sont effectués pour le deuxième niveau de la variable 'Region', toujours avec un alpha de 0.1 et 'Count' comme poids. Un titre est aussi attribué.
Copié !
proc freq data=Color order=freq;
tables region / binomial(ac wilson exact level=2) alpha=.1 ;
exact binomial;
weight Count;
title 'Hair and Eye Color of European Children';
run;
1
PROC FREQDATA=Color order=freq;
2
tables region / binomial(ac wilson exact level=2) alpha=.1 ;
3
exact binomial;
4
weight Count;
5
title 'Hair and Eye Color of European Children';
6
RUN;
4 Bloc de code
PROC FREQ
Explication : Ce bloc exécute une PROC FREQ sur le dataset 'Color' pour la variable 'Region'. L'option `binomial` seule demande des statistiques binomiales standard pour chaque niveau de 'Region', y compris les proportions, les fréquences et les intervalles de confiance par défaut, sans spécifications avancées des méthodes de calcul ou du niveau. L'ordre des fréquences est maintenu.
Copié !
proc freq data=Color order=freq;
tables region / binomial;
run;
1
2
PROC FREQ
3
DATA=Color order=freq;
4
tables region / binomial;
5
RUN;
6
Ce matériel est fourni "tel quel" par We Are Cas. Il n'y a aucune garantie, expresse ou implicite, quant à la qualité marchande ou à l'adéquation à un usage particulier concernant le matériel ou le code contenu dans les présentes. We Are Cas n'est pas responsable des erreurs dans ce matériel tel qu'il existe maintenant ou existera, et We Are Cas ne fournit pas de support technique pour celui-ci.
SAS et tous les autres noms de produits ou de services de SAS Institute Inc. sont des marques déposées ou des marques de commerce de SAS Institute Inc. aux États-Unis et dans d'autres pays. ® indique un enregistrement aux États-Unis. WeAreCAS est un site communautaire indépendant et n'est pas affilié à SAS Institute Inc.
Ce site utilise des cookies techniques et analytiques pour améliorer votre expérience.
En savoir plus.