Publié le :
Statistique CREATION_INTERNE

Analyse de la Fréquence des Couleurs des Yeux et Cheveux par Région

Ce code est également disponible en : Deutsch English Español
En attente de validation
Le script initialise un dataset nommé 'Color' en utilisant une étape DATA et des données directement fournies via des 'datalines'. Les variables 'Region', 'Eyes' (couleur des yeux, caractère), 'Hair' (couleur des cheveux, caractère) et 'Count' (numérique) sont définies. Des libellés descriptifs sont attribués aux variables 'Eyes', 'Hair' et 'Region' pour une meilleure interprétation des sorties. Par la suite, trois blocs PROC FREQ distincts sont exécutés sur le dataset 'Color'. Les deux premiers blocs se concentrent sur l'analyse de la fréquence de la variable 'Region', en appliquant des tests binomial avec des méthodes d'intervalle de confiance spécifiques (Agresti-Coull, Wilson, exact) pour le premier ('level=1') et le deuxième ('level=2') niveau de la variable 'Region', avec un seuil alpha de 0.1. La variable 'Count' est utilisée comme pondération pour ces analyses. Un titre commun est également défini pour les sorties de ces procédures. Le troisième bloc PROC FREQ réalise une analyse de fréquence binomiale standard sur la variable 'Region' sans spécifications avancées. L'objectif global du script est d'examiner la distribution et les proportions des catégories de couleurs des yeux et des cheveux en fonction de la région géographique.
Analyse des données

Type : CREATION_INTERNE


Le dataset 'Color' est créé et peuplé directement dans le script via une étape DATA et l'instruction DATALINES. Toutes les données nécessaires à l'analyse sont fournies de manière interne.

1 Bloc de code
DATA STEP Data
Explication :
Ce bloc DATA STEP crée le dataset 'Color' en lisant les données brutes fournies dans les DATALINES. Il définit quatre variables : 'Region' (numérique), 'Eyes' (chaîne de caractères), 'Hair' (chaîne de caractères) et 'Count' (numérique). Des libellés descriptifs sont attribués aux variables 'Eyes', 'Hair' et 'Region' pour améliorer la lisibilité des rapports de sortie.
Copié !
1DATA Color;
2 INPUT Region Eyes $ Hair $ Count;
3 label Eyes ='Eye Color'
4 Hair ='Hair Color'
5 Region='Geographic Region';
6 DATALINES;
71 blue fair 23 1 blue red 7 1 blue medium 24
81 blue dark 11 1 green fair 19 1 green red 7
91 green medium 18 1 green dark 14 1 brown fair 34
101 brown red 5 1 brown medium 41 1 brown dark 40
111 brown black 3 0 blue fair 46 0 blue red 21
120 blue medium 44 0 blue dark 40 0 blue black 6
130 green fair 50 0 green red 31 0 green medium 37
140 green dark 23 0 brown fair 56 0 brown red 42
150 brown medium 53 0 brown dark 54 0 brown black 13
16;
17RUN;
2 Bloc de code
PROC FREQ
Explication :
Ce bloc exécute la PROC FREQ sur le dataset 'Color'. Il génère des tableaux de fréquences pour la variable 'Region'. L'option `binomial(ac wilson exact level=1) alpha=.1` demande le calcul d'intervalles de confiance binomial (Agresti-Coull, Wilson, exact) pour le premier niveau de 'Region', avec un niveau de signification de 0.1. La variable 'Count' est utilisée comme variable de pondération des observations. Un titre est également spécifié pour la sortie.
Copié !
1PROC FREQ DATA=Color order=freq;
2 tables region / binomial(ac wilson exact level=1) alpha=.1 ;
3 exact binomial;
4 weight Count;
5 title 'Hair and Eye Color of European Children';
6RUN;
3 Bloc de code
PROC FREQ
Explication :
Similaire au bloc précédent, cette PROC FREQ analyse également la variable 'Region' du dataset 'Color'. La principale différence est l'option `level=2` dans `binomial(ac wilson exact level=2)`, qui indique que les calculs d'intervalles de confiance binomial sont effectués pour le deuxième niveau de la variable 'Region', toujours avec un alpha de 0.1 et 'Count' comme poids. Un titre est aussi attribué.
Copié !
1PROC FREQ DATA=Color order=freq;
2 tables region / binomial(ac wilson exact level=2) alpha=.1 ;
3 exact binomial;
4 weight Count;
5 title 'Hair and Eye Color of European Children';
6RUN;
4 Bloc de code
PROC FREQ
Explication :
Ce bloc exécute une PROC FREQ sur le dataset 'Color' pour la variable 'Region'. L'option `binomial` seule demande des statistiques binomiales standard pour chaque niveau de 'Region', y compris les proportions, les fréquences et les intervalles de confiance par défaut, sans spécifications avancées des méthodes de calcul ou du niveau. L'ordre des fréquences est maintenu.
Copié !
1 
2PROC FREQ
3DATA=Color order=freq;
4tables region / binomial;
5RUN;
6 
Ce matériel est fourni "tel quel" par We Are Cas. Il n'y a aucune garantie, expresse ou implicite, quant à la qualité marchande ou à l'adéquation à un usage particulier concernant le matériel ou le code contenu dans les présentes. We Are Cas n'est pas responsable des erreurs dans ce matériel tel qu'il existe maintenant ou existera, et We Are Cas ne fournit pas de support technique pour celui-ci.