Analyse des dépenses de crème glacée par PROC SURVEYMEANS

Niveau de difficulté
Débutant
Publié le :
Le script crée deux datasets en interne : `IceCream` et `StudentTotals`. Le dataset `IceCream` contient des informations sur les notes (Grade), les dépenses (Spending), les probabilités de sélection (Prob) et les poids (Weight) calculés. `StudentTotals` fournit les totaux de population pour chaque grade. Ensuite, la procédure `SURVEYMEANS` est utilisée pour calculer des statistiques descriptives (moyenne, somme) sur les dépenses de crème glacée, en tenant compte de la stratification par `Grade` et de la pondération par `Weight`. L'option `nomcar` est utilisée pour inclure les observations avec des valeurs manquantes dans le calcul du nombre d'observations non manquantes. Le paramètre `total` spécifie le dataset `StudentTotals` pour le calcul des pourcentages.
Analyse des données

Type : CREATION_INTERNE


Les datasets `IceCream` et `StudentTotals` sont créés directement dans le script à l'aide de blocs DATA avec `datalines`. Aucune source de données externe n'est utilisée.

1 Bloc de code
DATA STEP Data
Explication :
Ce bloc DATA Step crée le dataset `IceCream`. Il lit les variables `Grade` (catégorie) et `Spending` (dépenses) à partir des `datalines`. Ensuite, il calcule la probabilité de sélection (`Prob`) en fonction de la `Grade` et le poids (`Weight`) comme l'inverse de la probabilité, préparant les données pour l'analyse d'enquête. Certaines valeurs de `Spending` sont manquantes (indiquées par '.').
Copié !
1DATA IceCream;
2 INPUT Grade Spending;
3 IF Grade=7 THEN Prob=20/1824;
4 IF Grade=8 THEN Prob=9/1025;
5 IF Grade=9 THEN Prob=11/1151;
6 Weight=1/Prob;
7 DATALINES;
87 7 7 7 8 . 9 10 7 . 7 10 7 3 8 20 8 19 7 2
97 . 9 15 8 16 7 6 7 6 7 6 9 15 8 17 8 14 9 .
109 8 9 7 7 3 7 12 7 4 9 14 8 18 9 9 7 2 7 1
117 4 7 11 9 8 8 . 8 13 7 . 9 . 9 11 7 2 7 9
12;
2 Bloc de code
DATA STEP Data
Explication :
Ce bloc DATA Step crée le dataset `StudentTotals`. Il contient les totaux de population (`_total_`) pour chaque `Grade` (7, 8, 9), qui seront utilisés par `PROC SURVEYMEANS` pour ajuster les calculs statistiques et estimer les proportions de population.
Copié !
1DATA StudentTotals;
2 INPUT Grade _total_;
3 DATALINES;
47 1824
58 1025
69 1151
7;
3 Bloc de code
PROC SURVEYMEANS
Explication :
Cette procédure `SURVEYMEANS` analyse les données du dataset `IceCream`. L'option `total=StudentTotals` indique le dataset contenant les totaux de population pour les calculs. `nomcar` inclut les valeurs manquantes dans le décompte des observations. `mean` et `sum` demandent les statistiques de moyenne et de somme. `strata Grade` définit la variable `Grade` comme variable de stratification, et `weight Weight` indique la variable de pondération à utiliser pour les estimations.
Copié !
1title 'Analysis of Ice Cream Spending';
2PROC SURVEYMEANS DATA=IceCream total=StudentTotals nomcar mean sum;
3 strata Grade;
4 var Spending;
5 weight Weight;
6RUN;
Ce matériel est fourni "tel quel" par We Are Cas. Il n'y a aucune garantie, expresse ou implicite, quant à la qualité marchande ou à l'adéquation à un usage particulier concernant le matériel ou le code contenu dans les présentes. We Are Cas n'est pas responsable des erreurs dans ce matériel tel qu'il existe maintenant ou existera, et We Are Cas ne fournit pas de support technique pour celui-ci.
Informations de Copyright : S A S S A M P L E L I B R A R Y