Publié le :
Statistique CREATION_INTERNE

SVREX9 - Exemple 9 pour PROC SURVEYREG

En attente de validation
Le script crée un jeu de données interne 'IceCream' contenant des informations sur les dépenses, le revenu et la composition familiale. Il calcule ensuite les poids de sondage basés sur la probabilité de sélection par strate (Grade). La procédure SURVEYREG ajuste un modèle linéaire reliant les dépenses au revenu et au nombre d'enfants, tout en gérant la stratification et la pondération. La méthode Jackknife est spécifiée pour l'estimation de la variance, et les poids de réplication générés sont stockés dans une table de sortie 'JKWeights'.
Analyse des données

Type : CREATION_INTERNE


Les données sont générées directement dans le script via une étape DATA avec DATALINES (table IceCream).

1 Bloc de code
DATA STEP Data
Explication :
Création du jeu de données 'IceCream' à partir de données brutes incluses dans le code. L'instruction '@@' est utilisée dans l'INPUT pour lire plusieurs observations par ligne de données.
Copié !
1DATA IceCream;
2 INPUT Grade Spending Income Kids @@;
3 DATALINES;
47 7 39 2 7 7 38 1 8 12 47 1
59 10 47 4 7 1 34 4 7 10 43 2
67 3 44 4 8 20 60 3 8 19 57 4
77 2 35 2 7 2 36 1 9 15 51 1
88 16 53 1 7 6 37 4 7 6 41 2
97 6 39 2 9 15 50 4 8 17 57 3
108 14 46 2 9 8 41 2 9 8 41 1
119 7 47 3 7 3 39 3 7 12 50 2
127 4 43 4 9 14 46 3 8 18 58 4
139 9 44 3 7 2 37 1 7 1 37 2
147 4 44 2 7 11 42 2 9 8 41 2
158 10 42 2 8 13 46 1 7 2 40 3
169 6 45 1 9 11 45 4 7 2 36 1
177 9 46 1
18;
2 Bloc de code
DATA STEP Data
Explication :
Transformation des données : calcul de la probabilité de sélection 'Prob' en fonction de la strate 'Grade', et dérivation du poids de sondage 'Weight' (inverse de la probabilité).
Copié !
1DATA IceCream;
2 SET IceCream;
3 IF Grade=7 THEN Prob=20/1824;
4 IF Grade=8 THEN Prob=9/1025;
5 IF Grade=9 THEN Prob=11/1151;
6 Weight=1/Prob;
7RUN;
3 Bloc de code
PROC SURVEYREG
Explication :
Exécution de la procédure SURVEYREG pour modéliser les dépenses ('Spending'). 'Income' est une variable continue et 'Kids' une variable catégorielle (CLASS). L'option VARMETHOD=JACKKNIFE demande une estimation de variance par Jackknife, et OUTWEIGHTS sauvegarde les poids de réplication.
Copié !
1title1 'Ice Cream Spending Analysis';
2title2 'Use the Jackknife Method to Estimate the Variance';
3PROC SURVEYREG DATA=IceCream
4 varmethod=JACKKNIFE(outweights=JKWeights);
5 strata Grade;
6 class Kids;
7 model Spending = Income Kids / solution;
8 weight Weight;
9RUN;
4 Bloc de code
PROC PRINT
Explication :
Affichage des 6 premières observations de la table 'JKWeights' contenant les poids générés par la méthode Jackknife.
Copié !
1title 'The Jackknife Weights for the First 6 Obs';
2PROC PRINT
3DATA=JKWeights (obs=6);
4RUN;
5 
Ce matériel est fourni "tel quel" par We Are Cas. Il n'y a aucune garantie, expresse ou implicite, quant à la qualité marchande ou à l'adéquation à un usage particulier concernant le matériel ou le code contenu dans les présentes. We Are Cas n'est pas responsable des erreurs dans ce matériel tel qu'il existe maintenant ou existera, et We Are Cas ne fournit pas de support technique pour celui-ci.
Informations de Copyright : SAS SAMPLE LIBRARY


Banner
Le Conseil de l'Expert
Expert
Stéphanie
Spécialiste Machine Learning et IA.
« L'utilisation de PROC SURVEYREG est indispensable dès lors que vos données ne proviennent pas d'un tirage au sort pur et simple. Ignorer les poids ou la stratification conduirait à des p-values artificiellement basses et à des décisions erronées. La sortie JKWeights est d'ailleurs souvent requise par les organismes officiels pour valider la robustesse des modèles publiés. »