Publié le :
Statistique CREATION_INTERNE

Analyse descriptive I - Mesures de tendance centrale

Ce code est également disponible en : Deutsch English Español
En attente de validation
Le script commence par créer un jeu de données 'height_and_weight_20' en utilisant des 'datalines' internes. Il contient des variables pour l'ID, le sexe, la taille (ht_in) et le poids (wgt_lbs). Ensuite, il utilise 'PROC MEANS' pour calculer des statistiques descriptives (nombre d'observations, moyenne, médiane, mode, écart-type, minimum, maximum) pour la taille et le poids, avec une précision de deux décimales. Des commentaires dans le code source original signalent des 'drapeaux rouges' concernant des données manquantes pour le poids et une valeur impossible (-69) pour la taille.
Analyse des données

Type : CREATION_INTERNE


Les données sont créées directement dans le script via un DATA STEP avec des `datalines`.

1 Bloc de code
DATA STEP Data
Explication :
Ce bloc DATA STEP crée le jeu de données 'height_and_weight_20' en lisant les données brutes fournies dans les `datalines`. Il définit quatre variables : `id` (caractère), `sex` (caractère), `ht_in` (numérique pour la taille en pouces) et `wgt_lbs` (numérique pour le poids en livres). Des valeurs manquantes (points) sont présentes pour le sexe et le poids, et une valeur manifestement erronée (-69) est incluse pour la taille, ce qui est noté comme un 'drapeau rouge' dans les commentaires originaux.
Copié !
1DATA height_and_weight_20;
2 INPUT id $ sex $ ht_in wgt_lbs;
3 DATALINES;
4 001 Male 71 190
5 002 Male 69 175
6 003 Female 64 130
7 004 Female 65 154
8 005 . 73 173
9 006 Male 69 182
10 007 Female 68 .
11 008 . 73 185
12 009 Female 71 157
13 010 Male 66 155
14 011 Male 71 213
15 012 Female 69 151
16 013 Female 66 147
17 014 Female 68 196
18 015 Male 75 212
19 016 Female -69 190
20 017 Female 66 194
21 018 Female 65 176
22 019 Female 65 176
23 020 Female 65 102
24RUN;
2 Bloc de code
PROC MEANS
Explication :
Cette procédure 'PROC MEANS' est utilisée pour calculer des statistiques descriptives pour les variables `ht_in` et `wgt_lbs` du jeu de données `height_and_weight_20`. Les statistiques demandées sont le nombre d'observations (n), la moyenne (mean), la médiane (median), le mode (mode), l'écart-type (std), le minimum (min) et le maximum (max). L'option `maxdec=2` limite l'affichage des décimales à deux chiffres.
Copié !
1 
2PROC MEANS
3DATA = height_and_weight_20 n mean median mode std min max maxdec=2;
4var ht_in wgt_lbs;
5RUN;
6 
Ce matériel est fourni "tel quel" par We Are Cas. Il n'y a aucune garantie, expresse ou implicite, quant à la qualité marchande ou à l'adéquation à un usage particulier concernant le matériel ou le code contenu dans les présentes. We Are Cas n'est pas responsable des erreurs dans ce matériel tel qu'il existe maintenant ou existera, et We Are Cas ne fournit pas de support technique pour celui-ci.