Publié le :

Exemples d'introduction à SAS Studio

Ce code est également disponible en : Deutsch English Español
En attente de validation
Le script démontre l'utilisation de PROC PRINT pour afficher des données (complètes ou sélectionnées) du jeu de données SASHELP.CARS. Il utilise également PROC SQL pour créer une nouvelle table (WORK.query) en filtrant et ordonnant les données de SASHELP.CARS. PROC DATASETS est employé pour extraire les métadonnées de cette nouvelle table dans WORK.details, qui est ensuite affichée par PROC PRINT. Des statistiques descriptives sont calculées sur la variable 'Weight' du jeu de données SASHELP.CARS à l'aide de PROC MEANS. Enfin, PROC SGPLOT est utilisé pour générer un graphique à barres visualisant la population par région à partir de SASHELP.DEMOGRAPHICS, avec des options ODS Graphics pour la sortie.
Analyse des données

Type : SASHELP


Les données source primaires proviennent des bibliothèques SASHELP, notamment SASHELP.CARS et SASHELP.DEMOGRAPHICS. Des tables de travail intermédiaires (WORK.query, WORK.details) sont créées et utilisées au cours du script à partir de ces données source.

1 Bloc de code
PROC PRINT
Explication :
Affiche l'intégralité du jeu de données SASHELP.CARS dans le log ou la sortie par défaut, fournissant un aperçu rapide des données brutes.
Copié !
1PROC PRINT DATA=sashelp.cars;
2RUN;
2 Bloc de code
PROC PRINT
Explication :
Affiche une sélection spécifique de variables (Make, Model, Type, etc.) du jeu de données SASHELP.CARS. La clause 'by Make' organise la sortie par constructeur, ce qui permet de regrouper les observations pour une meilleure lisibilité.
Copié !
1PROC PRINT DATA=sashelp.cars;
2 BY Make;
3 var Make Model Type DriveTrain EngineSize Cylinders Horsepower MPG_City MPG_Highway;
4RUN;
3 Bloc de code
PROC SQL Data
Explication :
Crée une nouvelle table SAS temporaire nommée 'WORK.query' en utilisant une requête SQL. Cette requête sélectionne plusieurs colonnes du jeu de données SASHELP.CARS, filtre les voitures ayant une puissance (Horsepower) supérieure ou égale à 400, et trie les résultats par puissance décroissante pour identifier les véhicules les plus puissants.
Copié !
1PROC SQL;
2CREATE TABLE WORK.query AS
3SELECT Make , Model , 'Type'n , Origin , DriveTrain , EngineSize , Cylinders , Horsepower , MPG_City , MPG_Highway , Weight , Wheelbase FROM SASHELP.CARS WHERE Horsepower >=400 ORDER BY Horsepower DESCENDING;
4RUN;
5QUIT;
4 Bloc de code
PROC DATASETS Data
Explication :
Utilise PROC DATASETS pour générer un rapport de contenu détaillé (métadonnées) du jeu de données 'WORK.query' précédemment créé. Le résultat est sauvegardé dans une nouvelle table SAS, 'WORK.details', plutôt que d'être affiché directement dans le log. Les options NOLIST et NODETAILS suppriment les sorties de la procédure pour se concentrer uniquement sur la création de la table de métadonnées.
Copié !
1 
2PROC DATASETS NOLIST NODETAILS;
3CONTENTS
4DATA=WORK.query OUT=WORK.details;
5RUN;
6 
5 Bloc de code
PROC PRINT
Explication :
Affiche le contenu de la table 'WORK.details', qui contient les métadonnées (noms de variables, types, longueurs, formats, etc.) du jeu de données 'WORK.query'. Cela permet d'examiner la structure de la table intermédiaire.
Copié !
1PROC PRINT DATA=WORK.details;
2RUN;
6 Bloc de code
PROC MEANS
Explication :
Calcule des statistiques descriptives (moyenne, écart-type, minimum, maximum, nombre d'observations) pour la variable 'Weight' du jeu de données SASHELP.CARS. L'option 'chartype' est utilisée pour le type de données de la variable d'analyse, et 'vardef=df' spécifie que le diviseur pour l'écart-type et la variance doit être basé sur les degrés de liberté.
Copié !
1 
2PROC MEANS
3DATA=SASHELP.CARS chartype mean std min max n vardef=df;
4var Weight;
5RUN;
6 
7 Bloc de code
PROC SGPLOT
Explication :
Génère un graphique à barres visualisant la 'Population by Region' (Population par Région) à partir du jeu de données SASHELP.DEMOGRAPHICS. Les options ODS Graphics sont d'abord réinitialisées et configurées. Le graphique à barres utilise la variable 'region' pour les catégories et 'pop' (population) comme variable de réponse, affichant la moyenne de la population par région. Des attributs de remplissage et de style spécifiques sont appliqués pour une meilleure présentation. Enfin, les options ODS Graphics et le titre sont réinitialisés après la procédure pour éviter qu'ils n'affectent les sorties suivantes.
Copié !
1ods graphics / reset imagemap;
2 
3/*--SGPLOT proc statement--*/
4PROC SGPLOT DATA=SASHELP.DEMOGRAPHICS;
5 /*--TITLE and FOOTNOTE--*/
6 title 'Population by Region';
7 
8 /*--Bar chart settings--*/
9 vbar region / response=pop fillattrs=(color=CX0a66f1) stat=Mean dataskin=Crisp
10 name='Bar';
11 
12 /*--Response Axis--*/
13 yaxis grid;
14RUN;
15 
16ods graphics / reset;
17title;
Ce matériel est fourni "tel quel" par We Are Cas. Il n'y a aucune garantie, expresse ou implicite, quant à la qualité marchande ou à l'adéquation à un usage particulier concernant le matériel ou le code contenu dans les présentes. We Are Cas n'est pas responsable des erreurs dans ce matériel tel qu'il existe maintenant ou existera, et We Are Cas ne fournit pas de support technique pour celui-ci.
Informations de Copyright : Getting Started with SAS Studio; 10/28/2015; http://support.sas.com/training/tutorial/studio/get-started.html