Veröffentlicht am :

Einführungsbeispiele für SAS Studio

Dieser Code ist auch verfügbar auf: English Español Français
Wartet auf Validierung
Das Skript demonstriert die Verwendung von PROC PRINT, um Daten (vollständig oder ausgewählt) aus dem SASHELP.CARS-Datensatz anzuzeigen. Es verwendet auch PROC SQL, um eine neue Tabelle (WORK.query) zu erstellen, indem Daten aus SASHELP.CARS gefiltert und geordnet werden. PROC DATASETS wird verwendet, um die Metadaten dieser neuen Tabelle in WORK.details zu extrahieren, die anschließend von PROC PRINT angezeigt wird. Deskriptive Statistiken werden für die Variable 'Weight' des SASHELP.CARS-Datensatzes mit PROC MEANS berechnet. Schließlich wird PROC SGPLOT verwendet, um ein Balkendiagramm zu generieren, das die Bevölkerung nach Region aus SASHELP.DEMOGRAPHICS visualisiert, mit ODS Graphics-Optionen für die Ausgabe.
Datenanalyse

Type : SASHELP


Die primären Quelldaten stammen aus den SASHELP-Bibliotheken, insbesondere SASHELP.CARS und SASHELP.DEMOGRAPHICS. Temporäre Arbeitstabellen (WORK.query, WORK.details) werden während des Skripts aus diesen Quelldaten erstellt und verwendet.

1 Codeblock
PROC PRINT
Erklärung :
Zeigt den gesamten SASHELP.CARS-Datensatz im Log oder der Standardausgabe an und bietet einen schnellen Überblick über die Rohdaten.
Kopiert!
1PROC PRINT DATA=sashelp.cars;
2RUN;
2 Codeblock
PROC PRINT
Erklärung :
Zeigt eine spezifische Auswahl von Variablen (Make, Model, Type usw.) aus dem SASHELP.CARS-Datensatz an. Die Klausel 'by Make' organisiert die Ausgabe nach Hersteller, was eine Gruppierung der Beobachtungen für bessere Lesbarkeit ermöglicht.
Kopiert!
1PROC PRINT DATA=sashelp.cars;
2 BY Make;
3 var Make Model Type DriveTrain EngineSize Cylinders Horsepower MPG_City MPG_Highway;
4RUN;
3 Codeblock
PROC SQL Data
Erklärung :
Erstellt eine neue temporäre SAS-Tabelle namens 'WORK.query' mithilfe einer SQL-Abfrage. Diese Abfrage wählt mehrere Spalten aus dem SASHELP.CARS-Datensatz aus, filtert Autos mit einer Leistung (Horsepower) von 400 oder mehr und sortiert die Ergebnisse nach absteigender Leistung, um die leistungsstärksten Fahrzeuge zu identifizieren.
Kopiert!
1PROC SQL;
2CREATE TABLE WORK.query AS
3SELECT Make , Model , 'Type'n , Origin , DriveTrain , EngineSize , Cylinders , Horsepower , MPG_City , MPG_Highway , Weight , Wheelbase FROM SASHELP.CARS WHERE Horsepower >=400 ORDER BY Horsepower DESCENDING;
4RUN;
5QUIT;
4 Codeblock
PROC DATASETS Data
Erklärung :
Verwendet PROC DATASETS, um einen detaillierten Inhaltsbericht (Metadaten) des zuvor erstellten Datensatzes 'WORK.query' zu generieren. Das Ergebnis wird in einer neuen SAS-Tabelle, 'WORK.details', gespeichert, anstatt direkt im Log angezeigt zu werden. Die Optionen NOLIST und NODETAILS unterdrücken die Ausgaben der Prozedur, um sich ausschließlich auf die Erstellung der Metadatentabelle zu konzentrieren.
Kopiert!
1 
2PROC DATASETS NOLIST NODETAILS;
3CONTENTS
4DATA=WORK.query OUT=WORK.details;
5RUN;
6 
5 Codeblock
PROC PRINT
Erklärung :
Zeigt den Inhalt der Tabelle 'WORK.details' an, die die Metadaten (Variablennamen, Typen, Längen, Formate usw.) des Datensatzes 'WORK.query' enthält. Dies ermöglicht die Untersuchung der Struktur der Zwischentabelle.
Kopiert!
1PROC PRINT DATA=WORK.details;
2RUN;
6 Codeblock
PROC MEANS
Erklärung :
Berechnet deskriptive Statistiken (Mittelwert, Standardabweichung, Minimum, Maximum, Anzahl der Beobachtungen) für die Variable 'Weight' des SASHELP.CARS-Datensatzes. Die Option 'chartype' wird für den Datentyp der Analysevariablen verwendet, und 'vardef=df' gibt an, dass der Divisor für die Standardabweichung und die Varianz auf den Freiheitsgraden basieren soll.
Kopiert!
1 
2PROC MEANS
3DATA=SASHELP.CARS chartype mean std min max n vardef=df;
4var Weight;
5RUN;
6 
7 Codeblock
PROC SGPLOT
Erklärung :
Generiert ein Balkendiagramm, das die 'Population by Region' (Bevölkerung nach Region) aus dem SASHELP.DEMOGRAPHICS-Datensatz visualisiert. Die ODS Graphics-Optionen werden zuerst zurückgesetzt und konfiguriert. Das Balkendiagramm verwendet die Variable 'region' für die Kategorien und 'pop' (Bevölkerung) als Antwortvariable, wobei der Mittelwert der Bevölkerung nach Region angezeigt wird. Spezifische Füll- und Stilattribute werden für eine bessere Darstellung angewendet. Schließlich werden die ODS Graphics-Optionen und der Titel nach der Prozedur zurückgesetzt, um zu verhindern, dass sie nachfolgende Ausgaben beeinflussen.
Kopiert!
1ods graphics / reset imagemap;
2 
3/*--SGPLOT proc statement--*/
4PROC SGPLOT DATA=SASHELP.DEMOGRAPHICS;
5 /*--TITLE and FOOTNOTE--*/
6 title 'Population by Region';
7 
8 /*--Bar chart settings--*/
9 vbar region / response=pop fillattrs=(color=CX0a66f1) stat=Mean dataskin=Crisp
10 name='Bar';
11 
12 /*--Response Axis--*/
13 yaxis grid;
14RUN;
15 
16ods graphics / reset;
17title;
Dieses Material wird von We Are Cas "wie besehen" zur Verfügung gestellt. Es gibt keine ausdrücklichen oder stillschweigenden Garantien hinsichtlich der Marktgängigkeit oder Eignung für einen bestimmten Zweck in Bezug auf die hierin enthaltenen Materialien oder Codes. We Are Cas ist nicht verantwortlich für Fehler in diesem Material, wie es jetzt existiert oder existieren wird, noch bietet We Are Cas technischen Support dafür an.
Urheberrechtsinformationen : Getting Started with SAS Studio; 10/28/2015; http://support.sas.com/training/tutorial/studio/get-started.html