Das Skript beginnt mit einem DATA STEP, der Informationen über Krebs (Ursache, Jahr, Anzahl männlicher und weiblicher Fälle, Anzahl männlicher und weiblicher Todesfälle) aus dem DATALINES-Abschnitt liest. Anschließend berechnet es die Variable 'deaths' (Gesamttodesfälle) und konvertiert 'mcases' und 'mdeaths' in negative Werte für einen potenziellen spezifischen Anzeige- oder Analysezweck. Danach wird eine PROC SORT verwendet, um den Datensatz 'work.cancer' zu sortieren und 'work.cancer_sorted' zu erstellen, wobei die Datensätze nach 'Ano' (Jahr) und 'deaths' (Todesfälle) in absteigender Reihenfolge geordnet werden. Schließlich wird ein PROC FORMAT definiert, um ein benutzerdefiniertes Bildformat namens 'positive' zu erstellen, das Zahlen mit Tausendertrennzeichen formatiert.
Datenanalyse
Type : CREATION_INTERNE
Die Rohdaten werden direkt über den DATALINES-Abschnitt des DATA STEP in das SAS-Skript integriert, was bedeutet, dass sie intern erstellt werden und nicht von externen Dateien oder bereits vorhandenen SAS-Bibliotheken abhängen (mit Ausnahme der standardmäßigen Arbeitsbibliotheken wie WORK).
1 Codeblock
DATA STEP Data
Erklärung : Dieser DATA STEP erstellt den Datensatz 'work.cancer'. Er liest die Variablen 'cause', 'Ano', 'mcases', 'fcases', 'mdeaths', 'fdeaths' aus den Datenzeilen ('datalines'). 'cause' ist eine Zeichenkette von 20 Positionen, 'Ano' wird ebenfalls als Zeichenkette gelesen (obwohl sie Zahlen enthält), und die anderen sind numerisch. Er berechnet eine neue Variable 'deaths', indem er 'mdeaths' und 'fdeaths' addiert. Die Variablen 'mcases' und 'mdeaths' werden mit -1 multipliziert, wodurch sie negativ werden. Dies könnte für eine grafische Darstellung oder eine spezifische Berechnung sein, bei der diese Werte als Abzüge behandelt werden.
Kopiert!
data work.cancer;
infile datalines;
input cause $ 1-20 Ano $ mcases fcases mdeaths fdeaths;
deaths=mdeaths + fdeaths;
mcases= -1 * mcases;
mdeaths= -1 * mdeaths;
datalines;
Câncer de Pulmão 2007 114760 98620 89510 70880
Câncer Colorretal 2007 55290 57050 26000 26180
Câncer de Mama 2007 2030 178480 450 40460
Câncer de Pâncreas 2007 18830 18340 16840 16530
Câncer de Próstata 2007 218890 0 27050 0
Leucemia 2007 24800 19440 12320 9470
Linfoma 2007 38670 32710 10370 9360
Câncer de Fígado 2007 13650 5510 11280 5500
Câncer de Ovário 2007 0 22430 0 15280
Câncer de Esôfago 2007 12130 3430 10900 3040
Câncer de Bexiga 2007 50040 17120 9630 4120
Câncer de Rim 2007 31590 19600 8080 4810
Câncer de Pulmão 1997 98300 79800 94400 66000
Câncer Colorretal 1997 45500 48600 22600 24000
Câncer de Mama 1997 1400 180200 290 43900
Câncer de Pâncreas 1997 13400 14200 13500 14600
Câncer de Próstata 1997 334500 0 41800 0
Leucemia 1997 15900 12400 11770 9540
Linfoma 1997 34200 26900 13220 12060
Câncer de Fígado 1997 9100 4500 7500 4900
Câncer de Ovário 1997 0 26800 0 14200
Câncer de Esôfago 1997 9400 3100 8700 2800
Câncer de Bexiga 1997 39500 15000 7800 3900
Câncer de Rim 1997 17100 11700 7000 4300
;
run;
1
DATA work.cancer;
2
INFILEDATALINES;
3
INPUT cause $ 1-20 Ano $ mcases fcases mdeaths fdeaths;
4
deaths=mdeaths + fdeaths;
5
mcases= -1 * mcases;
6
mdeaths= -1 * mdeaths;
7
DATALINES;
8
Câncer de Pulmão 2007114760986208951070880
9
Câncer Colorretal 200755290570502600026180
10
Câncer de Mama 2007203017848045040460
11
Câncer de Pâncreas 200718830183401684016530
12
Câncer de Próstata 2007218890 0 27050 0
13
Leucemia 20072480019440123209470
14
Linfoma 20073867032710103709360
15
Câncer de Fígado 2007136505510112805500
16
Câncer de Ovário 2007 0 22430 0 15280
17
Câncer de Esôfago 2007121303430109003040
18
Câncer de Bexiga 2007500401712096304120
19
Câncer de Rim 2007315901960080804810
20
Câncer de Pulmão 199798300798009440066000
21
Câncer Colorretal 199745500486002260024000
22
Câncer de Mama 1997140018020029043900
23
Câncer de Pâncreas 199713400142001350014600
24
Câncer de Próstata 1997334500 0 41800 0
25
Leucemia 19971590012400117709540
26
Linfoma 199734200269001322012060
27
Câncer de Fígado 19979100450075004900
28
Câncer de Ovário 1997 0 26800 0 14200
29
Câncer de Esôfago 19979400310087002800
30
Câncer de Bexiga 1997395001500078003900
31
Câncer de Rim 1997171001170070004300
32
;
33
RUN;
2 Codeblock
PROC SORT
Erklärung : Diese PROC SORT nimmt den Datensatz 'work.cancer' als Eingabe und erstellt einen neuen Datensatz namens 'work.cancer_sorted'. Die Sortierung erfolgt in zwei Schritten: zuerst nach 'Ano' (Jahr) in absteigender Reihenfolge und dann nach 'deaths' (Gesamtzahl der Todesfälle) ebenfalls in absteigender Reihenfolge. Dies ermöglicht die Klassifizierung der Daten nach den neuesten Jahren und, für jedes Jahr, nach den Krebsursachen mit der höchsten Anzahl an Todesfällen.
Kopiert!
proc sort data=cancer out=cancer_sorted;
by descending Ano descending deaths;
run;
1
2
PROC SORT
3
DATA=cancer out=cancer_sorted;
4
BY descending Ano descending deaths;
5
RUN;
6
3 Codeblock
PROC FORMAT
Erklärung : Dieses PROC FORMAT definiert ein benutzerdefiniertes Bildformat namens 'positive'. Dieses Format wurde entwickelt, um positive Zahlen (von 0 bis zum maximalen Wert 'high') mit Tausendertrennzeichen anzuzeigen, z.B. '123.456'. Negative Zahlen (von 'low' bis weniger als 0) werden ebenfalls auf die gleiche Weise formatiert, was darauf hindeutet, dass das Format für die Anwendung auf absolute Zahlen oder Anzeigen gedacht ist, die nicht zwischen dem Vorzeichen unterscheiden, sondern eher die Größenordnung mit einer spezifischen Formatierung.
Dieses Material wird von We Are Cas "wie besehen" zur Verfügung gestellt. Es gibt keine ausdrücklichen oder stillschweigenden Garantien hinsichtlich der Marktgängigkeit oder Eignung für einen bestimmten Zweck in Bezug auf die hierin enthaltenen Materialien oder Codes. We Are Cas ist nicht verantwortlich für Fehler in diesem Material, wie es jetzt existiert oder existieren wird, noch bietet We Are Cas technischen Support dafür an.
Zugehörige Dokumentation
Aucune documentation spécifique pour cette catégorie.
SAS und alle anderen Produkt- oder Dienstleistungsnamen von SAS Institute Inc. sind eingetragene Marken oder Marken von SAS Institute Inc. in den USA und anderen Ländern. ® zeigt die Registrierung in den USA an. WeAreCAS ist eine unabhängige Community-Site und nicht mit SAS Institute Inc. verbunden.
Diese Website verwendet technische und analytische Cookies, um Ihre Erfahrung zu verbessern.
Mehr erfahren.