Veröffentlicht am :
Statistik CREATION_INTERNE

Statistische und grafische Analyse von biomedizinischen und epidemiologischen Daten

Dieser Code ist auch verfügbar auf: English Español Français
Wartet auf Validierung
Das Skript beginnt mit der Erstellung des 'Athelate'-Datensatzes über Datalines, wobei eine neue Variable (ABP - mittlerer arterieller Druck) berechnet wird. Der Inhalt dieses Datensatzes wird anschließend angezeigt. Eine Kopie, 'Practice.Athelate', wird für weitere Analysen erstellt. Deskriptive Statistiken (Mittelwerte, Standardabweichungen) werden für die numerischen Variablen von 'Athelate' über PROC MEANS berechnet und angezeigt. Mehrere univariate Analysen werden für die Variable 'Age' von 'Athelate' und 'Practice.Athelate' durchgeführt, einschließlich Konfidenzintervallen und Normalitätstests. Die Datenvisualisierung wird anschließend mit PROC SGPLOT für die Erstellung von vertikalen und horizontalen Boxplots der Variablen SBP und PROC PLOT für ein Streudiagramm zwischen SBP und DBP, alles für den Datensatz 'Practice.Athelate', behandelt. Schließlich wird ein zweiter Datensatz 'disease' über Datalines erstellt, um Kreuzfrequenzen zwischen 'Severity' und 'Herd_size' mit PROC FREQ zu analysieren, einschließlich Chi-Quadrat-Tests.
Datenanalyse

Type : CREATION_INTERNE


Alle Hauptdatensätze ('Athelate' und 'disease') werden direkt im SAS-Skript über DATALINES-Anweisungen erstellt, die Rohdaten in den Code integrieren. Die Datensätze 'Practice.Athelate' und 'desp_athelate' sind Ableitungen dieser internen Daten. Es werden keine externen Datenquellen (CSV-Dateien, Datenbanken usw.) direkt von diesem Skript gelesen.

1 Codeblock
DATA STEP Data
Erklärung :
Erstellt den SAS-Datensatz 'Athelate' durch Lesen der bereitgestellten Daten über die DATALINES-Anweisung. Es definiert die Variablen Id, Age, Race (Zeichen), SBP, DBP, HR (numerisch) und berechnet eine neue Variable 'ABP' (mittlerer arterieller Druck) aus SBP und DBP.
Kopiert!
1DATA Athelate;
2INPUT Id Age Race $ SBP DBP HR;
3ABP=1/3*SBP+2/3*DBP;
4DATALINES;
54101 18 W 130 80 60
64102 18 W 140 90 70
74103 19 B 120 70 64
84104 17 B 150 90 76
94105 18 B 124 86 72
104106 19 W 145 94 70
114107 23 B 125 78 68
124108 21 W 140 85 74
134109 18 W 150 82 65
144110 20 W 145 95 75
15RUN;
2 Codeblock
PROC PRINT
Erklärung :
Zeigt den Inhalt des Datensatzes 'Athelate' an. Die Option 'noobs' unterdrückt die Anzeige der standardmäßigen numerischen Beobachtungsspalte.
Kopiert!
1PROC PRINT DATA=Athelate noobs;
3 Codeblock
DATA STEP Data
Erklärung :
Erstellt einen neuen Datensatz namens 'Practice.Athelate' in der Bibliothek 'Practice' (falls definiert, ansonsten in WORK) durch Kopieren aller Beobachtungen und Variablen aus dem Datensatz 'Athelate'.
Kopiert!
1DATA Practice.Athelate;
2SET Athelate;
4 Codeblock
PROC MEANS Data
Erklärung :
Berechnet deskriptive Statistiken (Mittelwert und Standardabweichung) für die Variablen 'Age', 'SBP', 'DBP', 'HR' des Datensatzes 'Athelate'. Die Ergebnisse der Mittelwerte und Standardabweichungen für 'Age' und 'SBP' werden in einem neuen Datensatz 'desp_athelate' gespeichert.
Kopiert!
1 
2PROC MEANS
3DATA=Athelate;
4var Age SBP DBP HR;
5OUTPUT out=desp_athelate mean=av_Age av_SBP std=sd_Age sd_SBP;
6 
5 Codeblock
PROC PRINT
Erklärung :
Zeigt den Inhalt des Datensatzes 'desp_athelate' an, der die zuvor berechneten deskriptiven Statistiken enthält.
Kopiert!
1PROC PRINT DATA=desp_athelate;
6 Codeblock
PROC UNIVARIATE
Erklärung :
Führt eine univariate Analyse für die Variable 'Age' des Datensatzes 'athelate' durch. Es berechnet ein einfaches Konfidenzintervall (type=upper, alpha=0.10) und testet die Nullhypothese, dass der Mittelwert von 'Age' gleich 120 ist (mu0=120).
Kopiert!
1 
2PROC UNIVARIATE
3DATA=athelate cibasic(type=upper alpha=0.10) mu0=120;
4var Age;
5 
7 Codeblock
PROC UNIVARIATE
Erklärung :
Führt eine univariate Analyse für alle numerischen Variablen des Datensatzes 'athelate' durch und liefert deskriptive Statistiken und ein standardmäßiges einfaches Konfidenzintervall für den Mittelwert.
Kopiert!
1PROC UNIVARIATE DATA=athelate cibasic;
8 Codeblock
PROC UNIVARIATE
Erklärung :
Führt eine univariate Analyse für die Variable 'Age' des Datensatzes 'Practice.Athelate' durch. Die Option 'plots' generiert Standardgrafiken und 'normaltest' führt Normalitätstests durch. Die Anweisung 'histogram' erstellt ein Histogramm der Variable 'Age'.
Kopiert!
1 
2PROC UNIVARIATE
3DATA=Practice.Athelate plots normaltest;
4var Age;
5histogram;
6 
9 Codeblock
PROC SGPLOT
Erklärung :
Generiert ein vertikales Boxplot ('vbox') der Variablen 'SBP' aus dem Datensatz 'practice.athelate'. Das Gitter wird auf der Y-Achse aktiviert und ein Titel für das Diagramm festgelegt.
Kopiert!
1PROC SGPLOT DATA=practice.athelate;
2vbox SBP;
3yaxis grid;
4title "Boxplot of SBP Variable From Athelate data";
10 Codeblock
PROC SGPLOT
Erklärung :
Generiert ein horizontales Boxplot ('hbox') der Variablen 'SBP' aus dem Datensatz 'Practice.Athelate' mit einem spezifischen Titel.
Kopiert!
1 
2PROC SGPLOT
3DATA=Practice.Athelate;
4hbox SBP;
5title "Horizontal Boxplot of SBP Variable From Athelate
6data";
7 
11 Codeblock
PROC PLOT
Erklärung :
Erstellt ein Streudiagramm ('scatterplot') der Variablen 'SBP' und 'DBP' aus dem Datensatz 'Practice.Athelate', wobei 'SBP' auf der Y-Achse und 'DBP' auf der X-Achse liegt, und einen deskriptiven Titel.
Kopiert!
1 
2PROC PLOT
3DATA=Practice.Athelate;
4plot SBP*DBP;
5title "Scatter plot of SBP and DBP Variable";
6 
12 Codeblock
DATA STEP Data
Erklärung :
Erstellt den SAS-Datensatz 'disease' durch Lesen der bereitgestellten Daten über die DATALINES-Anweisung. Es definiert die Variablen 'Severity' (Zeichen), 'Herd_size' (Zeichen) und 'Count' (numerisch).
Kopiert!
1DATA disease;
2INPUT Severity $ Herd_size $ Count ;
3DATALINES;
4a1 b1 11 a1 b2 88 a1 b3 136
5a2 b1 18 a2 b2 4 a2 b3 19
6a3 b1 9 a3 b2 5 a3 b3 9
7RUN;
13 Codeblock
PROC PRINT
Erklärung :
Zeigt den Inhalt des Datensatzes 'disease' an.
Kopiert!
1PROC PRINT DATA=disease;
14 Codeblock
PROC FREQ
Erklärung :
Führt eine Frequenzanalyse für die Variablen 'Severity' und 'Herd_size' des Datensatzes 'disease' durch. Die Anweisung 'weight count' gibt an, dass die Variable 'count' die Häufigkeit der Beobachtungen darstellt. Der zweite 'tables'-Block fordert zusätzliche Statistiken an, einschließlich des Chi-Quadrat-Tests ('chisq'), und unterdrückt die Anzeige von Spalten-, Zeilen- und Gesamtprozentsätzen ('nocol', 'nopercent', 'norow') sowie von Assoziationsmaßen.
Kopiert!
1PROC FREQ;
2weight count;
3tables Severity*Herd_size;
4tables Severity*Herd_size / chisq nocol nopercent norow measures;
Dieses Material wird von We Are Cas "wie besehen" zur Verfügung gestellt. Es gibt keine ausdrücklichen oder stillschweigenden Garantien hinsichtlich der Marktgängigkeit oder Eignung für einen bestimmten Zweck in Bezug auf die hierin enthaltenen Materialien oder Codes. We Are Cas ist nicht verantwortlich für Fehler in diesem Material, wie es jetzt existiert oder existieren wird, noch bietet We Are Cas technischen Support dafür an.