Publicado el :
Estadística CREATION_INTERNE

Análisis Estadístico y Gráfico de Datos Biomédicos y Epidemiológicos

Este código también está disponible en: Deutsch English Français
En espera de validación
El script comienza con la creación del conjunto de datos 'Athelate' a través de datalines, donde se calcula una nueva variable (ABP - Presión Arterial Media). Luego se muestra el contenido de este conjunto de datos. Se crea una copia, 'Practice.Athelate', para otros análisis. Se calculan y muestran estadísticas descriptivas (medias, desviaciones estándar) para las variables numéricas de 'Athelate' a través de PROC MEANS. Se realizan varios análisis univariados sobre la variable 'Age' de 'Athelate' y 'Practice.Athelate', incluyendo intervalos de confianza y pruebas de normalidad. La visualización de datos se aborda a continuación con PROC SGPLOT para generar diagramas de caja verticales y horizontales de la variable SBP, y PROC PLOT para un diagrama de dispersión entre SBP y DBP, todo para el conjunto de datos 'Practice.Athelate'. Finalmente, se crea un segundo conjunto de datos 'disease' a través de datalines para analizar las frecuencias cruzadas entre 'Severity' y 'Herd_size' usando PROC FREQ, incluyendo pruebas de Chi-cuadrado.
Análisis de datos

Type : CREATION_INTERNE


Todos los conjuntos de datos principales ('Athelate' y 'disease') se crean directamente en el script SAS a través de instrucciones DATALINES, integrando los datos brutos en el código. Los conjuntos de datos 'Practice.Athelate' y 'desp_athelate' son derivaciones de estos datos internos. Ninguna fuente de datos externa (archivos CSV, bases de datos, etc.) es leída directamente por este script.

1 Bloque de código
DATA STEP Data
Explicación :
Crea el conjunto de datos SAS 'Athelate' leyendo los datos proporcionados a través de la instrucción DATALINES. Define las variables Id, Age, Race (carácter), SBP, DBP, HR (numéricas), y calcula una nueva variable 'ABP' (Presión Arterial Media) a partir de SBP y DBP.
¡Copiado!
1DATA Athelate;
2INPUT Id Age Race $ SBP DBP HR;
3ABP=1/3*SBP+2/3*DBP;
4DATALINES;
54101 18 W 130 80 60
64102 18 W 140 90 70
74103 19 B 120 70 64
84104 17 B 150 90 76
94105 18 B 124 86 72
104106 19 W 145 94 70
114107 23 B 125 78 68
124108 21 W 140 85 74
134109 18 W 150 82 65
144110 20 W 145 95 75
15RUN;
2 Bloque de código
PROC PRINT
Explicación :
Muestra el contenido del conjunto de datos 'Athelate'. La opción 'noobs' suprime la visualización de la columna de observación numérica por defecto.
¡Copiado!
1PROC PRINT DATA=Athelate noobs;
3 Bloque de código
DATA STEP Data
Explicación :
Crea un nuevo conjunto de datos llamado 'Practice.Athelate' en la librería 'Practice' (si está definida, de lo contrario en WORK) copiando todas las observaciones y variables del conjunto de datos 'Athelate'.
¡Copiado!
1DATA Practice.Athelate;
2SET Athelate;
4 Bloque de código
PROC MEANS Data
Explicación :
Calcula estadísticas descriptivas (media y desviación estándar) para las variables 'Age', 'SBP', 'DBP', 'HR' del conjunto de datos 'Athelate'. Los resultados de las medias y desviaciones estándar para 'Age' y 'SBP' se guardan en un nuevo conjunto de datos 'desp_athelate'.
¡Copiado!
1 
2PROC MEANS
3DATA=Athelate;
4var Age SBP DBP HR;
5OUTPUT out=desp_athelate mean=av_Age av_SBP std=sd_Age sd_SBP;
6 
5 Bloque de código
PROC PRINT
Explicación :
Muestra el contenido del conjunto de datos 'desp_athelate', que contiene las estadísticas descriptivas calculadas previamente.
¡Copiado!
1PROC PRINT DATA=desp_athelate;
6 Bloque de código
PROC UNIVARIATE
Explicación :
Realiza un análisis univariado sobre la variable 'Age' del conjunto de datos 'athelate'. Calcula un intervalo de confianza básico (type=upper, alpha=0.10) y prueba la hipótesis nula de que la media de 'Age' es igual a 120 (mu0=120).
¡Copiado!
1 
2PROC UNIVARIATE
3DATA=athelate cibasic(type=upper alpha=0.10) mu0=120;
4var Age;
5 
7 Bloque de código
PROC UNIVARIATE
Explicación :
Realiza un análisis univariado sobre todas las variables numéricas del conjunto de datos 'athelate', proporcionando estadísticas descriptivas y un intervalo de confianza básico por defecto para la media.
¡Copiado!
1PROC UNIVARIATE DATA=athelate cibasic;
8 Bloque de código
PROC UNIVARIATE
Explicación :
Realiza un análisis univariado sobre la variable 'Age' del conjunto de datos 'Practice.Athelate'. La opción 'plots' genera gráficos por defecto y 'normaltest' realiza pruebas de normalidad. La instrucción 'histogram' crea un histograma de la variable 'Age'.
¡Copiado!
1 
2PROC UNIVARIATE
3DATA=Practice.Athelate plots normaltest;
4var Age;
5histogram;
6 
9 Bloque de código
PROC SGPLOT
Explicación :
Genera un diagrama de caja vertical ('vbox') de la variable 'SBP' a partir del conjunto de datos 'practice.athelate'. La cuadrícula se activa en el eje Y y se define un título para el gráfico.
¡Copiado!
1PROC SGPLOT DATA=practice.athelate;
2vbox SBP;
3yaxis grid;
4title "Boxplot of SBP Variable From Athelate data";
10 Bloque de código
PROC SGPLOT
Explicación :
Genera un diagrama de caja horizontal ('hbox') de la variable 'SBP' a partir del conjunto de datos 'Practice.Athelate', con un título específico.
¡Copiado!
1 
2PROC SGPLOT
3DATA=Practice.Athelate;
4hbox SBP;
5title "Horizontal Boxplot of SBP Variable From Athelate
6data";
7 
11 Bloque de código
PROC PLOT
Explicación :
Crea un diagrama de dispersión ('scatterplot') de las variables 'SBP' y 'DBP' a partir del conjunto de datos 'Practice.Athelate', con 'SBP' en el eje Y y 'DBP' en el eje X, y un título descriptivo.
¡Copiado!
1 
2PROC PLOT
3DATA=Practice.Athelate;
4plot SBP*DBP;
5title "Scatter plot of SBP and DBP Variable";
6 
12 Bloque de código
DATA STEP Data
Explicación :
Crea el conjunto de datos SAS 'disease' leyendo los datos proporcionados a través de la instrucción DATALINES. Define las variables 'Severity' (carácter), 'Herd_size' (carácter) y 'Count' (numérica).
¡Copiado!
1DATA disease;
2INPUT Severity $ Herd_size $ Count ;
3DATALINES;
4a1 b1 11 a1 b2 88 a1 b3 136
5a2 b1 18 a2 b2 4 a2 b3 19
6a3 b1 9 a3 b2 5 a3 b3 9
7RUN;
13 Bloque de código
PROC PRINT
Explicación :
Muestra el contenido del conjunto de datos 'disease'.
¡Copiado!
1PROC PRINT DATA=disease;
14 Bloque de código
PROC FREQ
Explicación :
Realiza un análisis de frecuencias para las variables 'Severity' y 'Herd_size' del conjunto de datos 'disease'. La instrucción 'weight count' indica que la variable 'count' representa la frecuencia de las observaciones. El segundo bloque 'tables' solicita estadísticas adicionales, incluyendo la prueba de Chi-cuadrado ('chisq'), y suprime la visualización de los porcentajes de columna, fila y globales ('nocol', 'nopercent', 'norow'), así como las medidas de asociación.
¡Copiado!
1PROC FREQ;
2weight count;
3tables Severity*Herd_size;
4tables Severity*Herd_size / chisq nocol nopercent norow measures;
Este material se proporciona "tal cual" por We Are Cas. No hay garantías, expresas o implícitas, en cuanto a la comerciabilidad o idoneidad para un propósito particular con respecto a los materiales o el código contenidos en este documento. We Are Cas no es responsable de los errores en este material tal como existe ahora o existirá, ni We Are Cas proporciona soporte técnico para el mismo.