Análisis no paramétrico de los ingresos de los candidatos

Este código también está disponible en: Deutsch English Français
Nivel de dificultad
Principiante
Publicado el :
El script comienza eliminando cualquier versión existente de la tabla 'repincome' en la biblioteca WORK. Luego define un FILENAME para apuntar a un archivo CSV externo que contiene los datos de ingresos. El procedimiento PROC IMPORT se utiliza para cargar este archivo CSV en un dataset SAS© temporal llamado WORK.repincome. Después de la importación, PROC CONTENTS muestra los metadatos del dataset. Se generan dos gráficos con PROC SGPLOT: un diagrama de caja de los ingresos por candidato y un diagrama de dispersión de los ingresos frente a los candidatos. A continuación, el script crea tres datasets filtrados (TrumpCarson, TrumpCruz, CruzCarson) excluyendo un candidato específico en cada caso. Para cada par de candidatos, se realiza una prueba no paramétrica de Wilcoxon (PROC NPAR1WAY) para comparar las medianas de ingresos, con un nivel de significancia alfa de 0.05. Los títulos de las pruebas se personalizan para cada comparación.
Análisis de datos

Type : EXTERNE


Los datos provienen de un archivo CSV externo ('/home/gsturrock0/STAT1/RepIncome..csv') importado a través de PROC IMPORT. El script no contiene datos internos (datalines/cards) ni utiliza datos SASHELP.

1 Bloque de código
PROC IMPORT Data
Explicación :
Este bloque inicializa el entorno e importa los datos. La macro %web_drop_table elimina una tabla SAS existente. FILENAME asocia un nombre lógico (REFFILE) con la ruta del archivo CSV externo. PROC IMPORT lee este archivo CSV y lo convierte en un dataset SAS llamado WORK.repincome, usando la primera línea como nombres de variables (GETNAMES=YES). PROC CONTENTS muestra los metadatos del dataset importado. Finalmente, %web_open_table se utiliza para visualizar la tabla en SAS Studio.
¡Copiado!
1%web_drop_table(WORK.repincome);
2 
3FILENAME REFFILE '/home/myFolder/STAT1/RepIncome..csv';
4 
5PROC IMPORT DATAFILE=REFFILE
6 DBMS=CSV
7 OUT=WORK.repincome;
8 GETNAMES=YES;
9RUN;
10 
11PROC CONTENTS DATA=WORK.repincome; RUN;
12 
13%web_open_table(WORK.repincome);
2 Bloque de código
PROC SGPLOT
Explicación :
Este bloque está dedicado a la visualización exploratoria de los datos. Las dos llamadas a PROC SGPLOT crean gráficos: el primero genera un diagrama de caja (vbox) de los ingresos ('income') para cada candidato ('category=candidate'), y el segundo produce un diagrama de dispersión (scatter) de los ingresos ('y=income') en función del candidato ('x=candidate'). Estos gráficos ayudan a comprender la distribución y la relación entre los ingresos y los candidatos.
¡Copiado!
1PROC SGPLOT DATA=work.repincome;
2vbox income / category=candidate;
3RUN;
4 
5PROC SGPLOT DATA=work.repincome;
6scatter y=income x=candidate;
7RUN;
3 Bloque de código
DATA STEP / PROC NPAR1WAY Data
Explicación :
Este bloque se centra en la comparación entre 'Trump' y 'Carson'. Un paso DATA crea un nuevo dataset 'TrumpCarson' filtrando 'work.repincome' para incluir solo las observaciones donde el 'código' del candidato no es '3' (excluyendo así al tercer candidato). Luego, PROC NPAR1WAY ejecuta una prueba de Wilcoxon no paramétrica sobre la variable 'income', usando 'candidate' como variable de clasificación, con un nivel de significancia (alfa) de 0.05. Se solicita la prueba exacta de Wilcoxon, con la estimación de la diferencia de Hodges-Lehmann (HL). Se agrega un título específico 'Trump Carson' al informe de salida.
¡Copiado!
1*Trump Carson comparison;
2DATA TrumpCarson; SET work.repincome;
3 IF code NE 3;
4RUN;
5 
6PROC NPAR1WAY DATA=TrumpCarson wilcoxon alpha=.05;
7var income;
8class candidate;
9exact wilcoxon HL;
10title 'Trump Carson';
11RUN;
12title;
4 Bloque de código
DATA STEP / PROC NPAR1WAY Data
Explicación :
Similar al bloque anterior, este segmento prepara y analiza los datos para la comparación 'Trump' contra 'Cruz'. Un paso DATA filtra 'work.repincome' para crear 'TrumpCruz', excluyendo al candidato con el 'código' '2'. Luego se llama a PROC NPAR1WAY para realizar una prueba de Wilcoxon sobre 'income' por 'candidate', con los mismos parámetros de análisis (alfa=0.05, Wilcoxon exacto con HL). El informe se titula 'Trump Cruz'.
¡Copiado!
1*Trump Cruz Comparison;
2DATA TrumpCruz; SET work.repincome;
3 IF code NE 2;
4RUN;
5 
6PROC NPAR1WAY DATA=TrumpCruz wilcoxon alpha=.05;
7var income;
8class candidate;
9exact wilcoxon HL;
10title 'Trump Cruz';
11RUN;
12title;
5 Bloque de código
DATA STEP / PROC NPAR1WAY Data
¡Copiado!
1*Cruz Carson comparison;
2DATA CruzCarson; SET work.repincome;
3 IF code NE 1;
4RUN;
5 
6PROC NPAR1WAY DATA=CruzCarson wilcoxon alpha=.05;
7var income;
8class candidate;
9exact wilcoxon HL;
10title 'Cruz Carson';
11RUN;
12title;
Este material se proporciona "tal cual" por We Are Cas. No hay garantías, expresas o implícitas, en cuanto a la comerciabilidad o idoneidad para un propósito particular con respecto a los materiales o el código contenidos en este documento. We Are Cas no es responsable de los errores en este material tal como existe ahora o existirá, ni We Are Cas proporciona soporte técnico para el mismo.

Documentación relacionada

Aucune documentation spécifique pour cette catégorie.