Publicado el :
Estadística CREATION_INTERNE

Análisis de correspondencias: Población de EE. UU. 1920-1970

Este código también está disponible en: Deutsch English Français
En espera de validación
Este script crea un conjunto de datos que contiene la población de diferentes regiones de Estados Unidos durante varias décadas. Utiliza una ponderación específica para tratar a Alaska y Hawái como observaciones suplementarias (peso negativo). Luego, se utiliza el procedimiento PROC CORRESP para realizar un análisis de correspondencias simples, mostrando los perfiles de filas/columnas, las contribuciones al Chi-2 y generando un gráfico de correspondencias.
Análisis de datos

Type : CREATION_INTERNE


Los datos se integran directamente en el código a través de la instrucción DATALINES dentro del paso DATA.

1 Bloque de código
DATA STEP Data
Explicación :
Creación del conjunto de datos 'USPop' que contiene las poblaciones regionales. La variable 'w' se calcula para ponderar las observaciones, asignando un peso negativo a Alaska y Hawái para tratarlas como observaciones suplementarias en el análisis posterior.
¡Copiado!
1title 'United States Population, 1920-1970';
2 
3DATA USPop;
4 
5 * Regions:
6 * New England - ME, NH, VT, MA, RI, CT.
7 * Great Lakes - OH, IN, IL, MI, WI.
8 * South Atlantic - DE, MD, DC, VA, WV, NC, SC, GA, FL.
9 * Mountain - MT, ID, WY, CO, NM, AZ, UT, NV.
10 * Pacific - WA, OR, CA.
11 *
12 * Note: Multiply data values by 1000 to get populations.;
13 
14 INPUT Region $14. y1920 y1930 y1940 y1950 y1960 y1970;
15 
16 label y1920 = '1920' y1930 = '1930' y1940 = '1940'
17 y1950 = '1950' y1960 = '1960' y1970 = '1970';
18 
19 IF region = 'Hawaii' or region = 'Alaska'
20 THEN w = -1000; /* Flag Supplementary Observations */
21 ELSE w = 1000;
22 
23 DATALINES;
24New England 7401 8166 8437 9314 10509 11842
25NY, NJ, PA 22261 26261 27539 30146 34168 37199
26Great Lakes 21476 25297 26626 30399 36225 40252
27Midwest 12544 13297 13517 14061 15394 16319
28South Atlantic 13990 15794 17823 21182 25972 30671
29KY, TN, AL, MS 8893 9887 10778 11447 12050 12803
30AR, LA, OK, TX 10242 12177 13065 14538 16951 19321
31Mountain 3336 3702 4150 5075 6855 8282
32Pacific 5567 8195 9733 14486 20339 25454
33Alaska 55 59 73 129 226 300
34Hawaii 256 368 423 500 633 769
35;
2 Bloque de código
SAS SYSTEM
Explicación :
Activación del sistema ODS Graphics para la generación de gráficos estadísticos.
¡Copiado!
1ods graphics on;
3 Bloque de código
PROC CORRESP
Explicación :
Ejecución del análisis de correspondencias. La opción 'plot(flip)' transpone los ejes del gráfico. La variable 'w' se utiliza para la ponderación, tratando los pesos negativos como datos suplementarios.
¡Copiado!
1PROC CORRESP DATA=uspop PRINT=percent observed cellchi2 rp cp chi2p
2 short plot(flip);
3 var y1920 -- y1970;
4 id Region;
5 weight w;
6RUN;
Este material se proporciona "tal cual" por We Are Cas. No hay garantías, expresas o implícitas, en cuanto a la comerciabilidad o idoneidad para un propósito particular con respecto a los materiales o el código contenidos en este documento. We Are Cas no es responsable de los errores en este material tal como existe ahora o existirá, ni We Are Cas proporciona soporte técnico para el mismo.
Información de copyright : SAS SAMPLE LIBRARY