Veröffentlicht am :
Statistik CREATION_INTERNE

Korrespondenzanalyse: US-Bevölkerung 1920-1970

Dieser Code ist auch verfügbar auf: English Español Français
Wartet auf Validierung
Dieses Skript erstellt einen Datensatz, der die Bevölkerung verschiedener Regionen der Vereinigten Staaten über mehrere Jahrzehnte enthält. Es verwendet eine spezifische Gewichtung, um Alaska und Hawaii als zusätzliche Beobachtungen (negatives Gewicht) zu behandeln. Anschließend wird das Verfahren PROC CORRESP verwendet, um eine einfache Korrespondenzanalyse durchzuführen, die Zeilen-/Spaltenprofile, Beiträge zum Chi-Quadrat anzeigt und ein Korrespondenzdiagramm generiert.
Datenanalyse

Type : CREATION_INTERNE


Die Daten werden über die DATALINES-Anweisung innerhalb des DATA-Schritts direkt in den Code integriert.

1 Codeblock
DATA STEP Data
Erklärung :
Erstellung des Datensatzes 'USPop', der die regionalen Bevölkerungszahlen enthält. Die Variable 'w' wird zur Gewichtung der Beobachtungen berechnet, wobei Alaska und Hawaii ein negatives Gewicht erhalten, um sie in der späteren Analyse als zusätzliche Beobachtungen zu behandeln.
Kopiert!
1title 'United States Population, 1920-1970';
2 
3DATA USPop;
4 
5 * Regions:
6 * New England - ME, NH, VT, MA, RI, CT.
7 * Great Lakes - OH, IN, IL, MI, WI.
8 * South Atlantic - DE, MD, DC, VA, WV, NC, SC, GA, FL.
9 * Mountain - MT, ID, WY, CO, NM, AZ, UT, NV.
10 * Pacific - WA, OR, CA.
11 *
12 * Note: Multiply data values by 1000 to get populations.;
13 
14 INPUT Region $14. y1920 y1930 y1940 y1950 y1960 y1970;
15 
16 label y1920 = '1920' y1930 = '1930' y1940 = '1940'
17 y1950 = '1950' y1960 = '1960' y1970 = '1970';
18 
19 IF region = 'Hawaii' or region = 'Alaska'
20 THEN w = -1000; /* Flag Supplementary Observations */
21 ELSE w = 1000;
22 
23 DATALINES;
24New England 7401 8166 8437 9314 10509 11842
25NY, NJ, PA 22261 26261 27539 30146 34168 37199
26Great Lakes 21476 25297 26626 30399 36225 40252
27Midwest 12544 13297 13517 14061 15394 16319
28South Atlantic 13990 15794 17823 21182 25972 30671
29KY, TN, AL, MS 8893 9887 10778 11447 12050 12803
30AR, LA, OK, TX 10242 12177 13065 14538 16951 19321
31Mountain 3336 3702 4150 5075 6855 8282
32Pacific 5567 8195 9733 14486 20339 25454
33Alaska 55 59 73 129 226 300
34Hawaii 256 368 423 500 633 769
35;
2 Codeblock
SAS SYSTEM
Erklärung :
Aktivierung des ODS Graphics-Systems zur Erstellung statistischer Grafiken.
Kopiert!
1ods graphics on;
3 Codeblock
PROC CORRESP
Erklärung :
Ausführung der Korrespondenzanalyse. Die Option 'plot(flip)' transponiert die Achsen des Diagramms. Die Variable 'w' wird zur Gewichtung verwendet, wobei negative Gewichte als zusätzliche Daten behandelt werden.
Kopiert!
1PROC CORRESP DATA=uspop PRINT=percent observed cellchi2 rp cp chi2p
2 short plot(flip);
3 var y1920 -- y1970;
4 id Region;
5 weight w;
6RUN;
Dieses Material wird von We Are Cas "wie besehen" zur Verfügung gestellt. Es gibt keine ausdrücklichen oder stillschweigenden Garantien hinsichtlich der Marktgängigkeit oder Eignung für einen bestimmten Zweck in Bezug auf die hierin enthaltenen Materialien oder Codes. We Are Cas ist nicht verantwortlich für Fehler in diesem Material, wie es jetzt existiert oder existieren wird, noch bietet We Are Cas technischen Support dafür an.
Urheberrechtsinformationen : SAS SAMPLE LIBRARY