Veröffentlicht am :
Statistik CREATION_INTERNE

Kategorielle Datenanalyse mit PROC CATMOD

Dieser Code ist auch verfügbar auf: English Español Français Deutsch
Wartet auf Validierung
Das Skript beginnt mit der Erstellung eines 'detergent'-Datensatzes aus internen Daten (Datalines), die die Ergebnisse einer Umfrage zur Markenpräferenz darstellen. Anschließend wird PROC CATMOD verwendet, um zwei statistische Modelle anzupassen. Das erste ist ein gesättigtes Modell, das alle Interaktionen zwischen den erklärenden Variablen (Wassertyp, vorherige Verwendung, Temperatur) zur Vorhersage der bevorzugten Marke enthält. Das zweite ist ein einfacheres Modell, das nur die Haupteffekte dieser Variablen berücksichtigt, um die Anpassungen zu vergleichen.
Datenanalyse

Type : CREATION_INTERNE


Die Daten werden direkt im Skript über einen DATA STEP und eine DATALINES-Anweisung erstellt. Sie stellen eine aggregierte Kontingenztabelle dar, in der die Variable 'Count' als Gewicht dient.

1 Codeblock
DATA STEP Data
Erklärung :
Dieser DATA STEP-Block liest die Umfragedaten direkt aus dem Code (Datalines). Die Variablen Softness, Brand, Previous, Temperature und Count werden gelesen. Die Option ' @@' in der INPUT-Anweisung zeigt an, dass sich mehrere Beobachtungen in derselben Datenzeile befinden können.
Kopiert!
1DATA detergent;
2 INPUT Softness $ Brand $ Previous $ Temperature $ Count @code_sas_json/8_SAS_Intro_ReadFile_MultiCol_@@.json;
3 DATALINES;
4soft X yes high 19 soft X yes low 57
5soft X no high 29 soft X no low 63
6soft M yes high 29 soft M yes low 49
7soft M no high 27 soft M no low 53
8med X yes high 23 med X yes low 47
9med X no high 33 med X no low 66
10med M yes high 47 med M yes low 55
11med M no high 23 med M no low 50
12hard X yes high 24 hard X yes low 37
13hard X no high 42 hard X no low 68
14hard M yes high 43 hard M yes low 52
15hard M no high 30 hard M no low 42
16;
2 Codeblock
PROC CATMOD
Erklärung :
Diese Prozedur analysiert kategoriale Daten. 'WEIGHT Count' gibt an, dass die Daten aggregiert sind. 'RESPONSE 1 0' definiert die Antwortfunktion. Ein erstes gesättigtes Modell (vollständiges Modell mit allen Interaktionen: Softness|Previous|Temperature) wird angepasst. Anschließend wird ein zweites, einfacheres Modell, das nur die Haupteffekte berücksichtigt, getestet, um die Ergebnisse zu vergleichen. Die Optionen '/freq prob' fordern die Anzeige von Häufigkeiten und Wahrscheinlichkeiten an, und '/clparm noprofile design' fordert die Konfidenzintervalle für die Parameter sowie die Designmatrix des Modells an.
Kopiert!
1title 'Detergent Preference Study';
2PROC CATMOD DATA=detergent;
3 response 1 0;
4 weight Count;
5 model Brand=Softness|Previous|Temperature / freq prob;
6 title2 'Saturated Model';
7RUN;
8 
9 model Brand=Softness Previous Temperature
10 / clparm noprofile design;
11 title2 'Main-Effects Model';
12RUN;
13QUIT;
Dieses Material wird von We Are Cas "wie besehen" zur Verfügung gestellt. Es gibt keine ausdrücklichen oder stillschweigenden Garantien hinsichtlich der Marktgängigkeit oder Eignung für einen bestimmten Zweck in Bezug auf die hierin enthaltenen Materialien oder Codes. We Are Cas ist nicht verantwortlich für Fehler in diesem Material, wie es jetzt existiert oder existieren wird, noch bietet We Are Cas technischen Support dafür an.
Urheberrechtsinformationen : S A S S A M P L E L I B R A R Y