Robustheitstest: Umgang mit fehlenden Werten und gewichteten Beobachtungen
Scénario de test & Cas d'usage
Geschäftskontext
In einer klinischen Studie werden Daten von Patienten gesammelt, um die Wirksamkeit eines Medikaments vorherzusagen. Einige Biomarker-Messungen fehlen, und bestimmte Patientenkohorten sind unterrepräsentiert, was durch eine Frequenzvariable ausgeglichen werden soll. Das Ziel ist es, die Fähigkeit des Modells zu testen, mit unvollständigen und gewichteten Daten umzugehen.
Erstellung eines Datensatzes für eine klinische Studie mit fehlenden Werten in den Prädiktoren 'biomarker1' und 'biomarker2' sowie einer Frequenzvariable 'gewicht'.
Kopiert!
data klinische_daten;\n call streaminit(101);\n do patient_id = 1 to 500;\n alter = 30 + floor(rand('UNIFORM')*40);\n biomarker1 = rand('NORMAL', 100, 15);\n biomarker2 = rand('NORMAL', 50, 5);\n /* Fehlende Werte einführen */\n if rand('UNIFORM') < 0.15 then call missing(biomarker1);\n if rand('UNIFORM') < 0.10 then call missing(biomarker2);\n /* Gewichtung für eine bestimmte Altersgruppe */\n if alter > 60 then gewicht = 2; else gewicht = 1;\n p = 1 / (1 + exp(-( -4 + 0.02*alter + 0.01*biomarker1 - 0.05*biomarker2)));\n ansprechen = rand('BERNOULLI', p);\n output;\n end;\nrun;
1
DATA klinische_daten;
2
call streaminit(101);
3
DO patient_id = 1 to 500;
4
alter = 30 + floor(rand('UNIFORM')*40);
5
biomarker1 = rand('NORMAL', 100, 15);
6
biomarker2 = rand('NORMAL', 50, 5);
7
/* Fehlende Werte einführen */
8
IF rand('UNIFORM') < 0.15THEN call missing(biomarker1);
9
IF rand('UNIFORM') < 0.10THEN call missing(biomarker2);
Im ersten Lauf (missing='SEPARATE') wird das Modell erfolgreich trainiert, wobei alle Beobachtungen verwendet werden und fehlende Werte als separate Kategorie behandelt werden. Die Tabelle 'Anzahl der Beobachtungen' zeigt die volle gewichtete Anzahl. Im zweiten Lauf (missing='NONE') zeigt die Tabelle 'Anzahl der Beobachtungen' eine geringere Anzahl von verwendeten Beobachtungen, da Zeilen mit fehlenden Werten ausgeschlossen werden. Dies bestätigt, dass die `missing`-Option wie dokumentiert funktioniert und das Modell robust gegenüber unvollständigen Daten ist.
SAS und alle anderen Produkt- oder Dienstleistungsnamen von SAS Institute Inc. sind eingetragene Marken oder Marken von SAS Institute Inc. in den USA und anderen Ländern. ® zeigt die Registrierung in den USA an. WeAreCAS ist eine unabhängige Community-Site und nicht mit SAS Institute Inc. verbunden.
Diese Website verwendet technische und analytische Cookies, um Ihre Erfahrung zu verbessern.
Mehr erfahren.