regression

logisticScore

Beschreibung

Die Aktion logisticScore erstellt eine Tabelle auf dem Server, die Ergebnisse aus der Bewertung von Beobachtungen unter Verwendung eines angepassten Modells enthält. Diese Aktion ist entscheidend in der prädiktiven Modellierungsphase, in der ein trainiertes logistisches Regressionsmodell auf neue Daten angewendet wird, um Vorhersagen zu generieren. Sie kann eine Vielzahl von Statistiken berechnen, wie z.B. vorhergesagte Wahrscheinlichkeiten, Konfidenzintervalle und verschiedene Arten von Residuen, die für die Modellvalidierung und -interpretation unerlässlich sind.

regression.logisticScore { alpha=double, casOut={CASOUTTABLE}, cBar="string", copyVars={"variable-name-1" <, "variable-name-2", ...>}, difChisq="string", difDev="string", display={display-table-options}, fitData=TRUE | FALSE, h="string", into="string", intoCutpt=double, ipred="string", lcl="string", lclm="string", level="string", obscat=TRUE | FALSE, outputTables={output-table-options}, post="string", pred="string", predProbs=TRUE | FALSE, resChi="string", resDev="string", resLik="string", resRaw="string", restore={CASTABLE}, resWork="string", role="string", stdResChi="string", stdResDev="string", stdXBeta="string", table={CASTABLE}, ucl="string", uclm="string", xBeta="string" }
Einstellungen
ParameterBeschreibung
alpha Gibt das Signifikanzniveau für die Erstellung von Konfidenzintervallen an. Standardmäßig wird dies auf das globale Signifikanzniveau gesetzt.
casOut Gibt die Einstellungen für eine Ausgabetabelle an.
cBar Benennt die Konfidenzintervallverschiebung, die die Gesamtänderung der globalen Regressionsschätzungen misst, die auf das Löschen der einzelnen Beobachtung zurückzuführen ist.
copyVars Gibt eine Liste von einer oder mehreren Variablen an, die von der Eingabetabelle in die Ausgabetabelle kopiert werden sollen.
difChisq Benennt die Änderung in der Pearson-Chi-Quadrat-Statistik, die auf das Löschen der einzelnen Beobachtung zurückzuführen ist.
difDev Benennt die Änderung in der Devianz, die auf das Löschen der einzelnen Beobachtung zurückzuführen ist.
display Gibt eine Liste von Ergebnistabellen an, die zur Anzeige an den Client gesendet werden sollen.
fitData Wenn auf True gesetzt, gibt an, dass die zu bewertenden Daten auch zum Anpassen des Modells verwendet wurden.
h Benennt den Hebelwert (Leverage) der Beobachtung.
into Benennt das vorhergesagte Antwortniveau.
intoCutpt Gibt die vorhergesagte Ereigniswahrscheinlichkeit an, die das vorhergesagte binäre Antwortniveau bestimmt.
ipred Benennt den individuellen vorhergesagten Wert für einen kumulativen Link. Wenn Sie keine Ausgabestatistiken angeben, wird der vorhergesagte Wert standardmäßig _IPRED_ genannt.
lcl Benennt die untere Grenze eines Konfidenzintervalls für den linearen Prädiktor.
lclm Benennt die untere Grenze eines Konfidenzintervalls für den Mittelwert.
level Benennt das geordnete Antwortniveau.
obscat Wenn auf True gesetzt, werden multinomiale Ausgabestatistiken auf dem beobachteten Antwortniveau berechnet.
outputTables Listet die Namen der Ergebnistabellen auf, die als CAS-Tabellen auf dem Server gespeichert werden sollen.
post Benennt den posterioren vorhergesagten Wert.
pred Benennt den vorhergesagten Wert. Wenn Sie keine Ausgabestatistiken angeben, wird der vorhergesagte Wert standardmäßig _PRED_ genannt.
predProbs Wenn auf True gesetzt, werden angeforderte multinomiale vorhergesagte Wahrscheinlichkeiten als separate Variablen angezeigt.
resChi Benennt das Pearson-Chi-Quadrat-Residuum.
resDev Benennt das Devianz-Residuum.
resLik Benennt das Likelihood-Residuum (Likelihood-Verschiebung).
resRaw Benennt das rohe Residuum.
restore Stellt Regressionsmodelle aus einem Binary Large Object (BLOB) wieder her.
resWork Benennt das Arbeitsresiduum.
role Identifiziert die Trainings-, Validierungs- und Testrollen für die Beobachtungen.
stdResChi Benennt das standardisierte Pearson-Chi-Quadrat-Residuum.
stdResDev Benennt das standardisierte Devianz-Residuum.
stdXBeta Benennt den Standardfehler des linearen Prädiktors.
table Gibt die Eingabedatentabelle an.
ucl Benennt die obere Grenze eines Konfidenzintervalls für den linearen Prädiktor.
uclm Benennt die obere Grenze eines Konfidenzintervalls für den Mittelwert.
xBeta Benennt den linearen Prädiktor.
Datenvorbereitung für das Scoring

Zuerst wird ein logistisches Regressionsmodell mit der Aktion `logistic` angepasst, um den Effekt von Alter, Gewicht und Sauerstoffaufnahme auf die Wahrscheinlichkeit eines Herzinfarkts zu modellieren. Die Ergebnisse des Modells werden in der `myModel`-Tabelle für die spätere Verwendung beim Scoring gespeichert.

Kopiert!
1PROC CAS;
2 regression.logistic
3 TABLE={name='heart'},
4 class={'Status', 'Sex'},
5 model={depvar='Status',
6 effects={'Sex', 'Age', 'Weight', 'VO2_Max'}},
7 store={name='myModel', replace=true};
8RUN;

Beispiele

Dieses Beispiel verwendet die Aktion `logisticScore`, um eine neue Datentabelle (`heart`) zu bewerten. Es verwendet das zuvor trainierte und in der `myModel`-Tabelle gespeicherte Modell. Die resultierende Ausgabetabelle `myScoreResults` enthält die ursprünglichen Daten sowie die vorhergesagten Werte.

SAS® / CAS-Code Code wartet auf Validierung durch die Community
Kopiert!
1PROC CAS;
2 regression.logisticScore
3 restore='myModel',
4 TABLE='heart',
5 casOut={name='myScoreResults', replace=true};
6RUN;
Ergebnis :
Die Ausgabetabelle 'myScoreResults' wird im aktuellen Caslib erstellt. Sie enthält die ursprünglichen Spalten aus der 'heart'-Tabelle sowie eine neue Spalte mit den Scoring-Ergebnissen, die standardmäßig '_PRED_' genannt wird.

Dieses Beispiel zeigt, wie man mit `logisticScore` zusätzliche Statistiken generiert. Es bewertet die `heart`-Tabelle mit dem in `myModel` gespeicherten Modell und fordert mehrere Ausgabevariablen an: die vorhergesagte Wahrscheinlichkeit ('_PredP_'), die untere und obere Konfidenzgrenze für den Mittelwert ('_LCLM_', '_UCLM_') und das rohe Residuum ('_ResRaw_'). Diese Statistiken sind für eine detaillierte Modellbewertung nützlich.

SAS® / CAS-Code Code wartet auf Validierung durch die Community
Kopiert!
1PROC CAS;
2 regression.logisticScore
3 restore='myModel',
4 TABLE='heart',
5 casOut={name='myScoreResults_detailed', replace=true},
6 pred='_PredP_',
7 lclm='_LCLM_',
8 uclm='_UCLM_',
9 resRaw='_ResRaw_',
10 copyVars={'PatientID'};
11RUN;
Ergebnis :
Eine neue Tabelle 'myScoreResults_detailed' wird erstellt. Sie enthält die Variable 'PatientID' aus der Originaltabelle sowie die neu berechneten Spalten '_PredP_', '_LCLM_', '_UCLM_' und '_ResRaw_', die eine umfassende Analyse der Modellvorhersagen ermöglichen.

FAQ

Was ist der Zweck der `logisticScore`-Aktion in SAS Viya?
Welche Parameter sind für die Ausführung der `logisticScore`-Aktion zwingend erforderlich?
Wie kann ich angepasste Residuen in der Ausgabe speichern?
Was bewirkt der Parameter `copyVars`?
Wie erhalte ich die vorhergesagten Wahrscheinlichkeiten für jede Kategorie in einem multinomialen Modell?
Kann ich Konfidenzintervalle für die Vorhersagen berechnen?