regression

logisticScore

Beschreibung

Die Aktion logisticScore erstellt eine Tabelle auf dem Server, die Ergebnisse aus der Bewertung von Beobachtungen unter Verwendung eines angepassten Modells enthält. Diese Aktion ist entscheidend in der prädiktiven Modellierungsphase, in der ein trainiertes logistisches Regressionsmodell auf neue Daten angewendet wird, um Vorhersagen zu generieren. Sie kann eine Vielzahl von Statistiken berechnen, wie z.B. vorhergesagte Wahrscheinlichkeiten, Konfidenzintervalle und verschiedene Arten von Residuen, die für die Modellvalidierung und -interpretation unerlässlich sind.

regression.logisticScore { alpha=double, casOut={CASOUTTABLE}, cBar="string", copyVars={"variable-name-1" <, "variable-name-2", ...>}, difChisq="string", difDev="string", display={display-table-options}, fitData=TRUE | FALSE, h="string", into="string", intoCutpt=double, ipred="string", lcl="string", lclm="string", level="string", obscat=TRUE | FALSE, outputTables={output-table-options}, post="string", pred="string", predProbs=TRUE | FALSE, resChi="string", resDev="string", resLik="string", resRaw="string", restore={CASTABLE}, resWork="string", role="string", stdResChi="string", stdResDev="string", stdXBeta="string", table={CASTABLE}, ucl="string", uclm="string", xBeta="string" }
Einstellungen
ParameterBeschreibung
alphaGibt das Signifikanzniveau für die Erstellung von Konfidenzintervallen an. Standardmäßig wird dies auf das globale Signifikanzniveau gesetzt.
casOutGibt die Einstellungen für eine Ausgabetabelle an.
cBarBenennt die Konfidenzintervallverschiebung, die die Gesamtänderung der globalen Regressionsschätzungen misst, die auf das Löschen der einzelnen Beobachtung zurückzuführen ist.
copyVarsGibt eine Liste von einer oder mehreren Variablen an, die von der Eingabetabelle in die Ausgabetabelle kopiert werden sollen.
difChisqBenennt die Änderung in der Pearson-Chi-Quadrat-Statistik, die auf das Löschen der einzelnen Beobachtung zurückzuführen ist.
difDevBenennt die Änderung in der Devianz, die auf das Löschen der einzelnen Beobachtung zurückzuführen ist.
displayGibt eine Liste von Ergebnistabellen an, die zur Anzeige an den Client gesendet werden sollen.
fitDataWenn auf True gesetzt, gibt an, dass die zu bewertenden Daten auch zum Anpassen des Modells verwendet wurden.
hBenennt den Hebelwert (Leverage) der Beobachtung.
intoBenennt das vorhergesagte Antwortniveau.
intoCutptGibt die vorhergesagte Ereigniswahrscheinlichkeit an, die das vorhergesagte binäre Antwortniveau bestimmt.
ipredBenennt den individuellen vorhergesagten Wert für einen kumulativen Link. Wenn Sie keine Ausgabestatistiken angeben, wird der vorhergesagte Wert standardmäßig _IPRED_ genannt.
lclBenennt die untere Grenze eines Konfidenzintervalls für den linearen Prädiktor.
lclmBenennt die untere Grenze eines Konfidenzintervalls für den Mittelwert.
levelBenennt das geordnete Antwortniveau.
obscatWenn auf True gesetzt, werden multinomiale Ausgabestatistiken auf dem beobachteten Antwortniveau berechnet.
outputTablesListet die Namen der Ergebnistabellen auf, die als CAS-Tabellen auf dem Server gespeichert werden sollen.
postBenennt den posterioren vorhergesagten Wert.
predBenennt den vorhergesagten Wert. Wenn Sie keine Ausgabestatistiken angeben, wird der vorhergesagte Wert standardmäßig _PRED_ genannt.
predProbsWenn auf True gesetzt, werden angeforderte multinomiale vorhergesagte Wahrscheinlichkeiten als separate Variablen angezeigt.
resChiBenennt das Pearson-Chi-Quadrat-Residuum.
resDevBenennt das Devianz-Residuum.
resLikBenennt das Likelihood-Residuum (Likelihood-Verschiebung).
resRawBenennt das rohe Residuum.
restoreStellt Regressionsmodelle aus einem Binary Large Object (BLOB) wieder her.
resWorkBenennt das Arbeitsresiduum.
roleIdentifiziert die Trainings-, Validierungs- und Testrollen für die Beobachtungen.
stdResChiBenennt das standardisierte Pearson-Chi-Quadrat-Residuum.
stdResDevBenennt das standardisierte Devianz-Residuum.
stdXBetaBenennt den Standardfehler des linearen Prädiktors.
tableGibt die Eingabedatentabelle an.
uclBenennt die obere Grenze eines Konfidenzintervalls für den linearen Prädiktor.
uclmBenennt die obere Grenze eines Konfidenzintervalls für den Mittelwert.
xBetaBenennt den linearen Prädiktor.
Datenvorbereitung für das Scoring

Zuerst wird ein logistisches Regressionsmodell mit der Aktion `logistic` angepasst, um den Effekt von Alter, Gewicht und Sauerstoffaufnahme auf die Wahrscheinlichkeit eines Herzinfarkts zu modellieren. Die Ergebnisse des Modells werden in der `myModel`-Tabelle für die spätere Verwendung beim Scoring gespeichert.

Kopiert!
1PROC CAS;
2 regression.logistic
3 TABLE={name='heart'},
4 class={'Status', 'Sex'},
5 model={depvar='Status',
6 effects={'Sex', 'Age', 'Weight', 'VO2_Max'}},
7 store={name='myModel', replace=true};
8RUN;

Beispiele

Dieses Beispiel verwendet die Aktion `logisticScore`, um eine neue Datentabelle (`heart`) zu bewerten. Es verwendet das zuvor trainierte und in der `myModel`-Tabelle gespeicherte Modell. Die resultierende Ausgabetabelle `myScoreResults` enthält die ursprünglichen Daten sowie die vorhergesagten Werte.

SAS® / CAS-Code Code wartet auf Validierung durch die Community
Kopiert!
1PROC CAS;
2 regression.logisticScore
3 restore='myModel',
4 TABLE='heart',
5 casOut={name='myScoreResults', replace=true};
6RUN;
Ergebnis :
Die Ausgabetabelle 'myScoreResults' wird im aktuellen Caslib erstellt. Sie enthält die ursprünglichen Spalten aus der 'heart'-Tabelle sowie eine neue Spalte mit den Scoring-Ergebnissen, die standardmäßig '_PRED_' genannt wird.

Dieses Beispiel zeigt, wie man mit `logisticScore` zusätzliche Statistiken generiert. Es bewertet die `heart`-Tabelle mit dem in `myModel` gespeicherten Modell und fordert mehrere Ausgabevariablen an: die vorhergesagte Wahrscheinlichkeit ('_PredP_'), die untere und obere Konfidenzgrenze für den Mittelwert ('_LCLM_', '_UCLM_') und das rohe Residuum ('_ResRaw_'). Diese Statistiken sind für eine detaillierte Modellbewertung nützlich.

SAS® / CAS-Code Code wartet auf Validierung durch die Community
Kopiert!
1PROC CAS;
2 regression.logisticScore
3 restore='myModel',
4 TABLE='heart',
5 casOut={name='myScoreResults_detailed', replace=true},
6 pred='_PredP_',
7 lclm='_LCLM_',
8 uclm='_UCLM_',
9 resRaw='_ResRaw_',
10 copyVars={'PatientID'};
11RUN;
Ergebnis :
Eine neue Tabelle 'myScoreResults_detailed' wird erstellt. Sie enthält die Variable 'PatientID' aus der Originaltabelle sowie die neu berechneten Spalten '_PredP_', '_LCLM_', '_UCLM_' und '_ResRaw_', die eine umfassende Analyse der Modellvorhersagen ermöglichen.

FAQ

Was ist der Zweck der `logisticScore`-Aktion in SAS Viya?
Welche Parameter sind für die Ausführung der `logisticScore`-Aktion zwingend erforderlich?
Wie kann ich angepasste Residuen in der Ausgabe speichern?
Was bewirkt der Parameter `copyVars`?
Wie erhalte ich die vorhergesagten Wahrscheinlichkeiten für jede Kategorie in einem multinomialen Modell?
Kann ich Konfidenzintervalle für die Vorhersagen berechnen?