logisticScore - WeAreCAS

Q: Was ist der Zweck der `logisticScore`-Aktion in SAS Viya?

Die `logisticScore`-Aktion erstellt eine Tabelle auf dem Server, die Ergebnisse aus der Bewertung von Beobachtungen unter Verwendung eines zuvor angepassten logistischen Regressionsmodells enthält.

Q: Welche Parameter sind für die Ausführung der `logisticScore`-Aktion zwingend erforderlich?

Die erforderlichen Parameter sind `table`, um die Eingabedatentabelle anzugeben, `restore`, um das angepasste Modell aus einem Item-Store zu laden, und `casOut`, um die Ausgabetabelle zu definieren.

Q: Wie kann ich angepasste Residuen in der Ausgabe speichern?

Sie können verschiedene Arten von Residuen speichern, indem Sie Parameter wie `resDev` (Devianz-Residuum), `resChi` (Pearson-Chi-Quadrat-Residuum) oder `resRaw` (rohes Residuum) verwenden und ihnen einen Namen für die Ausgabespalte zuweisen.

Q: Was bewirkt der Parameter `copyVars`?

Der `copyVars`-Parameter ermöglicht es, eine oder mehrere Variablen von der Eingabetabelle in die Ausgabetabelle zu kopieren. Sie können bestimmte Variablen, alle Variablen (`ALL`) oder nur alle numerischen Variablen (`ALL_NUMERIC`) kopieren.

Q: Wie erhalte ich die vorhergesagten Wahrscheinlichkeiten für jede Kategorie in einem multinomialen Modell?

Um vorhergesagte Wahrscheinlichkeiten für multinomiale Modelle zu erhalten, verwenden Sie den Parameter `predProbs=TRUE`. Dies zeigt die angeforderten Wahrscheinlichkeiten als separate Variablen in der Ausgabetabelle an.

Q: Kann ich Konfidenzintervalle für die Vorhersagen berechnen?

Ja, Sie können die unteren und oberen Grenzen für das Konfidenzintervall des linearen Prädiktors (`lcl`, `ucl`) und des Mittelwerts (`lclm`, `uclm`) anfordern. Das Signifikanzniveau kann mit dem `alpha`-Parameter angepasst werden.

Beschreibung

Die Aktion logisticScore erstellt eine Tabelle auf dem Server, die Ergebnisse aus der Bewertung von Beobachtungen unter Verwendung eines angepassten Modells enthält. Diese Aktion ist entscheidend in der prädiktiven Modellierungsphase, in der ein trainiertes logistisches Regressionsmodell auf neue Daten angewendet wird, um Vorhersagen zu generieren. Sie kann eine Vielzahl von Statistiken berechnen, wie z.B. vorhergesagte Wahrscheinlichkeiten, Konfidenzintervalle und verschiedene Arten von Residuen, die für die Modellvalidierung und -interpretation unerlässlich sind.

regression.logisticScore { alpha=double, casOut={CASOUTTABLE}, cBar="string", copyVars={"variable-name-1" <, "variable-name-2", ...>}, difChisq="string", difDev="string", display={display-table-options}, fitData=TRUE | FALSE, h="string", into="string", intoCutpt=double, ipred="string", lcl="string", lclm="string", level="string", obscat=TRUE | FALSE, outputTables={output-table-options}, post="string", pred="string", predProbs=TRUE | FALSE, resChi="string", resDev="string", resLik="string", resRaw="string", restore={CASTABLE}, resWork="string", role="string", stdResChi="string", stdResDev="string", stdXBeta="string", table={CASTABLE}, ucl="string", uclm="string", xBeta="string" }

Einstellungen

Parameter	Beschreibung
alpha	Gibt das Signifikanzniveau für die Erstellung von Konfidenzintervallen an. Standardmäßig wird dies auf das globale Signifikanzniveau gesetzt.
casOut	Gibt die Einstellungen für eine Ausgabetabelle an.
cBar	Benennt die Konfidenzintervallverschiebung, die die Gesamtänderung der globalen Regressionsschätzungen misst, die auf das Löschen der einzelnen Beobachtung zurückzuführen ist.
copyVars	Gibt eine Liste von einer oder mehreren Variablen an, die von der Eingabetabelle in die Ausgabetabelle kopiert werden sollen.
difChisq	Benennt die Änderung in der Pearson-Chi-Quadrat-Statistik, die auf das Löschen der einzelnen Beobachtung zurückzuführen ist.
difDev	Benennt die Änderung in der Devianz, die auf das Löschen der einzelnen Beobachtung zurückzuführen ist.
display	Gibt eine Liste von Ergebnistabellen an, die zur Anzeige an den Client gesendet werden sollen.
fitData	Wenn auf True gesetzt, gibt an, dass die zu bewertenden Daten auch zum Anpassen des Modells verwendet wurden.
h	Benennt den Hebelwert (Leverage) der Beobachtung.
into	Benennt das vorhergesagte Antwortniveau.
intoCutpt	Gibt die vorhergesagte Ereigniswahrscheinlichkeit an, die das vorhergesagte binäre Antwortniveau bestimmt.
ipred	Benennt den individuellen vorhergesagten Wert für einen kumulativen Link. Wenn Sie keine Ausgabestatistiken angeben, wird der vorhergesagte Wert standardmäßig _IPRED_ genannt.
lcl	Benennt die untere Grenze eines Konfidenzintervalls für den linearen Prädiktor.
lclm	Benennt die untere Grenze eines Konfidenzintervalls für den Mittelwert.
level	Benennt das geordnete Antwortniveau.
obscat	Wenn auf True gesetzt, werden multinomiale Ausgabestatistiken auf dem beobachteten Antwortniveau berechnet.
outputTables	Listet die Namen der Ergebnistabellen auf, die als CAS-Tabellen auf dem Server gespeichert werden sollen.
post	Benennt den posterioren vorhergesagten Wert.
pred	Benennt den vorhergesagten Wert. Wenn Sie keine Ausgabestatistiken angeben, wird der vorhergesagte Wert standardmäßig _PRED_ genannt.
predProbs	Wenn auf True gesetzt, werden angeforderte multinomiale vorhergesagte Wahrscheinlichkeiten als separate Variablen angezeigt.
resChi	Benennt das Pearson-Chi-Quadrat-Residuum.
resDev	Benennt das Devianz-Residuum.
resLik	Benennt das Likelihood-Residuum (Likelihood-Verschiebung).
resRaw	Benennt das rohe Residuum.
restore	Stellt Regressionsmodelle aus einem Binary Large Object (BLOB) wieder her.
resWork	Benennt das Arbeitsresiduum.
role	Identifiziert die Trainings-, Validierungs- und Testrollen für die Beobachtungen.
stdResChi	Benennt das standardisierte Pearson-Chi-Quadrat-Residuum.
stdResDev	Benennt das standardisierte Devianz-Residuum.
stdXBeta	Benennt den Standardfehler des linearen Prädiktors.
table	Gibt die Eingabedatentabelle an.
ucl	Benennt die obere Grenze eines Konfidenzintervalls für den linearen Prädiktor.
uclm	Benennt die obere Grenze eines Konfidenzintervalls für den Mittelwert.
xBeta	Benennt den linearen Prädiktor.

Datenaufbereitung Datenaufbereitungsblatt ansehen

Datenvorbereitung für das Scoring

Zuerst wird ein logistisches Regressionsmodell mit der Aktion `logistic` angepasst, um den Effekt von Alter, Gewicht und Sauerstoffaufnahme auf die Wahrscheinlichkeit eines Herzinfarkts zu modellieren. Die Ergebnisse des Modells werden in der `myModel`-Tabelle für die spätere Verwendung beim Scoring gespeichert.

Kopiert!

1	PROC CAS;
2	regression.logistic
3	TABLE={name='heart'},
4	class={'Status', 'Sex'},
5	model={depvar='Status',
6	effects={'Sex', 'Age', 'Weight', 'VO2_Max'}},
7	store={name='myModel', replace=true};
8	RUN;

Beispiele

Dieses Beispiel verwendet die Aktion `logisticScore`, um eine neue Datentabelle (`heart`) zu bewerten. Es verwendet das zuvor trainierte und in der `myModel`-Tabelle gespeicherte Modell. Die resultierende Ausgabetabelle `myScoreResults` enthält die ursprünglichen Daten sowie die vorhergesagten Werte.

SAS® / CAS-Code Code wartet auf Validierung durch die Community

Kopiert!

1	PROC CAS;
2	regression.logisticScore
3	restore='myModel',
4	TABLE='heart',
5	casOut={name='myScoreResults', replace=true};
6	RUN;

Ergebnis :
Die Ausgabetabelle 'myScoreResults' wird im aktuellen Caslib erstellt. Sie enthält die ursprünglichen Spalten aus der 'heart'-Tabelle sowie eine neue Spalte mit den Scoring-Ergebnissen, die standardmäßig '_PRED_' genannt wird.

Dieses Beispiel zeigt, wie man mit `logisticScore` zusätzliche Statistiken generiert. Es bewertet die `heart`-Tabelle mit dem in `myModel` gespeicherten Modell und fordert mehrere Ausgabevariablen an: die vorhergesagte Wahrscheinlichkeit ('_PredP_'), die untere und obere Konfidenzgrenze für den Mittelwert ('_LCLM_', '_UCLM_') und das rohe Residuum ('_ResRaw_'). Diese Statistiken sind für eine detaillierte Modellbewertung nützlich.

SAS® / CAS-Code Code wartet auf Validierung durch die Community

Kopiert!

1	PROC CAS;
2	regression.logisticScore
3	restore='myModel',
4	TABLE='heart',
5	casOut={name='myScoreResults_detailed', replace=true},
6	pred='_PredP_',
7	lclm='_LCLM_',
8	uclm='_UCLM_',
9	resRaw='_ResRaw_',
10	copyVars={'PatientID'};
11	RUN;

Ergebnis :
Eine neue Tabelle 'myScoreResults_detailed' wird erstellt. Sie enthält die Variable 'PatientID' aus der Originaltabelle sowie die neu berechneten Spalten '_PredP_', '_LCLM_', '_UCLM_' und '_ResRaw_', die eine umfassende Analyse der Modellvorhersagen ermöglichen.

FAQ

Was ist der Zweck der `logisticScore`-Aktion in SAS Viya?

Welche Parameter sind für die Ausführung der `logisticScore`-Aktion zwingend erforderlich?

Wie kann ich angepasste Residuen in der Ausgabe speichern?

Was bewirkt der Parameter `copyVars`?

Wie erhalte ich die vorhergesagten Wahrscheinlichkeiten für jede Kategorie in einem multinomialen Modell?

Kann ich Konfidenzintervalle für die Vorhersagen berechnen?

Actions associées

regression

genmodScore

Erstellt eine Tabelle auf dem Server, die Ergebnisse der Bewertung von Beobac...

regression

glmScore

Die 'glmScore'-Aktion erstellt auf dem Server eine Tabelle, die Ergebnisse de...

regression

glm

Diese Aktion passt lineare Regressionsmodelle mithilfe der Methode der kleins...

regression

logisticAssociation

Berechnet Rangkorrelationsindizes zwischen vorhergesagten Wahrscheinlichkeite...

regression

logisticCode

Schreibt SAS DATA-Schritt-Code zur Berechnung der vorhergesagten Werte des an...

regression

logisticLackfit

Berechnet den Hosmer-Lemeshow-Anpassungstest für ein logistisches Regressions...

Inhaltsverzeichnis

Beschreibung

Datenvorbereitung für das Scoring

Beispiele

Einfaches Scoring-Beispiel

Detailliertes Scoring mit zusätzlichen Statistiken

FAQ

Actions associées

genmodScore

glmScore

glm

logisticAssociation

logisticCode

logisticLackfit