Die Aktion logisticScore erstellt eine Tabelle auf dem Server, die Ergebnisse aus der Bewertung von Beobachtungen unter Verwendung eines angepassten Modells enthält. Diese Aktion ist entscheidend in der prädiktiven Modellierungsphase, in der ein trainiertes logistisches Regressionsmodell auf neue Daten angewendet wird, um Vorhersagen zu generieren. Sie kann eine Vielzahl von Statistiken berechnen, wie z.B. vorhergesagte Wahrscheinlichkeiten, Konfidenzintervalle und verschiedene Arten von Residuen, die für die Modellvalidierung und -interpretation unerlässlich sind.
| Parameter | Beschreibung |
|---|---|
| alpha | Gibt das Signifikanzniveau für die Erstellung von Konfidenzintervallen an. Standardmäßig wird dies auf das globale Signifikanzniveau gesetzt. |
| casOut | Gibt die Einstellungen für eine Ausgabetabelle an. |
| cBar | Benennt die Konfidenzintervallverschiebung, die die Gesamtänderung der globalen Regressionsschätzungen misst, die auf das Löschen der einzelnen Beobachtung zurückzuführen ist. |
| copyVars | Gibt eine Liste von einer oder mehreren Variablen an, die von der Eingabetabelle in die Ausgabetabelle kopiert werden sollen. |
| difChisq | Benennt die Änderung in der Pearson-Chi-Quadrat-Statistik, die auf das Löschen der einzelnen Beobachtung zurückzuführen ist. |
| difDev | Benennt die Änderung in der Devianz, die auf das Löschen der einzelnen Beobachtung zurückzuführen ist. |
| display | Gibt eine Liste von Ergebnistabellen an, die zur Anzeige an den Client gesendet werden sollen. |
| fitData | Wenn auf True gesetzt, gibt an, dass die zu bewertenden Daten auch zum Anpassen des Modells verwendet wurden. |
| h | Benennt den Hebelwert (Leverage) der Beobachtung. |
| into | Benennt das vorhergesagte Antwortniveau. |
| intoCutpt | Gibt die vorhergesagte Ereigniswahrscheinlichkeit an, die das vorhergesagte binäre Antwortniveau bestimmt. |
| ipred | Benennt den individuellen vorhergesagten Wert für einen kumulativen Link. Wenn Sie keine Ausgabestatistiken angeben, wird der vorhergesagte Wert standardmäßig _IPRED_ genannt. |
| lcl | Benennt die untere Grenze eines Konfidenzintervalls für den linearen Prädiktor. |
| lclm | Benennt die untere Grenze eines Konfidenzintervalls für den Mittelwert. |
| level | Benennt das geordnete Antwortniveau. |
| obscat | Wenn auf True gesetzt, werden multinomiale Ausgabestatistiken auf dem beobachteten Antwortniveau berechnet. |
| outputTables | Listet die Namen der Ergebnistabellen auf, die als CAS-Tabellen auf dem Server gespeichert werden sollen. |
| post | Benennt den posterioren vorhergesagten Wert. |
| pred | Benennt den vorhergesagten Wert. Wenn Sie keine Ausgabestatistiken angeben, wird der vorhergesagte Wert standardmäßig _PRED_ genannt. |
| predProbs | Wenn auf True gesetzt, werden angeforderte multinomiale vorhergesagte Wahrscheinlichkeiten als separate Variablen angezeigt. |
| resChi | Benennt das Pearson-Chi-Quadrat-Residuum. |
| resDev | Benennt das Devianz-Residuum. |
| resLik | Benennt das Likelihood-Residuum (Likelihood-Verschiebung). |
| resRaw | Benennt das rohe Residuum. |
| restore | Stellt Regressionsmodelle aus einem Binary Large Object (BLOB) wieder her. |
| resWork | Benennt das Arbeitsresiduum. |
| role | Identifiziert die Trainings-, Validierungs- und Testrollen für die Beobachtungen. |
| stdResChi | Benennt das standardisierte Pearson-Chi-Quadrat-Residuum. |
| stdResDev | Benennt das standardisierte Devianz-Residuum. |
| stdXBeta | Benennt den Standardfehler des linearen Prädiktors. |
| table | Gibt die Eingabedatentabelle an. |
| ucl | Benennt die obere Grenze eines Konfidenzintervalls für den linearen Prädiktor. |
| uclm | Benennt die obere Grenze eines Konfidenzintervalls für den Mittelwert. |
| xBeta | Benennt den linearen Prädiktor. |
Zuerst wird ein logistisches Regressionsmodell mit der Aktion `logistic` angepasst, um den Effekt von Alter, Gewicht und Sauerstoffaufnahme auf die Wahrscheinlichkeit eines Herzinfarkts zu modellieren. Die Ergebnisse des Modells werden in der `myModel`-Tabelle für die spätere Verwendung beim Scoring gespeichert.
| 1 | PROC CAS; |
| 2 | regression.logistic |
| 3 | TABLE={name='heart'}, |
| 4 | class={'Status', 'Sex'}, |
| 5 | model={depvar='Status', |
| 6 | effects={'Sex', 'Age', 'Weight', 'VO2_Max'}}, |
| 7 | store={name='myModel', replace=true}; |
| 8 | RUN; |
Dieses Beispiel verwendet die Aktion `logisticScore`, um eine neue Datentabelle (`heart`) zu bewerten. Es verwendet das zuvor trainierte und in der `myModel`-Tabelle gespeicherte Modell. Die resultierende Ausgabetabelle `myScoreResults` enthält die ursprünglichen Daten sowie die vorhergesagten Werte.
| 1 | PROC CAS; |
| 2 | regression.logisticScore |
| 3 | restore='myModel', |
| 4 | TABLE='heart', |
| 5 | casOut={name='myScoreResults', replace=true}; |
| 6 | RUN; |
Dieses Beispiel zeigt, wie man mit `logisticScore` zusätzliche Statistiken generiert. Es bewertet die `heart`-Tabelle mit dem in `myModel` gespeicherten Modell und fordert mehrere Ausgabevariablen an: die vorhergesagte Wahrscheinlichkeit ('_PredP_'), die untere und obere Konfidenzgrenze für den Mittelwert ('_LCLM_', '_UCLM_') und das rohe Residuum ('_ResRaw_'). Diese Statistiken sind für eine detaillierte Modellbewertung nützlich.
| 1 | PROC CAS; |
| 2 | regression.logisticScore |
| 3 | restore='myModel', |
| 4 | TABLE='heart', |
| 5 | casOut={name='myScoreResults_detailed', replace=true}, |
| 6 | pred='_PredP_', |
| 7 | lclm='_LCLM_', |
| 8 | uclm='_UCLM_', |
| 9 | resRaw='_ResRaw_', |
| 10 | copyVars={'PatientID'}; |
| 11 | RUN; |