Die 'glmScore'-Aktion erstellt auf dem Server eine Tabelle, die Ergebnisse der Bewertung von Beobachtungen mithilfe eines angepassten Modells enthält. Diese Aktion wird verwendet, um vorhergesagte Werte und verschiedene Einflussstatistiken aus einem zuvor angepassten verallgemeinerten linearen Modell (GLM) zu generieren. Sie bietet eine detaillierte Analyse der Modellleistung und der Einflussfaktoren einzelner Beobachtungen.
| Parameter | Description |
|---|---|
| allStats | Wenn auf 'True' gesetzt, werden alle verfügbaren Statistiken angefordert. Standard ist 'False'. |
| alpha | Gibt das Signifikanzniveau für die Erstellung aller Konfidenzintervalle an. Standard ist 0.05. Der Wertebereich ist (0, 1). |
| casOut | Gibt die Einstellungen für eine Ausgabetabelle an. Dies ist ein erforderlicher Parameter. Weitere Informationen zur Angabe des 'casOut'-Parameters finden Sie im allgemeinen Parameter 'casouttable (Form 1)' (Anhang A: Allgemeine Parameter). |
| cooksD | Benennt die Cook's D-Einflussstatistik. |
| copyVars | Gibt eine Liste von einer oder mehreren Variablen an, die von der Eingabetabelle in die Ausgabetabelle kopiert werden sollen. Sie können alternativ den Wert 'ALL' oder 'ALL_NUMERIC' angeben, wodurch alle Variablen bzw. alle numerischen Variablen aus der Eingabetabelle in die Ausgabetabelle kopiert werden. |
| covRatio | Benennt den Standardeinfluss der Beobachtung auf die Kovarianz der Beta-Werte. Die COVRATIO-Statistik misst die Änderung der Determinante der Kovarianzmatrix der Schätzungen durch Löschen der i-ten Beobachtung. |
| dffits | Benennt das skalierte Maß der Änderung des vorhergesagten Werts für die i-te Beobachtung und wird durch Löschen der i-ten Beobachtung berechnet. Ein großer Wert weist darauf hin, dass die Beobachtung in ihrer Umgebung des X-Raums sehr einflussreich ist. |
| display | Gibt eine Liste von Ergebnistabellen an, die zur Anzeige an den Client gesendet werden sollen. Weitere Informationen zur Angabe des 'display'-Parameters finden Sie im allgemeinen Parameter 'displayTables' (Anhang A: Allgemeine Parameter). |
| fitData | Wenn auf 'True' gesetzt, gibt an, dass die zu bewertenden Daten auch zum Anpassen des Modells verwendet wurden. Standard ist 'False'. |
| h | Benennt den Hebel der Beobachtung. |
| lcl | Benennt die Untergrenze eines Konfidenzintervalls für eine individuelle Vorhersage. |
| lclm | Benennt die Untergrenze eines Konfidenzintervalls für den erwarteten Wert der abhängigen Variablen. |
| likeDist | Benennt die Likelihood-Verschiebung. |
| outputTables | Listet die Namen der Ergebnistabellen auf, die als CAS-Tabellen auf dem Server gespeichert werden sollen. Alias ist 'displayOut'. Weitere Informationen zur Angabe des 'outputTables'-Parameters finden Sie im allgemeinen Parameter 'outputTables' (Anhang A: Allgemeine Parameter). |
| pred | Benennt den vorhergesagten Wert. Wenn Sie keine Ausgabestatistiken angeben, wird der vorhergesagte Wert standardmäßig als 'Pred' bezeichnet. |
| press | Benennt das i-te Residuum geteilt durch 1 - h, wobei h der Hebel ist und das Modell ohne die i-te Beobachtung neu angepasst wurde. |
| resid | Benennt das Residuum, berechnet als IST-Wert minus VORHERGESAGTER Wert. |
| restore | Stellt Regressionsmodelle aus einem Binärobjekt (BLOB) wieder her. Dies ist ein erforderlicher Parameter. Die castable-Werte können 'caslib', 'dataSourceOptions', 'name' und 'whereTable' umfassen. |
| role | Identifiziert die Trainings-, Validierungs- und Testrollen für die Beobachtungen. |
| rStudent | Benennt das studentisierte Residuum, wobei die aktuelle Beobachtung gelöscht wurde. |
| stdi | Benennt den Standardfehler des individuell vorhergesagten Werts. |
| stdp | Benennt den Standardfehler des mittleren vorhergesagten Werts. |
| stdr | Benennt den Standardfehler des Residuums. |
| student | Benennt die studentisierten Residuen, welche die Residuen geteilt durch ihre Standardfehler sind. |
| table | Gibt die Eingabedatentabelle an. Dies ist ein erforderlicher Parameter. Weitere Informationen zur Angabe des 'table'-Parameters finden Sie im allgemeinen Parameter 'castable (Form 1)' (Anhang A: Allgemeine Parameter). |
| ucl | Benennt die Obergrenze eines Konfidenzintervalls für eine individuelle Vorhersage. |
| uclm | Benennt die Obergrenze eines Konfidenzintervalls für den erwarteten Wert der abhängigen Variablen. |
In diesem Beispiel werden die Eingabedaten für die 'glmScore'-Aktion aus einem zuvor angepassten Modell und einer Tabelle mit Beobachtungen geladen.
| 1 | |
| 2 | DATA mycas.input_data; |
| 3 | INPUT Y X1 X2; |
| 4 | DATALINES; |
| 5 | 1 10 20 2 12 22 3 15 25 4 18 28 5 20 30 ; |
| 6 | RUN; |
| 7 | |
| 8 | PROC CAS; |
| 9 | regression.glm / TABLE='input_data', model={depvar='Y', effects={'X1', 'X2'}}, store={name='glm_model', replace=true}; |
| 10 | |
| 11 | RUN; |
| 12 | |
| 13 | QUIT; |
| 14 |
Dieses Beispiel zeigt die grundlegende Verwendung der 'glmScore'-Aktion, um Vorhersagen aus einem zuvor gespeicherten Modell zu generieren. Die Vorhersagen werden in einer neuen CAS-Tabelle gespeichert.
| 1 | |
| 2 | PROC CAS; |
| 3 | regression.glmScore / TABLE='input_data', restore={name='glm_model'}, casOut={name='scored_data', replace=true}, pred='PredictedY'; |
| 4 | |
| 5 | RUN; |
| 6 | |
| 7 | QUIT; |
| 8 | |
| 9 | PROC PRINT |
| 10 | DATA=mycas.scored_data; |
| 11 | |
| 12 | RUN; |
| 13 |
Dieses Beispiel demonstriert die Generierung von Vorhersagen und mehreren Einflussstatistiken (z.B. Residuen, Studentisierte Residuen, Hebelwerte) aus einem angepassten Modell. Die Ergebnisse werden in einer neuen Tabelle gespeichert, und es wird der Signifikanzwert für Konfidenzintervalle angepasst.
| 1 | |
| 2 | PROC CAS; |
| 3 | regression.glmScore / TABLE='input_data', restore={name='glm_model'}, casOut={name='detailed_scored_data', replace=true}, pred='PredictedY', resid='Residuals', student='StudentResiduals', h='Leverage', alpha=0.10, allStats=true; |
| 4 | |
| 5 | RUN; |
| 6 | |
| 7 | QUIT; |
| 8 | |
| 9 | PROC PRINT |
| 10 | DATA=mycas.detailed_scored_data; |
| 11 | |
| 12 | RUN; |
| 13 |