regression

glmScore

Beschreibung

Die 'glmScore'-Aktion erstellt auf dem Server eine Tabelle, die Ergebnisse der Bewertung von Beobachtungen mithilfe eines angepassten Modells enthält. Diese Aktion wird verwendet, um vorhergesagte Werte und verschiedene Einflussstatistiken aus einem zuvor angepassten verallgemeinerten linearen Modell (GLM) zu generieren. Sie bietet eine detaillierte Analyse der Modellleistung und der Einflussfaktoren einzelner Beobachtungen.

regression.glmScore <result=results> <status=rc> / allStats=TRUE | FALSE, alpha=double, casOut={caslib="string", compress=TRUE | FALSE, indexVars={"variable-name-1" <, "variable-name-2", ...>}, label="string", lifetime=64-bit-integer, maxMemSize=64-bit-integer, memoryFormat="DVR" | "INHERIT" | "STANDARD", name="table-name", promote=TRUE | FALSE, replace=TRUE | FALSE, replication=integer, tableRedistUpPolicy="DEFER" | "NOREDIST" | "REBALANCE", threadBlockSize=64-bit-integer, timeStamp="string", where={"string-1" <, "string-2", ...>}}, cooksD="string", copyVars="ALL" | "ALL_NUMERIC" | {"variable-name-1" <, "variable-name-2", ...>}, covRatio="string", dffits="string", display={caseSensitive=TRUE | FALSE, exclude=TRUE | FALSE, excludeAll=TRUE | FALSE, keyIsPath=TRUE | FALSE, names={"string-1" <, "string-2", ...>}, pathType="LABEL" | "NAME", traceNames=TRUE | FALSE}, fitData=TRUE | FALSE, h="string", lcl="string", lclm="string", likeDist="string", outputTables={groupByVarsRaw=TRUE | FALSE, includeAll=TRUE | FALSE, names={"string-1" <, "string-2", ...>} | {key-1={casouttable-1} <, key-2={casouttable-2}, ...>}, repeated=TRUE | FALSE, replace=TRUE | FALSE}, pred="string", press="string", resid="string", restore={caslib="string", dataSourceOptions={key-1=any-list-or-data-type-1 <, key-2=any-list-or-data-type-2, ...>}, name="table-name", whereTable={casLib="string", dataSourceOptions={adls_noreq-parameters | bigquery-parameters | cas_noreq-parameters | clouddex-parameters | db2-parameters | dnfs-parameters | esp-parameters | fedsvr-parameters | gcs_noreq-parameters | hadoop-parameters | hana-parameters | impala-parameters | informix-parameters | jdbc-parameters | mongodb-parameters | mysql-parameters | odbc-parameters | oracle-parameters | path-parameters | postgres-parameters | redshift-parameters | s3-parameters | sapiq-parameters | sforce-parameters | singlestore_standard-parameters | snowflake-parameters | spark-parameters | spde-parameters | sqlserver-parameters | ss_noreq-parameters | teradata-parameters | vertica-parameters | yellowbrick-parameters}, importOptions={fileType="ANY" | "AUDIO" | "AUTO" | "BASESAS" | "CSV" | "DELIMITED" | "DOCUMENT" | "DTA" | "ESP" | "EXCEL" | "FMT" | "HDAT" | "IMAGE" | "JMP" | "LASR" | "PARQUET" | "SOUND" | "SPSS" | "VIDEO" | "XLS", fileType-specific-parameters}, name="table-name", vars={{format="string", formattedLength=integer, label="string", name="variable-name", nfd=integer, nfl=integer}, {...}}, where="where-expression"}}, role="string", rStudent="string", stdi="string", stdp="string", stdr="string", student="string", table={caslib="string", computedOnDemand=TRUE | FALSE, computedVars={{format="string", formattedLength=integer, label="string", name="variable-name", nfd=integer, nfl=integer}, {...}}, computedVarsProgram="string", dataSourceOptions={key-1=any-list-or-data-type-1 <, key-2=any-list-or-data-type-2, ...>}, groupBy={{format="string", formattedLength=integer, label="string", name="variable-name", nfd=integer, nfl=integer}, {...}}, groupByMode="NOSORT" | "REDISTRIBUTE", importOptions={fileType="ANY" | "AUDIO" | "AUTO" | "BASESAS" | "CSV" | "DELIMITED" | "DOCUMENT" | "DTA" | "ESP" | "EXCEL" | "FMT" | "HDAT" | "IMAGE" | "JMP" | "LASR" | "PARQUET" | "SOUND" | "SPSS" | "VIDEO" | "XLS", fileType-specific-parameters}, name="table-name", orderBy={{format="string", formattedLength=integer, label="string", name="variable-name", nfd=integer, nfl=integer}, {...}}, singlePass=TRUE | FALSE, vars={{format="string", formattedLength=integer, label="string", name="variable-name", nfd=integer, nfl=integer}, {...}}, where="where-expression", whereTable={casLib="string", dataSourceOptions={adls_noreq-parameters | bigquery-parameters | cas_noreq-parameters | clouddex-parameters | db2-parameters | dnfs-parameters | esp-parameters | fedsvr-parameters | gcs_noreq-parameters | hadoop-parameters | hana-parameters | impala-parameters | informix-parameters | jdbc-parameters | mongodb-parameters | mysql-parameters | odbc-parameters | oracle-parameters | path-parameters | postgres-parameters | redshift-parameters | s3-parameters | sapiq-parameters | sforce-parameters | singlestore_standard-parameters | snowflake-parameters | spark-parameters | spde-parameters | sqlserver-parameters | ss_noreq-parameters | teradata-parameters | vertica-parameters | yellowbrick-parameters}, importOptions={fileType="ANY" | "AUDIO" | "AUTO" | "BASESAS" | "CSV" | "DELIMITED" | "DOCUMENT" | "DTA" | "ESP" | "EXCEL" | "FMT" | "HDAT" | "IMAGE" | "JMP" | "LASR" | "PARQUET" | "SOUND" | "SPSS" | "VIDEO" | "XLS", fileType-specific-parameters}, name="table-name", vars={{format="string", formattedLength=integer, label="string", name="variable-name", nfd=integer, nfl=integer}, {...}}, where="where-expression"}}, ucl="string", uclm="string";
Einstellungen
ParameterBeschreibung
allStats Wenn auf 'True' gesetzt, werden alle verfügbaren Statistiken angefordert. Standard ist 'False'.
alpha Gibt das Signifikanzniveau für die Erstellung aller Konfidenzintervalle an. Standard ist 0.05. Der Wertebereich ist (0, 1).
casOut Gibt die Einstellungen für eine Ausgabetabelle an. Dies ist ein erforderlicher Parameter. Weitere Informationen zur Angabe des 'casOut'-Parameters finden Sie im allgemeinen Parameter 'casouttable (Form 1)' (Anhang A: Allgemeine Parameter).
cooksD Benennt die Cook's D-Einflussstatistik.
copyVars Gibt eine Liste von einer oder mehreren Variablen an, die von der Eingabetabelle in die Ausgabetabelle kopiert werden sollen. Sie können alternativ den Wert 'ALL' oder 'ALL_NUMERIC' angeben, wodurch alle Variablen bzw. alle numerischen Variablen aus der Eingabetabelle in die Ausgabetabelle kopiert werden.
covRatio Benennt den Standardeinfluss der Beobachtung auf die Kovarianz der Beta-Werte. Die COVRATIO-Statistik misst die Änderung der Determinante der Kovarianzmatrix der Schätzungen durch Löschen der i-ten Beobachtung.
dffits Benennt das skalierte Maß der Änderung des vorhergesagten Werts für die i-te Beobachtung und wird durch Löschen der i-ten Beobachtung berechnet. Ein großer Wert weist darauf hin, dass die Beobachtung in ihrer Umgebung des X-Raums sehr einflussreich ist.
display Gibt eine Liste von Ergebnistabellen an, die zur Anzeige an den Client gesendet werden sollen. Weitere Informationen zur Angabe des 'display'-Parameters finden Sie im allgemeinen Parameter 'displayTables' (Anhang A: Allgemeine Parameter).
fitData Wenn auf 'True' gesetzt, gibt an, dass die zu bewertenden Daten auch zum Anpassen des Modells verwendet wurden. Standard ist 'False'.
h Benennt den Hebel der Beobachtung.
lcl Benennt die Untergrenze eines Konfidenzintervalls für eine individuelle Vorhersage.
lclm Benennt die Untergrenze eines Konfidenzintervalls für den erwarteten Wert der abhängigen Variablen.
likeDist Benennt die Likelihood-Verschiebung.
outputTables Listet die Namen der Ergebnistabellen auf, die als CAS-Tabellen auf dem Server gespeichert werden sollen. Alias ist 'displayOut'. Weitere Informationen zur Angabe des 'outputTables'-Parameters finden Sie im allgemeinen Parameter 'outputTables' (Anhang A: Allgemeine Parameter).
pred Benennt den vorhergesagten Wert. Wenn Sie keine Ausgabestatistiken angeben, wird der vorhergesagte Wert standardmäßig als 'Pred' bezeichnet.
press Benennt das i-te Residuum geteilt durch 1 - h, wobei h der Hebel ist und das Modell ohne die i-te Beobachtung neu angepasst wurde.
resid Benennt das Residuum, berechnet als IST-Wert minus VORHERGESAGTER Wert.
restore Stellt Regressionsmodelle aus einem Binärobjekt (BLOB) wieder her. Dies ist ein erforderlicher Parameter. Die castable-Werte können 'caslib', 'dataSourceOptions', 'name' und 'whereTable' umfassen.
role Identifiziert die Trainings-, Validierungs- und Testrollen für die Beobachtungen.
rStudent Benennt das studentisierte Residuum, wobei die aktuelle Beobachtung gelöscht wurde.
stdi Benennt den Standardfehler des individuell vorhergesagten Werts.
stdp Benennt den Standardfehler des mittleren vorhergesagten Werts.
stdr Benennt den Standardfehler des Residuums.
student Benennt die studentisierten Residuen, welche die Residuen geteilt durch ihre Standardfehler sind.
table Gibt die Eingabedatentabelle an. Dies ist ein erforderlicher Parameter. Weitere Informationen zur Angabe des 'table'-Parameters finden Sie im allgemeinen Parameter 'castable (Form 1)' (Anhang A: Allgemeine Parameter).
ucl Benennt die Obergrenze eines Konfidenzintervalls für eine individuelle Vorhersage.
uclm Benennt die Obergrenze eines Konfidenzintervalls für den erwarteten Wert der abhängigen Variablen.
Beispiel für die Erstellung von Daten

In diesem Beispiel werden die Eingabedaten für die 'glmScore'-Aktion aus einem zuvor angepassten Modell und einer Tabelle mit Beobachtungen geladen.

Kopiert!
1 
2DATA mycas.input_data;
3INPUT Y X1 X2;
4DATALINES;
51 10 20 2 12 22 3 15 25 4 18 28 5 20 30 ;
6RUN;
7 
8PROC CAS;
9regression.glm / TABLE='input_data', model={depvar='Y', effects={'X1', 'X2'}}, store={name='glm_model', replace=true};
10 
11RUN;
12 
13QUIT;
14 

Beispiele

Dieses Beispiel zeigt die grundlegende Verwendung der 'glmScore'-Aktion, um Vorhersagen aus einem zuvor gespeicherten Modell zu generieren. Die Vorhersagen werden in einer neuen CAS-Tabelle gespeichert.

SAS® / CAS-Code Code wartet auf Validierung durch die Community
Kopiert!
1 
2PROC CAS;
3regression.glmScore / TABLE='input_data', restore={name='glm_model'}, casOut={name='scored_data', replace=true}, pred='PredictedY';
4 
5RUN;
6 
7QUIT;
8 
9PROC PRINT
10DATA=mycas.scored_data;
11 
12RUN;
13 
Ergebnis :
Eine neue CAS-Tabelle 'scored_data' wird erstellt, die die ursprünglichen Daten und eine neue Spalte 'PredictedY' mit den vorhergesagten Werten enthält.

Dieses Beispiel demonstriert die Generierung von Vorhersagen und mehreren Einflussstatistiken (z.B. Residuen, Studentisierte Residuen, Hebelwerte) aus einem angepassten Modell. Die Ergebnisse werden in einer neuen Tabelle gespeichert, und es wird der Signifikanzwert für Konfidenzintervalle angepasst.

SAS® / CAS-Code Code wartet auf Validierung durch die Community
Kopiert!
1 
2PROC CAS;
3regression.glmScore / TABLE='input_data', restore={name='glm_model'}, casOut={name='detailed_scored_data', replace=true}, pred='PredictedY', resid='Residuals', student='StudentResiduals', h='Leverage', alpha=0.10, allStats=true;
4 
5RUN;
6 
7QUIT;
8 
9PROC PRINT
10DATA=mycas.detailed_scored_data;
11 
12RUN;
13 
Ergebnis :
Eine neue CAS-Tabelle 'detailed_scored_data' wird erstellt, die die ursprünglichen Daten sowie Spalten für 'PredictedY', 'Residuals', 'StudentResiduals', 'Leverage' und weitere Statistiken enthält. Die Konfidenzintervalle werden mit einem Signifikanzniveau von 0.10 berechnet.

FAQ

Was ist die glmScore-Aktion?
Wie lautet die CASL-Syntax für die glmScore-Aktion?
Zusammenfassung der Eingabe- und Ausgabetabellen für glmScore?
Was ist der Parameter allStats?
Was ist der Parameter alpha?
Was ist der Parameter casOut?
Was ist der Parameter cooksD?
Was ist der Parameter copyVars?
Was ist der Parameter covRatio?
Was ist der Parameter dffits?
Was ist der Parameter display?
Was ist der Parameter fitData?
Was ist der Parameter h?
Was ist der Parameter lcl?
Was ist der Parameter lclm?
Was ist der Parameter likeDist?
Was ist der Parameter outputTables?
Was ist der Parameter pred?
Was ist der Parameter press?
Was ist der Parameter resid?
Was ist der Parameter restore?
Was ist der Parameter role?
Was ist der Parameter rStudent?
Was ist der Parameter stdi?
Was ist der Parameter stdp?
Was ist der Parameter stdr?
Was ist der Parameter student?
Was ist der Parameter table?
Was ist der Parameter ucl?
Was ist der Parameter uclm?