regression

glmScore

Beschreibung

Die 'glmScore'-Aktion erstellt auf dem Server eine Tabelle, die Ergebnisse der Bewertung von Beobachtungen mithilfe eines angepassten Modells enthält. Diese Aktion wird verwendet, um vorhergesagte Werte und verschiedene Einflussstatistiken aus einem zuvor angepassten verallgemeinerten linearen Modell (GLM) zu generieren. Sie bietet eine detaillierte Analyse der Modellleistung und der Einflussfaktoren einzelner Beobachtungen.

regression.glmScore <result=results> <status=rc> / allStats=TRUE | FALSE, alpha=double, casOut={caslib="string", compress=TRUE | FALSE, indexVars={"variable-name-1" <, "variable-name-2", ...>}, label="string", lifetime=64-bit-integer, maxMemSize=64-bit-integer, memoryFormat="DVR" | "INHERIT" | "STANDARD", name="table-name", promote=TRUE | FALSE, replace=TRUE | FALSE, replication=integer, tableRedistUpPolicy="DEFER" | "NOREDIST" | "REBALANCE", threadBlockSize=64-bit-integer, timeStamp="string", where={"string-1" <, "string-2", ...>}}, cooksD="string", copyVars="ALL" | "ALL_NUMERIC" | {"variable-name-1" <, "variable-name-2", ...>}, covRatio="string", dffits="string", display={caseSensitive=TRUE | FALSE, exclude=TRUE | FALSE, excludeAll=TRUE | FALSE, keyIsPath=TRUE | FALSE, names={"string-1" <, "string-2", ...>}, pathType="LABEL" | "NAME", traceNames=TRUE | FALSE}, fitData=TRUE | FALSE, h="string", lcl="string", lclm="string", likeDist="string", outputTables={groupByVarsRaw=TRUE | FALSE, includeAll=TRUE | FALSE, names={"string-1" <, "string-2", ...>} | {key-1={casouttable-1} <, key-2={casouttable-2}, ...>}, repeated=TRUE | FALSE, replace=TRUE | FALSE}, pred="string", press="string", resid="string", restore={caslib="string", dataSourceOptions={key-1=any-list-or-data-type-1 <, key-2=any-list-or-data-type-2, ...>}, name="table-name", whereTable={casLib="string", dataSourceOptions={adls_noreq-parameters | bigquery-parameters | cas_noreq-parameters | clouddex-parameters | db2-parameters | dnfs-parameters | esp-parameters | fedsvr-parameters | gcs_noreq-parameters | hadoop-parameters | hana-parameters | impala-parameters | informix-parameters | jdbc-parameters | mongodb-parameters | mysql-parameters | odbc-parameters | oracle-parameters | path-parameters | postgres-parameters | redshift-parameters | s3-parameters | sapiq-parameters | sforce-parameters | singlestore_standard-parameters | snowflake-parameters | spark-parameters | spde-parameters | sqlserver-parameters | ss_noreq-parameters | teradata-parameters | vertica-parameters | yellowbrick-parameters}, importOptions={fileType="ANY" | "AUDIO" | "AUTO" | "BASESAS" | "CSV" | "DELIMITED" | "DOCUMENT" | "DTA" | "ESP" | "EXCEL" | "FMT" | "HDAT" | "IMAGE" | "JMP" | "LASR" | "PARQUET" | "SOUND" | "SPSS" | "VIDEO" | "XLS", fileType-specific-parameters}, name="table-name", vars={{format="string", formattedLength=integer, label="string", name="variable-name", nfd=integer, nfl=integer}, {...}}, where="where-expression"}}, role="string", rStudent="string", stdi="string", stdp="string", stdr="string", student="string", table={caslib="string", computedOnDemand=TRUE | FALSE, computedVars={{format="string", formattedLength=integer, label="string", name="variable-name", nfd=integer, nfl=integer}, {...}}, computedVarsProgram="string", dataSourceOptions={key-1=any-list-or-data-type-1 <, key-2=any-list-or-data-type-2, ...>}, groupBy={{format="string", formattedLength=integer, label="string", name="variable-name", nfd=integer, nfl=integer}, {...}}, groupByMode="NOSORT" | "REDISTRIBUTE", importOptions={fileType="ANY" | "AUDIO" | "AUTO" | "BASESAS" | "CSV" | "DELIMITED" | "DOCUMENT" | "DTA" | "ESP" | "EXCEL" | "FMT" | "HDAT" | "IMAGE" | "JMP" | "LASR" | "PARQUET" | "SOUND" | "SPSS" | "VIDEO" | "XLS", fileType-specific-parameters}, name="table-name", orderBy={{format="string", formattedLength=integer, label="string", name="variable-name", nfd=integer, nfl=integer}, {...}}, singlePass=TRUE | FALSE, vars={{format="string", formattedLength=integer, label="string", name="variable-name", nfd=integer, nfl=integer}, {...}}, where="where-expression", whereTable={casLib="string", dataSourceOptions={adls_noreq-parameters | bigquery-parameters | cas_noreq-parameters | clouddex-parameters | db2-parameters | dnfs-parameters | esp-parameters | fedsvr-parameters | gcs_noreq-parameters | hadoop-parameters | hana-parameters | impala-parameters | informix-parameters | jdbc-parameters | mongodb-parameters | mysql-parameters | odbc-parameters | oracle-parameters | path-parameters | postgres-parameters | redshift-parameters | s3-parameters | sapiq-parameters | sforce-parameters | singlestore_standard-parameters | snowflake-parameters | spark-parameters | spde-parameters | sqlserver-parameters | ss_noreq-parameters | teradata-parameters | vertica-parameters | yellowbrick-parameters}, importOptions={fileType="ANY" | "AUDIO" | "AUTO" | "BASESAS" | "CSV" | "DELIMITED" | "DOCUMENT" | "DTA" | "ESP" | "EXCEL" | "FMT" | "HDAT" | "IMAGE" | "JMP" | "LASR" | "PARQUET" | "SOUND" | "SPSS" | "VIDEO" | "XLS", fileType-specific-parameters}, name="table-name", vars={{format="string", formattedLength=integer, label="string", name="variable-name", nfd=integer, nfl=integer}, {...}}, where="where-expression"}}, ucl="string", uclm="string";
Einstellungen
ParameterBeschreibung
allStatsWenn auf 'True' gesetzt, werden alle verfügbaren Statistiken angefordert. Standard ist 'False'.
alphaGibt das Signifikanzniveau für die Erstellung aller Konfidenzintervalle an. Standard ist 0.05. Der Wertebereich ist (0, 1).
casOutGibt die Einstellungen für eine Ausgabetabelle an. Dies ist ein erforderlicher Parameter. Weitere Informationen zur Angabe des 'casOut'-Parameters finden Sie im allgemeinen Parameter 'casouttable (Form 1)' (Anhang A: Allgemeine Parameter).
cooksDBenennt die Cook's D-Einflussstatistik.
copyVarsGibt eine Liste von einer oder mehreren Variablen an, die von der Eingabetabelle in die Ausgabetabelle kopiert werden sollen. Sie können alternativ den Wert 'ALL' oder 'ALL_NUMERIC' angeben, wodurch alle Variablen bzw. alle numerischen Variablen aus der Eingabetabelle in die Ausgabetabelle kopiert werden.
covRatioBenennt den Standardeinfluss der Beobachtung auf die Kovarianz der Beta-Werte. Die COVRATIO-Statistik misst die Änderung der Determinante der Kovarianzmatrix der Schätzungen durch Löschen der i-ten Beobachtung.
dffitsBenennt das skalierte Maß der Änderung des vorhergesagten Werts für die i-te Beobachtung und wird durch Löschen der i-ten Beobachtung berechnet. Ein großer Wert weist darauf hin, dass die Beobachtung in ihrer Umgebung des X-Raums sehr einflussreich ist.
displayGibt eine Liste von Ergebnistabellen an, die zur Anzeige an den Client gesendet werden sollen. Weitere Informationen zur Angabe des 'display'-Parameters finden Sie im allgemeinen Parameter 'displayTables' (Anhang A: Allgemeine Parameter).
fitDataWenn auf 'True' gesetzt, gibt an, dass die zu bewertenden Daten auch zum Anpassen des Modells verwendet wurden. Standard ist 'False'.
hBenennt den Hebel der Beobachtung.
lclBenennt die Untergrenze eines Konfidenzintervalls für eine individuelle Vorhersage.
lclmBenennt die Untergrenze eines Konfidenzintervalls für den erwarteten Wert der abhängigen Variablen.
likeDistBenennt die Likelihood-Verschiebung.
outputTablesListet die Namen der Ergebnistabellen auf, die als CAS-Tabellen auf dem Server gespeichert werden sollen. Alias ist 'displayOut'. Weitere Informationen zur Angabe des 'outputTables'-Parameters finden Sie im allgemeinen Parameter 'outputTables' (Anhang A: Allgemeine Parameter).
predBenennt den vorhergesagten Wert. Wenn Sie keine Ausgabestatistiken angeben, wird der vorhergesagte Wert standardmäßig als 'Pred' bezeichnet.
pressBenennt das i-te Residuum geteilt durch 1 - h, wobei h der Hebel ist und das Modell ohne die i-te Beobachtung neu angepasst wurde.
residBenennt das Residuum, berechnet als IST-Wert minus VORHERGESAGTER Wert.
restoreStellt Regressionsmodelle aus einem Binärobjekt (BLOB) wieder her. Dies ist ein erforderlicher Parameter. Die castable-Werte können 'caslib', 'dataSourceOptions', 'name' und 'whereTable' umfassen.
roleIdentifiziert die Trainings-, Validierungs- und Testrollen für die Beobachtungen.
rStudentBenennt das studentisierte Residuum, wobei die aktuelle Beobachtung gelöscht wurde.
stdiBenennt den Standardfehler des individuell vorhergesagten Werts.
stdpBenennt den Standardfehler des mittleren vorhergesagten Werts.
stdrBenennt den Standardfehler des Residuums.
studentBenennt die studentisierten Residuen, welche die Residuen geteilt durch ihre Standardfehler sind.
tableGibt die Eingabedatentabelle an. Dies ist ein erforderlicher Parameter. Weitere Informationen zur Angabe des 'table'-Parameters finden Sie im allgemeinen Parameter 'castable (Form 1)' (Anhang A: Allgemeine Parameter).
uclBenennt die Obergrenze eines Konfidenzintervalls für eine individuelle Vorhersage.
uclmBenennt die Obergrenze eines Konfidenzintervalls für den erwarteten Wert der abhängigen Variablen.
Beispiel für die Erstellung von Daten

In diesem Beispiel werden die Eingabedaten für die 'glmScore'-Aktion aus einem zuvor angepassten Modell und einer Tabelle mit Beobachtungen geladen.

Kopiert!
1 
2DATA mycas.input_data;
3INPUT Y X1 X2;
4DATALINES;
51 10 20 2 12 22 3 15 25 4 18 28 5 20 30 ;
6RUN;
7 
8PROC CAS;
9regression.glm / TABLE='input_data', model={depvar='Y', effects={'X1', 'X2'}}, store={name='glm_model', replace=true};
10 
11RUN;
12 
13QUIT;
14 

Beispiele

Dieses Beispiel zeigt die grundlegende Verwendung der 'glmScore'-Aktion, um Vorhersagen aus einem zuvor gespeicherten Modell zu generieren. Die Vorhersagen werden in einer neuen CAS-Tabelle gespeichert.

SAS® / CAS-Code Code wartet auf Validierung durch die Community
Kopiert!
1 
2PROC CAS;
3regression.glmScore / TABLE='input_data', restore={name='glm_model'}, casOut={name='scored_data', replace=true}, pred='PredictedY';
4 
5RUN;
6 
7QUIT;
8 
9PROC PRINT
10DATA=mycas.scored_data;
11 
12RUN;
13 
Ergebnis :
Eine neue CAS-Tabelle 'scored_data' wird erstellt, die die ursprünglichen Daten und eine neue Spalte 'PredictedY' mit den vorhergesagten Werten enthält.

Dieses Beispiel demonstriert die Generierung von Vorhersagen und mehreren Einflussstatistiken (z.B. Residuen, Studentisierte Residuen, Hebelwerte) aus einem angepassten Modell. Die Ergebnisse werden in einer neuen Tabelle gespeichert, und es wird der Signifikanzwert für Konfidenzintervalle angepasst.

SAS® / CAS-Code Code wartet auf Validierung durch die Community
Kopiert!
1 
2PROC CAS;
3regression.glmScore / TABLE='input_data', restore={name='glm_model'}, casOut={name='detailed_scored_data', replace=true}, pred='PredictedY', resid='Residuals', student='StudentResiduals', h='Leverage', alpha=0.10, allStats=true;
4 
5RUN;
6 
7QUIT;
8 
9PROC PRINT
10DATA=mycas.detailed_scored_data;
11 
12RUN;
13 
Ergebnis :
Eine neue CAS-Tabelle 'detailed_scored_data' wird erstellt, die die ursprünglichen Daten sowie Spalten für 'PredictedY', 'Residuals', 'StudentResiduals', 'Leverage' und weitere Statistiken enthält. Die Konfidenzintervalle werden mit einem Signifikanzniveau von 0.10 berechnet.

FAQ

Was ist die glmScore-Aktion?
Wie lautet die CASL-Syntax für die glmScore-Aktion?
Zusammenfassung der Eingabe- und Ausgabetabellen für glmScore?
Was ist der Parameter allStats?
Was ist der Parameter alpha?
Was ist der Parameter casOut?
Was ist der Parameter cooksD?
Was ist der Parameter copyVars?
Was ist der Parameter covRatio?
Was ist der Parameter dffits?
Was ist der Parameter display?
Was ist der Parameter fitData?
Was ist der Parameter h?
Was ist der Parameter lcl?
Was ist der Parameter lclm?
Was ist der Parameter likeDist?
Was ist der Parameter outputTables?
Was ist der Parameter pred?
Was ist der Parameter press?
Was ist der Parameter resid?
Was ist der Parameter restore?
Was ist der Parameter role?
Was ist der Parameter rStudent?
Was ist der Parameter stdi?
Was ist der Parameter stdp?
Was ist der Parameter stdr?
Was ist der Parameter student?
Was ist der Parameter table?
Was ist der Parameter ucl?
Was ist der Parameter uclm?