glmScore - WeAreCAS

Q: Was ist die glmScore-Aktion?

Die "glmScore Action" erstellt eine Tabelle auf dem Server, die Ergebnisse aus der Bewertung von Beobachtungen unter Verwendung eines angepassten Modells enthält.

Q: Zusammenfassung der Eingabe- und Ausgabetabellen für glmScore?

Eingabetabellen: * **restore**: Stellt Regressionsmodelle aus einem binären großen Objekt (BLOB) wieder her. * **table**: Gibt die Eingabedatentabelle an. Ausgabetabellen: * **casOut**: Gibt die Einstellungen für eine Ausgabetabelle an. * **outputTables**: Listet die Namen der Ergebnistabellen auf, die als CAS-Tabellen auf dem Server gespeichert werden sollen.

Q: Was ist der Parameter allStats?

Wenn auf "TRUE" gesetzt, werden alle verfügbaren Statistiken angefordert. Standard ist "FALSE".

Q: Was ist der Parameter alpha?

Gibt das Signifikanzniveau an, das für die Konstruktion aller Konfidenzintervalle verwendet werden soll. Standard ist 0.05. Der Bereich ist (0, 1).

Q: Was ist der Parameter casOut?

Gibt die Einstellungen für eine Ausgabetabelle an. Weitere Informationen zum Angeben des Parameters casOut finden Sie unter dem allgemeinen Parameter "casouttable (Form 1)" (Anhang A: Allgemeine Parameter).

Q: Was ist der Parameter copyVars?

Gibt eine Liste von einer oder mehreren Variablen an, die aus der Eingabetabelle in die Ausgabetabelle kopiert werden sollen. Sie können alternativ den Wert ALL oder ALL_NUMERIC angeben, der alle Variablen bzw. alle numerischen Variablen aus der Eingabetabelle in die Ausgabetabelle kopiert.

Beschreibung

Die 'glmScore'-Aktion erstellt auf dem Server eine Tabelle, die Ergebnisse der Bewertung von Beobachtungen mithilfe eines angepassten Modells enthält. Diese Aktion wird verwendet, um vorhergesagte Werte und verschiedene Einflussstatistiken aus einem zuvor angepassten verallgemeinerten linearen Modell (GLM) zu generieren. Sie bietet eine detaillierte Analyse der Modellleistung und der Einflussfaktoren einzelner Beobachtungen.

regression.glmScore <result=results> <status=rc> / allStats=TRUE | FALSE, alpha=double, casOut={caslib="string", compress=TRUE | FALSE, indexVars={"variable-name-1" <, "variable-name-2", ...>}, label="string", lifetime=64-bit-integer, maxMemSize=64-bit-integer, memoryFormat="DVR" | "INHERIT" | "STANDARD", name="table-name", promote=TRUE | FALSE, replace=TRUE | FALSE, replication=integer, tableRedistUpPolicy="DEFER" | "NOREDIST" | "REBALANCE", threadBlockSize=64-bit-integer, timeStamp="string", where={"string-1" <, "string-2", ...>}}, cooksD="string", copyVars="ALL" | "ALL_NUMERIC" | {"variable-name-1" <, "variable-name-2", ...>}, covRatio="string", dffits="string", display={caseSensitive=TRUE | FALSE, exclude=TRUE | FALSE, excludeAll=TRUE | FALSE, keyIsPath=TRUE | FALSE, names={"string-1" <, "string-2", ...>}, pathType="LABEL" | "NAME", traceNames=TRUE | FALSE}, fitData=TRUE | FALSE, h="string", lcl="string", lclm="string", likeDist="string", outputTables={groupByVarsRaw=TRUE | FALSE, includeAll=TRUE | FALSE, names={"string-1" <, "string-2", ...>} | {key-1={casouttable-1} <, key-2={casouttable-2}, ...>}, repeated=TRUE | FALSE, replace=TRUE | FALSE}, pred="string", press="string", resid="string", restore={caslib="string", dataSourceOptions={key-1=any-list-or-data-type-1 <, key-2=any-list-or-data-type-2, ...>}, name="table-name", whereTable={casLib="string", dataSourceOptions={adls_noreq-parameters | bigquery-parameters | cas_noreq-parameters | clouddex-parameters | db2-parameters | dnfs-parameters | esp-parameters | fedsvr-parameters | gcs_noreq-parameters | hadoop-parameters | hana-parameters | impala-parameters | informix-parameters | jdbc-parameters | mongodb-parameters | mysql-parameters | odbc-parameters | oracle-parameters | path-parameters | postgres-parameters | redshift-parameters | s3-parameters | sapiq-parameters | sforce-parameters | singlestore_standard-parameters | snowflake-parameters | spark-parameters | spde-parameters | sqlserver-parameters | ss_noreq-parameters | teradata-parameters | vertica-parameters | yellowbrick-parameters}, importOptions={fileType="ANY" | "AUDIO" | "AUTO" | "BASESAS" | "CSV" | "DELIMITED" | "DOCUMENT" | "DTA" | "ESP" | "EXCEL" | "FMT" | "HDAT" | "IMAGE" | "JMP" | "LASR" | "PARQUET" | "SOUND" | "SPSS" | "VIDEO" | "XLS", fileType-specific-parameters}, name="table-name", vars={{format="string", formattedLength=integer, label="string", name="variable-name", nfd=integer, nfl=integer}, {...}}, where="where-expression"}}, role="string", rStudent="string", stdi="string", stdp="string", stdr="string", student="string", table={caslib="string", computedOnDemand=TRUE | FALSE, computedVars={{format="string", formattedLength=integer, label="string", name="variable-name", nfd=integer, nfl=integer}, {...}}, computedVarsProgram="string", dataSourceOptions={key-1=any-list-or-data-type-1 <, key-2=any-list-or-data-type-2, ...>}, groupBy={{format="string", formattedLength=integer, label="string", name="variable-name", nfd=integer, nfl=integer}, {...}}, groupByMode="NOSORT" | "REDISTRIBUTE", importOptions={fileType="ANY" | "AUDIO" | "AUTO" | "BASESAS" | "CSV" | "DELIMITED" | "DOCUMENT" | "DTA" | "ESP" | "EXCEL" | "FMT" | "HDAT" | "IMAGE" | "JMP" | "LASR" | "PARQUET" | "SOUND" | "SPSS" | "VIDEO" | "XLS", fileType-specific-parameters}, name="table-name", orderBy={{format="string", formattedLength=integer, label="string", name="variable-name", nfd=integer, nfl=integer}, {...}}, singlePass=TRUE | FALSE, vars={{format="string", formattedLength=integer, label="string", name="variable-name", nfd=integer, nfl=integer}, {...}}, where="where-expression", whereTable={casLib="string", dataSourceOptions={adls_noreq-parameters | bigquery-parameters | cas_noreq-parameters | clouddex-parameters | db2-parameters | dnfs-parameters | esp-parameters | fedsvr-parameters | gcs_noreq-parameters | hadoop-parameters | hana-parameters | impala-parameters | informix-parameters | jdbc-parameters | mongodb-parameters | mysql-parameters | odbc-parameters | oracle-parameters | path-parameters | postgres-parameters | redshift-parameters | s3-parameters | sapiq-parameters | sforce-parameters | singlestore_standard-parameters | snowflake-parameters | spark-parameters | spde-parameters | sqlserver-parameters | ss_noreq-parameters | teradata-parameters | vertica-parameters | yellowbrick-parameters}, importOptions={fileType="ANY" | "AUDIO" | "AUTO" | "BASESAS" | "CSV" | "DELIMITED" | "DOCUMENT" | "DTA" | "ESP" | "EXCEL" | "FMT" | "HDAT" | "IMAGE" | "JMP" | "LASR" | "PARQUET" | "SOUND" | "SPSS" | "VIDEO" | "XLS", fileType-specific-parameters}, name="table-name", vars={{format="string", formattedLength=integer, label="string", name="variable-name", nfd=integer, nfl=integer}, {...}}, where="where-expression"}}, ucl="string", uclm="string";

Einstellungen

Parameter	Beschreibung
allStats	Wenn auf 'True' gesetzt, werden alle verfügbaren Statistiken angefordert. Standard ist 'False'.
alpha	Gibt das Signifikanzniveau für die Erstellung aller Konfidenzintervalle an. Standard ist 0.05. Der Wertebereich ist (0, 1).
casOut	Gibt die Einstellungen für eine Ausgabetabelle an. Dies ist ein erforderlicher Parameter. Weitere Informationen zur Angabe des 'casOut'-Parameters finden Sie im allgemeinen Parameter 'casouttable (Form 1)' (Anhang A: Allgemeine Parameter).
cooksD	Benennt die Cook's D-Einflussstatistik.
copyVars	Gibt eine Liste von einer oder mehreren Variablen an, die von der Eingabetabelle in die Ausgabetabelle kopiert werden sollen. Sie können alternativ den Wert 'ALL' oder 'ALL_NUMERIC' angeben, wodurch alle Variablen bzw. alle numerischen Variablen aus der Eingabetabelle in die Ausgabetabelle kopiert werden.
covRatio	Benennt den Standardeinfluss der Beobachtung auf die Kovarianz der Beta-Werte. Die COVRATIO-Statistik misst die Änderung der Determinante der Kovarianzmatrix der Schätzungen durch Löschen der i-ten Beobachtung.
dffits	Benennt das skalierte Maß der Änderung des vorhergesagten Werts für die i-te Beobachtung und wird durch Löschen der i-ten Beobachtung berechnet. Ein großer Wert weist darauf hin, dass die Beobachtung in ihrer Umgebung des X-Raums sehr einflussreich ist.
display	Gibt eine Liste von Ergebnistabellen an, die zur Anzeige an den Client gesendet werden sollen. Weitere Informationen zur Angabe des 'display'-Parameters finden Sie im allgemeinen Parameter 'displayTables' (Anhang A: Allgemeine Parameter).
fitData	Wenn auf 'True' gesetzt, gibt an, dass die zu bewertenden Daten auch zum Anpassen des Modells verwendet wurden. Standard ist 'False'.
h	Benennt den Hebel der Beobachtung.
lcl	Benennt die Untergrenze eines Konfidenzintervalls für eine individuelle Vorhersage.
lclm	Benennt die Untergrenze eines Konfidenzintervalls für den erwarteten Wert der abhängigen Variablen.
likeDist	Benennt die Likelihood-Verschiebung.
outputTables	Listet die Namen der Ergebnistabellen auf, die als CAS-Tabellen auf dem Server gespeichert werden sollen. Alias ist 'displayOut'. Weitere Informationen zur Angabe des 'outputTables'-Parameters finden Sie im allgemeinen Parameter 'outputTables' (Anhang A: Allgemeine Parameter).
pred	Benennt den vorhergesagten Wert. Wenn Sie keine Ausgabestatistiken angeben, wird der vorhergesagte Wert standardmäßig als 'Pred' bezeichnet.
press	Benennt das i-te Residuum geteilt durch 1 - h, wobei h der Hebel ist und das Modell ohne die i-te Beobachtung neu angepasst wurde.
resid	Benennt das Residuum, berechnet als IST-Wert minus VORHERGESAGTER Wert.
restore	Stellt Regressionsmodelle aus einem Binärobjekt (BLOB) wieder her. Dies ist ein erforderlicher Parameter. Die castable-Werte können 'caslib', 'dataSourceOptions', 'name' und 'whereTable' umfassen.
role	Identifiziert die Trainings-, Validierungs- und Testrollen für die Beobachtungen.
rStudent	Benennt das studentisierte Residuum, wobei die aktuelle Beobachtung gelöscht wurde.
stdi	Benennt den Standardfehler des individuell vorhergesagten Werts.
stdp	Benennt den Standardfehler des mittleren vorhergesagten Werts.
stdr	Benennt den Standardfehler des Residuums.
student	Benennt die studentisierten Residuen, welche die Residuen geteilt durch ihre Standardfehler sind.
table	Gibt die Eingabedatentabelle an. Dies ist ein erforderlicher Parameter. Weitere Informationen zur Angabe des 'table'-Parameters finden Sie im allgemeinen Parameter 'castable (Form 1)' (Anhang A: Allgemeine Parameter).
ucl	Benennt die Obergrenze eines Konfidenzintervalls für eine individuelle Vorhersage.
uclm	Benennt die Obergrenze eines Konfidenzintervalls für den erwarteten Wert der abhängigen Variablen.

Datenaufbereitung Datenaufbereitungsblatt ansehen

Beispiel für die Erstellung von Daten

In diesem Beispiel werden die Eingabedaten für die 'glmScore'-Aktion aus einem zuvor angepassten Modell und einer Tabelle mit Beobachtungen geladen.

Kopiert!

1
2	DATA mycas.input_data;
3	INPUT Y X1 X2;
4	DATALINES;
5	1 10 20 2 12 22 3 15 25 4 18 28 5 20 30 ;
6	RUN;
7
8	PROC CAS;
9	regression.glm / TABLE='input_data', model={depvar='Y', effects={'X1', 'X2'}}, store={name='glm_model', replace=true};
10
11	RUN;
12
13	QUIT;
14

Beispiele

Dieses Beispiel zeigt die grundlegende Verwendung der 'glmScore'-Aktion, um Vorhersagen aus einem zuvor gespeicherten Modell zu generieren. Die Vorhersagen werden in einer neuen CAS-Tabelle gespeichert.

SAS® / CAS-Code Code wartet auf Validierung durch die Community

Kopiert!

1
2	PROC CAS;
3	regression.glmScore / TABLE='input_data', restore={name='glm_model'}, casOut={name='scored_data', replace=true}, pred='PredictedY';
4
5	RUN;
6
7	QUIT;
8
9	PROC PRINT
10	DATA=mycas.scored_data;
11
12	RUN;
13

Ergebnis :
Eine neue CAS-Tabelle 'scored_data' wird erstellt, die die ursprünglichen Daten und eine neue Spalte 'PredictedY' mit den vorhergesagten Werten enthält.

Dieses Beispiel demonstriert die Generierung von Vorhersagen und mehreren Einflussstatistiken (z.B. Residuen, Studentisierte Residuen, Hebelwerte) aus einem angepassten Modell. Die Ergebnisse werden in einer neuen Tabelle gespeichert, und es wird der Signifikanzwert für Konfidenzintervalle angepasst.

SAS® / CAS-Code Code wartet auf Validierung durch die Community

Kopiert!

1
2	PROC CAS;
3	regression.glmScore / TABLE='input_data', restore={name='glm_model'}, casOut={name='detailed_scored_data', replace=true}, pred='PredictedY', resid='Residuals', student='StudentResiduals', h='Leverage', alpha=0.10, allStats=true;
4
5	RUN;
6
7	QUIT;
8
9	PROC PRINT
10	DATA=mycas.detailed_scored_data;
11
12	RUN;
13

Ergebnis :
Eine neue CAS-Tabelle 'detailed_scored_data' wird erstellt, die die ursprünglichen Daten sowie Spalten für 'PredictedY', 'Residuals', 'StudentResiduals', 'Leverage' und weitere Statistiken enthält. Die Konfidenzintervalle werden mit einem Signifikanzniveau von 0.10 berechnet.

FAQ

Was ist die glmScore-Aktion?

Wie lautet die CASL-Syntax für die glmScore-Aktion?

Zusammenfassung der Eingabe- und Ausgabetabellen für glmScore?

Was ist der Parameter allStats?

Was ist der Parameter alpha?

Was ist der Parameter casOut?

Was ist der Parameter cooksD?

Was ist der Parameter copyVars?

Was ist der Parameter covRatio?

Was ist der Parameter dffits?

Was ist der Parameter display?

Was ist der Parameter fitData?

Was ist der Parameter h?

Was ist der Parameter lcl?

Was ist der Parameter lclm?

Was ist der Parameter likeDist?

Was ist der Parameter outputTables?

Was ist der Parameter pred?

Was ist der Parameter press?

Was ist der Parameter resid?

Was ist der Parameter restore?

Was ist der Parameter role?

Was ist der Parameter rStudent?

Was ist der Parameter stdi?

Was ist der Parameter stdp?

Was ist der Parameter stdr?

Was ist der Parameter student?

Was ist der Parameter table?

Was ist der Parameter ucl?

Was ist der Parameter uclm?

Actions associées

regression

genmodScore

Erstellt eine Tabelle auf dem Server, die Ergebnisse der Bewertung von Beobac...

regression

glm

Diese Aktion passt lineare Regressionsmodelle mithilfe der Methode der kleins...

regression

logisticAssociation

Berechnet Rangkorrelationsindizes zwischen vorhergesagten Wahrscheinlichkeite...

regression

logisticCode

Schreibt SAS DATA-Schritt-Code zur Berechnung der vorhergesagten Werte des an...

regression

logisticLackfit

Berechnet den Hosmer-Lemeshow-Anpassungstest für ein logistisches Regressions...

regression

logisticOddsRatio

Erstellt eine Tabelle, die Subpopulationen mithilfe von Odds Ratios vergleich...

Inhaltsverzeichnis

Beschreibung

Beispiel für die Erstellung von Daten

Beispiele

Einfache Anwendung der glmScore-Aktion

Detaillierte Analyse mit glmScore und zusätzlichen Statistiken

FAQ

Actions associées

genmodScore

glm

logisticAssociation

logisticCode

logisticLackfit

logisticOddsRatio