regression

glmScore

Descripción

La acción `glmScore` crea una tabla en el servidor que contiene los resultados de la puntuación de las observaciones utilizando un modelo ajustado. Es parte del conjunto de acciones de Regresión en SAS Visual Statistics.

regression.glmScore <result=results> <status=rc> / allStats=TRUE | FALSE, alpha=double, casOut={ caslib="string", compress=TRUE | FALSE, indexVars={"variable-name-1" <, "variable-name-2", ...>}, label="string", lifetime=64-bit-integer, maxMemSize=64-bit-integer, memoryFormat="DVR" | "INHERIT" | "STANDARD", name="table-name", promote=TRUE | FALSE, replace=TRUE | FALSE, replication=integer, tableRedistUpPolicy="DEFER" | "NOREDIST" | "REBALANCE", threadBlockSize=64-bit-integer, timeStamp="string", where={"string-1" <, "string-2", ...>} }, cooksD="string", copyVars="ALL" | "ALL_NUMERIC" | {"variable-name-1" <, "variable-name-2", ...>}, covRatio="string", dffits="string", display={ caseSensitive=TRUE | FALSE, exclude=TRUE | FALSE, excludeAll=TRUE | FALSE, keyIsPath=TRUE | FALSE, names={"string-1" <, "string-2", ...>}, pathType="LABEL" | "NAME", traceNames=TRUE | FALSE }, fitData=TRUE | FALSE, h="string", lcl="string", lclm="string", likeDist="string", outputTables={ groupByVarsRaw=TRUE | FALSE, includeAll=TRUE | FALSE, names={ "string-1" <, "string-2", ...> } | { key-1={casouttable-1} <, key-2={casouttable-2}, ...> }, repeated=TRUE | FALSE, replace=TRUE | FALSE }, pred="string", press="string", resid="string", restore={ caslib="string", dataSourceOptions={key-1=any-list-or-data-type-1 <, key-2=any-list-or-data-type-2, ...>}, name="table-name", whereTable={ casLib="string", dataSourceOptions=adls_noreq-parameters | bigquery-parameters | cas_noreq-parameters | clouddex-parameters | db2-parameters | dnfs-parameters | esp-parameters | fedsvr-parameters | gcs_noreq-parameters | hadoop-parameters | hana-parameters | impala-parameters | informix-parameters | jdbc-parameters | mongodb-parameters | mysql-parameters | odbc-parameters | oracle-parameters | path-parameters | postgres-parameters | redshift-parameters | s3-parameters | sapiq-parameters | sforce-parameters | singlestore_standard-parameters | snowflake-parameters | spark-parameters | spde-parameters | sqlserver-parameters | ss_noreq-parameters | teradata-parameters | vertica-parameters | yellowbrick-parameters, importOptions={ fileType="ANY" | "AUDIO" | "AUTO" | "BASESAS" | "CSV" | "DELIMITED" | "DOCUMENT" | "DTA" | "ESP" | "EXCEL" | "FMT" | "HDAT" | "IMAGE" | "JMP" | "LASR" | "PARQUET" | "SOUND" | "SPSS" | "VIDEO" | "XLS", fileType-specific-parameters }, name="table-name", vars={{format="string", formattedLength=integer, label="string", name="variable-name", nfd=integer, nfl=integer} <, {...}>}, where="where-expression" } }, role="string", rStudent="string", stdi="string", stdp="string", stdr="string", student="string", table={ caslib="string", computedOnDemand=TRUE | FALSE, computedVars={{format="string", formattedLength=integer, label="string", name="variable-name", nfd=integer, nfl=integer} <, {...}>}, computedVarsProgram="string", dataSourceOptions={key-1=any-list-or-data-type-1 <, key-2=any-list-or-data-type-2, ...>}, groupBy={{format="string", formattedLength=integer, label="string", name="variable-name", nfd=integer, nfl=integer} <, {...}>}, groupByMode="NOSORT" | "REDISTRIBUTE", importOptions={ fileType="ANY" | "AUDIO" | "AUTO" | "BASESAS" | "CSV" | "DELIMITED" | "DOCUMENT" | "DTA" | "ESP" | "EXCEL" | "FMT" | "HDAT" | "IMAGE" | "JMP" | "LASR" | "PARQUET" | "SOUND" | "SPSS" | "VIDEO" | "XLS", fileType-specific-parameters }, name="table-name", orderBy={{format="string", formattedLength=integer, label="string", name="variable-name", nfd=integer, nfl=integer} <, {...}>}, singlePass=TRUE | FALSE, vars={{format="string", formattedLength=integer, label="string", name="variable-name", nfd=integer, nfl=integer} <, {...}>}, where="where-expression", whereTable={ casLib="string", dataSourceOptions=adls_noreq-parameters | bigquery-parameters | cas_noreq-parameters | clouddex-parameters | db2-parameters | dnfs-parameters | esp-parameters | fedsvr-parameters | gcs_noreq-parameters | hadoop-parameters | hana-parameters | impala-parameters | informix-parameters | jdbc-parameters | mongodb-parameters | mysql-parameters | odbc-parameters | oracle-parameters | path-parameters | postgres-parameters | redshift-parameters | s3-parameters | sapiq-parameters | sforce-parameters | singlestore_standard-parameters | snowflake-parameters | spark-parameters | spde-parameters | sqlserver-parameters | ss_noreq-parameters | teradata-parameters | vertica-parameters | yellowbrick-parameters, importOptions={ fileType="ANY" | "AUDIO" | "AUTO" | "BASESAS" | "CSV" | "DELIMITED" | "DOCUMENT" | "DTA" | "ESP" | "EXCEL" | "FMT" | "HDAT" | "IMAGE" | "JMP" | "LASR" | "PARQUET" | "SOUND" | "SPSS" | "VIDEO" | "XLS", fileType-specific-parameters }, name="table-name", vars={{format="string", formattedLength=integer, label="string", name="variable-name", nfd=integer, nfl=integer} <, {...}>}, where="where-expression" } }, ucl="string", uclm="string" );
Parámetros
ParámetroDescripción
allStats Cuando se establece en 'TRUE', solicita todas las estadísticas disponibles. El valor predeterminado es 'FALSE'.
alpha Especifica el nivel de significancia para la construcción de todos los intervalos de confianza. El valor predeterminado es 0.05 y el rango es (0, 1).
casOut Especifica la configuración para una tabla de salida. Para obtener más información, consulte el parámetro común 'casouttable' (Formulario 1) en el Apéndice A: Parámetros Comunes. Este es un parámetro requerido.
cooksD Asigna un nombre a la estadística de influencia D de Cook.
copyVars Especifica una lista de una o más variables para copiar de la tabla de entrada a la tabla de salida. Alternativamente, puede especificar el valor 'ALL' (todas las variables) o 'ALL_NUMERIC' (todas las variables numéricas).
covRatio Asigna un nombre a la influencia estándar de la observación sobre la covarianza de los coeficientes (betas). La estadística 'COVRATIO' mide el cambio en el determinante de la matriz de covarianza de las estimaciones al eliminar la i-ésima observación.
dffits Asigna un nombre a la medida escalada del cambio en el valor predicho para la i-ésima observación, calculada al eliminar la i-ésima observación. Un valor grande indica que la observación es muy influyente en su vecindad del espacio X.
display Especifica una lista de tablas de resultados para enviar al cliente para su visualización. Para obtener más información, consulte el parámetro común 'displayTables' en el Apéndice A: Parámetros Comunes.
fitData Cuando se establece en 'TRUE', especifica que los datos a puntuar también se utilizaron para ajustar el modelo. El valor predeterminado es 'FALSE'.
h Asigna un nombre al apalancamiento de la observación.
lcl Asigna un nombre al límite inferior de un intervalo de confianza para una predicción individual.
lclm Asigna un nombre al límite inferior de un intervalo de confianza para el valor esperado de la variable dependiente.
likeDist Asigna un nombre al desplazamiento de la verosimilitud.
outputTables Enumera los nombres de las tablas de resultados para guardar como tablas CAS en el servidor. Para obtener más información, consulte el parámetro común 'outputTables' en el Apéndice A: Parámetros Comunes. También conocido como 'displayOut'.
pred Asigna un nombre al valor predicho. Si no especifica ninguna estadística de salida, el valor predicho se denomina 'Pred' por defecto.
press Asigna un nombre al i-ésimo residuo dividido por 1 - h, donde h es el apalancamiento, y donde el modelo se ha reajustado sin la i-ésima observación.
resid Asigna un nombre al residuo, calculado como REAL menos PREDECIDO.
restore Restaura modelos de regresión desde un objeto binario grande (BLOB). Este es un parámetro requerido.
role Identifica los roles de entrenamiento, validación y prueba para las observaciones.
rStudent Asigna un nombre al residuo estudentizado con la observación actual eliminada.
stdi Asigna un nombre al error estándar del valor predicho individual.
stdp Asigna un nombre al error estándar del valor predicho medio.
stdr Asigna un nombre al error estándar del residuo.
student Asigna un nombre a los residuos estudentizados, que son los residuos divididos por sus errores estándar.
table Especifica la tabla de datos de entrada. Para obtener más información, consulte el parámetro común 'castable' (Formulario 1) en el Apéndice A: Parámetros Comunes. Este es un parámetro requerido.
ucl Asigna un nombre al límite superior de un intervalo de confianza para una predicción individual.
uclm Asigna un nombre al límite superior de un intervalo de confianza para el valor esperado de la variable dependiente.
Creación de datos para el ejemplo

Crea una tabla en memoria llamada 'sData' con variables numéricas 'x', 'y' y una variable categórica 'c'.

¡Copiado!
1DATA sData;
2 INPUT x y c$;
3 DATALINES;
41 2 A
52 4 B
63 6 A
74 8 B
85 10 A
96 12 B
10;
11RUN;
12 
13PROC CAS;
14 upload caslib="casuser" path="sData.sas7bdat" out="sData" promote;
15QUIT;

Ejemplos

Este ejemplo muestra cómo usar `glmScore` para generar valores predichos a partir de un modelo GLM previamente ajustado y guardarlos en una nueva tabla.

Código SAS® / CAS Código en espera de validación por la comunidad
¡Copiado!
1PROC CAS;
2 /* Ajustar un modelo GLM */
3 regression.glm(
4 TABLE={name='sData'},
5 model={depvar='y', effects={'x', 'c'}},
6 OUTPUT={casOut={name='glm_model', replace=true}, copyVars='ALL'}
7 );
8 
9 /* Puntuar el modelo y guardar las predicciones */
10 regression.glmScore(
11 TABLE={name='sData'},
12 restore={name='glm_model'},
13 casOut={name='scored_sData', replace=true},
14 pred='predicted_y'
15 );
16 
17 /* Mostrar los resultados de la puntuación */
18 PRINT casOut.name='scored_sData';
19QUIT;
Resultado :
Se crea una nueva tabla 'scored_sData' que contiene los datos originales y una nueva columna 'predicted_y' con los valores predichos por el modelo GLM.

Este ejemplo demuestra cómo usar `glmScore` para obtener todas las estadísticas de influencia (Cook's D, CovRatio, Dffits, etc.), así como los límites de confianza y los errores estándar para las predicciones. También se copian todas las variables numéricas a la tabla de salida.

Código SAS® / CAS Código en espera de validación por la comunidad
¡Copiado!
1PROC CAS;
2 /* Ajustar un modelo GLM */
3 regression.glm(
4 TABLE={name='sData'},
5 model={depvar='y', effects={'x', 'c'}},
6 OUTPUT={casOut={name='glm_model_full', replace=true}, copyVars='ALL'}
7 );
8 
9 /* Puntuar el modelo y guardar las predicciones con todas las estadísticas */
10 regression.glmScore(
11 TABLE={name='sData'},
12 restore={name='glm_model_full'},
13 casOut={name='scored_sData_full', replace=true},
14 allStats=true,
15 pred='predicted_y',
16 lcl='lower_cl',
17 ucl='upper_cl',
18 lclm='lower_cl_mean',
19 uclm='upper_cl_mean',
20 stdi='std_err_indiv',
21 stdp='std_err_mean',
22 stdr='std_err_resid',
23 student='studentized_resid',
24 cooksD='cooks_d_val',
25 covRatio='cov_ratio_val',
26 dffits='dffits_val',
27 h='leverage_val',
28 likeDist='like_dist_val',
29 press='press_val',
30 resid='residual_val',
31 copyVars='ALL_NUMERIC'
32 );
33 
34 /* Mostrar las primeras filas de la tabla de salida para verificar las nuevas columnas */
35 TABLE.fetch(
36 TABLE={name='scored_sData_full'},
37 to=5
38 );
39QUIT;
Resultado :
Se crea una tabla 'scored_sData_full' que incluye los datos originales, la predicción 'predicted_y' y una serie de columnas adicionales con las estadísticas de influencia y los intervalos de confianza (lcl, ucl, lclm, uclm, stdi, stdp, stdr, student, cooksD, covRatio, dffits, h, likeDist, press, resid). Todas las variables numéricas de la tabla de entrada se copian a la tabla de salida.

FAQ

¿Qué hace el parámetro "allStats"?
¿Qué especifica el parámetro "alpha"?
¿Para qué se utiliza el parámetro "casOut"?
¿Qué nombra el parámetro "cooksD"?
¿Qué hace el parámetro "copyVars"?
¿Qué nombra el parámetro "covRatio"?
¿Qué nombra el parámetro "dffits"?
¿Qué especifica el parámetro "display"?
¿Qué hace el parámetro "fitData"?
¿Qué nombra el parámetro "h"?
¿Qué nombra el parámetro "lcl"?
¿Qué nombra el parámetro "lclm"?
¿Qué nombra el parámetro "likeDist"?
¿Para qué se utiliza el parámetro "outputTables"?
¿Qué nombra el parámetro "pred"?
¿Qué nombra el parámetro "press"?
¿Qué nombra el parámetro "resid"?
¿Para qué se utiliza el parámetro "restore"?
¿Qué especifica "caslib" dentro de "restore"?
¿Qué especifica "dataSourceOptions" dentro de "restore"?
¿Qué especifica "name" dentro de "restore"?
¿Qué especifica "whereTable" dentro de "restore"?
¿Qué especifica "casLib" dentro de "whereTable" (que está dentro de "restore")?
¿Qué especifica "dataSourceOptions" dentro de "whereTable" (que está dentro de "restore")?
¿Qué especifica "importOptions" dentro de "whereTable" (que está dentro de "restore")?
¿Qué especifica "name" dentro de "whereTable" (que está dentro de "restore")?
¿Qué especifica "vars" dentro de "whereTable" (que está dentro de "restore")?
¿Qué especifica "where" dentro de "whereTable" (que está dentro de "restore")?
¿Qué hace el parámetro "role"?
¿Qué nombra el parámetro "rStudent"?
¿Qué nombra el parámetro "stdi"?
¿Qué nombra el parámetro "stdp"?
¿Qué nombra el parámetro "stdr"?
¿Qué nombra el parámetro "student"?
¿Para qué se utiliza el parámetro "table"?
¿Qué nombra el parámetro "ucl"?
¿Qué nombra el parámetro "uclm"?