regression

glmScore

Descripción

La acción `glmScore` crea una tabla en el servidor que contiene los resultados de la puntuación de las observaciones utilizando un modelo ajustado. Es parte del conjunto de acciones de Regresión en SAS Visual Statistics.

regression.glmScore <result=results> <status=rc> / allStats=TRUE | FALSE, alpha=double, casOut={ caslib="string", compress=TRUE | FALSE, indexVars={"variable-name-1" <, "variable-name-2", ...>}, label="string", lifetime=64-bit-integer, maxMemSize=64-bit-integer, memoryFormat="DVR" | "INHERIT" | "STANDARD", name="table-name", promote=TRUE | FALSE, replace=TRUE | FALSE, replication=integer, tableRedistUpPolicy="DEFER" | "NOREDIST" | "REBALANCE", threadBlockSize=64-bit-integer, timeStamp="string", where={"string-1" <, "string-2", ...>} }, cooksD="string", copyVars="ALL" | "ALL_NUMERIC" | {"variable-name-1" <, "variable-name-2", ...>}, covRatio="string", dffits="string", display={ caseSensitive=TRUE | FALSE, exclude=TRUE | FALSE, excludeAll=TRUE | FALSE, keyIsPath=TRUE | FALSE, names={"string-1" <, "string-2", ...>}, pathType="LABEL" | "NAME", traceNames=TRUE | FALSE }, fitData=TRUE | FALSE, h="string", lcl="string", lclm="string", likeDist="string", outputTables={ groupByVarsRaw=TRUE | FALSE, includeAll=TRUE | FALSE, names={ "string-1" <, "string-2", ...> } | { key-1={casouttable-1} <, key-2={casouttable-2}, ...> }, repeated=TRUE | FALSE, replace=TRUE | FALSE }, pred="string", press="string", resid="string", restore={ caslib="string", dataSourceOptions={key-1=any-list-or-data-type-1 <, key-2=any-list-or-data-type-2, ...>}, name="table-name", whereTable={ casLib="string", dataSourceOptions=adls_noreq-parameters | bigquery-parameters | cas_noreq-parameters | clouddex-parameters | db2-parameters | dnfs-parameters | esp-parameters | fedsvr-parameters | gcs_noreq-parameters | hadoop-parameters | hana-parameters | impala-parameters | informix-parameters | jdbc-parameters | mongodb-parameters | mysql-parameters | odbc-parameters | oracle-parameters | path-parameters | postgres-parameters | redshift-parameters | s3-parameters | sapiq-parameters | sforce-parameters | singlestore_standard-parameters | snowflake-parameters | spark-parameters | spde-parameters | sqlserver-parameters | ss_noreq-parameters | teradata-parameters | vertica-parameters | yellowbrick-parameters, importOptions={ fileType="ANY" | "AUDIO" | "AUTO" | "BASESAS" | "CSV" | "DELIMITED" | "DOCUMENT" | "DTA" | "ESP" | "EXCEL" | "FMT" | "HDAT" | "IMAGE" | "JMP" | "LASR" | "PARQUET" | "SOUND" | "SPSS" | "VIDEO" | "XLS", fileType-specific-parameters }, name="table-name", vars={{format="string", formattedLength=integer, label="string", name="variable-name", nfd=integer, nfl=integer} <, {...}>}, where="where-expression" } }, role="string", rStudent="string", stdi="string", stdp="string", stdr="string", student="string", table={ caslib="string", computedOnDemand=TRUE | FALSE, computedVars={{format="string", formattedLength=integer, label="string", name="variable-name", nfd=integer, nfl=integer} <, {...}>}, computedVarsProgram="string", dataSourceOptions={key-1=any-list-or-data-type-1 <, key-2=any-list-or-data-type-2, ...>}, groupBy={{format="string", formattedLength=integer, label="string", name="variable-name", nfd=integer, nfl=integer} <, {...}>}, groupByMode="NOSORT" | "REDISTRIBUTE", importOptions={ fileType="ANY" | "AUDIO" | "AUTO" | "BASESAS" | "CSV" | "DELIMITED" | "DOCUMENT" | "DTA" | "ESP" | "EXCEL" | "FMT" | "HDAT" | "IMAGE" | "JMP" | "LASR" | "PARQUET" | "SOUND" | "SPSS" | "VIDEO" | "XLS", fileType-specific-parameters }, name="table-name", orderBy={{format="string", formattedLength=integer, label="string", name="variable-name", nfd=integer, nfl=integer} <, {...}>}, singlePass=TRUE | FALSE, vars={{format="string", formattedLength=integer, label="string", name="variable-name", nfd=integer, nfl=integer} <, {...}>}, where="where-expression", whereTable={ casLib="string", dataSourceOptions=adls_noreq-parameters | bigquery-parameters | cas_noreq-parameters | clouddex-parameters | db2-parameters | dnfs-parameters | esp-parameters | fedsvr-parameters | gcs_noreq-parameters | hadoop-parameters | hana-parameters | impala-parameters | informix-parameters | jdbc-parameters | mongodb-parameters | mysql-parameters | odbc-parameters | oracle-parameters | path-parameters | postgres-parameters | redshift-parameters | s3-parameters | sapiq-parameters | sforce-parameters | singlestore_standard-parameters | snowflake-parameters | spark-parameters | spde-parameters | sqlserver-parameters | ss_noreq-parameters | teradata-parameters | vertica-parameters | yellowbrick-parameters, importOptions={ fileType="ANY" | "AUDIO" | "AUTO" | "BASESAS" | "CSV" | "DELIMITED" | "DOCUMENT" | "DTA" | "ESP" | "EXCEL" | "FMT" | "HDAT" | "IMAGE" | "JMP" | "LASR" | "PARQUET" | "SOUND" | "SPSS" | "VIDEO" | "XLS", fileType-specific-parameters }, name="table-name", vars={{format="string", formattedLength=integer, label="string", name="variable-name", nfd=integer, nfl=integer} <, {...}>}, where="where-expression" } }, ucl="string", uclm="string" );
Parámetros
ParámetroDescripción
allStatsCuando se establece en 'TRUE', solicita todas las estadísticas disponibles. El valor predeterminado es 'FALSE'.
alphaEspecifica el nivel de significancia para la construcción de todos los intervalos de confianza. El valor predeterminado es 0.05 y el rango es (0, 1).
casOutEspecifica la configuración para una tabla de salida. Para obtener más información, consulte el parámetro común 'casouttable' (Formulario 1) en el Apéndice A: Parámetros Comunes. Este es un parámetro requerido.
cooksDAsigna un nombre a la estadística de influencia D de Cook.
copyVarsEspecifica una lista de una o más variables para copiar de la tabla de entrada a la tabla de salida. Alternativamente, puede especificar el valor 'ALL' (todas las variables) o 'ALL_NUMERIC' (todas las variables numéricas).
covRatioAsigna un nombre a la influencia estándar de la observación sobre la covarianza de los coeficientes (betas). La estadística 'COVRATIO' mide el cambio en el determinante de la matriz de covarianza de las estimaciones al eliminar la i-ésima observación.
dffitsAsigna un nombre a la medida escalada del cambio en el valor predicho para la i-ésima observación, calculada al eliminar la i-ésima observación. Un valor grande indica que la observación es muy influyente en su vecindad del espacio X.
displayEspecifica una lista de tablas de resultados para enviar al cliente para su visualización. Para obtener más información, consulte el parámetro común 'displayTables' en el Apéndice A: Parámetros Comunes.
fitDataCuando se establece en 'TRUE', especifica que los datos a puntuar también se utilizaron para ajustar el modelo. El valor predeterminado es 'FALSE'.
hAsigna un nombre al apalancamiento de la observación.
lclAsigna un nombre al límite inferior de un intervalo de confianza para una predicción individual.
lclmAsigna un nombre al límite inferior de un intervalo de confianza para el valor esperado de la variable dependiente.
likeDistAsigna un nombre al desplazamiento de la verosimilitud.
outputTablesEnumera los nombres de las tablas de resultados para guardar como tablas CAS en el servidor. Para obtener más información, consulte el parámetro común 'outputTables' en el Apéndice A: Parámetros Comunes. También conocido como 'displayOut'.
predAsigna un nombre al valor predicho. Si no especifica ninguna estadística de salida, el valor predicho se denomina 'Pred' por defecto.
pressAsigna un nombre al i-ésimo residuo dividido por 1 - h, donde h es el apalancamiento, y donde el modelo se ha reajustado sin la i-ésima observación.
residAsigna un nombre al residuo, calculado como REAL menos PREDECIDO.
restoreRestaura modelos de regresión desde un objeto binario grande (BLOB). Este es un parámetro requerido.
roleIdentifica los roles de entrenamiento, validación y prueba para las observaciones.
rStudentAsigna un nombre al residuo estudentizado con la observación actual eliminada.
stdiAsigna un nombre al error estándar del valor predicho individual.
stdpAsigna un nombre al error estándar del valor predicho medio.
stdrAsigna un nombre al error estándar del residuo.
studentAsigna un nombre a los residuos estudentizados, que son los residuos divididos por sus errores estándar.
tableEspecifica la tabla de datos de entrada. Para obtener más información, consulte el parámetro común 'castable' (Formulario 1) en el Apéndice A: Parámetros Comunes. Este es un parámetro requerido.
uclAsigna un nombre al límite superior de un intervalo de confianza para una predicción individual.
uclmAsigna un nombre al límite superior de un intervalo de confianza para el valor esperado de la variable dependiente.
Creación de datos para el ejemplo

Crea una tabla en memoria llamada 'sData' con variables numéricas 'x', 'y' y una variable categórica 'c'.

¡Copiado!
1DATA sData;
2 INPUT x y c$;
3 DATALINES;
41 2 A
52 4 B
63 6 A
74 8 B
85 10 A
96 12 B
10;
11RUN;
12 
13PROC CAS;
14 upload caslib="casuser" path="sData.sas7bdat" out="sData" promote;
15QUIT;

Ejemplos

Este ejemplo muestra cómo usar `glmScore` para generar valores predichos a partir de un modelo GLM previamente ajustado y guardarlos en una nueva tabla.

Código SAS® / CAS Código en espera de validación por la comunidad
¡Copiado!
1PROC CAS;
2 /* Ajustar un modelo GLM */
3 regression.glm(
4 TABLE={name='sData'},
5 model={depvar='y', effects={'x', 'c'}},
6 OUTPUT={casOut={name='glm_model', replace=true}, copyVars='ALL'}
7 );
8 
9 /* Puntuar el modelo y guardar las predicciones */
10 regression.glmScore(
11 TABLE={name='sData'},
12 restore={name='glm_model'},
13 casOut={name='scored_sData', replace=true},
14 pred='predicted_y'
15 );
16 
17 /* Mostrar los resultados de la puntuación */
18 PRINT casOut.name='scored_sData';
19QUIT;
Resultado :
Se crea una nueva tabla 'scored_sData' que contiene los datos originales y una nueva columna 'predicted_y' con los valores predichos por el modelo GLM.

Este ejemplo demuestra cómo usar `glmScore` para obtener todas las estadísticas de influencia (Cook's D, CovRatio, Dffits, etc.), así como los límites de confianza y los errores estándar para las predicciones. También se copian todas las variables numéricas a la tabla de salida.

Código SAS® / CAS Código en espera de validación por la comunidad
¡Copiado!
1PROC CAS;
2 /* Ajustar un modelo GLM */
3 regression.glm(
4 TABLE={name='sData'},
5 model={depvar='y', effects={'x', 'c'}},
6 OUTPUT={casOut={name='glm_model_full', replace=true}, copyVars='ALL'}
7 );
8 
9 /* Puntuar el modelo y guardar las predicciones con todas las estadísticas */
10 regression.glmScore(
11 TABLE={name='sData'},
12 restore={name='glm_model_full'},
13 casOut={name='scored_sData_full', replace=true},
14 allStats=true,
15 pred='predicted_y',
16 lcl='lower_cl',
17 ucl='upper_cl',
18 lclm='lower_cl_mean',
19 uclm='upper_cl_mean',
20 stdi='std_err_indiv',
21 stdp='std_err_mean',
22 stdr='std_err_resid',
23 student='studentized_resid',
24 cooksD='cooks_d_val',
25 covRatio='cov_ratio_val',
26 dffits='dffits_val',
27 h='leverage_val',
28 likeDist='like_dist_val',
29 press='press_val',
30 resid='residual_val',
31 copyVars='ALL_NUMERIC'
32 );
33 
34 /* Mostrar las primeras filas de la tabla de salida para verificar las nuevas columnas */
35 TABLE.fetch(
36 TABLE={name='scored_sData_full'},
37 to=5
38 );
39QUIT;
Resultado :
Se crea una tabla 'scored_sData_full' que incluye los datos originales, la predicción 'predicted_y' y una serie de columnas adicionales con las estadísticas de influencia y los intervalos de confianza (lcl, ucl, lclm, uclm, stdi, stdp, stdr, student, cooksD, covRatio, dffits, h, likeDist, press, resid). Todas las variables numéricas de la tabla de entrada se copian a la tabla de salida.

FAQ

¿Qué hace el parámetro "allStats"?
¿Qué especifica el parámetro "alpha"?
¿Para qué se utiliza el parámetro "casOut"?
¿Qué nombra el parámetro "cooksD"?
¿Qué hace el parámetro "copyVars"?
¿Qué nombra el parámetro "covRatio"?
¿Qué nombra el parámetro "dffits"?
¿Qué especifica el parámetro "display"?
¿Qué hace el parámetro "fitData"?
¿Qué nombra el parámetro "h"?
¿Qué nombra el parámetro "lcl"?
¿Qué nombra el parámetro "lclm"?
¿Qué nombra el parámetro "likeDist"?
¿Para qué se utiliza el parámetro "outputTables"?
¿Qué nombra el parámetro "pred"?
¿Qué nombra el parámetro "press"?
¿Qué nombra el parámetro "resid"?
¿Para qué se utiliza el parámetro "restore"?
¿Qué especifica "caslib" dentro de "restore"?
¿Qué especifica "dataSourceOptions" dentro de "restore"?
¿Qué especifica "name" dentro de "restore"?
¿Qué especifica "whereTable" dentro de "restore"?
¿Qué especifica "casLib" dentro de "whereTable" (que está dentro de "restore")?
¿Qué especifica "dataSourceOptions" dentro de "whereTable" (que está dentro de "restore")?
¿Qué especifica "importOptions" dentro de "whereTable" (que está dentro de "restore")?
¿Qué especifica "name" dentro de "whereTable" (que está dentro de "restore")?
¿Qué especifica "vars" dentro de "whereTable" (que está dentro de "restore")?
¿Qué especifica "where" dentro de "whereTable" (que está dentro de "restore")?
¿Qué hace el parámetro "role"?
¿Qué nombra el parámetro "rStudent"?
¿Qué nombra el parámetro "stdi"?
¿Qué nombra el parámetro "stdp"?
¿Qué nombra el parámetro "stdr"?
¿Qué nombra el parámetro "student"?
¿Para qué se utiliza el parámetro "table"?
¿Qué nombra el parámetro "ucl"?
¿Qué nombra el parámetro "uclm"?