glmScore - WeAreCAS

Q: ¿Qué hace el parámetro "allStats"?

Cuando se establece en "True", solicita todas las estadísticas disponibles. El valor predeterminado es "False".

Q: ¿Qué especifica el parámetro "alpha"?

Especifica el nivel de significancia que se utilizará para la construcción de todos los intervalos de confianza. El valor predeterminado es "0.05" y el rango es "(0, 1)".

Q: ¿Para qué se utiliza el parámetro "casOut"?

Especifica la configuración de una tabla de salida. Para obtener más información sobre cómo especificar el parámetro casOut, consulte el parámetro común "casouttable (Formulario 1)" (Apéndice A: Parámetros comunes).

Q: ¿Qué nombra el parámetro "cooksD"?

Nombra la estadística de influencia D de Cook.

Q: ¿Qué nombra el parámetro "covRatio"?

Nombra la influencia estándar de la observación en la covarianza de los coeficientes beta. La estadística COVRATIO mide el cambio en el determinante de la matriz de covarianza de las estimaciones al eliminar la i-ésima observación.

Q: ¿Qué nombra el parámetro "dffits"?

Nombra la medida escalada del cambio en el valor predicho para la i-ésima observación y se calcula eliminando la i-ésima observación. Un valor grande indica que la observación es muy influyente en su vecindad del espacio X.

Q: ¿Qué hace el parámetro "fitData"?

Cuando se establece en "True", especifica que los datos a calificar también se utilizaron para ajustar el modelo. El valor predeterminado es "False".

Q: ¿Qué nombra el parámetro "h"?

Nombra el apalancamiento de la observación.

Tabla de contenidos

Descripción

La acción `glmScore` crea una tabla en el servidor que contiene los resultados de la puntuación de las observaciones utilizando un modelo ajustado. Es parte del conjunto de acciones de Regresión en SAS Visual Statistics.

regression.glmScore <result=results> <status=rc> / allStats=TRUE | FALSE, alpha=double, casOut={ caslib="string", compress=TRUE | FALSE, indexVars={"variable-name-1" <, "variable-name-2", ...>}, label="string", lifetime=64-bit-integer, maxMemSize=64-bit-integer, memoryFormat="DVR" | "INHERIT" | "STANDARD", name="table-name", promote=TRUE | FALSE, replace=TRUE | FALSE, replication=integer, tableRedistUpPolicy="DEFER" | "NOREDIST" | "REBALANCE", threadBlockSize=64-bit-integer, timeStamp="string", where={"string-1" <, "string-2", ...>} }, cooksD="string", copyVars="ALL" | "ALL_NUMERIC" | {"variable-name-1" <, "variable-name-2", ...>}, covRatio="string", dffits="string", display={ caseSensitive=TRUE | FALSE, exclude=TRUE | FALSE, excludeAll=TRUE | FALSE, keyIsPath=TRUE | FALSE, names={"string-1" <, "string-2", ...>}, pathType="LABEL" | "NAME", traceNames=TRUE | FALSE }, fitData=TRUE | FALSE, h="string", lcl="string", lclm="string", likeDist="string", outputTables={ groupByVarsRaw=TRUE | FALSE, includeAll=TRUE | FALSE, names={ "string-1" <, "string-2", ...> } | { key-1={casouttable-1} <, key-2={casouttable-2}, ...> }, repeated=TRUE | FALSE, replace=TRUE | FALSE }, pred="string", press="string", resid="string", restore={ caslib="string", dataSourceOptions={key-1=any-list-or-data-type-1 <, key-2=any-list-or-data-type-2, ...>}, name="table-name", whereTable={ casLib="string", dataSourceOptions=adls_noreq-parameters | bigquery-parameters | cas_noreq-parameters | clouddex-parameters | db2-parameters | dnfs-parameters | esp-parameters | fedsvr-parameters | gcs_noreq-parameters | hadoop-parameters | hana-parameters | impala-parameters | informix-parameters | jdbc-parameters | mongodb-parameters | mysql-parameters | odbc-parameters | oracle-parameters | path-parameters | postgres-parameters | redshift-parameters | s3-parameters | sapiq-parameters | sforce-parameters | singlestore_standard-parameters | snowflake-parameters | spark-parameters | spde-parameters | sqlserver-parameters | ss_noreq-parameters | teradata-parameters | vertica-parameters | yellowbrick-parameters, importOptions={ fileType="ANY" | "AUDIO" | "AUTO" | "BASESAS" | "CSV" | "DELIMITED" | "DOCUMENT" | "DTA" | "ESP" | "EXCEL" | "FMT" | "HDAT" | "IMAGE" | "JMP" | "LASR" | "PARQUET" | "SOUND" | "SPSS" | "VIDEO" | "XLS", fileType-specific-parameters }, name="table-name", vars={{format="string", formattedLength=integer, label="string", name="variable-name", nfd=integer, nfl=integer} <, {...}>}, where="where-expression" } }, role="string", rStudent="string", stdi="string", stdp="string", stdr="string", student="string", table={ caslib="string", computedOnDemand=TRUE | FALSE, computedVars={{format="string", formattedLength=integer, label="string", name="variable-name", nfd=integer, nfl=integer} <, {...}>}, computedVarsProgram="string", dataSourceOptions={key-1=any-list-or-data-type-1 <, key-2=any-list-or-data-type-2, ...>}, groupBy={{format="string", formattedLength=integer, label="string", name="variable-name", nfd=integer, nfl=integer} <, {...}>}, groupByMode="NOSORT" | "REDISTRIBUTE", importOptions={ fileType="ANY" | "AUDIO" | "AUTO" | "BASESAS" | "CSV" | "DELIMITED" | "DOCUMENT" | "DTA" | "ESP" | "EXCEL" | "FMT" | "HDAT" | "IMAGE" | "JMP" | "LASR" | "PARQUET" | "SOUND" | "SPSS" | "VIDEO" | "XLS", fileType-specific-parameters }, name="table-name", orderBy={{format="string", formattedLength=integer, label="string", name="variable-name", nfd=integer, nfl=integer} <, {...}>}, singlePass=TRUE | FALSE, vars={{format="string", formattedLength=integer, label="string", name="variable-name", nfd=integer, nfl=integer} <, {...}>}, where="where-expression", whereTable={ casLib="string", dataSourceOptions=adls_noreq-parameters | bigquery-parameters | cas_noreq-parameters | clouddex-parameters | db2-parameters | dnfs-parameters | esp-parameters | fedsvr-parameters | gcs_noreq-parameters | hadoop-parameters | hana-parameters | impala-parameters | informix-parameters | jdbc-parameters | mongodb-parameters | mysql-parameters | odbc-parameters | oracle-parameters | path-parameters | postgres-parameters | redshift-parameters | s3-parameters | sapiq-parameters | sforce-parameters | singlestore_standard-parameters | snowflake-parameters | spark-parameters | spde-parameters | sqlserver-parameters | ss_noreq-parameters | teradata-parameters | vertica-parameters | yellowbrick-parameters, importOptions={ fileType="ANY" | "AUDIO" | "AUTO" | "BASESAS" | "CSV" | "DELIMITED" | "DOCUMENT" | "DTA" | "ESP" | "EXCEL" | "FMT" | "HDAT" | "IMAGE" | "JMP" | "LASR" | "PARQUET" | "SOUND" | "SPSS" | "VIDEO" | "XLS", fileType-specific-parameters }, name="table-name", vars={{format="string", formattedLength=integer, label="string", name="variable-name", nfd=integer, nfl=integer} <, {...}>}, where="where-expression" } }, ucl="string", uclm="string" );

Parámetros

Parámetro	Descripción
allStats	Cuando se establece en 'TRUE', solicita todas las estadísticas disponibles. El valor predeterminado es 'FALSE'.
alpha	Especifica el nivel de significancia para la construcción de todos los intervalos de confianza. El valor predeterminado es 0.05 y el rango es (0, 1).
casOut	Especifica la configuración para una tabla de salida. Para obtener más información, consulte el parámetro común 'casouttable' (Formulario 1) en el Apéndice A: Parámetros Comunes. Este es un parámetro requerido.
cooksD	Asigna un nombre a la estadística de influencia D de Cook.
copyVars	Especifica una lista de una o más variables para copiar de la tabla de entrada a la tabla de salida. Alternativamente, puede especificar el valor 'ALL' (todas las variables) o 'ALL_NUMERIC' (todas las variables numéricas).
covRatio	Asigna un nombre a la influencia estándar de la observación sobre la covarianza de los coeficientes (betas). La estadística 'COVRATIO' mide el cambio en el determinante de la matriz de covarianza de las estimaciones al eliminar la i-ésima observación.
dffits	Asigna un nombre a la medida escalada del cambio en el valor predicho para la i-ésima observación, calculada al eliminar la i-ésima observación. Un valor grande indica que la observación es muy influyente en su vecindad del espacio X.
display	Especifica una lista de tablas de resultados para enviar al cliente para su visualización. Para obtener más información, consulte el parámetro común 'displayTables' en el Apéndice A: Parámetros Comunes.
fitData	Cuando se establece en 'TRUE', especifica que los datos a puntuar también se utilizaron para ajustar el modelo. El valor predeterminado es 'FALSE'.
h	Asigna un nombre al apalancamiento de la observación.
lcl	Asigna un nombre al límite inferior de un intervalo de confianza para una predicción individual.
lclm	Asigna un nombre al límite inferior de un intervalo de confianza para el valor esperado de la variable dependiente.
likeDist	Asigna un nombre al desplazamiento de la verosimilitud.
outputTables	Enumera los nombres de las tablas de resultados para guardar como tablas CAS en el servidor. Para obtener más información, consulte el parámetro común 'outputTables' en el Apéndice A: Parámetros Comunes. También conocido como 'displayOut'.
pred	Asigna un nombre al valor predicho. Si no especifica ninguna estadística de salida, el valor predicho se denomina 'Pred' por defecto.
press	Asigna un nombre al i-ésimo residuo dividido por 1 - h, donde h es el apalancamiento, y donde el modelo se ha reajustado sin la i-ésima observación.
resid	Asigna un nombre al residuo, calculado como REAL menos PREDECIDO.
restore	Restaura modelos de regresión desde un objeto binario grande (BLOB). Este es un parámetro requerido.
role	Identifica los roles de entrenamiento, validación y prueba para las observaciones.
rStudent	Asigna un nombre al residuo estudentizado con la observación actual eliminada.
stdi	Asigna un nombre al error estándar del valor predicho individual.
stdp	Asigna un nombre al error estándar del valor predicho medio.
stdr	Asigna un nombre al error estándar del residuo.
student	Asigna un nombre a los residuos estudentizados, que son los residuos divididos por sus errores estándar.
table	Especifica la tabla de datos de entrada. Para obtener más información, consulte el parámetro común 'castable' (Formulario 1) en el Apéndice A: Parámetros Comunes. Este es un parámetro requerido.
ucl	Asigna un nombre al límite superior de un intervalo de confianza para una predicción individual.
uclm	Asigna un nombre al límite superior de un intervalo de confianza para el valor esperado de la variable dependiente.

Preparación de datos Ver hoja de preparación de datos

Creación de datos para el ejemplo

Crea una tabla en memoria llamada 'sData' con variables numéricas 'x', 'y' y una variable categórica 'c'.

¡Copiado!

1	DATA sData;
2	INPUT x y c$;
3	DATALINES;
4	1 2 A
5	2 4 B
6	3 6 A
7	4 8 B
8	5 10 A
9	6 12 B
10	;
11	RUN;
12
13	PROC CAS;
14	upload caslib="casuser" path="sData.sas7bdat" out="sData" promote;
15	QUIT;

Ejemplos

Este ejemplo muestra cómo usar `glmScore` para generar valores predichos a partir de un modelo GLM previamente ajustado y guardarlos en una nueva tabla.

Código SAS® / CAS Código en espera de validación por la comunidad

¡Copiado!

1	PROC CAS;
2	/* Ajustar un modelo GLM */
3	regression.glm(
4	TABLE={name='sData'},
5	model={depvar='y', effects={'x', 'c'}},
6	OUTPUT={casOut={name='glm_model', replace=true}, copyVars='ALL'}
7	);
8
9	/* Puntuar el modelo y guardar las predicciones */
10	regression.glmScore(
11	TABLE={name='sData'},
12	restore={name='glm_model'},
13	casOut={name='scored_sData', replace=true},
14	pred='predicted_y'
15	);
16
17	/* Mostrar los resultados de la puntuación */
18	PRINT casOut.name='scored_sData';
19	QUIT;

Resultado :
Se crea una nueva tabla 'scored_sData' que contiene los datos originales y una nueva columna 'predicted_y' con los valores predichos por el modelo GLM.

Este ejemplo demuestra cómo usar `glmScore` para obtener todas las estadísticas de influencia (Cook's D, CovRatio, Dffits, etc.), así como los límites de confianza y los errores estándar para las predicciones. También se copian todas las variables numéricas a la tabla de salida.

Código SAS® / CAS Código en espera de validación por la comunidad

¡Copiado!

1	PROC CAS;
2	/* Ajustar un modelo GLM */
3	regression.glm(
4	TABLE={name='sData'},
5	model={depvar='y', effects={'x', 'c'}},
6	OUTPUT={casOut={name='glm_model_full', replace=true}, copyVars='ALL'}
7	);
8
9	/* Puntuar el modelo y guardar las predicciones con todas las estadísticas */
10	regression.glmScore(
11	TABLE={name='sData'},
12	restore={name='glm_model_full'},
13	casOut={name='scored_sData_full', replace=true},
14	allStats=true,
15	pred='predicted_y',
16	lcl='lower_cl',
17	ucl='upper_cl',
18	lclm='lower_cl_mean',
19	uclm='upper_cl_mean',
20	stdi='std_err_indiv',
21	stdp='std_err_mean',
22	stdr='std_err_resid',
23	student='studentized_resid',
24	cooksD='cooks_d_val',
25	covRatio='cov_ratio_val',
26	dffits='dffits_val',
27	h='leverage_val',
28	likeDist='like_dist_val',
29	press='press_val',
30	resid='residual_val',
31	copyVars='ALL_NUMERIC'
32	);
33
34	/* Mostrar las primeras filas de la tabla de salida para verificar las nuevas columnas */
35	TABLE.fetch(
36	TABLE={name='scored_sData_full'},
37	to=5
38	);
39	QUIT;

Resultado :
Se crea una tabla 'scored_sData_full' que incluye los datos originales, la predicción 'predicted_y' y una serie de columnas adicionales con las estadísticas de influencia y los intervalos de confianza (lcl, ucl, lclm, uclm, stdi, stdp, stdr, student, cooksD, covRatio, dffits, h, likeDist, press, resid). Todas las variables numéricas de la tabla de entrada se copian a la tabla de salida.

FAQ

¿Qué hace el parámetro "allStats"?

¿Qué especifica el parámetro "alpha"?

¿Para qué se utiliza el parámetro "casOut"?

¿Qué nombra el parámetro "cooksD"?

¿Qué hace el parámetro "copyVars"?

¿Qué nombra el parámetro "covRatio"?

¿Qué nombra el parámetro "dffits"?

¿Qué especifica el parámetro "display"?

¿Qué hace el parámetro "fitData"?

¿Qué nombra el parámetro "h"?

¿Qué nombra el parámetro "lcl"?

¿Qué nombra el parámetro "lclm"?

¿Qué nombra el parámetro "likeDist"?

¿Para qué se utiliza el parámetro "outputTables"?

¿Qué nombra el parámetro "pred"?

¿Qué nombra el parámetro "press"?

¿Qué nombra el parámetro "resid"?

¿Para qué se utiliza el parámetro "restore"?

¿Qué especifica "caslib" dentro de "restore"?

¿Qué especifica "dataSourceOptions" dentro de "restore"?

¿Qué especifica "name" dentro de "restore"?

¿Qué especifica "whereTable" dentro de "restore"?

¿Qué especifica "casLib" dentro de "whereTable" (que está dentro de "restore")?

¿Qué especifica "dataSourceOptions" dentro de "whereTable" (que está dentro de "restore")?

¿Qué especifica "importOptions" dentro de "whereTable" (que está dentro de "restore")?

¿Qué especifica "name" dentro de "whereTable" (que está dentro de "restore")?

¿Qué especifica "vars" dentro de "whereTable" (que está dentro de "restore")?

¿Qué especifica "where" dentro de "whereTable" (que está dentro de "restore")?

¿Qué hace el parámetro "role"?

¿Qué nombra el parámetro "rStudent"?

¿Qué nombra el parámetro "stdi"?

¿Qué nombra el parámetro "stdp"?

¿Qué nombra el parámetro "stdr"?

¿Qué nombra el parámetro "student"?

¿Para qué se utiliza el parámetro "table"?

¿Qué nombra el parámetro "ucl"?

¿Qué nombra el parámetro "uclm"?

Actions associées

regression

genmodScore

crea una tabla en el servidor que contiene los resultados de la puntuación de...

regression

genmod

Se ajusta a modelos de regresión lineal generalizados.

regression

glm

Se utiliza para ajustar modelos de regresión lineal utilizando el método de m...

regression

logisticAssociation

Calcula índices de correlación de rango entre las probabilidades predichas y ...

regression

logisticCode

Escribe código de paso DATA de SAS para calcular los valores predichos del mo...

regression

logisticLackfit

La acción logisticLackfit calcula la prueba de bondad de ajuste de Hosmer y L...

Tabla de contenidos

Descripción

Creación de datos para el ejemplo

Ejemplos

Puntuación de un modelo GLM con valores predichos

Puntuación de un modelo GLM con todas las estadísticas de influencia y copia de variables

FAQ

Actions associées

genmodScore

genmod

glm

logisticAssociation

logisticCode

logisticLackfit