countreg

countregFitModel

Descripción

Analiza modelos de regresión en los que la variable dependiente toma valores enteros no negativos o de conteo y típicamente representa el número de veces que ocurre un evento.

countreg.countregFitModel <result=results> <status=rc> / bayes={...}, bounds={"string-1" <, "string-2", ...>}, class={{classStatement-1} <, {classStatement-2}, ...>}, collection={{collection-1} <, {collection-2}, ...>}, display={displayTables}, dispmodel={cregdispmodelstmt}, extendparmlength=TRUE | FALSE, freq="variable-name", groupid="variable-name", includeinternalnames=TRUE | FALSE, initialvalues={"string-1" <, "string-2", ...>}, model={cregmodelstmt}, multimember={{multimember-1} <, {multimember-2}, ...>}, optimizer={optimizerOpts}, output={cregoutputStatement}, outputTables={outputTables}, polynomial={{polynomial-1} <, {polynomial-2}, ...>}, prior={{priorDetails-1} <, {priorDetails-2}, ...>}, restrictions={"string-1" <, "string-2", ...>}, selection={selectionStatement}, spline={{spline-1} <, {spline-2}, ...>}, store={casouttable}, table={castable}, tests={{singleTest-1} <, {singleTest-2}, ...>}, timingReport={timingReportOpts}, weight={cregweightvarOptions}, zeromodel={cregzeromodelstmt};
Parámetros
ParámetroDescripción
bayes Especifica las opciones a utilizar para el análisis bayesiano.
bounds Impone restricciones de límite simples en las estimaciones de los parámetros.
class Especifica las variables de clasificación.
collection Define un conjunto de variables que se tratan como un único efecto con múltiples grados de libertad.
display Especifica una lista de tablas de resultados para enviar al cliente para su visualización.
dispmodel Especifica los regresores relacionados con la dispersión que se utilizan para modelar la dispersión. Se asume que el tipo de modelo es Conway-Maxwell-Poisson o Conway-Maxwell-Poisson inflado de ceros.
extendparmlength Cuando se establece en True, imprime las etiquetas de los parámetros sin truncar en la tabla de estimaciones de parámetros.
freq Especifica la variable de frecuencia de observación.
groupid Especifica una variable de identificación. Disponible solo para los modelos de panel de efectos fijos y efectos aleatorios.
includeinternalnames Cuando se establece en True, agrega una columna adicional a la tabla de estimaciones de parámetros que muestra los nombres internos de los parámetros.
initialvalues Especifica los valores iniciales para los parámetros en la optimización.
model Especifica la variable dependiente y las variables regresoras independientes para el modelo de regresión.
multimember Utiliza una o más variables de clasificación de tal manera que cada observación puede asociarse con uno o más niveles de la unión de los niveles de las variables de clasificación.
optimizer Especifica los parámetros que controlan diversos aspectos del proceso de estimación de parámetros.
output Especifica los detalles de una tabla de datos de salida para contener puntuaciones de diversas estadísticas.
outputTables Enumera los nombres de las tablas de resultados para guardar como tablas CAS en el servidor.
polynomial Especifica un efecto polinómico. Todas las variables especificadas deben ser numéricas.
prior Especifica la distribución a priori.
restrictions Especifica las restricciones lineales que se impondrán a las estimaciones de los parámetros.
selection Especifica el método de selección de modelo.
spline Expande las variables en bases spline cuya forma depende de los parámetros especificados.
store Almacena un modelo de regresión en un almacén de elementos.
table Especifica la tabla de datos de entrada.
tests Especifica hipótesis lineales sobre los parámetros de regresión y las pruebas que se realizarán sobre las hipótesis.
timingReport Especifica el tipo de información de tiempo que desea que la acción proporcione.
weight Especifica los detalles de la variable de ponderación de la observación.
zeromodel Especifica los regresores inflados de ceros que determinan la probabilidad de un conteo de cero.
Creación de Datos de Conteo

Este ejemplo crea una tabla en memoria llamada 'dath' que contiene datos sobre el número de artículos comprados por clientes en una tienda. Las variables incluyen 'articulos' (el número de artículos, nuestra variable de conteo), 'educacion' (nivel de educación), 'ingreso' (ingreso anual) y 'edad' (edad del cliente).

¡Copiado!
1DATA dath;
2 INPUT educacion ingreso edad articulos @@;
3 DATALINES;
4 1 20 30 2 1 25 30 1 1 30 30 2 1 35 30 3 1 40 30 4
5 2 20 30 1 2 25 30 2 2 30 30 2 2 35 30 3 2 40 30 4
6 3 20 30 1 3 25 30_ 1 3 30 30 2 3 35 30 2 3 40 30 3
7 1 20 40 1 1 25 40 2 1 30 40 2 1 35 40 3 1 40 40 4
8 2 20 40 1 2 25 40 2 2 30 40 3 2 35 40 3 2 40 40 4
9 3 20 40 1 3 25 40 1 3 30 40 2 3 35 40 2 3 40 40 2
10 1 20 50 1 1 25 50 1 1 30 50 2 1 35 50 2 1 40 50 3
11 2 20 50 1 2 25 50 2 2 30 50 2 2 35 50_ 3 2 40 50 3
12 3 20 50 1 3 25 50 1 3 30 50 1 3 35 50 2 3 40 50 2
13 ;
14RUN;
15PROC CAS;
16 TABLE.droptable / caslib='casuser' name='dath' quiet=true;
17 TABLE.upload / caslib='casuser' path='dath.sashdat' casout={name='dath', replace=true};
18RUN;

Ejemplos

Este ejemplo ajusta un modelo de regresión de Poisson simple donde 'articulos' es la variable dependiente y 'educacion', 'ingreso' y 'edad' son las variables independientes.

Código SAS® / CAS Código en espera de validación por la comunidad
¡Copiado!
1PROC CAS;
2 countreg.countregFitModel /
3 TABLE={name='dath'},
4 model={depVars={{name='articulos'}},
5 effects={{vars={'educacion', 'ingreso', 'edad'}}},
6 modeloptions={modeltype='POISSON'}};
7RUN;
Resultado :
Se espera una tabla de 'Estimaciones de Parámetros' que muestre los coeficientes para el intercepto, educacion, ingreso y edad, junto con sus errores estándar y valores p.

Este ejemplo ajusta un modelo ZINB más complejo. El modelo principal predice 'articulos' usando 'educacion' e 'ingreso'. El modelo de inflación de ceros, que predice el exceso de ceros, usa 'edad' como predictor. Además, se modela la dispersión usando la variable 'ingreso'.

Código SAS® / CAS Código en espera de validación por la comunidad
¡Copiado!
1PROC CAS;
2 countreg.countregFitModel /
3 TABLE={name='dath'},
4 model={depVars={{name='articulos'}},
5 effects={{vars={'educacion', 'ingreso'}}},
6 modeloptions={modeltype='ZINB'}},
7 zeromodel={effects={{vars={'edad'}}}},
8 dispmodel={effects={{vars={'ingreso'}}}};
9RUN;
Resultado :
Se esperan tres tablas de estimaciones de parámetros: una para el modelo de conteo principal (Intercepto, educacion, ingreso), una para el modelo de inflación de ceros (Intercepto, edad) y una para el modelo de dispersión (Intercepto, ingreso).

FAQ

¿Para qué se utiliza la acción `countregFitModel`?
¿Qué tipos de modelos de regresión de conteo se pueden ajustar con esta acción?
¿Cómo se especifica un modelo inflado de ceros?
¿Es posible realizar análisis bayesiano con la acción `countregFitModel`?
¿Qué métodos de selección de modelos están disponibles?

Escenarios asociados

Caso de uso
Modelado de Frecuencia de Siniestros de Seguros

Una compañía de seguros desea predecir el número de siniestros anuales por cliente para ajustar las primas. Dado que los datos de siniestros suelen tener una varianza mayor que ...

Caso de uso
Análisis de Conversión Web con Exceso de Ceros y Selección de Variables

Un sitio de comercio electrónico analiza el número de artículos comprados por sesión. La mayoría de las sesiones terminan sin compra (0 artículos), lo que requiere un modelo Inf...

Caso de uso
Control de Calidad: Análisis Bayesiano con Restricciones (Casos Límite)

Una fábrica de semiconductores analiza el número de defectos microscópicos por oblea. Debido a la naturaleza crítica y los datos limitados (lotes pequeños), se prefiere un enfoq...