Publicado el :
Estadística CREACION_INTERNE

Análisis de Datos Categóricos con PROC CATMOD

Este código también está disponible en: Deutsch English Français Español
En espera de validación
El script comienza creando un conjunto de datos 'detergent' a partir de datos internos (datalines), que representan los resultados de una encuesta de preferencia de marca. Luego, utiliza PROC CATMOD para ajustar dos modelos estadísticos. El primero es un modelo saturado que incluye todas las interacciones entre las variables explicativas (tipo de agua, uso anterior, temperatura) para predecir la marca preferida. El segundo es un modelo más simple, que considera solo los efectos principales de estas mismas variables, con el fin de comparar los ajustes.
Análisis de datos

Type : CREACION_INTERNE


Los datos se crean directamente en el script a través de un paso DATA STEP y una instrucción DATALINES. Representan una tabla de contingencia agregada donde la variable 'Count' sirve como peso.

1 Bloque de código
DATA STEP Data
Explicación :
Este bloque DATA STEP lee los datos de la encuesta directamente del código (datalines). Se leen las variables Softness, Brand, Previous, Temperature y Count. La opción '@@' en la instrucción INPUT indica que varias observaciones pueden estar en la misma línea de datos.
¡Copiado!
1DATA detergent;
2 INPUT Softness $ Brand $ Previous $ Temperature $ Count @code_sas_json/8_SAS_Intro_ReadFile_MultiCol_@@.json;
3 DATALINES;
4soft X yes high 19 soft X yes low 57
5soft X no high 29 soft X no low 63
6soft M yes high 29 soft M yes low 49
7soft M no high 27 soft M no low 53
8med X yes high 23 med X yes low 47
9med X no high 33 med X no low 66
10med M yes high 47 med M yes low 55
11med M no high 23 med M no low 50
12hard X yes high 24 hard X yes low 37
13hard X no high 42 hard X no low 68
14hard M yes high 43 hard M yes low 52
15hard M no high 30 hard M no low 42
16;
2 Bloque de código
PROC CATMOD
Explicación :
Este procedimiento analiza los datos categóricos. 'WEIGHT Count' especifica que los datos están agregados. 'RESPONSE 1 0' define la función de respuesta. Se ajusta un primer modelo saturado (modelo completo con todas las interacciones: Softness|Previous|Temperature). Luego, se prueba un segundo modelo más simple, con solo los efectos principales, para comparar los resultados. Las opciones '/freq prob' solicitan la visualización de frecuencias y probabilidades, y '/clparm noprofile design' solicitan los intervalos de confianza para los parámetros y la matriz de diseño del modelo.
¡Copiado!
1title 'Detergent Preference Study';
2PROC CATMOD DATA=detergent;
3 response 1 0;
4 weight Count;
5 model Brand=Softness|Previous|Temperature / freq prob;
6 title2 'Saturated Model';
7RUN;
8 
9 model Brand=Softness Previous Temperature
10 / clparm noprofile design;
11 title2 'Main-Effects Model';
12RUN;
13QUIT;
Este material se proporciona "tal cual" por We Are Cas. No hay garantías, expresas o implícitas, en cuanto a la comerciabilidad o idoneidad para un propósito particular con respecto a los materiales o el código contenidos en este documento. We Are Cas no es responsable de los errores en este material tal como existe ahora o existirá, ni We Are Cas proporciona soporte técnico para el mismo.
Información de copyright : S A S S A M P L E L I B R A R Y