nominalVarsDimReduction

mca

Descripción

Reduce la dimensionalidad de las variables nominales mediante un análisis de correspondencias múltiples (MCA). Esta técnica es útil para visualizar y resumir las relaciones entre múltiples variables categóricas.

nominalVarsDimReduction.mca result=results status=rc / dimensions=integer, display={...}, freq="variable-name", id={"variable-name-1", ...}, inputs={{...}}, nominals={{...}}, output={...}, outputTables={...}, prefix="string", saveState={...}, table={...};
Parámetros
ParámetroDescripción
dimensionsEspecifica el número de variables reducidas (dimensiones) a generar.
displayEspecifica una lista de tablas de resultados para enviar al cliente para su visualización.
freqEspecifica la variable de frecuencia que se utilizará en el análisis.
idEspecifica las variables que se utilizarán como identificadores de registro y se transferirán a la tabla de salida.
inputsEspecifica las variables a utilizar en el análisis.
nominalsEspecifica las variables nominales a utilizar en el entrenamiento del modelo.
outputEspecifica la tabla de datos de salida que contiene los valores de las variables reducidas para los datos nominales de entrenamiento.
outputTablesEnumera los nombres de las tablas de resultados para guardarlas como tablas CAS en el servidor.
prefixEspecifica un prefijo para aplicar a los nombres de las variables reducidas.
saveStateEspecifica la tabla de datos de salida en la que se guardará el modelo de reducción de dimensionalidad para su uso futuro en puntuación.
tableEspecifica la tabla de entrada para el análisis.
Creación de Datos de Ejemplo para MCA

Este conjunto de datos contiene variables categóricas que representan las respuestas de una encuesta sobre preferencias de productos y demografía. Es ideal para demostrar el Análisis de Correspondencias Múltiples.

¡Copiado!
1DATA mycas.survey_data;
2 INPUT ID$ Gender$ AgeGroup$ Product$ Satisfaction$;
3 DATALINES;
4 1 Male 18-25 A High
5 2 Female 26-35 B Medium
6 3 Female 18-25 C Low
7 4 Male >35 A High
8 5 Male 26-35 B High
9 6 Female 26-35 C Medium
10 7 Female >35 B Low
11 8 Male 18-25 A Medium
12 ;
13RUN;

Ejemplos

Este ejemplo realiza un Análisis de Correspondencias Múltiples básico para reducir la dimensionalidad de las variables nominales a 2 dimensiones, utilizando el prefijo predeterminado 'rv'.

Código SAS® / CAS Código en espera de validación por la comunidad
¡Copiado!
1PROC CAS;
2 nominalVarsDimReduction.mca
3 TABLE={name='survey_data'},
4 nominals={'Gender', 'AgeGroup', 'Product', 'Satisfaction'},
5 dimensions=2,
6 OUTPUT={casout={name='mca_out', replace=true}, copyVars={'ID'}};
7RUN;
Resultado :
Se crea una tabla de salida llamada 'mca_out' en la caslib activa. Esta tabla contendrá la variable 'ID' y dos nuevas variables de dimensión reducida, 'rv_1' y 'rv_2', que representan las coordenadas de cada observación en el nuevo espacio dimensional.

Este ejemplo realiza un MCA reduciendo a 3 dimensiones. Nombra las nuevas variables con el prefijo 'mca_dim' y guarda el estado del modelo en una tabla para poder puntuar nuevos datos en el futuro. También muestra tablas de resultados como la inercia y los detalles de las variables.

Código SAS® / CAS Código en espera de validación por la comunidad
¡Copiado!
1PROC CAS;
2 nominalVarsDimReduction.mca
3 TABLE={name='survey_data'},
4 nominals={'Gender', 'AgeGroup', 'Product', 'Satisfaction'},
5 id={'ID'},
6 dimensions=3,
7 prefix='mca_dim',
8 OUTPUT={casout={name='mca_out_detailed', replace=true}},
9 saveState={name='mca_model_state', replace=true},
10 display={names={'Inertia', 'LevelInfo', 'VarInfo'}};
11RUN;
Resultado :
Se generan dos tablas de salida: 'mca_out_detailed' y 'mca_model_state'. La tabla 'mca_out_detailed' contiene la variable 'ID' y tres nuevas variables ('mca_dim_1', 'mca_dim_2', 'mca_dim_3'). La tabla 'mca_model_state' almacena el modelo para uso futuro. Adicionalmente, se muestran en los resultados las tablas de Inercia (que indica la varianza explicada por cada dimensión), LevelInfo (información sobre los niveles de las variables) y VarInfo (información sobre las variables originales).

FAQ

¿Qué hace la acción mca?
¿Cuál es el propósito del parámetro 'dimensions'?
¿Cómo se especifica la tabla de datos de entrada para el análisis?
¿Es posible guardar el modelo resultante para usarlo posteriormente?
¿Para qué sirve el parámetro 'prefix'?
¿Puedo transferir variables de identificación al conjunto de datos de salida?