nominalVarsDimReduction

lpca

Descripción

Reduce la dimensionalidad de las variables nominales mediante un análisis de componentes principales logístico (LPCA). Esta técnica es útil para transformar un conjunto de variables categóricas correlacionadas en un conjunto más pequeño de variables no correlacionadas (componentes principales) que retienen la mayor parte de la información original.

nominalVarsDimReduction.lpca result=<results> status=<rc> / table={...} dimensions=integer <epsilon=double> <freq="variable-name"> <id={"variable-name-1", "variable-name-2", ...}> <inputs={{...}, {...}, ...}> <m=double> <maxIter=integer> <nominals={{...}, {...}, ...}> <output={...}> <outputTables={...}> <prefix="string"> <saveState={...}>;
Parámetros
ParámetroDescripción
dimensions Especifica el número de variables reducidas (componentes) a generar.
table Especifica la tabla de entrada que contiene las variables nominales a procesar.
epsilon Especifica la tolerancia a utilizar para determinar la convergencia del algoritmo iterativo.
freq Especifica la variable numérica cuyos valores representan las frecuencias de las observaciones.
id Especifica las variables para usar como identificadores de registro, que se transfieren a la tabla de salida.
inputs Especifica las variables a utilizar en el análisis. Si no se especifica, se utilizan todas las variables numéricas.
m Especifica un valor positivo finito para aproximar los límites infinitos de la función logit: logit(1) se aproxima por 'm' y logit(0) por '-m'.
maxIter Especifica el número máximo de iteraciones para el algoritmo.
nominals Especifica explícitamente las variables nominales a utilizar en el entrenamiento.
output Especifica la tabla de datos de salida que contendrá los valores de las variables reducidas.
outputTables Enumera los nombres de las tablas de resultados (como 'NObs', 'ModelInfo') para guardar como tablas CAS en el servidor.
prefix Especifica un prefijo para aplicar a los nombres de las nuevas variables reducidas en la tabla de salida.
saveState Especifica una tabla de salida para guardar el modelo de reducción de dimensionalidad para futuras puntuaciones.
Creación de un conjunto de datos de ejemplo

Este código crea una tabla en memoria llamada 'CARS_NOMINAL' con variables categóricas para ser utilizadas en los ejemplos de LPCA.

¡Copiado!
1DATA casuser.cars_nominal;
2 SET sashelp.cars;
3 keep Type Origin DriveTrain;
4RUN;

Ejemplos

Este ejemplo realiza un análisis de componentes principales logístico en la tabla 'CARS_NOMINAL' para reducir sus variables a 2 dimensiones.

Código SAS® / CAS Código en espera de validación por la comunidad
¡Copiado!
1PROC CAS;
2 nominalVarsDimReduction.lpca
3 TABLE={name='CARS_NOMINAL'},
4 nominals={'Type', 'Origin', 'DriveTrain'},
5 dimensions=2;
6RUN;

Este ejemplo realiza un LPCA, reduce las variables nominales a 3 dimensiones, guarda los resultados en una nueva tabla llamada 'CARS_LPCA_RESULTS' con el prefijo 'LPCA_', y guarda el estado del modelo para futuras puntuaciones en la tabla 'CARS_LPCA_MODEL'.

Código SAS® / CAS Código en espera de validación por la comunidad
¡Copiado!
1PROC CAS;
2 nominalVarsDimReduction.lpca
3 TABLE={name='CARS_NOMINAL'},
4 nominals={'Type', 'Origin', 'DriveTrain'},
5 dimensions=3,
6 prefix='LPCA_',
7 OUTPUT={name='CARS_LPCA_RESULTS', replace=true},
8 saveState={name='CARS_LPCA_MODEL', replace=true};
9RUN;