nominalVarsDimReduction

lpca

Descripción

Reduce la dimensionalidad de las variables nominales mediante un análisis de componentes principales logístico (LPCA). Esta técnica es útil para transformar un conjunto de variables categóricas correlacionadas en un conjunto más pequeño de variables no correlacionadas (componentes principales) que retienen la mayor parte de la información original.

nominalVarsDimReduction.lpca result=<results> status=<rc> / table={...} dimensions=integer <epsilon=double> <freq="variable-name"> <id={"variable-name-1", "variable-name-2", ...}> <inputs={{...}, {...}, ...}> <m=double> <maxIter=integer> <nominals={{...}, {...}, ...}> <output={...}> <outputTables={...}> <prefix="string"> <saveState={...}>;
Parámetros
ParámetroDescripción
dimensionsEspecifica el número de variables reducidas (componentes) a generar.
tableEspecifica la tabla de entrada que contiene las variables nominales a procesar.
epsilonEspecifica la tolerancia a utilizar para determinar la convergencia del algoritmo iterativo.
freqEspecifica la variable numérica cuyos valores representan las frecuencias de las observaciones.
idEspecifica las variables para usar como identificadores de registro, que se transfieren a la tabla de salida.
inputsEspecifica las variables a utilizar en el análisis. Si no se especifica, se utilizan todas las variables numéricas.
mEspecifica un valor positivo finito para aproximar los límites infinitos de la función logit: logit(1) se aproxima por 'm' y logit(0) por '-m'.
maxIterEspecifica el número máximo de iteraciones para el algoritmo.
nominalsEspecifica explícitamente las variables nominales a utilizar en el entrenamiento.
outputEspecifica la tabla de datos de salida que contendrá los valores de las variables reducidas.
outputTablesEnumera los nombres de las tablas de resultados (como 'NObs', 'ModelInfo') para guardar como tablas CAS en el servidor.
prefixEspecifica un prefijo para aplicar a los nombres de las nuevas variables reducidas en la tabla de salida.
saveStateEspecifica una tabla de salida para guardar el modelo de reducción de dimensionalidad para futuras puntuaciones.
Creación de un conjunto de datos de ejemplo

Este código crea una tabla en memoria llamada 'CARS_NOMINAL' con variables categóricas para ser utilizadas en los ejemplos de LPCA.

¡Copiado!
1DATA casuser.cars_nominal;
2 SET sashelp.cars;
3 keep Type Origin DriveTrain;
4RUN;

Ejemplos

Este ejemplo realiza un análisis de componentes principales logístico en la tabla 'CARS_NOMINAL' para reducir sus variables a 2 dimensiones.

Código SAS® / CAS Código en espera de validación por la comunidad
¡Copiado!
1PROC CAS;
2 nominalVarsDimReduction.lpca
3 TABLE={name='CARS_NOMINAL'},
4 nominals={'Type', 'Origin', 'DriveTrain'},
5 dimensions=2;
6RUN;

Este ejemplo realiza un LPCA, reduce las variables nominales a 3 dimensiones, guarda los resultados en una nueva tabla llamada 'CARS_LPCA_RESULTS' con el prefijo 'LPCA_', y guarda el estado del modelo para futuras puntuaciones en la tabla 'CARS_LPCA_MODEL'.

Código SAS® / CAS Código en espera de validación por la comunidad
¡Copiado!
1PROC CAS;
2 nominalVarsDimReduction.lpca
3 TABLE={name='CARS_NOMINAL'},
4 nominals={'Type', 'Origin', 'DriveTrain'},
5 dimensions=3,
6 prefix='LPCA_',
7 OUTPUT={name='CARS_LPCA_RESULTS', replace=true},
8 saveState={name='CARS_LPCA_MODEL', replace=true};
9RUN;