Reduce la dimensionalidad de las variables nominales mediante un análisis de componentes principales logístico (LPCA). Esta técnica es útil para transformar un conjunto de variables categóricas correlacionadas en un conjunto más pequeño de variables no correlacionadas (componentes principales) que retienen la mayor parte de la información original.
| Parámetro | Descripción |
|---|---|
| dimensions | Especifica el número de variables reducidas (componentes) a generar. |
| table | Especifica la tabla de entrada que contiene las variables nominales a procesar. |
| epsilon | Especifica la tolerancia a utilizar para determinar la convergencia del algoritmo iterativo. |
| freq | Especifica la variable numérica cuyos valores representan las frecuencias de las observaciones. |
| id | Especifica las variables para usar como identificadores de registro, que se transfieren a la tabla de salida. |
| inputs | Especifica las variables a utilizar en el análisis. Si no se especifica, se utilizan todas las variables numéricas. |
| m | Especifica un valor positivo finito para aproximar los límites infinitos de la función logit: logit(1) se aproxima por 'm' y logit(0) por '-m'. |
| maxIter | Especifica el número máximo de iteraciones para el algoritmo. |
| nominals | Especifica explícitamente las variables nominales a utilizar en el entrenamiento. |
| output | Especifica la tabla de datos de salida que contendrá los valores de las variables reducidas. |
| outputTables | Enumera los nombres de las tablas de resultados (como 'NObs', 'ModelInfo') para guardar como tablas CAS en el servidor. |
| prefix | Especifica un prefijo para aplicar a los nombres de las nuevas variables reducidas en la tabla de salida. |
| saveState | Especifica una tabla de salida para guardar el modelo de reducción de dimensionalidad para futuras puntuaciones. |
Este código crea una tabla en memoria llamada 'CARS_NOMINAL' con variables categóricas para ser utilizadas en los ejemplos de LPCA.
| 1 | DATA casuser.cars_nominal; |
| 2 | SET sashelp.cars; |
| 3 | keep Type Origin DriveTrain; |
| 4 | RUN; |
Este ejemplo realiza un análisis de componentes principales logístico en la tabla 'CARS_NOMINAL' para reducir sus variables a 2 dimensiones.
| 1 | PROC CAS; |
| 2 | nominalVarsDimReduction.lpca |
| 3 | TABLE={name='CARS_NOMINAL'}, |
| 4 | nominals={'Type', 'Origin', 'DriveTrain'}, |
| 5 | dimensions=2; |
| 6 | RUN; |
Este ejemplo realiza un LPCA, reduce las variables nominales a 3 dimensiones, guarda los resultados en una nueva tabla llamada 'CARS_LPCA_RESULTS' con el prefijo 'LPCA_', y guarda el estado del modelo para futuras puntuaciones en la tabla 'CARS_LPCA_MODEL'.
| 1 | PROC CAS; |
| 2 | nominalVarsDimReduction.lpca |
| 3 | TABLE={name='CARS_NOMINAL'}, |
| 4 | nominals={'Type', 'Origin', 'DriveTrain'}, |
| 5 | dimensions=3, |
| 6 | prefix='LPCA_', |
| 7 | OUTPUT={name='CARS_LPCA_RESULTS', replace=true}, |
| 8 | saveState={name='CARS_LPCA_MODEL', replace=true}; |
| 9 | RUN; |