pca

eig

Descripción

Extrae componentes principales utilizando el método de descomposición de valores propios.

Parámetros
ParámetroDescripción
attributes Cambia los atributos de las variables utilizadas en esta acción. Actualmente, los atributos especificados en los parámetros inputs y nominals se ignoran.
code Escribe el código del paso DATA de SAS para calcular los valores pronosticados del modelo ajustado.
cov Cuando se establece en True, calcula los componentes principales a partir de la matriz de covarianza.
display Especifica una lista de tablas de resultados para enviar al cliente para su visualización.
freq Especifica una variable numérica que contiene la frecuencia de aparición de cada observación.
gpu Especifica la configuración para las unidades de procesamiento gráfico (GPU). Si se especifica el subparámetro groupBy en el parámetro table, se ignora el parámetro gpu.
groupbyLimit Suprime el análisis si el número de grupos BY excede el valor especificado.
inputs Especifica las variables numéricas que se analizarán.
n Especifica el número de componentes principales que se calcularán. Si el valor es 0, se calculan todos los componentes principales.
noInt Cuando se establece en True, omite la intersección del modelo.
output Especifica la tabla de salida que se creará para contener estadísticas de observación. Si no especifica ninguna estadística, solo se incluyen las puntuaciones de los componentes principales.
outputTables Enumera los nombres de las tablas de resultados para guardar como tablas CAS en el servidor.
outStat Especifica la tabla de salida que se creará para contener varias estadísticas, incluidas las medias, las desviaciones estándar, los valores propios y los vectores propios.
partial Especifica las variables numéricas que se parcializarán si desea analizar una correlación parcial o una matriz de covarianza.
prefix Especifica un prefijo para nombrar los componentes principales.
singular Especifica el criterio de singularidad.
std Cuando se establece en True, estandariza a varianza unitaria las puntuaciones de los componentes principales en la tabla de salida especificada en el parámetro de salida.
store Especifica la tabla de salida que se creará para guardar la información de ajuste del modelo que puede utilizar para la puntuación.
table Especifica la configuración para una tabla de entrada.
varDef Especifica el divisor a utilizar en el cálculo de varianzas y desviaciones estándar.
weight Especifica una variable numérica que se utiliza como peso para realizar un análisis ponderado de los datos.
Creación de datos de crimen

Crea un conjunto de datos con estadísticas de crimen por ciudad para el análisis.

¡Copiado!
1DATA mycas.crime;
2 INPUT City $ Population Murder Rape Robbery Assault Burglary Larceny AutoTheft;
3 DATALINES;
4Atlanta 12750 16.5 24.8 106 147 1112 905 494
5Boston 14710 12.0 20.5 130 158 1102 1080 680
6Chicago 26400 10.4 23.3 190 135 1088 1090 700
7Dallas 31040 10.9 19.8 178 120 1058 1020 620
8Detroit 36200 13.5 21.6 188 140 1060 980 500
9Houston 16800 14.5 25.3 170 160 1090 1010 650
10LosAngeles 24000 15.0 22.5 165 155 1070 1030 600
11NewOrleans 12800 13.0 24.0 160 150 1080 990 550
12NewYork 78950 9.8 18.5 200 115 1040 1100 750
13Philadelphia 18500 11.5 21.0 150 145 1095 1050 630
14Portland 11500 6.5 15.8 75 90 850 800 400
15StLouis 15000 12.5 22.0 140 130 1050 1000 580
16SanFrancisco 14000 7.8 17.5 110 105 900 850 450
17Seattle 11000 8.0 18.0 120 110 950 900 480
18Washington 22000 10.0 19.5 160 130 1000 950 520
19;
20RUN;

Ejemplos

Realiza un análisis de componentes principales básico en las variables numéricas de crimen.

Código SAS® / CAS Código en espera de validación por la comunidad
¡Copiado!
1 
2PROC CAS;
3pca.eig / TABLE="crime", inputs={"Murder", "Rape", "Robbery", "Assault", "Burglary", "Larceny", "AutoTheft"};
4RUN;
5 
Resultado :
Genera tablas con valores propios, vectores propios y estadísticas simples de las variables seleccionadas.

Realiza PCA solicitando 3 componentes, estandarización de varianza, y guarda estadísticas y puntuaciones en tablas CAS.

Código SAS® / CAS Código en espera de validación por la comunidad
¡Copiado!
1PROC CAS;
2 pca.eig /
3 TABLE="crime",
4 inputs={"Murder", "Rape", "Robbery", "Assault", "Burglary", "Larceny", "AutoTheft"},
5 n=3,
6 std=true,
7 outStat={casOut={name="stats", replace=true}},
8 OUTPUT={casOut={name="scores", replace=true}, score="Comp"};
9RUN;
Resultado :
Genera 3 componentes principales estandarizados, guarda las estadísticas del modelo en la tabla 'stats' y las puntuaciones de cada observación en la tabla 'scores' con el prefijo 'Comp'.

FAQ

¿Cuál es el propósito principal de la acción eig?
¿Qué tipos de variables permite analizar el parámetro inputs en la acción eig?
¿Cómo se puede calcular los componentes principales a partir de la matriz de covarianza?
¿Qué parámetro se utiliza para especificar el número de componentes principales a calcular?
¿Cómo se puede omitir la intersección (intercept) del modelo?
¿Qué función cumple el parámetro outStat?
¿Cómo se puede estandarizar a varianza unitaria las puntuaciones de los componentes principales en la tabla de salida?
¿Qué parámetro permite guardar la información del ajuste del modelo para su uso en puntuación (scoring)?
¿Cómo se puede especificar un prefijo personalizado para nombrar los componentes principales?
¿Qué permite hacer el parámetro code?

Escenarios asociados

Caso de uso
Reducción de Dimensionalidad para Sensores Industriales

Una fábrica de semiconductores desea monitorear la salud de sus máquinas. Tienen múltiples sensores (temperatura, presión, vibración, voltaje) altamente correlacionados. El obje...

Caso de uso
Análisis de Riesgo Financiero con Matriz de Covarianza y Ponderación

Un fondo de inversión quiere analizar la estructura de riesgo de un portafolio de activos. A diferencia del análisis estándar, requieren usar la matriz de covarianza (no correla...

Caso de uso
Segmentación de Clientes con Despliegue de Código (Scoring)

El departamento de marketing desea segmentar clientes basándose en su comportamiento de compra. Necesitan guardar el modelo para aplicar el scoring a nuevos clientes en producci...