dataSciencePilot

featureMachine

Descripción

Motor automatizado de transformación y generación de características. La acción featureMachine realiza un análisis exploratorio de datos, cribado de variables y generación de características para transformar automáticamente los datos de entrada y generar nuevas características predictivas.

Parámetros
ParámetroDescripción
tableEspecifica el nombre de la tabla, la caslib y otros parámetros comunes de la tabla de entrada.
targetEspecifica la variable objetivo para el análisis.
featureOutEspecifica la tabla CAS para almacenar las tuberías de transformación y generación de características resultantes.
transformationOutEspecifica la tabla CAS para almacenar las definiciones de transformación.
casoutEspecifica la tabla CAS para almacenar los resultados generales del análisis.
explorationPolicyEspecifica la política para el análisis y agrupación automática de variables (AVAPT), definiendo umbrales para cardinalidad, entropía, valores atípicos, etc.
screenPolicyEspecifica la política de cribado para identificar variables constantes, niveles raros, fugas de información, redundancia o exceso de valores perdidos.
transformationPolicyDefine el espacio de transformación y generación de características (e.g., interacciones, polinomios, tratamiento de valores perdidos) que la máquina utilizará.
rankPolicyEspecifica la política de clasificación de características, incluyendo las estadísticas a utilizar para variables de intervalo y nominales.
saveStateEspecifica la tabla CAS para guardar el modelo de transformación y generación de características (ASTORE) para puntuación futura.
Carga de datos de ejemplo

Carga el conjunto de datos HMEQ en CAS para su uso en los ejemplos.

¡Copiado!
1PROC CAS;
2 SESSION casauto;
3 loadtable caslib="samples" path="hmeq.sashdat" casout="hmeq";
4RUN;

Ejemplos

Ejecuta featureMachine en la tabla HMEQ para generar características predictivas para la variable objetivo BAD.

Código SAS® / CAS Código en espera de validación por la comunidad
¡Copiado!
1PROC CAS;
2 dataSciencePilot.featureMachine
3 TABLE="hmeq"
4 target="BAD"
5 featureOut={name="features", replace=true}
6 transformationOut={name="transforms", replace=true};
7RUN;
Resultado :
Genera dos tablas: 'features' con las características generadas y 'transforms' con los detalles de las transformaciones aplicadas.

Ejecuta featureMachine con políticas personalizadas de cribado y transformación, incluyendo la generación de interacciones y polinomios, y guarda el estado analítico.

Código SAS® / CAS Código en espera de validación por la comunidad
¡Copiado!
1PROC CAS;
2 dataSciencePilot.featureMachine
3 TABLE="hmeq"
4 target="BAD"
5 featureOut={name="features_adv", replace=true}
6 transformationOut={name="transforms_adv", replace=true}
7 saveState={name="astore_model", replace=true}
8 screenPolicy={
9 missingPercentThreshold=50,
10 leakagePercentThreshold=95
11 }
12 transformationPolicy={
13 interaction=true,
14 polynomial=true,
15 missing=true
16 };
17RUN;
Resultado :
Genera características avanzadas incluyendo interacciones y polinomios, aplica un cribado más estricto y guarda el modelo ASTORE en 'astore_model'.

FAQ

¿Cuál es el propósito principal de la acción featureMachine?
¿Cuáles son los parámetros obligatorios que se deben especificar?
¿Qué función cumple el parámetro explorationPolicy?
¿Para qué sirve el parámetro screenPolicy?
¿Es posible guardar el modelo de transformación para usarlo después?
¿Qué controla el parámetro transformationPolicy?