Motor automatizado de transformación y generación de características. La acción featureMachine realiza un análisis exploratorio de datos, cribado de variables y generación de características para transformar automáticamente los datos de entrada y generar nuevas características predictivas.
| Parámetro | Descripción |
|---|---|
| table | Especifica el nombre de la tabla, la caslib y otros parámetros comunes de la tabla de entrada. |
| target | Especifica la variable objetivo para el análisis. |
| featureOut | Especifica la tabla CAS para almacenar las tuberías de transformación y generación de características resultantes. |
| transformationOut | Especifica la tabla CAS para almacenar las definiciones de transformación. |
| casout | Especifica la tabla CAS para almacenar los resultados generales del análisis. |
| explorationPolicy | Especifica la política para el análisis y agrupación automática de variables (AVAPT), definiendo umbrales para cardinalidad, entropía, valores atípicos, etc. |
| screenPolicy | Especifica la política de cribado para identificar variables constantes, niveles raros, fugas de información, redundancia o exceso de valores perdidos. |
| transformationPolicy | Define el espacio de transformación y generación de características (e.g., interacciones, polinomios, tratamiento de valores perdidos) que la máquina utilizará. |
| rankPolicy | Especifica la política de clasificación de características, incluyendo las estadísticas a utilizar para variables de intervalo y nominales. |
| saveState | Especifica la tabla CAS para guardar el modelo de transformación y generación de características (ASTORE) para puntuación futura. |
Carga el conjunto de datos HMEQ en CAS para su uso en los ejemplos.
| 1 | PROC CAS; |
| 2 | SESSION casauto; |
| 3 | loadtable caslib="samples" path="hmeq.sashdat" casout="hmeq"; |
| 4 | RUN; |
Ejecuta featureMachine en la tabla HMEQ para generar características predictivas para la variable objetivo BAD.
| 1 | PROC CAS; |
| 2 | dataSciencePilot.featureMachine |
| 3 | TABLE="hmeq" |
| 4 | target="BAD" |
| 5 | featureOut={name="features", replace=true} |
| 6 | transformationOut={name="transforms", replace=true}; |
| 7 | RUN; |
Ejecuta featureMachine con políticas personalizadas de cribado y transformación, incluyendo la generación de interacciones y polinomios, y guarda el estado analítico.
| 1 | PROC CAS; |
| 2 | dataSciencePilot.featureMachine |
| 3 | TABLE="hmeq" |
| 4 | target="BAD" |
| 5 | featureOut={name="features_adv", replace=true} |
| 6 | transformationOut={name="transforms_adv", replace=true} |
| 7 | saveState={name="astore_model", replace=true} |
| 8 | screenPolicy={ |
| 9 | missingPercentThreshold=50, |
| 10 | leakagePercentThreshold=95 |
| 11 | } |
| 12 | transformationPolicy={ |
| 13 | interaction=true, |
| 14 | polynomial=true, |
| 15 | missing=true |
| 16 | }; |
| 17 | RUN; |