textRuleDevelop

exportTextModel

Descripción

La acción exportTextModel construye un modelo de almacenamiento analítico (astore) de categorías, conceptos o sentimientos. Esta acción toma como entrada una tabla CAS que contiene un modelo compilado (generado previamente por acciones como compileCategory, compileConcept o compileSentiment) y lo exporta como un objeto de almacenamiento analítico (astore) que puede ser utilizado para puntuación (scoring) en entornos de producción o bases de datos compatibles.

Parámetros
ParámetroDescripción
buildEspecifica el tipo de modelo (CATEGORY, CONCEPT o SENTIMENT) y las opciones específicas para ese tipo de modelo. Determina qué otros parámetros son aplicables.
casOutEspecifica la tabla de salida que contendrá el modelo astore generado. Es un parámetro obligatorio.
fixedCharLengthEspecifica la longitud de las variables de caracteres de salida cuando el astore se utiliza para puntuación. El valor predeterminado es 1024.
languageEspecifica el idioma que se utiliza en el análisis. El valor predeterminado es ENGLISH.
tableEspecifica la tabla de entrada que contiene el modelo compilado (de categoría, concepto o sentimiento). Es un parámetro obligatorio.
textEspecifica el nombre de la variable de texto de entrada que se utilizará al puntuar el modelo. El valor predeterminado es '_text_'.
build.modelTypeSubparámetro de 'build'. Define si el modelo a exportar es de categorías, conceptos o sentimientos.
build.docTypeOpcional para modelType='CATEGORY'. Especifica el tipo de documento ('TEXT' o 'XML'). El valor predeterminado es 'TEXT'.
build.outputTableModeEspecifica la estructura de las tablas de salida ('DATAGRID' o 'DEFAULT'). 'DATAGRID' genera una fila por documento con resultados anidados; 'DEFAULT' genera tablas normalizadas.
build.scoringAlgorithmOpcional para modelType='CATEGORY'. Especifica el algoritmo de puntuación ('FREQUENCY' o 'WEIGHTED').
build.litiChunkSizeOpcional para modelType='CONCEPT'. Especifica el tamaño de los fragmentos (chunks) usados al procesar documentos (ej. '32K').
build.matchTypeOpcional para modelType='CONCEPT'. Especifica el tipo de coincidencia de conceptos ('ALL', 'BEST', 'LONGEST').
Creación de Datos y Compilación del Modelo Previo

Para exportar un modelo, primero debemos compilar unas reglas LITI. Este código carga el conjunto de acciones, define reglas simples de conceptos y las compila en una tabla CAS llamada 'modeloConceptos' que servirá de entrada para la exportación.

¡Copiado!
1PROC CAS;
2 SESSION casauto;
3 LOADACTIONSET "textRuleDevelop";
4
5 /* Crear tabla con reglas LITI */
6 DATA casuser.reglas;
7 INFILE DATALINES delimiter='|';
8 LENGTH rule $200;
9 INPUT rule $;
10 DATALINES;
11 CLASSIFIER:SAS
12 CONCEPT:SOFTWARE
13 ;
14 RUN;
15
16 /* Compilar las reglas para crear el modelo binario de entrada */
17 textRuleDevelop.compileConcept /
18 TABLE={name="reglas", caslib="casuser"}
19 casOut={name="modeloConceptos", caslib="casuser"};
20 RUN;

Ejemplos

Exporta la tabla del modelo compilado 'modeloConceptos' a una tabla de almacén analítico (astore) llamada 'miAstoreConceptos'.

Código SAS® / CAS Código en espera de validación por la comunidad
¡Copiado!
1PROC CAS;
2 textRuleDevelop.exportTextModel /
3 build={modelType="CONCEPT"}
4 TABLE={name="modeloConceptos", caslib="casuser"}
5 casOut={name="miAstoreConceptos", caslib="casuser", replace=TRUE};
6 RUN;
Resultado :
Se genera la tabla 'miAstoreConceptos' en la librería 'casuser', que contiene el binario del astore listo para ser desplegado.

Exporta un modelo con configuración específica: se define el idioma como Español, se establece una longitud fija para caracteres de salida y se selecciona el modo 'DATAGRID' para la tabla de salida del astore, útil para integración con sistemas que soportan estructuras anidadas.

Código SAS® / CAS Código en espera de validación por la comunidad
¡Copiado!
1PROC CAS;
2 textRuleDevelop.exportTextModel /
3 build={
4 modelType="CONCEPT",
5 matchType="LONGEST",
6 outputTableMode="DATAGRID"
7 }
8 TABLE={name="modeloConceptos", caslib="casuser"}
9 casOut={name="miAstoreAvanzado", caslib="casuser", replace=TRUE}
10 language="SPANISH"
11 fixedCharLength=2048;
12 RUN;
Resultado :
Se crea la tabla 'miAstoreAvanzado'. El modelo astore interno está configurado para buscar la coincidencia más larga (LONGEST), esperar texto en español y generar salidas en formato DATAGRID con un ancho de columna de 2048 caracteres.

FAQ

¿Cuál es el propósito principal de la acción exportTextModel?
¿Qué parámetro se utiliza para definir el tipo de modelo a generar?
¿Cuál es el valor predeterminado para el parámetro `fixedCharLength` y qué controla?
¿Qué opciones ofrece el parámetro `outputTableMode` para un modelo de tipo CATEGORY?
¿Cómo se controla el procesamiento de documentos grandes en un modelo de tipo CONCEPT?
¿Qué valores acepta el parámetro `matchType` al construir un modelo de conceptos?