L'action exportTextModel permet de compiler et d'exporter des modèles de règles linguistiques (catégories, concepts ou sentiments) créés avec SAS Visual Text Analytics sous forme de tables 'analytic store' (astore). Ce format binaire portable et optimisé est conçu pour le déploiement en production, permettant un scoring haute performance via l'action astore.score, tant dans l'environnement SAS Viya que dans des environnements externes via SAS Micro Analytic Service.
| Paramètre | Description |
|---|---|
| build | Paramètre obligatoire définissant le type de modèle à construire (CATEGORY, CONCEPT, SENTIMENT) ainsi que ses sous-options spécifiques (ex: docType, outputTableMode). |
| casOut | Spécifie la table de sortie CAS qui contiendra le modèle binaire (blob) au format astore. Cette table est l'artefact final à sauvegarder pour le déploiement. |
| table | Spécifie la table d'entrée contenant les définitions brutes du modèle (les règles LITI ou les définitions de catégories). |
| text | Indique le nom de la variable dans la table d'entrée qui contient le texte des règles (par défaut '_text_'). |
| language | Définit la langue utilisée pour l'analyse linguistique (ex: 'FRENCH', 'ENGLISH', 'GERMAN'). Valeur par défaut : ENGLISH. |
| fixedCharLength | Définit la longueur maximale (en octets) des chaînes de caractères générées en sortie lors du scoring futur du modèle (défaut : 1024). |
Génération d'une table CAS contenant des règles LITI simples pour identifier des termes spécifiques.
| 1 | DATA casuser.my_concept_rules; LENGTH rule $200; INPUT rule $ &; DATALINES; |
| 2 | CLASSIFIER:SAS_App "Visual Text Analytics" |
| 3 | CLASSIFIER:SAS_Platform "Viya" |
| 4 | ; |
| 5 | RUN; |
| 6 | PROC CASUTIL; load DATA=casuser.my_concept_rules casout="my_concept_rules" outcaslib="casuser" replace; RUN; |
Compilation de la table de règles définie précédemment en un modèle astore utilisable.
| 1 | |
| 2 | PROC CAS; |
| 3 | textRuleDevelop.exportTextModel / build={modelType="CONCEPT"} casOut={name="conceptAstore", caslib="casuser", replace=TRUE} TABLE={name="my_concept_rules", caslib="casuser"} text="rule"; |
| 4 | |
| 5 | RUN; |
| 6 |
Construction d'un modèle de catégorisation pour la langue française, en configurant la sortie du futur scoring au format DataGrid pour optimiser la structure des résultats.
| 1 | |
| 2 | PROC CAS; |
| 3 | textRuleDevelop.exportTextModel / build={modelType="CATEGORY", docType="TEXT", outputTableMode="DATAGRID", scoringAlgorithm="WEIGHTED"} language="FRENCH" fixedCharLength=512 casOut={name="frCategoryModel", caslib="casuser", replace=TRUE} TABLE={name="category_rules_fr", caslib="casuser"} text="rule_def"; |
| 4 | |
| 5 | RUN; |
| 6 |